Більшість з нас вважає, що плагіат розцвів пишним цвітом лише тоді, коли з'явився інтернет. Однак історія цього явища сягає глибокої давнини. У плагіаті підозрювали Геродота і Софокла, Вергілія і Шекспіра. Нитка звинувачень можна розкручувати нескінченно. Але завжди знайдуться ті, хто, як Мольєр, дадуть відповідь обвинувачам: «Я беру своє добро усюди, де його знаходжу!»
Сьогодні, коли навіть художня література часто-густо складається з явного плагіату і компіляцій, про плагіат на сайтах стає говорити все складніше. Так просто забути про етичні принципи, якщо про них воліють не згадувати знаменитості, яких підтримують видавці, читачі і критики.
Але одна справа книги, зовсім інше - сайти. Унікальний контент в нашій сфері - одна з вимог пошукового просування. Правда, ні-ні та й лунають твердження про те, що все це просто міф, звичка, забобон. Тоді і писати більше нічого не треба. Цілком можна обійтися тим, що вже з'явилося за час існування інтернету.
Проте сенс у створенні унікального контенту та боротьби з плагіатом є. Про це поговоримо далі, але почнемо з сервісів перевірки унікальності текстів. Адже саме вони дозволяють виявити плагіат.
Сервіси перевірки унікальності текстів
А хто був першим?
Принципи роботи програм перевірки текстів на плагіат
На сьогоднішній день існує кілька методів перевірки текстів на плагіат. Однак всі вони базуються на пошуку окремих фраз і фрагментів тексту в пошукових машинах. По суті - це перший етап роботи кожної програми.
Після того як в пошуковику виявлені схожі фрази, програма забирає їх і починає обробку за власними алгоритмами: вираховує відсоток унікальності, виявляє рерайт і визначає інші характеристики тексту, закладені розробниками.
Необхідно відзначити, що кожна програма дробить текст по-своєму. Назвати ці частини можна як завгодно: шингли, шматки, фрази. Одні програми вибирають фрази з кількох слів, що йдуть один за одним. Інші - висмикують фрази з тексту в довільному порядку. Треті - беруть з тексту пересічні фрази. Варіантів безліч, але чим більше текст, тим більше цих шматків, які потрібно перевірити.
Наприклад, візьмемо текст з 1500 символів і припустимо, що цей обсяг включає приблизно 250 слів. Розіб'ємо текст на шматки, що складаються з п'яти слів. Якщо програма буде враховувати фрази без перетинів, то в підсумку вийде 50 фраз. Якщо ж зробити перетин в одно-два слова, то кількість фраз збільшиться в кілька разів.
Щоб перевірити текст на унікальність з максимальною точністю, потрібно досліджувати всі ці фрази. Тобто доведеться зробити 50 запитів до пошукової системи. Програма, яка націлена на звичайну видачу, вже на третьому запиті викличе підозри пошукача і для подальшої перевірки доведеться вводити капчу 47 разів.
Є програми, які використовують xml-запити до пошукових систем. Тоді капч ніяких не буде, але запити будуть недешевими. Віддати 50 запитів для перевірки одного тексту та ще й безкоштовно - занадто марнотратно.
Отже, програми не перевіряють текст досконально, цілком і повністю. Очевидно, що для кожної перевірки використовується менша кількість запитів.
Але, використовуючи десять запитів і перевіряючи десять обраних випадковим чином фраз, ми отримаємо один результат. При повторній перевірці програма вибере інші фрази з тексту (і ймовірність цього дуже висока), тому результати перевірки виявляться іншими. Це не кажучи про те, що результати пошукової системи можуть бути різними не тільки для одного і того ж запиту, але і для різних регіонів.
Висновок зі сказаного вище один: навіть найбільш просунуті алгоритми перевірки не гарантують стовідсоткової точності: результати п'яти перевірок, проведених одна за одною, але в різний час, з різних регіонів або різними людьми, будуть відрізнятися.
Популярні сервіси та програми перевірки текстів на плагіат
Менш відомі сервіси
Начебто плагіат є, а ніби його й немає
Якщо на сайті розміщується текстовий контент, то власник сайту неодмінно зіткнеться з проблемою плагіату і задасть ці три питання:
1. Як відстежувати розміщення текстів на інших веб-ресурсах?
3. Чи варто йти в суд?
Відповімо на кожен з них.
Абсолютно безкоштовно сьогодні можна використовувати тільки пошукові системи. Але уявіть, скільки часу буде потрібно, щоб обробити таким чином кожну статтю!
Деякі сервіси (наприклад, Text.ru, Content Watch) передбачають перевірку всього сайту, але без оплати зробити це не вдасться.
Як варіант - можна зовсім відмовитися від використання сервісів і програм, зосередивши свої зусилля лише на сайтах конкурентів. Адже, по суті, сьогодні важливіше запобігти плагіат з їх боку, особливо якщо мова йде про сайти компаній. Відстежувати десяток-другий конкуруючих сайтів набагато простіше, ніж рити весь інтернет.
У Бюро копірайтингу Textbroker.ru проблема виявлення плагіату вирішується всередині системи. Клієнтам доступна опція «Плагіатфіндер», за допомогою якої кожен місяць перевіряються статті певного цінового рівня. Якщо виявиться передрук, то клієнт дізнається про це відразу.
У кожній із цих ситуацій не заважає підстрахуватися:
★ Оскільки унікальні тексти насамперед потрібні для пошукового просування, краще зафіксувати дату розміщення статті за допомогою сервісу Яндекса «Оригінальні тексти».
★ Деякі сервіси перевірки унікальності текстів (наприклад, Text.ru) пропонують зафіксувати унікальність за допомогою банера.
Якщо ми звернемося до судової практики, то знайдемо жодного випадку, коли факт плагіату статті розглядався в суді.
Ситуація цілком з'ясовна. Масштаби плагіату текстового контенту настільки несуттєві, що краще не доводити справу до суду. Ті суми, які може отримати позивач в разі рішення суду на його користь, просто не можна порівняти з тимчасовими витратами і переживаннями.
Відповідно до статті 7.12 КоАП РФ суми адміністративного штрафу складають:
- для громадян - від 1 500 до 2 000 рублів;
- для посадових осіб - від 10 000 до 20 000 рублів;
- для юросіб - від 30 000 до 40 000 рублів.
Адміністративне покарання супроводжується конфіскацією творів, фонограм, матеріалів, устаткування та інших знарядь вчинення адміністративного правопорушення.
Рерайтінг- це плагіат?
висновки та рекомендації
Рекомендації власникам сайтів, які хочуть захистити контент від плагіату
1. Оскільки сьогодні пошукові системи при ранжируванні сайтів, крім унікальності, використовують і безліч інших параметрів, робити ставку на унікальність як основу пошукового просування не варто. Це не означає, що можна запозичити контент у інших. Просто краще зосередитися на якості інформації та її подачі. Тоді захист від плагіату буде більш осмисленим.
2. Текст на сайті можна захистити від виділення і копіювання за допомогою спеціальних плагінів. Однак покладатися на них не варто, так як при бажанні їх можна легко обійти.
3. Не намагайтеся стежити за всім інтернетом. Визначте конкурентів і моніторьте їх сайти. Якщо конкурентів занадто багато, то має сенс вибрати тільки найбільших.
Рекомендації тим, кого все-таки звинуватили в плагіаті
3. Якщо ви впевнені, що у вашій сфері складно створити щось нове і єдиний вихід - рерайтинг, то краще не поспішайте. Може бути, потрібно поспостерігати за цільовою аудиторією, зрозуміти її потреби, інтереси і звички, з'ясувати, які суміжні напрямки можуть зацікавити користувачів. На основі цих даних з'являться ідеї для контенту, і не факт, що це будуть виключно статті.