Rookee
Россия+7 (495) 960-65-87

Как защитить сайт от плагиата?

Россия+7 (495) 960-65-87
Шрифт:
1 11692

Всё в этом мире плагиат!

Это утверждение принадлежит Дюма-отцу, который без всяческих стеснений обвинил в плагиате даже Господа Бога. Ведь он создавал Адама по своему образу и подобию. Вот только юристы с этим утверждением вряд ли согласятся, поскольку чаще обращаются к законодательству. А в нём предельно чётко сказано, что плагиат – это присвоение авторства (почитайте статью 146 Уголовного кодекса РФ).

Большинство из нас считает, что плагиат расцвёл пышным цветом лишь тогда, когда появился интернет. Однако история этого явления уходит в глубокую древность. В плагиате подозревали Геродота и Софокла, Вергилия и Шекспира. Нить обвинений можно раскручивать бесконечно. Но всегда найдутся те, кто, как Мольер, ответят обвинителям: «Я беру своё добро всюду, где его нахожу!»

Сегодня, когда даже художественная литература сплошь и рядом состоит из явного плагиата и компиляций, о плагиате на сайтах становится говорить всё сложнее. Так просто забыть о нравственных принципах, если о них предпочитают не вспоминать знаменитости, которых поддерживают издатели, читатели и критики.

Но одно дело книги, совсем другое – сайты. Уникальный контент в нашей сфере – одно из требований поискового продвижения. Правда, нет-нет да и звучат утверждения о том, что всё это просто миф, привычка, предрассудок. Тогда и писать больше ничего не надо. Вполне можно обойтись тем, что уже появилось за время существования интернета.

Тем не менее смысл в создании уникального контента и борьбе с плагиатом есть. Об это поговорим дальше, но начнём с сервисов проверки уникальности текстов. Ведь именно они позволяют обнаружить плагиат.

Сервисы проверки уникальности текстов

А кто был первым?

В деле создания сервисов и программ проверки текстов на плагиат Россия всего на год отстала от Запада: монополист западного рынка Copyscape был запущен в 2004, а уже на следующий год началось тестирование российского «Антиплагиата» http://www.antiplagiat.ru/. Правда, этот сервис, в отличие от западного, предназначался исключительно для системы образования. И сейчас он используется для проверки учебных и научных работ на заимствования.

Второй по времени создания стала программа Double Content Finder (DCFinder), которую разработали программисты Бюро копирайтинга Textbroker.ru в 2007 году. В отличие от «Антиплагиата», прогоняющего тексты по собственной базе, DCFinder осуществлял проверку через поисковые системы.

Принципы работы программ проверки текстов на плагиат

На сегодняшний день существует несколько методов проверки текстов на плагиат. Однако все они базируются на поиске отдельных фраз и фрагментов текста в поисковых машинах. По сути – это первый этап работы каждой программы.

После того как в поисковике обнаружены схожие фразы, программа забирает их и начинает обработку по собственным алгоритмам: высчитывает процент уникальности, обнаруживает рерайт и определяет другие характеристики текста, заложенные разработчиками.

Необходимо отметить, что каждая программа дробит текст по-своему. Назвать эти части можно как угодно: шинглы, куски, фразы. Одни программы выбирают фразы из нескольких слов, идущих друг за другом. Другие – выдёргивают фразы из текста в случайном порядке. Третьи – берут из текста пересекающиеся фразы. Вариантов множество, но чем больше текст, тем больше этих кусков, которые требуется проверить.

Например, возьмём текст из 1500 символов и предположим, что этот объём включает примерно 250 слов. Разобьём текст на куски, состоящие из пяти слов. Если программа будет учитывать фразы без пересечений, то в итоге получится 50 фраз. Если же сделать пересечение в одно-два слова, то количество фраз увеличится в несколько раз.

Чтобы проверить текст на уникальность с максимальной точностью, нужно исследовать все эти фразы. То есть придётся сделать 50 запросов к поисковой системе. Программа, которая нацелена на обычную выдачу, уже на третьем запросе вызовет подозрения поисковика и для последующей проверки придётся вводить капчу 47 раз.

Есть программы, использующие xml-запросы к поисковым системам. Тогда капч никаких не будет, но запросы будут недешёвыми. Отдать 50 запросов для проверки одного текста да ещё и бесплатно – слишком расточительно.

Следовательно, программы не проверяют текст досконально, целиком и полностью. Очевидно, что для каждой проверки используется меньшее количество запросов.

Но, используя десять запросов и проверяя десять выбранных случайным образом фраз, мы получим один результат. При повторной проверке программа выберет другие фразы из текста (и вероятность этого очень высока), поэтому результаты проверки окажутся другими. Это не говоря о том, что результаты поисковой системы могут быть разными не только для одного и того же запроса, но и для разных регионов.

Вывод из вышесказанного один: даже самые продвинутые алгоритмы проверки не гарантируют стопроцентной точности: результаты пяти проверок, проведённых одна за другой, но в разное время, из разных регионов или разными людьми, будут различаться.

Популярные сервисы и программы проверки текстов на плагиат

Программы

  • Advego Plagiatus
  • eTXT Антиплагиат

Сервисы

  • Text.ru
  • Copyscape

Менее известные сервисы

Вроде плагиат есть, а вроде его и нет

Если на сайте размещается текстовый контент, то владелец сайта непременно столкнётся с проблемой плагиата и задаст эти три вопроса:

1. Как отслеживать размещение текстов на других веб-ресурсах?

2. А если они вдруг и обнаружатся, как доказать авторство?

3. Стоит ли идти в суд?

Ответим на каждый из них.

Как отслеживать размещение текстов на других веб-ресурсах?

Совершенно бесплатно сегодня можно использовать только поисковые системы. Но представьте, сколько времени потребуется, чтобы обработать таким образом каждую статью!

Некоторые сервисы (например, Text.ru, Content Watch) предусматривают проверку всего сайта, но без оплаты сделать это не удастся.

Как вариант – можно вовсе отказаться от использования сервисов и программ, сосредоточив свои усилия лишь на сайтах конкурентов. Ведь, по сути, сегодня важнее предотвратить плагиат с их стороны, особенно если речь идёт о сайтах компаний. Отслеживать десяток-другой конкурирующих сайтов гораздо проще, чем рыть весь интернет.

В Бюро копирайтинга Textbroker.ru проблема обнаружения плагиата решается внутри системы. Клиентам доступна опция «Плагиатфиндер», с помощью которой каждый месяц проверяются статьи определённого ценового уровня. Если обнаружится перепечатка, то клиент узнает об этом сразу.

плагиатфиндер.png

Как доказать авторство?

Некоторые уверены, что если автор не указан, то и претензии о нарушении авторских прав никто не заявит, а если заявит, то доказать не сможет. На самом деле не всегда это так.

Ситуация с авторством на текстовый контент может разворачиваться в нескольких направлениях.

Первый вариант. На сайте размещаются статьи, которые пишет штатный автор, получающий за это заработную плату. В соответствии со статьёй 1295 Гражданского кодекса РФ авторское право принадлежит автору, а исключительное право на использование – работодателю, если не был заключён договор на каких-либо других условиях.

Второй вариант. Создание текстового контента компания отдала на аутсорсинг в другую организацию: агентство, бюро, биржу копирайтинга или отдельному автору. Соответственно, в этом случае стороны заключают договор, в котором отражаются все тонкости, связанные с авторским правом.

В любой из этих ситуаций не мешает подстраховаться:

★ Поскольку уникальные тексты прежде всего нужны для поискового продвижения, лучше зафиксировать дату размещения статьи с помощью сервиса Яндекса «Оригинальные тексты».

★ Некоторые сервисы проверки уникальности текстов (например, Text.ru) предлагают зафиксировать уникальность с помощью баннера.

баннеры.png

★ Можно создавать pdf-файлы, в которых, кроме текста, будет дата и время его создания, данные авторы и правообладателя. Такой подход используется у нас в бюро: опция CopyGuard формирует pdf-файл со статьей и направляет его на адрес электронной почты клиента. Если возникнут проблемы с авторскими правами, то факт отправки файла станет подтверждением получения имущественных прав на текст в точно зафиксированное время. По сути, этот вариант заменяет собой отправку почтой бумажного письма с распечатанной статьёй. Автор или правообладатель отправляет себе такое письмо и хранит в запечатанном виде на случай, если понадобится доказывать авторство.

письмо.png

Стоит ли идти в суд?

Если мы обратимся к судебной практике, то не найдём ни одного случая, когда факт плагиата статьи рассматривался в суде.

Есть примеры судебных дел, связанных с воровством дизайна сайта или его элементов. Не поддаётся подсчёту количество судебных разбирательств с продавцами контрафакта и юрлицами, использующими программы без лицензий. То и дело вспыхивают споры об авторском праве между авторами художественных произведений и научных работ.

Ситуация вполне объяснима. Масштабы плагиата текстового контента настолько несущественны, что предпочтительнее не доводить дело до суда. Те суммы, которые может получить истец в случае решения суда в его пользу, просто не сопоставимы с временными затратами и переживаниями.

В соответствии со статьёй 7.12 КоАП РФ суммы административного штрафа составляют:

  • для граждан – от 1 500 до 2 000 рублей;
  • для должностных лиц – от 10 000 до 20 000 рублей;
  • для юрлиц – от 30 000 до 40 000 рублей.

Административное наказание сопровождается конфискацией произведений, фонограмм, материалов, оборудования и иных орудий совершения административного правонарушения.

Однако, для доказательства факта плагиата придётся провести автороведческую экспертизу, стоимость которой начинается от 40 000 рублей.

За плагиат предусмотрена и уголовная ответственность, но при условии, что автору или правообладателю причинён крупный ущерб (более 100 000 рублей). Конечно, вполне возможно подсчитать доход, который получил владелец сайта, например, с рекламы. Но стоит ли с этим возиться? Ведь сопутствующие затраты могут оказаться гораздо выше компенсаций.

Рерайтинг – это плагиат?

Это ещё одна скользкая тема, связанная с плагиатом. Закон не запрещает заимствовать в определённых пределах и перерабатывать авторский текст, но переработка должна быть творческой.

Претензий не будет к тем текстам, в которых позаимствованная идея обрела дополнительный смысл. Если же рерайтинг выполнен поверхностно да ещё указано имя другого автора, то доказать факт плагиата будет просто.

Выводы и рекомендации

Рекомендации владельцам сайтов, которые хотят защитить контент от плагиата

1. Поскольку сегодня поисковые системы при ранжировании сайтов, кроме уникальности, используют и множество других параметров, делать ставку на уникальность как основу поискового продвижения не стоит. Это не значит, что можно позаимствовать контент у других. Просто лучше сосредоточиться на качестве информации и её подачи. Тогда защита от плагиата будет более осмысленной.

2. Текст на сайте можно защитить от выделения и копирования с помощью специальных плагинов. Однако полагаться на них не стоит, так как при желании их можно легко обойти.

3. Не пытайтесь следить за всем интернетом. Определите конкурентов и мониторьте их сайты. Если конкурентов слишком много, то имеет смысл выбрать только самых крупных.

4. Разработайте политику использования материалов сайта. Иногда лучше не запрещать перепечатку, а разрешить её с обязательным указанием имени автора, названия источника и гиперссылки на сайт.

Рекомендации тем, кого всё-таки обвинили в плагиате

1. Если к вам обратились с претензией об обнаружении на вашем сайте плагиата и вы знаете, что это плагиат, лучше сразу убрать текст с сайта или выполнить требования, например, указать имя автора и поставить гиперссылку на сайт-источник.

2. Если вы даже не догадываетесь, что разместили плагиат на сайте, а претензия поступила, то разбираться придётся не только с обратившимися, но и с автором, которому были заплачены деньги. Вероятно, в этой ситуации стоит пересмотреть подходы к сотрудничеству с авторами и приобретению контента. И преимущество в данном случае за агентствами и компаниями. С ними можно заключить договор, а значит и решить любую проблему, касающуюся контента, будет гораздо проще.

3. Если вы уверены, что в вашей сфере сложно создать что-то новое и единственный выход – рерайтинг, то лучше не торопитесь. Может быть, нужно понаблюдать за целевой аудиторией, понять её потребности, интересы и привычки, выяснить, какие смежные направления могут заинтересовать пользователей. На основе этих данных появятся идеи для контента, и не факт, что это будут исключительно статьи.

(Нет голосов)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Рейтинг Известности 2018: старт народного голосования
Михаил Р
1
комментарий
LANG_NO
читателей
Полный профиль
Михаил Р - 1. Demis 2. кокс 3. Ашманов 4. Скобеев 5. Digital Strategy
Рейтинг Известности 2018: второй этап народного голосования
Константин Сокол
3
комментария
LANG_NO
читателей
Полный профиль
Константин Сокол - Кто был ответственный за дизайн таблицы голосования? Копирайтер?
Сколько ссылок помогут продвинуть молодой сайт
Павел Андрейчук
30
комментариев
LANG_NO
читателей
Полный профиль
Павел Андрейчук - Дело в том, что вряд ли в ваших платных "качественных" кейсах найдётся хоть пару % действительно новой и полезной информации которой бы не было на общедоступных источниках.
Сайт на WordPress: за и против
Мира Смурков
1
комментарий
LANG_NO
читателей
Полный профиль
Мира Смурков - Людмила, я согласен с большинством комментаторов. Вы хоть один полноценный магазин сделали на этих движках? Woocommerce это система с супер возможностями. И к ней есть дополнительные модули, с функционалом, который вряд ли появиться на Битрикс. А самому это программировать - сотни тысяч рублей на разработку. А приведя в пример сложности с robots.txt и Sitemap вы ставите под вопрос вашу компетенцию в понимании Интернет-бизнеса и веб-разработки в целом. Во-первых это такие мелочи, а во-вторых это все делается на вордпресса за 2 минуты, и опять же с возможностями многократно превышающими Битрикс.
Кейс: вывод лендинга по изготовлению флагов на заказ в ТОП 1 по Санкт-Петербургу
utka21
5
комментариев
LANG_NO
читателей
Полный профиль
utka21 - Кейс как кейс. Для некоторых станет вполне возможно полезным. ( Для конкурентов точно) . А вот с комментариями , что то пошло не так )
Обзор популярных CMS: плюсы и минусы
Гость
1
комментарий
LANG_NO
читателей
Полный профиль
Гость - У Битрикса техническое seo сильно страдает, чтоб оно там было нормальным придется все переделать. Безопасность у Битрикса тоже низкая, особено если надо дорабатывать функционал, как только правиться функционал у Битрикс , то уровень ее безопасности определяет тот разработчик , который этим занимается. Самые безопасные движки те, что нет в общем доступе и где нельзя ничего редактировать в коде. =)
Google обошел Яндекс по популярности в России в 2018 году: исследование SEO Auditor
Рамблер
1
комментарий
LANG_NO
читателей
Полный профиль
Рамблер - Вот вроде отечественный - это сказано верно.. «Я́ндекс» — российская транснациональная компания, зарегистрированная в Нидерландах. Так говорится в Википедии. И с хрена ли ОТЕЧЕСТВЕННЫЙ поисковик зарегистрирован в Европе? И где платится основная часть налогов? Ну-ууу, точно не в России. И если запахнет жаренным, то был Яндекс и нет Яндекса!
8 методик в SEO, от которых давно пора отказаться
Евгений Сметанин
11
комментариев
LANG_NO
читателей
Полный профиль
Евгений Сметанин - Факторов вообще очень много, согласитесь, вы будете использовать максимальное их количество, особенно, если в ТОПе засели агрегаторы с сумасшедшими ПФ. В таких случаях, вхождение ключа в домен для маленького профильного сайта, сыграет свою положительную роль. Конечно же, если контент на страницах хорошего качества. У меня есть несколько успешных кейсов на эту тему. На сайте продают несколько видов товаров, а выстреливает в ТОП тот, название которого присутствует в доменном имени. Как корабль назовешь, так он и поплывет, верно?))
Инструкция: настраиваем цели Яндекс.Метрики через Google Tag Manager
Roman Gorkunenko
1
комментарий
LANG_NO
читателей
Полный профиль
Roman Gorkunenko - Здравствуйте. Подскажите, пожалуйста, можно с айпи метрики вытащить среднюю стоимость клика по утм меткам? В метрике есть такой шаблон tags_u_t_m, но он не совместим с меткой директа, у них разные префиксы.
Аудит структуры интернет-магазина мебели от «Ашманов и партнеры»
Дмитрий
9
комментариев
LANG_NO
читателей
Полный профиль
Дмитрий - Сергей, а вы допускаете, что вся ваша жизнь - seo-миф?
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
344
Комментариев
262
Комментариев
246
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
100
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
73
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
56
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!