Как защитить сайт от плагиата?

Россия+7 (495) 960-65-87
Шрифт:
1 7947

Всё в этом мире плагиат!

Это утверждение принадлежит Дюма-отцу, который без всяческих стеснений обвинил в плагиате даже Господа Бога. Ведь он создавал Адама по своему образу и подобию. Вот только юристы с этим утверждением вряд ли согласятся, поскольку чаще обращаются к законодательству. А в нём предельно чётко сказано, что плагиат – это присвоение авторства (почитайте статью 146 Уголовного кодекса РФ).

Большинство из нас считает, что плагиат расцвёл пышным цветом лишь тогда, когда появился интернет. Однако история этого явления уходит в глубокую древность. В плагиате подозревали Геродота и Софокла, Вергилия и Шекспира. Нить обвинений можно раскручивать бесконечно. Но всегда найдутся те, кто, как Мольер, ответят обвинителям: «Я беру своё добро всюду, где его нахожу!»

Сегодня, когда даже художественная литература сплошь и рядом состоит из явного плагиата и компиляций, о плагиате на сайтах становится говорить всё сложнее. Так просто забыть о нравственных принципах, если о них предпочитают не вспоминать знаменитости, которых поддерживают издатели, читатели и критики.

Но одно дело книги, совсем другое – сайты. Уникальный контент в нашей сфере – одно из требований поискового продвижения. Правда, нет-нет да и звучат утверждения о том, что всё это просто миф, привычка, предрассудок. Тогда и писать больше ничего не надо. Вполне можно обойтись тем, что уже появилось за время существования интернета.

Тем не менее смысл в создании уникального контента и борьбе с плагиатом есть. Об это поговорим дальше, но начнём с сервисов проверки уникальности текстов. Ведь именно они позволяют обнаружить плагиат.

Сервисы проверки уникальности текстов

А кто был первым?

В деле создания сервисов и программ проверки текстов на плагиат Россия всего на год отстала от Запада: монополист западного рынка Copyscape был запущен в 2004, а уже на следующий год началось тестирование российского «Антиплагиата» http://www.antiplagiat.ru/. Правда, этот сервис, в отличие от западного, предназначался исключительно для системы образования. И сейчас он используется для проверки учебных и научных работ на заимствования.

Второй по времени создания стала программа Double Content Finder (DCFinder), которую разработали программисты Бюро копирайтинга Textbroker.ru в 2007 году. В отличие от «Антиплагиата», прогоняющего тексты по собственной базе, DCFinder осуществлял проверку через поисковые системы.

Принципы работы программ проверки текстов на плагиат

На сегодняшний день существует несколько методов проверки текстов на плагиат. Однако все они базируются на поиске отдельных фраз и фрагментов текста в поисковых машинах. По сути – это первый этап работы каждой программы.

После того как в поисковике обнаружены схожие фразы, программа забирает их и начинает обработку по собственным алгоритмам: высчитывает процент уникальности, обнаруживает рерайт и определяет другие характеристики текста, заложенные разработчиками.

Необходимо отметить, что каждая программа дробит текст по-своему. Назвать эти части можно как угодно: шинглы, куски, фразы. Одни программы выбирают фразы из нескольких слов, идущих друг за другом. Другие – выдёргивают фразы из текста в случайном порядке. Третьи – берут из текста пересекающиеся фразы. Вариантов множество, но чем больше текст, тем больше этих кусков, которые требуется проверить.

Например, возьмём текст из 1500 символов и предположим, что этот объём включает примерно 250 слов. Разобьём текст на куски, состоящие из пяти слов. Если программа будет учитывать фразы без пересечений, то в итоге получится 50 фраз. Если же сделать пересечение в одно-два слова, то количество фраз увеличится в несколько раз.

Чтобы проверить текст на уникальность с максимальной точностью, нужно исследовать все эти фразы. То есть придётся сделать 50 запросов к поисковой системе. Программа, которая нацелена на обычную выдачу, уже на третьем запросе вызовет подозрения поисковика и для последующей проверки придётся вводить капчу 47 раз.

Есть программы, использующие xml-запросы к поисковым системам. Тогда капч никаких не будет, но запросы будут недешёвыми. Отдать 50 запросов для проверки одного текста да ещё и бесплатно – слишком расточительно.

Следовательно, программы не проверяют текст досконально, целиком и полностью. Очевидно, что для каждой проверки используется меньшее количество запросов.

Но, используя десять запросов и проверяя десять выбранных случайным образом фраз, мы получим один результат. При повторной проверке программа выберет другие фразы из текста (и вероятность этого очень высока), поэтому результаты проверки окажутся другими. Это не говоря о том, что результаты поисковой системы могут быть разными не только для одного и того же запроса, но и для разных регионов.

Вывод из вышесказанного один: даже самые продвинутые алгоритмы проверки не гарантируют стопроцентной точности: результаты пяти проверок, проведённых одна за другой, но в разное время, из разных регионов или разными людьми, будут различаться.

Популярные сервисы и программы проверки текстов на плагиат

Программы

  • Advego Plagiatus
  • eTXT Антиплагиат

Сервисы

  • Text.ru
  • Copyscape

Менее известные сервисы

Вроде плагиат есть, а вроде его и нет

Если на сайте размещается текстовый контент, то владелец сайта непременно столкнётся с проблемой плагиата и задаст эти три вопроса:

1. Как отслеживать размещение текстов на других веб-ресурсах?

2. А если они вдруг и обнаружатся, как доказать авторство?

3. Стоит ли идти в суд?

Ответим на каждый из них.

Как отслеживать размещение текстов на других веб-ресурсах?

Совершенно бесплатно сегодня можно использовать только поисковые системы. Но представьте, сколько времени потребуется, чтобы обработать таким образом каждую статью!

Некоторые сервисы (например, Text.ru, Content Watch) предусматривают проверку всего сайта, но без оплаты сделать это не удастся.

Как вариант – можно вовсе отказаться от использования сервисов и программ, сосредоточив свои усилия лишь на сайтах конкурентов. Ведь, по сути, сегодня важнее предотвратить плагиат с их стороны, особенно если речь идёт о сайтах компаний. Отслеживать десяток-другой конкурирующих сайтов гораздо проще, чем рыть весь интернет.

В Бюро копирайтинга Textbroker.ru проблема обнаружения плагиата решается внутри системы. Клиентам доступна опция «Плагиатфиндер», с помощью которой каждый месяц проверяются статьи определённого ценового уровня. Если обнаружится перепечатка, то клиент узнает об этом сразу.

плагиатфиндер.png

Как доказать авторство?

Некоторые уверены, что если автор не указан, то и претензии о нарушении авторских прав никто не заявит, а если заявит, то доказать не сможет. На самом деле не всегда это так.

Ситуация с авторством на текстовый контент может разворачиваться в нескольких направлениях.

Первый вариант. На сайте размещаются статьи, которые пишет штатный автор, получающий за это заработную плату. В соответствии со статьёй 1295 Гражданского кодекса РФ авторское право принадлежит автору, а исключительное право на использование – работодателю, если не был заключён договор на каких-либо других условиях.

Второй вариант. Создание текстового контента компания отдала на аутсорсинг в другую организацию: агентство, бюро, биржу копирайтинга или отдельному автору. Соответственно, в этом случае стороны заключают договор, в котором отражаются все тонкости, связанные с авторским правом.

В любой из этих ситуаций не мешает подстраховаться:

★ Поскольку уникальные тексты прежде всего нужны для поискового продвижения, лучше зафиксировать дату размещения статьи с помощью сервиса Яндекса «Оригинальные тексты».

★ Некоторые сервисы проверки уникальности текстов (например, Text.ru) предлагают зафиксировать уникальность с помощью баннера.

баннеры.png

★ Можно создавать pdf-файлы, в которых, кроме текста, будет дата и время его создания, данные авторы и правообладателя. Такой подход используется у нас в бюро: опция CopyGuard формирует pdf-файл со статьей и направляет его на адрес электронной почты клиента. Если возникнут проблемы с авторскими правами, то факт отправки файла станет подтверждением получения имущественных прав на текст в точно зафиксированное время. По сути, этот вариант заменяет собой отправку почтой бумажного письма с распечатанной статьёй. Автор или правообладатель отправляет себе такое письмо и хранит в запечатанном виде на случай, если понадобится доказывать авторство.

письмо.png

Стоит ли идти в суд?

Если мы обратимся к судебной практике, то не найдём ни одного случая, когда факт плагиата статьи рассматривался в суде.

Есть примеры судебных дел, связанных с воровством дизайна сайта или его элементов. Не поддаётся подсчёту количество судебных разбирательств с продавцами контрафакта и юрлицами, использующими программы без лицензий. То и дело вспыхивают споры об авторском праве между авторами художественных произведений и научных работ.

Ситуация вполне объяснима. Масштабы плагиата текстового контента настолько несущественны, что предпочтительнее не доводить дело до суда. Те суммы, которые может получить истец в случае решения суда в его пользу, просто не сопоставимы с временными затратами и переживаниями.

В соответствии со статьёй 7.12 КоАП РФ суммы административного штрафа составляют:

  • для граждан – от 1 500 до 2 000 рублей;
  • для должностных лиц – от 10 000 до 20 000 рублей;
  • для юрлиц – от 30 000 до 40 000 рублей.

Административное наказание сопровождается конфискацией произведений, фонограмм, материалов, оборудования и иных орудий совершения административного правонарушения.

Однако, для доказательства факта плагиата придётся провести автороведческую экспертизу, стоимость которой начинается от 40 000 рублей.

За плагиат предусмотрена и уголовная ответственность, но при условии, что автору или правообладателю причинён крупный ущерб (более 100 000 рублей). Конечно, вполне возможно подсчитать доход, который получил владелец сайта, например, с рекламы. Но стоит ли с этим возиться? Ведь сопутствующие затраты могут оказаться гораздо выше компенсаций.

Рерайтинг – это плагиат?

Это ещё одна скользкая тема, связанная с плагиатом. Закон не запрещает заимствовать в определённых пределах и перерабатывать авторский текст, но переработка должна быть творческой.

Претензий не будет к тем текстам, в которых позаимствованная идея обрела дополнительный смысл. Если же рерайтинг выполнен поверхностно да ещё указано имя другого автора, то доказать факт плагиата будет просто.

Выводы и рекомендации

Рекомендации владельцам сайтов, которые хотят защитить контент от плагиата

1. Поскольку сегодня поисковые системы при ранжировании сайтов, кроме уникальности, используют и множество других параметров, делать ставку на уникальность как основу поискового продвижения не стоит. Это не значит, что можно позаимствовать контент у других. Просто лучше сосредоточиться на качестве информации и её подачи. Тогда защита от плагиата будет более осмысленной.

2. Текст на сайте можно защитить от выделения и копирования с помощью специальных плагинов. Однако полагаться на них не стоит, так как при желании их можно легко обойти.

3. Не пытайтесь следить за всем интернетом. Определите конкурентов и мониторьте их сайты. Если конкурентов слишком много, то имеет смысл выбрать только самых крупных.

4. Разработайте политику использования материалов сайта. Иногда лучше не запрещать перепечатку, а разрешить её с обязательным указанием имени автора, названия источника и гиперссылки на сайт.

Рекомендации тем, кого всё-таки обвинили в плагиате

1. Если к вам обратились с претензией об обнаружении на вашем сайте плагиата и вы знаете, что это плагиат, лучше сразу убрать текст с сайта или выполнить требования, например, указать имя автора и поставить гиперссылку на сайт-источник.

2. Если вы даже не догадываетесь, что разместили плагиат на сайте, а претензия поступила, то разбираться придётся не только с обратившимися, но и с автором, которому были заплачены деньги. Вероятно, в этой ситуации стоит пересмотреть подходы к сотрудничеству с авторами и приобретению контента. И преимущество в данном случае за агентствами и компаниями. С ними можно заключить договор, а значит и решить любую проблему, касающуюся контента, будет гораздо проще.

3. Если вы уверены, что в вашей сфере сложно создать что-то новое и единственный выход – рерайтинг, то лучше не торопитесь. Может быть, нужно понаблюдать за целевой аудиторией, понять её потребности, интересы и привычки, выяснить, какие смежные направления могут заинтересовать пользователей. На основе этих данных появятся идеи для контента, и не факт, что это будут исключительно статьи.

Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Рейтинг «Известность бренда SEO-компаний 2017»: народное голосование
Иван
1
комментарий
0
читателей
Полный профиль
Иван - 1) IT-Agency 2) Пиксели 3) 1ps 4) Ингейт 5) Нетпики
«Баден-Баден»: как выйти из-под фильтра
Сергей Дембицкий «Sima-Land.ru»
17
комментариев
0
читателей
Полный профиль
Сергей Дембицкий «Sima-Land.ru» - Скрины Метрики показывать не буду, но мы (sima-land.ru - 1,5 млн. стр. в поиске Яндекс) в сентябре загремели под ББ, в разгар сезона и вышли из-под фильтра, спустя 50 дней, удалив все тексты с сайта: категории + карточки товаров (описание). Трафик с Google только вырос. Тексты возвращать собираемся, но процесс будет длительный, тексты будем теперь писать исключительно полезные, т.к. было больно :-))
Второе дыхание ссылочного продвижения
Автопилот
14
комментариев
0
читателей
Полный профиль
Автопилот - Еще лучше, когда продвижение осуществляется комплексно :)
Кейс: продвигаем бизнес по продаже пластиковых окон в Москве
Иван Стороженко
5
комментариев
0
читателей
Полный профиль
Иван Стороженко - 1. По началу вообще не использовали, сейчас уже много каналов используется. 2. Все может быть, в принципе сайты должны быть удобны для пользователя, для этого и нужна схожесть между собой. Честно говоря старались брать все самое интересное у конкурентов + подкреплять своими идеями.
Западные специалисты выяснили, как повысить позиции ресурса в выдаче Google
Максим Мирошник
2
комментария
0
читателей
Полный профиль
Максим Мирошник -
«Прямая линия» с Александром Алаевым («АлаичЪ и Ко»): отвечаем на вопросы
Александр Алаев
13
комментариев
0
читателей
Полный профиль
Александр Алаев - Роман. Тут ответ очень простой. Каждый запрос можно четко разделить на коммерческий или некоммерческий. "Купить слона" и его длинные хвосты - коммерческий. "Как выбрать слона" и подобные - информационные. Вот под коммерческие ключи должны быть страницы услуг или каталога товаров. А под информационку - блог. Очень важно не путать их, тем более несоответствующая коммерческим факторам страниц просто не продвинется, то есть по запросу с "купить" блог никогда не будет показываться в выдаче, так же как и страница услуги/товаров не покажется по "как выбрать". Понятно примерно?
Инфографика: самые распространенные SEO-ошибки Рунета
Dmitro Grunt
2
комментария
0
читателей
Полный профиль
Dmitro Grunt - Кстати, у проектов которые продвигает Нетпик все тайтлы не более 65 символов? Или вы надеетесь что кто то послушает советов и отдаст вам часть трафика? :-)
7 причин не работать на биржах копирайтинга
Dasha Shkaruba
6
комментариев
0
читателей
Полный профиль
Dasha Shkaruba - Спасибо за мнение! Кстати, на бирже главреда прием анкет закрыт
«Прямая линия» с Артуром Латыповым: отвечаем на вопросы
God Koss
1
комментарий
0
читателей
Полный профиль
God Koss - Добрый день! Есть сайты одной компании продвигающиеся в разных странах. .ru .com .net. На российском сайте два языка ru и en, на остальных до 10 языков. Недавно сайт ru по основному брендовому запросу выпал из выдачи Яндекс но после апа вернулся на вторую позицию. На вопрос аффилирования в тех поддержку, получит ответ, что всё в порядке и сайт com не учавствует в выдаче. Но он есть и занимает 1 место. Как быть в данной ситуации? Так же, после возврата в топ 10 по этому запросу зашла еще одна внутренняя страница. Могло ли это случиться из-за каннибализации запроса? Немного изменил description на внутренней, исключил вхождения брендового запроса. Жду апа. Хотел бы услышать ваше мнение. Заранее благодарю!
Google.ru внесли в реестр запрещенных сайтов
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
314
Комментариев
262
Комментариев
229
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
80
Комментариев
78
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
55
Комментариев
54
Комментариев
52
Комментариев
49

Отправьте отзыв!
Отправьте отзыв!