Принцип работы программ для проверки уникальности

Виды контента для современных сайтов и вопросы связанные с его созданием и продвижением.

Принцип работы программ для проверки уникальности

Сообщение Andrews » 31 июл 2012, 06:57

Для проверки уникальности текста я пользуюсь программами "Адвего Плагиатус" и "Etxt Антиплагиат". Работают они вроде бы неплохо, но до сих пор для меня непонятно по каким именно принципам эти программы вычисляют уникальность. Например, некоторые устоявшиеся речевые обороты эти программы принимают за уникальные, хотя, очевидно, что уникальными они быть не могут. У меня есть версия, что программа, анализируя ключевые слова, определяет тематику статьи и в дальнейшем производит поиск совпадений только среди статей той же тематики. Так ли это?
Аватар пользователя
Andrews
Студент
 
Сообщений: 96
Зарегистрирован: 11 июл 2012, 09:44

Re: Принцип работы программ для проверки уникальности

Сообщение Татьяна » 31 июл 2012, 08:54

Принцип программы прост, он образует следующую цепочку: текст – предложение – ключевые слова, описываемой темы – устойчивые речевые обороты – стоп-слова. Проверка уникальности происходит по такому принципу: чем меньше цепочек слов из вашего текста совпадает с уже имеющимися цепочками слов в интернете, тем соответственно выше уникальность текста. В процессе проверки уникальности программа из этой цепочки обращает внимание в первую очередь на ключевые слова и устойчивые речевые обороты. При использовании распространенных выражений русской речи программа может оценить уникальный по смыслу текст, как плагиат.
Татьяна
Интересующийся
 
Сообщений: 138
Зарегистрирован: 03 май 2012, 10:04
Откуда: Харьков

Re: Принцип работы программ для проверки уникальности

Сообщение maidok » 01 авг 2012, 11:33

Насчет принципа работы программ для проверки уникальности в целом согласен с Татьяной. Что касается уникальности устоявшихся речевых оборотов, то тут возможно дело в настройках программы. В Адвего плагиатусе уникальность текста от этого сильно зависит. Там можно регулировать размер шингла и размер фразы. Если установлены стандартные значения – 5 и 6, то уникальность может быть 100%, а если установлены более жесткие параметры 4 и 5, то у того же текста уникальность может быть 70%. Еще в Адвего плагиатусе можно запускать глубокую проверку текста или обычную.
Аватар пользователя
maidok
Продвинутый Юзер
 
Сообщений: 321
Зарегистрирован: 10 апр 2012, 12:03

Re: Принцип работы программ для проверки уникальности

Сообщение yuliyaskiba » 01 авг 2012, 12:18

Могу сказать только одно: если один и тот же текст проверять разными программами, то результат может быть совершенно разным. Тут вся проблема в настройках программы. А принцип работы таких программ очень прост. Программа проверяет интернет-адреса на предмет совпадения фраз, состоящих из определенного количества слов. Найденные совпадения и есть не уникальность. Секретом не является то, что чем больше текст, тем выше уникальность. Ничего удивительного в этом нет. Поэтому лучше выставлять самые жесткие настройки и проверять тексты.
Аватар пользователя
yuliyaskiba
Продвинутый Юзер
 
Сообщений: 722
Зарегистрирован: 01 май 2012, 11:37

Re: Принцип работы программ для проверки уникальности

Сообщение Vendy » 10 авг 2012, 14:25

Какой процент в тексте занимают заведомо не уникальные устойчивые словосочетания? Согласитесь, небольшой, к тому же они крайне редко являются ключевыми словами, потому и погоды не делают, что в принципе справедливо.
Единственное, что мне не нравится в программах проверки уникальности, так это то, что в процессе проверки они лазят где попало и притаскивают вирусы. Адвего Плагиатус когда-нибудь антивирусник с ума сведёт, писк только и слышен.
Кто знает, как его настроить, по одному добавлять ссылки на сайты с вирусами или есть более простой способ?
Vendy
Чайник
 
Сообщений: 17
Зарегистрирован: 31 май 2012, 08:41


Вернуться в Контент

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2

cron