Поисковые системы Вебмастерам Google Клиентам Чилаут Яндекс Исследования Сервисы SEO Интернет-реклама Контекстная реклама Социалки Блоги Пресс-релизы Yahoo Сделки Конференции Microsoft Финансы Бегун Конкурсы Ссылки Рамблер Поиск Статистика больше
Реклама на сайте
Рекламные ссылки
Колдунщик умер, да здравствует колдун!
05.12.07 | 03:07
. Новый «персонаж» вывел в свет руководитель отдела продвижения РА MIRALAB Михаил Райцин. Знакомство состоялось накануне на SE-форуме, где новичку был оказан весьма теплый прием.

Сервис Miratools.ru, первой ласточкой которого стал инструмент для проверки весов слов, с таким близким сердцу названием – koldun, задумывался как собрание уникальных сервисов для SEO-специалистов. «В основу легли алгоритмы, разработанные нами для внедрения во внутренние системы поисковой аналитики», - говорит Михаил. Проверку бэклинков планируется запустить к концу декабря.

Всех тонкостей работы koldun создатели не раскрывают, но отмечают, что веса слов берутся из собственной базы, объем которой порядка 210 000 слов, а при проверке весов используется расчет по кворуму. Слова, которых нет в базе, ставятся в очередь - раз в сутки обрабатывается 1 000 новых слов. Но произошло форс-мажорное обстоятельство, по словам Михаила, «кто-то "скормил" сервису базу на 90 000 слов, из-за чего проверка затянулась. Мы не предусмотрели, что кто-то захочет прогнать собственные базы, используя наш сервис. Меры уже приняли, такого больше не повторится! Базу обновим к концу недели».

Колдунщик умер, да здравствует колдун!

Точность и полноту алгоритма расчета весов разработчики Miratools.ru оценивают на 100%. Некоторая погрешность в расчете базы может появиться только в результате сбоя программного обеспечения или сбоев в выдаче Яндекса. База будет периодически обновляться и проверяться на соответствие реальным весам.

Дмитрий Рузанов, аналитик-проектировщик компании Ингейт, не только подтверждает, что сервис в точности определяет веса слов, но и пытается проанализировать сам процесс:

«Скорее всего, такая точность достигается путем вычисления весов через формулу кворума. Т.е. решается обратная задача: задают Яндексу запрос из нескольких слов, где для всех слов, кроме искомого, заданы в явном виде веса (например, хочу::1000 & посчитать::10000 & вес). Далее, манипулируя весами других слов, ищут пороговую величину кворума, т.е. когда выдача по запросу присутствует, и когда в выдаче нет ни одного сайта.

Может быть, задача решается несколько иначе. Например, есть много-много текстов. По ним составляется обратный индекс. Для ряда слов уже известны веса. Тогда по обратному индексу определяется отношение частоты искомого слова и уже известного слова. Через пропорцию вычисляют вес искомого слова во всей коллекции документов. Потом уже более точно подбирают через формулу кворума.

Может, также используют значение количества сайтов в выдаче по запросу. Но все равно, как мне кажется, последняя стадия - это проверка непосредственно через сам кворум и выдачу Яндекса
».

Однако у Дмитрия есть опасения, если Яндекс прикроет возможность задавать веса слов непосредственно в запросе, то данный сервис потеряет значительно в точности. «Хотя создатели сервиса набрали достаточную базу по весам слов. В общем, в любом случае они молодцы!».

25 комментариев
Miha Kuzmin | 05.12.07 | 15:46
Аналитик ингейта похоже бредит. Лечить надо. Это раз. Второе - веса слов - это далеко не замена выводимого запроса колдунщика. Самое интересное в контекстных ограничениях.
Гость | 05.12.07 | 16:03
Миша, а когда ты хоть что-то внятно прокомментируешь, без "лечить надо" и мата? Может тебе всё-таки стоило получить высшее образование хотя бы для того, чтобы научиться нормально изъясняться в приличном обществе?
Miha Kuzmin | 05.12.07 | 16:04
Господин онаним, разрешите вас культурно и со всем уважением послать [цензура] :)
Гость | 05.12.07 | 16:12
"[цензура]" пишется раздельно. "на" - это предлог. школу тоже не посещали... :)
Гость | 05.12.07 | 16:14
Кузьмин совершенно прав - самое вкусное - это как раз ограничения. А вот сервис по их определению мы выкладывать в паблик не будем.
Miha Kuzmin | 05.12.07 | 16:18
Кузьмин совершенно прав - самое вкусное - это как раз ограничения. А вот сервис по их определению мы выкладывать в паблик не будем.

Ты и этот зря выложил, к слову :)

Онаним, продолжай онани... Жечь, в плане! :)))
Гость | 05.12.07 | 16:20
Миш, возможно.
Но там есть мой интерес, поэтому выложили.
Гость | 05.12.07 | 17:17
Неясно только, кто же новичок, Михаил или Колдун? =)
Miha Kuzmin | 05.12.07 | 17:25
Яндекс :)
Чернева Светлана | 05.12.07 | 18:48
Колдунщик, колдун... оказывается о нём (колдунщике) в пору его существования никто и не знал, причём не знали люди, продвигающие сайты, да и сейчас спрашивают "что это такое".

>>Неясно только, кто же новичок, Михаил или Колдун?
>>Яндекс
Бедный Яндекс - везде ему достаётся :)
Гость | 06.12.07 | 00:00
Кто-то удивиться, но знал и раньше, но не пользовал. Смысла большого мне так никто и не смог объяснить в этом.
Сахно Олег | 06.12.07 | 10:45
А смысл был :)
Рузанов Дмитрий | 06.12.07 | 11:09
Аналитик ингейта похоже бредит. Лечить надо. Это раз.

Лекарство есть, великий критик из bdbd?
Вы как всегда - посрались и ушли...
Miha Kuzmin | 06.12.07 | 14:08
Есть. Начать с учебника русского языка.

p.s. раз уж великий, исполни 10 раз ку :)
Чернева Светлана | 06.12.07 | 15:10
Кто-то удивиться, но знал и раньше, но не пользовал. Смысла большого мне так никто и не смог объяснить в этом.

Давай я объясню :) что тебе объяснить?
Miha Kuzmin | 07.12.07 | 09:09
Давай мне обьяснишь :) Что мне обьяснишь?
Чернева Светлана | 07.12.07 | 11:56
Давай мне обьяснишь :) Что мне обьяснишь?

Про колдунщика ты и без моих объяснений знаешь всё :)
Гость | 30.05.08 | 15:50
как выбирать другие слова при манипулировании их весами в запросе (хочу::10 & посчитать::10 & вес)//6
?
Рузанов Дмитрий | 30.05.08 | 16:30
Блин, давно это было...
Но стратегия вроде бы следующая
Хотим проверить вес слова "seo"
Берем фразу (hfghfewhf::1 & ertert::1 seo)//6 - по этому запросу в выдаче есть сайты, т.к. при малых значениях весов первых двух слов одного слова seo достаточно для прохождения кворума. Увеличиваем веса первых двух слов... ну и т.д.
Пришли в следующему:
(hfghfewhf::795 & ertert::410 seo)//6 - в выдаче есть сайты
(hfghfewhf::795 & ertert::411 seo)//6 - в выдаче нет сайтов

Через формулу кворума пересчитываем, что вес слов seo около 120000
Для повышения точности надо брать больше двух слов
------------------------
Это первая стратегия, которая приходит на ум.
Не знаю, может Михаил Райцин использует корпус документов, по которым считает IDF.
Novichek | 02.06.08 | 15:25
по формуле получается, что
seo^0,3798=(1-0,06^(1/sqrt(2)))*(seo^0,3798+795^0,3798+411^0,3798).
Решая уравнение, относительно seo, получаем вес seo=462689.
Откуда ~120000 ??
Рузанов Дмитрий | 02.06.08 | 16:29
по формуле получается, что
seo^0,3798=(1-0,06^(1/sqrt(2)))*(seo^0,3798+795^0,3798+411^0,3798).
Решая уравнение, относительно seo, получаем вес seo=462689.
Откуда ~120000 ??

Да, по формуле действительно так. Поспешил )
Проверил на реальной выдаче - получается вообще другое - порог вот такой (hfghfewhf::795 & ertert::411 seo::83725)//6
т.е. вес слова seo - 83725
Подставив в формулу кворума получаем, что значение степени должно измениться с 0,3798 до 0.5113
Если манипулировать мягкостью и весами других слов, то вроде бы выдача меняется, т.е. эти операторы - рабочие. Соответственно, скорее всего изменился вид формулы.

-------------------------
А вообще интересно, надо будет на досуге заняться
Novichek | 02.06.08 | 16:39
Вот-вот. с магадном с кворумом что-то нахимичили.
Рузанов Дмитрий | 02.06.08 | 16:47
Так, небольшая ошибка - запрос я задавал без второго &
Со вторым амперсантом вроде все ок, если не считать того, что вылазят только записи с блогов
Novichek | 02.06.08 | 17:08
вероятно формула верна только для блогов и не факт, что там присутствуют только статические параметры..
(hfghfewhf::101 & ertert::92 & seo::77001)//6 - граничные значения.
(hfghfewhf::795 & ertert::411 & seo::461071)//6 - граничные значения.
Рузанов Дмитрий | 02.06.08 | 17:09
Ну в общем вывод - точно есть изменения, а какие - это надо искать

Добавить комментарий
Гость | Сегодня
Ваше имя:
Текст на
картинке
Расширенный ответ
Анонс

SEMonline исполнилось два года!


Всего на сайте
6638    пользователей
7031 материал
9434 сообщения на форуме
Спонсоры и партнеры SEOnews
Трастовые СМИ-площадки под статьи

Трастовые СМИ-площадки под статьи

Поисковое продвижение сайтов: новейшие технологии, эффективные стратегии
Поисковая оптимизация и продвижение сайтов в Интернете 2010 ЦОП РСЯ Profit-Partner

Информационные партнеры
При использовании материалов сайта ссылка на сайт обязательна. Приглашаем авторов!
Rambler's Top100
2005-2010 Seonews.ru: новости поисковых систем, раскрутка сайта, продвижение сайта в интернете
и оптимизация сайта.
Сайт работает на системе
«1С-Битрикс: Управление сайтом»
Техническая реализация:
«Профессиональный подход»
Карта сайта
RSS