Поисковые системы научатся отвечать на вопросы

Россия+7 (495) 960-65-87
Шрифт:
2 1660

Группа студентов из университета Карнеги-Мелона разрабатывает проект JAVELIN. Ожидается, что созданная система сможет находить ответы на вопросы различной формулировки, отбирая и комбинируя нужную информацию. Проект JAVELIN направлен на разработку новых способов комбинирования естественного процесса лингвистической обработки информации, машинного перевода, новых технологий с многоязычными системами, реагирующими на различные типы вопросов и выбирающими необходимую поисковую стратегию в зависимости от потребности пользователя. Вместо запроса в виде ключевых фраз, пользователь сможет вводить вопросы любой сложности, начиная с элементарного вопроса «Где находится пустыня Атакама» и заканчивая более сложными, например, «Какова вероятность мирного урегулирования израильско-палестинского конфликта»? Система будет искать документы и ответы на многих языках, а также входить в диалог с пользователем для предоставления максимально релевантных результатов.

Перечислим научные положения проекта:

Реализация проекта JAVELIN - многоуровневая задача, решение которой зависит от типа вопроса, доступности информации, требований пользователя. Именно эти факторы определяют оптимальную QA (Question Answering) стратегию. Предлагается внедрение общей плановой инфраструктуры, которая совмещает в себе анализ модулей, информационные ресурсы, аналитический обзор и синтез ответов, которые необходимы для реализации программы «вопрос-ответ». Поддерживаются разнообразные типы информационных ресурсов (text, html, DBs, KBs).

Путь от полученного вопроса к предоставлению информации представляет собой ряд взаимозависимостей, которые представлены не просто в виде анонимных ссылок, а в виде хранилища обновляемой динамической информации, включающей в себя достоверные источники, различные алгоритмические методы, оценку актуальности той или иной тематики.

Составляющие полезной информации. Любой информации (I) может быть присвоена ценность в зависимости от ее необходимости аналитику (А) с учетом заданного контекста (Т) и вопроса (Q). Показатели полезности информации могут быть использованы для распределения возможных ответов в соответствии с Максимальной Маргинальной Релевантностью.

U = Argmaxk[F(Rel(I,Q,T),Nov(I,T,A),Ver(S,Sup(I,S)),Div(S),Cmp(I,A)),Cst(I,A)]

Все компоненты информации (факты, ссылки и т.д.), образуя ответ, могут классифицироваться по следующим параметрам:

•релевантность по отношению к запрашиваемой информации

•новизна (вероятность того, что аналитик с предлагаемой информацией еще не знаком)

•точность и достоверность информации из конкретного источника

•разнообразие ресурсов

•восприятие информации аналитиком

•временные издержки (время, потраченное аналитиком на восприятие информации

Таким образом, на сложный вопрос «Каковы последствия гражданской войны в Судане», система должна оценить, известно ли аналитику о разделении Судана на южную и северные части , и в этом случае сконцентрироваться на таких последствиях, как массовый голод, беженцы, религиозные репрессии и т.д. Более того, вопрос является достаточно общим, поэтому система предложит ответ, где указаны основные последствия, и предоставит интерактивную обработку информации.

По информации lti.cs.cmu.edu

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
SEOnews и Serpstat запускают конкурс для интернет-маркетологов
Marina Lagutina
1
комментарий
0
читателей
Полный профиль
Marina Lagutina - Добрый день! Видимо я из тех, кто пытается последней вскочить в уходящий поезд. Ночью написала статью на тему "обзор инструментов контент-маркетинга". Своего блога нет. Отправила вам не мейл. Я еще могу у вас разместиться или искать, кто возьмет статью к себе в блог?
«Я оптимизировал сайт, а он не в ТОП! Что делать?»
Павел Горбунов
7
комментариев
0
читателей
Полный профиль
Павел Горбунов - Как можно в инструменте tools.pixelplus.ru/tools/text-natural сравнить текст со страницы конкурента и со своей страницы? Я вижу возможность только для проверки одного урла.
Монетизация сайта. Как, когда, сколько?
Гость2
1
комментарий
0
читателей
Полный профиль
Гость2 - Руслан! Спасибо за ваш сервис и за данную статью в частности! С апреля являюсь вашим пользователем - очень доволен как сервисом, так и уровнем заработка! Еще раз спасибо, удачи вашему проекту!
Влияние HTTPS на ранжирование региональных поддоменов в Яндексе
Екатерина Иванова
1
комментарий
0
читателей
Полный профиль
Екатерина Иванова - Посмотрите на сколько упал трафик и на сколько потом вырос:упал на 10-20% на 1 месяц, а вырос в итоге в 5 раз. Одним мартовским трафиком всё падение перекрыли. Или можно ждать Яндекс неопределённое количество времени со стартовым уровнем трафика. Упущенные возможности и всё-такое.
Мир глазами поисковых систем
Александр Рунов
7
комментариев
0
читателей
Полный профиль
Александр Рунов - Какой регион, если не секрет? В Мск, в ряде ВК тематик (в тех же "окнах" или "колесах"), без работы с внешними факторами по ВЧ запросам в ТОП не выплывешь. Хотя в большинстве направлений вполне реально.
Google.ru внесли в реестр запрещенных сайтов
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Гон, все работает и будет работать. Да и пусть банят, будет как с рутрекером.
День рождения SEOnews: 12 лет в эфире!
Анна Макарова
308
комментариев
0
читателей
Полный профиль
Анна Макарова - Ура )
7 причин не работать на биржах копирайтинга
Dasha Shkaruba
6
комментариев
0
читателей
Полный профиль
Dasha Shkaruba - Спасибо за мнение! Кстати, на бирже главреда прием анкет закрыт
Инфографика: самые распространенные SEO-ошибки Рунета
Alex Wise
3
комментария
0
читателей
Полный профиль
Alex Wise - Спасибо, Женя, за рекомендацию! :) Андрей, чтобы понять, какой программой пользоваться, нужно сделать несколько вещей: 1. Попробовать обе: у нас в Netpeak Spider бесплатный триал на 14 дней с полным функционало; у SFSS до 500 URL всегда бесплатно, но с ограниченным функционалом. 2. Понять свой стиль работы – если вы любите полный контроль и из-за этого более высокую скорость пробивки, тогда выбирайте Netpeak Spider. Если для вас не так важна скорость и количество пробитых URL, то можно остановиться на SFSS. 3. Определиться с нужными функциями: их в обоих программах очень много и как в Netpeak Spider есть уникальные, так и в SFSS есть свои уникальные. Мы всегда ориентируемся на то, чтобы быстро и чётко показать ошибки – для этого у нас вся таблица красится в соответствующие цвета. Думайте!) И, если что, обращайтесь с вопросами – мы будем рады помочь!)
Интеграция call tracking и CRM: углубленный анализ данных о звонках и продажах
Денис
2
комментария
0
читателей
Полный профиль
Денис - Какой смысл вообще в облачных CRM, обрезанный фугкционал, свое дописать невозможно, слив клиентов другим компаниям. Серверные бесплатные CRM куда надежней и кастамизируй как хочешь.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
308
Комментариев
262
Комментариев
224
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
55
Комментариев
53
Комментариев
52
Комментариев
46

Отправьте отзыв!
Отправьте отзыв!