×
Россия +7 (495) 139-20-33

Поисковые системы научатся отвечать на вопросы

Россия +7 (495) 139-20-33
Шрифт:
2 4337

Группа студентов из университета Карнеги-Мелона разрабатывает проект JAVELIN. Ожидается, что созданная система сможет находить ответы на вопросы различной формулировки, отбирая и комбинируя нужную информацию. Проект JAVELIN направлен на разработку новых способов комбинирования естественного процесса лингвистической обработки информации, машинного перевода, новых технологий с многоязычными системами, реагирующими на различные типы вопросов и выбирающими необходимую поисковую стратегию в зависимости от потребности пользователя. Вместо запроса в виде ключевых фраз, пользователь сможет вводить вопросы любой сложности, начиная с элементарного вопроса «Где находится пустыня Атакама» и заканчивая более сложными, например, «Какова вероятность мирного урегулирования израильско-палестинского конфликта»? Система будет искать документы и ответы на многих языках, а также входить в диалог с пользователем для предоставления максимально релевантных результатов.

Перечислим научные положения проекта:

Реализация проекта JAVELIN - многоуровневая задача, решение которой зависит от типа вопроса, доступности информации, требований пользователя. Именно эти факторы определяют оптимальную QA (Question Answering) стратегию. Предлагается внедрение общей плановой инфраструктуры, которая совмещает в себе анализ модулей, информационные ресурсы, аналитический обзор и синтез ответов, которые необходимы для реализации программы «вопрос-ответ». Поддерживаются разнообразные типы информационных ресурсов (text, html, DBs, KBs).

Путь от полученного вопроса к предоставлению информации представляет собой ряд взаимозависимостей, которые представлены не просто в виде анонимных ссылок, а в виде хранилища обновляемой динамической информации, включающей в себя достоверные источники, различные алгоритмические методы, оценку актуальности той или иной тематики.

Составляющие полезной информации. Любой информации (I) может быть присвоена ценность в зависимости от ее необходимости аналитику (А) с учетом заданного контекста (Т) и вопроса (Q). Показатели полезности информации могут быть использованы для распределения возможных ответов в соответствии с Максимальной Маргинальной Релевантностью.

U = Argmaxk[F(Rel(I,Q,T),Nov(I,T,A),Ver(S,Sup(I,S)),Div(S),Cmp(I,A)),Cst(I,A)]

Все компоненты информации (факты, ссылки и т.д.), образуя ответ, могут классифицироваться по следующим параметрам:

• релевантность по отношению к запрашиваемой информации

• новизна (вероятность того, что аналитик с предлагаемой информацией еще не знаком)

• точность и достоверность информации из конкретного источника

• разнообразие ресурсов

• восприятие информации аналитиком

• временные издержки (время, потраченное аналитиком на восприятие информации

Таким образом, на сложный вопрос «Каковы последствия гражданской войны в Судане», система должна оценить, известно ли аналитику о разделении Судана на южную и северные части , и в этом случае сконцентрироваться на таких последствиях, как массовый голод, беженцы, религиозные репрессии и т.д. Более того, вопрос является достаточно общим, поэтому система предложит ответ, где указаны основные последствия, и предоставит интерактивную обработку информации.

По информации lti.cs.cmu.edu

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Ане Макаровой


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
«Юзабилити-лаборатория»: оставляйте заявку на участие!
Анна Макарова
381
комментарий
0
читателей
Полный профиль
Анна Макарова - Антон, добрый день! Ваш сайт не попал в основную выборку для юзабилити-анализа, но эксперты постараются сделать по вашему сайту видеоразбор (ю-ревью). Будем держать вас в курсе )
Тест по SEO – проверь свой уровень знаний
Артем Дорофеев
8
комментариев
0
читателей
Полный профиль
Артем Дорофеев - Полный текст вопроса со скриншотом панели прикладываю. Итого, что имеем: - на скриншоте отмечено, что это фильтр МПК - сайт коммерческий - рекламы на сайте нет С вероятностью 95% это ошибка (которая уже дважды случалась в Яндексе), когда они случайно "закосили" неповинные сайты. Тогда по запросу Платону фильтр быстренько снимали. Но вопрос даже не на знание этого нюанса. В любой непонятной ситуации, прежде чем что-либо предпринимать (особенно переписывать весь контент на сайте или менять дизайн, как указано в других вариантах) - фильтр следует подтвердить. Правильный ответ: "Написать письмо в техподдержку Яндекса".
Кейс: как за 30 дней вывести новый сайт в ТОП выдачи Google
Сергей
2
комментария
0
читателей
Полный профиль
Сергей - Прошёл у Паши курс год назад, пытался продвигать свой сайт portativ.org.ua, но особых продвижений нет. Наверное сео уже умерло??
Выбираем CMS для сайта с точки зрения SEO: базовые требования
SEO.RU
6
комментариев
0
читателей
Полный профиль
SEO.RU - Спасибо за замечание, действительно была допущена неточность - возможно информация была не так давно обновилась. Данные в статье поправим на актуальные.
Digital-marketing: как выжить в кризис. Опыт реальной компании
Maks
1
комментарий
0
читателей
Полный профиль
Maks - Спасибо за опыт Вашей компании, Иван Папусь. Интересно получилось! Желаю Вашему бизнесу стабильности и успешно пережить все кризисы))
100+ ресурсов по SEO для изучения поисковой оптимизации с нуля
Марина Ибушева
0
комментариев
0
читателей
Полный профиль
Марина Ибушева - Спасибо за добавление. Мы уже работаем над отдельным материалом про курсы, потому что одной статьи мало, чтобы охватить все крутое по обучению)
SEO must go on! Почему в кризис нельзя останавливать продвижение сайта
everystraus
43
комментария
0
читателей
Полный профиль
everystraus - Мы даже варианты не рассматривали. Если проект неустойчив, сразу предлагали сбавить обороты до минимума, но и так, чтоб не свалиться в штопор. Именно по СЕО чаще всего.
Как стандартизировать данные семантики с помощью логарифмов
Юлий
1
комментарий
0
читателей
Полный профиль
Юлий - Чем снималась коммерцелизация?
Вебмастера жалуются на массовое выпадение страниц из индекса Яндекса
Дмитрий Севальнев
113
комментария
0
читателей
Полный профиль
Дмитрий Севальнев - Яна, да, в таком случае события могут быть более чем связаны! Мы в проектах отслеживаем суммы частот по всему ядру. Где-то просадки и правда есть 50%.
Гайд по работе с освобождающимися доменами: перехват, восстановление, создание сетки и заработок
Daniel Dan
1
комментарий
0
читателей
Полный профиль
Daniel Dan - Интересно и полезно читать, Спасибо!
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
381
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
141
Комментариев
121
Комментариев
113
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
89
Комментариев
80
Комментариев
77
Комментариев
67
Комментариев
60
Комментариев
60
Комментариев
59
Комментариев
57

Отправьте отзыв!
Отправьте отзыв!