teleastro

Поисковые системы научатся отвечать на вопросы

Россия+7 (495) 960-65-87
Шрифт:
2 2061

Группа студентов из университета Карнеги-Мелона разрабатывает проект JAVELIN. Ожидается, что созданная система сможет находить ответы на вопросы различной формулировки, отбирая и комбинируя нужную информацию. Проект JAVELIN направлен на разработку новых способов комбинирования естественного процесса лингвистической обработки информации, машинного перевода, новых технологий с многоязычными системами, реагирующими на различные типы вопросов и выбирающими необходимую поисковую стратегию в зависимости от потребности пользователя. Вместо запроса в виде ключевых фраз, пользователь сможет вводить вопросы любой сложности, начиная с элементарного вопроса «Где находится пустыня Атакама» и заканчивая более сложными, например, «Какова вероятность мирного урегулирования израильско-палестинского конфликта»? Система будет искать документы и ответы на многих языках, а также входить в диалог с пользователем для предоставления максимально релевантных результатов.

Перечислим научные положения проекта:

Реализация проекта JAVELIN - многоуровневая задача, решение которой зависит от типа вопроса, доступности информации, требований пользователя. Именно эти факторы определяют оптимальную QA (Question Answering) стратегию. Предлагается внедрение общей плановой инфраструктуры, которая совмещает в себе анализ модулей, информационные ресурсы, аналитический обзор и синтез ответов, которые необходимы для реализации программы «вопрос-ответ». Поддерживаются разнообразные типы информационных ресурсов (text, html, DBs, KBs).

Путь от полученного вопроса к предоставлению информации представляет собой ряд взаимозависимостей, которые представлены не просто в виде анонимных ссылок, а в виде хранилища обновляемой динамической информации, включающей в себя достоверные источники, различные алгоритмические методы, оценку актуальности той или иной тематики.

Составляющие полезной информации. Любой информации (I) может быть присвоена ценность в зависимости от ее необходимости аналитику (А) с учетом заданного контекста (Т) и вопроса (Q). Показатели полезности информации могут быть использованы для распределения возможных ответов в соответствии с Максимальной Маргинальной Релевантностью.

U = Argmaxk[F(Rel(I,Q,T),Nov(I,T,A),Ver(S,Sup(I,S)),Div(S),Cmp(I,A)),Cst(I,A)]

Все компоненты информации (факты, ссылки и т.д.), образуя ответ, могут классифицироваться по следующим параметрам:

•релевантность по отношению к запрашиваемой информации

•новизна (вероятность того, что аналитик с предлагаемой информацией еще не знаком)

•точность и достоверность информации из конкретного источника

•разнообразие ресурсов

•восприятие информации аналитиком

•временные издержки (время, потраченное аналитиком на восприятие информации

Таким образом, на сложный вопрос «Каковы последствия гражданской войны в Судане», система должна оценить, известно ли аналитику о разделении Судана на южную и северные части , и в этом случае сконцентрироваться на таких последствиях, как массовый голод, беженцы, религиозные репрессии и т.д. Более того, вопрос является достаточно общим, поэтому система предложит ответ, где указаны основные последствия, и предоставит интерактивную обработку информации.

По информации lti.cs.cmu.edu

Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Кейс: как продвинуть сайт производителя мебели на заказ в Москве
Art Moderator
2
комментария
0
читателей
Полный профиль
Art Moderator -
32 инструмента в помощь SEO-специалисту
clark
3
комментария
0
читателей
Полный профиль
clark - Я - г-н Марк Джо из корпорации corp, мы являемся законной, зарегистрированной и гарантированной кредитной компанией, мы предоставляем 3% -ые кредиты частным лицам, компаниям, государственным учреждениям и деловым организациям и людям всех родов. Свободные кредиты - это решение всех ваших финансовых проблем. свяжитесь с нами по электронной почте: mjoe0123@gmail.com
Исследование: влияние smart-ссылок на продвижение по СЧ-запросам
Анатолий Шевчик
1
комментарий
0
читателей
Полный профиль
Анатолий Шевчик - +1097988
Контекст под SEO. Как поисковая реклама помогает позициям в органической выдаче
Сергей Дембицкий «Sima-Land.ru»
22
комментария
0
читателей
Полный профиль
Сергей Дембицкий «Sima-Land.ru» - Боже мой, неужели SEO-маги вернулись??? Открыть в роботс utm-метки для индексации и наплодить дублей...что? А расчеты в конце статьи про бюджет на SEO и контекст...откуда эти пропорции? Как по мне, SEO-магия вне Хогвартс. Спасибо, развеселили!
Все, что нужно SEO-специалисту. Обзор инструментов
Администратор Сайта
1
комментарий
1
читатель
Полный профиль
Администратор Сайта - Шаришь в seo! Сервис реально хороший
Два идеальных способа разориться на старте интернет-магазина
Стас
4
комментария
0
читателей
Полный профиль
Стас - Seonews в последнее время такую чушь несет! Где вы таких афторов находите? Статья ничего не стоит и несет чушь! Кто хоть немного понимает в этом так вам и скажет, и такие де комментаторы горе-сеошники, просто смешно читать, вы хоть модерируете ваши статьи или просто для воды на сайте?! Бред сивой кобылы эта статья до самой последней точки!!!
4 способа быстро собрать теги для сайта
Рустем Низамутинов
5
комментариев
0
читателей
Полный профиль
Рустем Низамутинов - Расписал и закинул в Google Docs, а то здесь в комментариях ссылки на активны. docs.google.com/document/d/1r0TZLNrQyYLdIzDQsD5YKlMG41HUGQgEep3bxE_ij-M/edit?usp=sharing
Яндекс перестал индексировать сайты, созданные на Wix
Константин Даткунас
3
комментария
0
читателей
Полный профиль
Константин Даткунас - Было бы интересно посмотреть саму выборку из 10 000 и методику анализа.
Яндекс: как мы модерируем объявления
Гость
5
комментариев
0
читателей
Полный профиль
Гость - Это ж Яндекс, чего вы ожидали-то? Коммерческая структура с раздутым штатом, задачей которой является заработать больше денег. Любыми методами. Задача всех пользователей посадить на Директ, даже если придется разрушить суть рунета, реализуется по полной программе. Все возражающие караются и выпиливаются. И каждый из сотрудников делает все возможное и невозможное, чтобы реализовать любую дурацкую идею - за это еще и премию выхватить можно. Даже если потом придется выполнять "откат", премиальные уже заплачены. Так было с одним из фильтров Яндекса, так было с купленным им сайтом Кинопоиска, который из русскоязычной энциклопедии кино был превращен за безумные деньги в банальный платный онлайн-кинотеатр.
Как мы разработали и вывели в ТОП сайт курсов рисования
Иван Стороженко
23
комментария
0
читателей
Полный профиль
Иван Стороженко - Добрый день. 1)Чаще всего основная проблема заключается, в согласовании с клиентом добавляемого контента и то как он будет отображаться. На данном сайте фото и услуги конечно предоставлял клиент, все остальное уже делали мы. 2)Да в принципе, когда есть команда и понимание, что нужно делать, все идет быстро (опять же основная заминка идет на согласовании с клиентом) 3)Смысла делать новый в данном случает нет. В принципе доделывался полноценный сайт. 4)Когда клиент уже не предоставляет информацию, приходится искать у конкурентов (например с других стран или регионов). Но чаще всего клиент, хоть что-то "подкидывает".
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
325
Комментариев
262
Комментариев
234
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
97
Комментариев
97
Комментариев
95
Комментариев
86
Комментариев
80
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55
Комментариев
54
Комментариев
53

Отправьте отзыв!
Отправьте отзыв!