×
Россия +7 (495) 960-65-87

Поисковые системы научатся отвечать на вопросы

Россия +7 (495) 960-65-87
SEOnews
Шрифт:
2 4037

Группа студентов из университета Карнеги-Мелона разрабатывает проект JAVELIN. Ожидается, что созданная система сможет находить ответы на вопросы различной формулировки, отбирая и комбинируя нужную информацию. Проект JAVELIN направлен на разработку новых способов комбинирования естественного процесса лингвистической обработки информации, машинного перевода, новых технологий с многоязычными системами, реагирующими на различные типы вопросов и выбирающими необходимую поисковую стратегию в зависимости от потребности пользователя. Вместо запроса в виде ключевых фраз, пользователь сможет вводить вопросы любой сложности, начиная с элементарного вопроса «Где находится пустыня Атакама» и заканчивая более сложными, например, «Какова вероятность мирного урегулирования израильско-палестинского конфликта»? Система будет искать документы и ответы на многих языках, а также входить в диалог с пользователем для предоставления максимально релевантных результатов.

Перечислим научные положения проекта:

Реализация проекта JAVELIN - многоуровневая задача, решение которой зависит от типа вопроса, доступности информации, требований пользователя. Именно эти факторы определяют оптимальную QA (Question Answering) стратегию. Предлагается внедрение общей плановой инфраструктуры, которая совмещает в себе анализ модулей, информационные ресурсы, аналитический обзор и синтез ответов, которые необходимы для реализации программы «вопрос-ответ». Поддерживаются разнообразные типы информационных ресурсов (text, html, DBs, KBs).

Путь от полученного вопроса к предоставлению информации представляет собой ряд взаимозависимостей, которые представлены не просто в виде анонимных ссылок, а в виде хранилища обновляемой динамической информации, включающей в себя достоверные источники, различные алгоритмические методы, оценку актуальности той или иной тематики.

Составляющие полезной информации. Любой информации (I) может быть присвоена ценность в зависимости от ее необходимости аналитику (А) с учетом заданного контекста (Т) и вопроса (Q). Показатели полезности информации могут быть использованы для распределения возможных ответов в соответствии с Максимальной Маргинальной Релевантностью.

U = Argmaxk[F(Rel(I,Q,T),Nov(I,T,A),Ver(S,Sup(I,S)),Div(S),Cmp(I,A)),Cst(I,A)]

Все компоненты информации (факты, ссылки и т.д.), образуя ответ, могут классифицироваться по следующим параметрам:

• релевантность по отношению к запрашиваемой информации

• новизна (вероятность того, что аналитик с предлагаемой информацией еще не знаком)

• точность и достоверность информации из конкретного источника

• разнообразие ресурсов

• восприятие информации аналитиком

• временные издержки (время, потраченное аналитиком на восприятие информации

Таким образом, на сложный вопрос «Каковы последствия гражданской войны в Судане», система должна оценить, известно ли аналитику о разделении Судана на южную и северные части , и в этом случае сконцентрироваться на таких последствиях, как массовый голод, беженцы, религиозные репрессии и т.д. Более того, вопрос является достаточно общим, поэтому система предложит ответ, где указаны основные последствия, и предоставит интерактивную обработку информации.

По информации lti.cs.cmu.edu

(Голосов: 5, Рейтинг: 5)
Читайте нас в Telegram - digital_bar

Есть о чем рассказать? Тогда присылайте свои материалы Даше Калинской


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
#SEOnews14: мы празднуем – вы получаете подарки!
Анна Макарова
358
комментариев
0
читателей
Полный профиль
Анна Макарова - Гость, добрый день! С победителями мы связывались сразу после розыгрыша. Если мы вам не написали, значит, ваш номер не выпал. Но не расстраивайтесь, у нас обязательно будут новые розыгрыши!
Google Data Studio: делаем красивые отчеты по контекстной рекламе для клиентов
Светлана Зубрицкая
1
комментарий
0
читателей
Полный профиль
Светлана Зубрицкая - Нужно убрать пробелы между строк и заменить кавычки на вот такие "
Как ускорить сайт на WordPress, чтобы получить 100/100 в Google PageSpeed Insights
Георгий
1
комментарий
0
читателей
Полный профиль
Георгий - Все что рекомендуется в этой статье есть у w.tools. Ни разу не пожалел что подключился. Своя CDN сеть, кеш статики и динамики, минификация js\css и кешируемого html, оптимизация всех типов картинок и еще куча всего полезного. Сайт летает и я не знаю проблем. Могу рекомендовать от души.
Война с дубликатами. Как нужно и как не нужно канонизировать URL
Ann Yaroshenko
5
комментариев
0
читателей
Полный профиль
Ann Yaroshenko - Дмитрий, добрый день! Если вы проставили на странице с автозапчастями rel=canonical ( а я вижу в коде, что не проставили) или в HTTP хедере, то бот, как правило: выберит ту страницу главной, которую вы указали в rel=canonical ссылке. Eсли же вы этого не сделали, то бот сам выберит оригинал (алгоритмы, по которым бот это делает, скрыты Googl-ом)
От мечты стать юристом к собственному SMM-агентству. Как найти себя в современном цифровом мире
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Статья выглядит, как резюме студента - когда рассказать нечего, рассказываешь все подряд: "а потом я школу закончил, о жизни, о том, о сем..." Удачи, конечно, ребята, вам! Но, видимо, гранит науки ещё грызть и грызть, опыт нарабатывать и нарабатывать... Дерзайте.
«Аудит, чтобы ты заплакала…», или Что делать, когда получил сторонний аудит сайта
Trydogolik
12
комментариев
0
читателей
Полный профиль
Trydogolik - Да. К сожалению рекламодатели и прочие владельцы сайтов оценивают работу количеством заказов. Как SEO, где результат это позиции, а рекламу где результат это целевой трафик, оценивать количеством конверсий на сайте? Не понятно. Все что в наших силах это рекомендовать владельцу сайта, но не править на свое усмотрение.
BDD 2019: Как перестать убивать время на сбор и обработку тонны данных для SEO-аудита
Feth
1
комментарий
0
читателей
Полный профиль
Feth - Тот момент, когда от статьи в интернете получаешь больше полезных знаний и навыков, чем от своего начальства. По статьям нетпиковцев можно учебник про SEO уже сшивать, ребята молодцы. Спасибо, что делитесь информацией.
10 элементов сайта, которые гарантированно отпугнут посетителей
Андрей
2
комментария
0
читателей
Полный профиль
Андрей - Ну типа потому что клиентское seo больше для коммерции предназначено. Типа контентники и сами знают что делать. В коммерции можно тысячу причин найти чтобы поработать с сайтом, а с контентными такие фокусы уже не прокатят, поэтому и не пишут. Всё продвижение для контентников сеошники описывают в трех словах: скорость, качество, систематичность. А, ну ещё конечно же СЯ, как же я про него забыл (фундамент жеть!).
Как вывести сайт в ТОП 10 Google в 2019 году
Анна Макарова
358
комментариев
0
читателей
Полный профиль
Анна Макарова - Сергей, в нашей отрасли много заимствований из английского, иногда с ними быстрее, проще .Но будем стараться ))
Как я пытался купить CRM-систему, но мне ее поленились продать
Kristina
1
комментарий
0
читателей
Полный профиль
Kristina - Очень рекомендую CRM-систему польской фирмы Firmao. Все функции настраиваются в соответствии с индивидуальным потребностям компании! Советую попробовать бесплатную демо-версию, чтобы попробовать все необходимые функции, без лишних кнопок и траты дополнительных финансов! :) Сайт: firmao.ru/info
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
373
Комментариев
358
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
137
Комментариев
121
Комментариев
106
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
73
Комментариев
67
Комментариев
60
Комментариев
59
Комментариев
57
Комментариев
55

Отправьте отзыв!
Отправьте отзыв!