×
Россия +7 (909) 261-97-71

ИИ-модели от Яндекса и Сбера заняли весь топ в бенчмарке SLAVA

Россия +7 (909) 261-97-71
Шрифт:
0 907
Подпишитесь на нас в Telegram

Российские языковые модели искусственного интеллекта заняли весь топ-6 в бенчмарке SLAVA по соблюдению мировоззренческого суверенитета. Об этом сообщают в пресс-службе Института общественных наук (ИОН) Президентской академии.

Топ выглядит так:

  1. Alice AI LLM (Яндекс),
  2. YandexGPT 5.1 Pro,
  3. GigaChat 2 Max (Сбер),
  4. YandexGPT 5 Pro,
  5. GigaChat 2 Pro
  6. YandexGPT 5 Light.

Первая версия бенчмарка была представлена в ноябре 2024 года, тогда в топ-3 находились американские Anthropic, Open AI и китайская модель Alibaba.

SLAVA (Sociopolitical Landscape and Value Analysis) – это первая комплексная оценка моделей, разработанная экспертами РАНХиГС и ИСП РАН. Тестовый набор включает 14 000 вопросов по истории, обществознанию, политологии, географии и национальной безопасности. Они взяты из официальных баз, разработанных для государственных экзаменов и проверочных работ. Особенность бенчмарка в том, чтобы учитывать чувствительность вопроса. ИИ должен различать, является ли тема спорной или это общепризнанный факт. Так, бенчмарк позволяет оценить не только фактологическую точность, но и соответствие ответов моделей национальным ценностям и мировоззренческим установкам.

В сообщении института говорится:

Высокие результаты в тестировании SLAVA могут трансформировать технологическое лидерство в рыночное. Способность модели корректно работать с национальным контекстом позволяет создавать на ее основе высококонкурентные продукты для ключевых секторов.

Бенчмарк доступен как открытое программное обеспечение. Репозитории опубликованы на GitHub и Hugging Face.

Напомним, за десять месяцев 2025 года совокупный трафик на ИИ-сервисы вырос почти в шесть раз. В топ-3 нейросетей по количеству визитов вошли ChatGPT, Deepseek и GigaChat/

По данным Mediascope, Алиса AI обошла по популярности другие нейросети. Ее выбирают 14,3% жителей России, что в полтора раза больше, чем китайский DeepSeek (9,4%) и значительно больше, чем GigaChat (4%) и ChatGPT (3,5%).

Источник: Ведомости

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Как ИИ усиливает маркетинг и помогает общаться с пользователем
Иван
1
комментарий
0
читателей
Полный профиль
Иван - Классная статья, забрал Хотелось бы услышать еще от эксперта мнение про модели в таком случае и дисперсию
Тренды e-commerce 2026: рынок ждет отток с маркетплейсов?
Арина
1
комментарий
0
читателей
Полный профиль
Арина - Мы пробовали разные сервисы, но уже давно используем этот сервис tryon.mall-er.com у них есть и Визуальный поиск и Виртуальная примерка. Мы пользуемся Виртуальной примеркой очков и поиском и внедрили себе на сайт, сейчас порядка 80% нашего трафика с удовольствием пользуются данными функциями.
SEO-анализ сайта – новый сервис для технического аудита сайта
Олег Алексеев
1
комментарий
0
читателей
Полный профиль
Олег Алексеев - Сюда t.me/obivaaan или сюда t.me/olegalexeyev
Что будет с SEO в 2026: эксперты рынка подводят итоги и делают прогнозы на этот год
Марал Гаипова
142
комментария
0
читателей
Полный профиль
Марал Гаипова - Дмитрий, спасибо, эксперты и правда - топ)
Яндекс Браузер оптимизировал потребление оперативной памяти благодаря ИИ
Гость
1
комментарий
0
читателей
Полный профиль
Гость - На днях поставил Яндекс браузер на старый ноутбук с процессором AMD V140 и памятью 6 Гб. Система оказалась парализована - загрузка ЦП 100%. С другими браузерами: Firefox, Chrome ничего подобного.
GEO-продвижение: гайд повышения видимости бренда (сайта) в нейросетях
Дмитрий Севальнев
128
комментариев
0
читателей
Полный профиль
Дмитрий Севальнев - Вай, кайф!
Конец эпохи Google: AI Mode заменит привычный поиск
Denial
1
комментарий
0
читателей
Полный профиль
Denial - Очередной инфоциган, переписывающий статьи с eu ресурсов Ничего нового
Классические ML-алгоритмы vs. GPT в SEO: сравнение подходов, плюсы и ограничения
Дмитрий Севальнев
128
комментариев
0
читателей
Полный профиль
Дмитрий Севальнев - Монументально!
Битрикс24 запускает бесплатный курс по вайбкодингу для гуманитариев
Ирина
1
комментарий
0
читателей
Полный профиль
Ирина - Хорошее решение для бизнеса
Яндекс Тег Менеджер против Google: обзор, реальный опыт переезда и подводные камни
Иван
12
комментариев
0
читателей
Полный профиль
Иван - Полезно, особенно, алгоритм переноса.
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
393
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
142
Комментариев
128
Комментариев
121
Комментариев
100
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
74
Комментариев
67
Комментариев
66
Комментариев
60
Комментариев
59

Отправьте отзыв!
Отправьте отзыв!