×
Россия +7 (909) 261-97-71

Сбер опубликовал первую в России диффузионную большую языковую модель GFusion

Россия +7 (909) 261-97-71
Шрифт:
0 1
Подпишитесь на нас в MAX

Исследователи из Сбера разработали и опубликовали первую в России большую языковую модель GFusion. Ее работа основывается на тех же принципах, которые используются диффузионными нейросетями для генерации изображений и роликов. Этот подход ускорил написание текстов на 45% по сравнению с классической большой языковой моделью, на базе которой обучался новый ИИ.

Даниил Тихонов, инженер Сбера:

Диффузионные модели лучше структурируют ответы и могут самостоятельно выбирать порядок его написания, а не генерировать его последовательно. По сравнению с классическими моделями они также более эффективно используют ограниченный объем данных при обучении. Это пока во многом открытое направление – устоявшихся архитектурных стандартов здесь меньше, что дает больше пространства для собственных решений.

Как объясняет Даниил Тихонов, существующие большие языковые модели генерируют текст последовательно, слово за словом, что вынуждает модель переписывать весь ответ заново, если она находит какую-то ошибку в уже сгенерированном тексте. В отличие от этого, диффузионные нейросети, часто применяемые для генерации изображений и видео, создают приблизительный «набросок» ответа, а затем пошагово дорабатывают его.

Также у этого подхода есть и другие преимущества:

  • позволяет более гибко генерировать «блоки» ответов и вырабатывать их не по одному, а пачками;
  • диффузионные модели способны извлекать больше информации из ограниченного объема данных, обучаясь на одном и том же наборе данных несколько раз.

Эти плюсы данного подхода к созданию нейросетей заставляют ученых со всего мира активно внедрять его в большие языковые модели.

В частности, специалисты Сбера разработали и опубликовали в открытом доступе диффузионную языковую модель GFusion, а также набор инструментов, ускоряющих обучение этих систем ИИ и позволяющих проводить данный процесс с применением меньшего числа видеокарт. Также исследователи дополнили самые популярные в индустрии инструменты для запуска языковых моделей, добавив в них возможность работы с диффузионными нейросетями.

Федор Минькин, технический директор фундаментальных моделей GigaChat:

Насколько нам известно, это первая выпущенная в опенсорс диффузионная модель для генерации текста такого масштаба в России. Диффузионные языковые модели – одно из самых перспективных и сложных направлений в генеративном ИИ, и у нас в команде стажер смог не просто разобраться в архитектуре, а довести модель до открытого релиза.

Напомним, в июне 2026 года Сбер объявил о выпуске обновленной версии ИИ-помощника для программистов GigaCode. Ранее СберТех представил платформу, которая поможет бизнесу контролировать работу ИИ.

Источник: ТАСС

Случилось что-то важное? Поделитесь новостью с редакцией.


Новые 
Новые
Лучшие
Старые
Сообщество
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Отправить отзыв
ПОПУЛЯРНЫЕ ОБСУЖДЕНИЯ НА SEONEWS
Как ИИ усиливает маркетинг и помогает общаться с пользователем
Максим
1
комментарий
0
читателей
Полный профиль
Максим - labrika.ru/
GEO-продвижение: гайд повышения видимости бренда (сайта) в нейросетях
dayitrix
3
комментария
0
читателей
Полный профиль
dayitrix - Спасибо за разбор. Сейчас как раз в процессе изучения GEO-продвижения, хочется разобраться, как вообще попадать в ответы нейросетей. Ну и смотрю, уже услуги по такому продвижению начали появляться, типа Zenlink Geo. Но пока по большей части информацию собираем, что это и стоит ли в это лезть. Но учитывая то, что люди сейчас в основном через нейронной информацию ищут, было б неплохо, чтоб нейросети нас упоминали)
Накрутка ПФ vs Бизнес: как накрутка поведенческих факторов «убьет» ваш бизнес в интернете
Гость
1
комментарий
0
читателей
Полный профиль
Гость - Вообще бред несут-пункт позиции и там и там суотрудничать,банов нет,риски и остальные пункты просто смешно,пф гораздо эффективнее чем платить в пиксель)))
Что будет с SEO в 2026: эксперты рынка подводят итоги и делают прогнозы на этот год
Марал Гаипова
142
комментария
0
читателей
Полный профиль
Марал Гаипова - Дмитрий, спасибо, эксперты и правда - топ)
Мы сократили рутину SEO-специалиста на 95% – вот архитектура, которая это сделала
Гостьkorayaskin
2
комментария
0
читателей
Полный профиль
Гостьkorayaskin - Можно также посмотреть разбор инструментов типа KeywordKick — помогает быстрее понять, где именно конфликт сигналов.
Что прямо сейчас можно сделать сайту регионального СМИ, чтобы получить мощный приток органического трафика
Дмитрий Севальнев
0
комментариев
0
читателей
Полный профиль
Дмитрий Севальнев - Максим, молодец! Хороший материал
Сервисы для создания квизов: сравнение по конверсии, гибкости сценариев и интеграциям
Виктор
1
комментарий
0
читателей
Полный профиль
Виктор - Без сервиса FormDesigner.ru эта подборка будет не полной. Удивлен, почему вы его не включили в список?
5 полезных сервисов для работы с учебными текстами
Anna B.
2
комментария
0
читателей
Полный профиль
Anna B. - Отличный разбор, очень своевременно!
Битрикс24 запускает бесплатный курс по вайбкодингу для гуманитариев
Ирина
1
комментарий
0
читателей
Полный профиль
Ирина - Хорошее решение для бизнеса
Yandex Cloud сменил логотип и визуальный стиль
Гостьфы
1
комментарий
0
читателей
Полный профиль
Гостьфы - это че такое
ТОП КОММЕНТАТОРОВ
Комментариев
910
Комментариев
834
Комментариев
554
Комментариев
540
Комментариев
483
Комментариев
393
Комментариев
373
Комментариев
262
Комментариев
249
Комментариев
171
Комментариев
156
Комментариев
142
Комментариев
130
Комментариев
121
Комментариев
100
Комментариев
97
Комментариев
97
Комментариев
96
Комментариев
80
Комментариев
77
Комментариев
74
Комментариев
67
Комментариев
66
Комментариев
60
Комментариев
59

Отправьте отзыв!
Отправьте отзыв!