Яндекс представил третье поколение больших языковых моделей YandexGPT

Яндекс представил новую линейку нейросетей, которая называется YandexGPT 3. Первая языковая модель этой линейки, YandexGPT 3 Pro, уже доступна на сайте Yandex Cloud. Она отличается от предыдущей модели тем, что лучше работает с сложными запросами и точнее следует формату ответов. Это делает ее особенно полезной при решении реальных задач компаний и в IT-продуктах.

В ближайшее время нейросети третьего поколения YandexGPT будут доступны и для широкой аудитории через сервисы Яндекса.

YandexGPT 3 Pro можно встроить в продукты бизнеса с помощью API. Перед использованием можно оценить качество работы нейросети в деморежиме. Новым зарегистрированным пользователям доступно 100 бесплатных запросов в час.

YandexGPT 3 Pro — это первая нейросеть из линейки YandexGPT 3. В будущем будет представлено еще больше моделей, каждая из которых будет ориентирована на решение задач определенного типа.

YandexGPT 3 Pro обладает новыми возможностями, такими как более эффективное решение сложных задач и лучшее понимание контекста беседы по сравнению с YandexGPT 2. Новая модель хорошо обрабатывает инструкции с несколькими условиями, дает более точные и полные ответы, а также совершает меньше стилистических ошибок. Более того, YandexGPT 3 Pro может обрабатывать гораздо больше запросов за единицу времени, чем языковые модели предыдущего поколения YandexGPT.

Новая нейросеть особенно хорошо себя проявляет в клиентской поддержке, онлайн-продажах, цифровых коммуникациях, маркетинге, рекламе и управлении персоналом. Она также лучше работает с документами, такими как договоры, счета, нормативная документация, должностные инструкции и другие. Задачи, связанные с указанными отраслями, составили значительную часть набора данных для обучения YandexGPT 3.

Стоимость использования нейросети снизилась почти в два раза. Заказчики могут самостоятельно дообучить YandexGPT 3 Pro в сервисе ML-разработки Yandex Datasphere, чтобы модель еще лучше соответствовала их потребностям. Для этого нужно загрузить в Datasphere файлы с примерами запросов и эталонными ответами. Такая дообученная нейросеть будет доступна только компании, которая ее дообучила.

Качество работы YandexGPT 3 Pro было проверено с помощью нескольких тестов. Один из них был проведен с использованием русскоязычной версии международного бенчмарка MMLU. Также разработчики применили методику тестирования Side by Side (SBS), чтобы оценить, как новая модель справляется с генерацией идей, обобщением информации, классификацией задач, созданием контента и другими бизнес-задачами. В среднем YandexGPT 3 отвечала лучше, чем YandexGPT 2, в 67% случаев. При работе с пользовательскими запросами и обработке бизнес-запросов новая нейросеть отвечала лучше в 69% и 60% случаев соответственно.

Чтобы проверить, насколько хорошо ответы первой нейросети из линейки YandexGPT 3 соответствуют заданному формату в запросе, был создан русскоязычный тест на базе бенчмарка IFeval. При сравнении с YandexGPT 2, качество ответов YandexGPT 3 улучшилось на 10 процентных пунктов, а их консистентность увеличилась в два раза. То есть нейросеть научилась лучше понимать разные формулировки одних и тех же вопросов.

Кроме того, новая языковая модель гораздо реже допускает ошибки. В сравнении с YandexGPT 2, количество фактических ошибок уменьшилось с 16,4% до 13,5%, а доля неподтвержденной информации в ответах снизилась с 6,4% до 5%. Количество ситуаций, когда модель не может дать ответ на вопрос пользователя, уменьшилось в 5 раз. Все эти проверки проводились на сложных запросах, связанных с реальным бизнесом.

YandexGPT — это нейросеть, способная создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем. Она используется для краткого пересказа статей из интернета, обобщения отзывов о товарах, создания описаний товаров для продавцов маркета, написания рекламных объявлений и других задач. Нейросеть можно протестировать в собственном бизнесе, зарегистрировавшись в Yandex Cloud и использовав API.