Карина Пардаева
«Яндекс» разрабатывает единую нейросеть для речи и текста. Для работы над мультимодальной SpeechGPT уже ищут сотрудников. Об этом говорится в разделе вакансий компании, пишет «Ъ».
В компании пояснили, что работают над мультимодальностью в ассистенте «Алиса» и других сервисах. На вопрос о единой нейросети в «Яндекс» не ответили.
Мультимодальные модели с поддержкой аудио, по словам гендиректора группы компаний ЦРТ Дмитрия Дырмовского, способны «распознавать речь на нескольких языках, разделять реплики дикторов, определять эмоции и сложные невербальные приемы, такие как ирония и сарказм». При этом они смогут снизить порог входа в речевые технологии.
В марте 2024 года «Яндекс» представил линейку нейросетей YandexGPT 3. Первая языковая модель в линейке —YandexGPT 3 Pro — лучше работает со сложными запросами и точнее следует заданному формату ответов.
YandexGPT — нейросеть, способная создавать и перерабатывать тексты, учитывает контекст беседы с пользователем. Может кратко пересказывать статьи из интернета, обобщать информацию из отзывов о товарах, создавать описания товаров для продавцов «Маркета», писать рекламные объявления.
Фото на обложке: Unsplash
Источник: rb.ru