Дмитрий Новиков
13 декабря 2024 16:36:53
Фото: © RusPhotoBank
«Т-банк» представил языковые модели T-Pro и T-Lite для эффективного решения узкоспециализированных задач.
«Т-банк» объявил о доступе к двум расширенным языковым моделям: T-Pro с 32 миллиардами параметров и обновленной T-Lite с 7 миллиардами параметров. Эти модели, разработанные на основе технологии Qwen-2.5 от китайской Alibaba Group и адаптированные под русский язык, входят в собственное семейство языковых моделей «Т-банка» Gen-T, предназначенные для решения специализированных задач. На их основе разработчики могут создавать чат-ботов для поддержки клиентов или ассистентов для сотрудников.
Представитель «Т-банка» отметил, что использование предварительно обученных моделей Qwen-2.5 позволяет сократить затраты на разработку собственных моделей на 80–90% по сравнению с их полным обучением с нуля, при этом качество решений на русском языке превосходит те, что предлагаются OpenAI, Google и Anthropic.
Эту стратегию также используют другие компании: например, МТС в ноябре представила ИИ-модель Cotype Nano с 1,5 млрд параметров, также разработанную на базе Qwen 2.5 Alibaba Cloud. «Яндекс» рассматривает возможность открытого доступа к исходному коду своей модели, а «Сбер» уже предоставляет свободный доступ к моделям Kandinsky и GigaAM.
Ранее Сбер представил новую нейросеть для генерации видео Kandinsky Video 4.0.