Российская визуально-языковая модель обошла Google, OpenAI, Anthropic и Alibaba
Визуально‑текстовая модель Яндекса Alice AI VLM показала высокий результат в первом русскоязычном бенчмарке MWS Vision Bench, посвящённом бизнес‑OCR и мультимодальным моделям для реальных бизнес‑сценариев. В рейтинге она заняла второе место, опередив популярные зарубежные аналоги, такие как Gemini 2.5 Flash (Google), GPT‑4.1 mini (OpenAI) и Claude 4.5 Sonnet (Anthropic). Уступила российская разработка лишь модели Gemini 2.5 Pro от Google.
MWS Vision Bench тестирует способность моделей анализировать изображения и текст, в том числе сложные русскоязычные документы. Результаты Alice AI VLM демонстрируют, что российская разработка вышла на уровень лучших мировых решений. Модель эффективно распознаёт и интерпретирует визуально‑текстовую информацию, превосходя многие зарубежные мультимодальные системы.
Alice AI VLM входит в новое семейство генеративных моделей Яндекса Alice AI, созданных для решения практических задач. Ключевые технические преимущества модели:
- поддержка контекста до 32 тыс. токенов;
- расширенный набор данных для обучения;
- обновлённый OCR‑датасет.
Эти характеристики обеспечивают повышенную точность и эффективность при работе с текстом на изображениях.









