💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!
Читайте также: З лютого Wix повертається до роботи в офісах. Чи вплине це на команду в Україні
Бета-тестування національної LLM почнеться навесні 2026 року. На сьогодні триває збір даних для навчання мовної моделі.
Про це повідомив Михайло Федоров.
За його словами, йдеться не лише про відкриті джерела з інтернету, а й про великі масиви інформації від державних органів, медіа, університетів та інших інституцій. Паралельно розробляють юридичну рамку, щоб робота з цими даними відповідала вимогам безпеки й законодавства.
Окремо формують систему перевірки якості моделі. Група незалежних експертів створюють бенчмарки, які будуть оцінювати технічну якість моделі, знання української мови, розуміння національного контексту, а також етичності та безпечності відповідей.
У січні команда планує підготувати першу навчальну базу текстів, удосконалити токенізатор для української мови та запустити власні тести якості. Після цього навесні модель відкриють для бета-тестування.
Назву для національної LLM обиратимуть самі українці — голосування планують провести через застосунок «Дія» також у січні.
Читайте также: MacPaw та Respeecher стали партнерами й працюватимуть над ШІ-асистентом Eney

📌 Контекст
4 лютого у межах стратегії інновацій WINWIN Мінцифри оголосило про запуск AI Center of Excellence. ШІ-центр має стати ядром національної ШІ-екосистеми. У лютому 2025 року команда анонсувала перші продукти та цілі. Серед них — створення національної мовної моделі.
Розробку LLM почали у червні 2025 року. За технічну частину відповідає «Київстар», а уряд відповідає за координацію розробки та створення органів, які стежитимуть за якістю, безпекою та етичністю цієї технології.
У Мінцифри розповідали DOU, що проєкт фінансується за кошти бізнесу, без витрат з державного бюджету. Після запуску модель буде доступна для тестування державними, науковими та громадськими організаціями, а згодом відкрита у форматі open source.
Через два місяці Мінцифри і Київстар представили експертну групу, відповідальну за різні аспекти створення LLM.
У вересні на DOU вийшло інтерв’ю з CTO WINWIN AI Center of Excellence при Мінцифри Дмитром Овчаренком, в якому він детально розповів, як вирішують питання із захистом персональних даних, що отримає «Київстар» за розробку національної LLM і інші аспекти її розробки.
Читайте также: «Лишився неприємний осад». Шість історій айтівців, яких скоротили
А 1 грудня стало відомо, що українську модель розроблятимуть на базі Gemma 3.
Все про українське ІТ в телеграмі — підписуйтеся на канал DOU