This move, driven by Western sanctions, signals Russia’s intent to forge alternative pathways to bolster its technological advancements.
Below is a detailed breakdown of this development, its motivations, challenges, and potential implications.
Nonetheless, Putin still declared at the conference that AI is “the most important resource for achieving the national development goals of the country, to ensure the strengthening of its defense capability, the qualitative development of the economy and social sectors, public administration, and the growth of innovation.” He is most likely correct about that. But there is little sign that any models besides American ones can deliver those results, even in Russian.
https://www.themoscowtimes.com/2025/01/28/russian-ai-struggles-in-its-own-language-a87773
Copilot kommentoi:
Venäjän suurimmat tekoälymallit ovat tällä hetkellä Sberbankin GigaChat‑malliperhe, jonka tunnetuin versio on noin 20 miljardin parametrin kokoinen GigaChat‑20B. Uudemmat versiot, kuten GigaChat MAX ja GigaChat 2.0 ‑sarja, ovat Venäjän yritys kuroa kiinni länsimaisia ja kiinalaisia malleja, mutta niiden koko ja suorituskyky jäävät edelleen jälkeen alan suurimmista.
Venäjän merkittävimmät LLM‑mallit
🇷🇺 GigaChat‑20B (Sberbank)
- Parametrimäärä: 20 miljardia
- Arkkitehtuuri: Mixture‑of‑Experts (MoE), josta vain 3 miljardia aktivoituu inferenssissä Hugging Face
- Kontekstipituus: 131 000 tokenia
- Käyttötarkoitus: Venäjänkielinen tekstintuotto, keskustelu, koodaus, multimodaaliset tehtävät
- Huomio: Rakennettu alusta asti venäjän kielelle.
🇷🇺 GigaChat (yleinen versio)
- Julkaistu: 2023
- Kuvaus: Venäjän vastine ChatGPT:lle, multimodaalinen (teksti + kuvat) Wikipedia
- Käyttäjämäärä: Yli 2,5 miljoonaa helmikuuhun 2024 mennessä Wikipedia
🇷🇺 GigaChat MAX / GigaChat 2.0
- Kuvaus: Uudempi, parannettu versio, jota Sberbank markkinoi “huippuluokan” venäjänkielisenä mallina
- Suorituskyky: Parannettu MMLU‑tulos (80 %), mutta edelleen jäljessä amerikkalaisista ja kiinalaisista huippumalleista The Moscow Times
- Väite: Sberbankin mukaan GigaChat 2 MAX päihittää GPT‑4o:n ja Qwen2.5:n venäjänkielisissä tehtävissä (MERA‑benchmark) DT next
- Parametrimäärä: Ei julkistettu, mutta arvioiden mukaan kymmeniä miljardeja, ei satoja.
Miten nämä vertautuvat maailman suurimpiin malleihin?
| Maa | Malli | Parametrit (arvio) | Huomio |
|---|---|---|---|
| USA | GPT‑4‑sarja | 1–2 biljoonaa (arvioitu) | Selvästi suurin ja kehittynein |
| Kiina | Qwen2.5, DeepSeek‑V3 | 70–671B | Nopea kehitys |
| Venäjä | GigaChat‑20B, GigaChat MAX | 20B – ~50B (arvio) | Selvästi pienempiä |
Venäjän mallit ovat siis keskikokoisia, eivät jättiluokan LLM:iä. Teknologiset rajoitteet (GPU‑pakotteet, sirupula) rajoittavat mallien koon kasvattamista.
Yhteenveto
Venäjällä on muutamia merkittäviä suuria kielimalleja, mutta niiden koko on 20–50 miljardin parametrin luokkaa, mikä on huomattavasti pienempi kuin Yhdysvaltojen ja Kiinan huippumallit. Venäjä keskittyy erityisesti venäjänkieliseen optimointiin ja MoE‑arkkitehtuureihin kompensoidakseen rautapulaa.
Jos haluat, voin myös:
- vertailla Venäjän mallien suorituskykyä GPT‑4‑tasoon
- selittää, miten pakotteet vaikuttavat mallien kokoon
- kertoa, millaisia sovelluksia Venäjä rakentaa näiden mallien ympärille
Ei kommentteja:
Lähetä kommentti