Sber je predstavio veliko ažuriranje svog AI asistenta GigaChat, koji sada pokreće novi vodeći model GigaChat Ultra. Ova ažurirana verzija omogućava AI asistentu da pamti činjenice o korisnicima radi personalizirane komunikacije i rješenja, samostalno pretražuje informacije na internetu i generira tekstualne odgovore dvostruko brže.
Objavljivanje ovog novog modela otvara mogućnosti ne samo za krajnje korisnike, već i za developere koji mogu graditi primijenjene AI proizvode i usluge koristeći GigaChat Ultra. Korisnici mogu pokretati kod direktno unutar interfejsa i dobivati odgovore na pitanja o vlastitim mogućnostima, oslanjajući se na trenutnu dokumentaciju.
Anton Frolov, viši potpredsjednik, direktor razvoja generativne umjetne inteligencije, Sberbank:
"Činimo korak od alata koji samo daje odgovore ka višeagentnom AI asistentu. Ali naš cilj ide dalje od toga: stvaramo budućnost u kojoj tradicionalne mobilne aplikacije ustupaju mjesto interfejsima zasnovanim na neuronskim mrežama. Potrebne funkcije će se pojaviti na zahtjev, čineći navigaciju kroz digitalni svijet besprijekornom. GigaChat Ultra je jedan od najvećih modela na svijetu u potpunosti razvijen i obučen u Rusiji. Pamti vaše preferencije, radi brže, dublje razumije zadatke i pruža preporuke višeg kvaliteta. Uklanjamo posljednje prepreke u interakciji čovjeka i mašine."
Dugoročna memorija
Jedna ključna inovacija je dugoročna memorija. Dok je kontekstualna (kratkoročna) memorija ograničena na jednu sesiju razgovora i resetira se kada se ona završi, dugoročna memorija GigaChata funkcionira drugačije – ona zadržava činjenice specifične za korisnika kroz više sesija i koristi ih u narednim razgovorima.Evo šta tačno GigaChat pamti:
- hobije, ukuse i interesovanja;
- profesiju, obrazovanje, životne ciljeve i navike;
- lične podatke – samo u mjeri u kojoj ih korisnici sami podijele;
- informacije o članovima porodice i kućnim ljubimcima.
Sistem automatski prepoznaje važne činjenice bez preopterećivanja memorije trivijalnostima poput kratkoročnih planova ili općepoznatih znanja. Svi podaci se pohranjuju u jedinstveni profil koji je sinhroniziran između web verzija, mobilnih aplikacija i Telegram bot-a putem prijave putem Sber ID-a. Korisnici imaju potpunu kontrolu nad ovom funkcijom: memorija se može uključiti ili isključiti u svakom trenutku u postavkama.
Brzina generiranja odgovora udvostručena
GigaChat generira tekstualne odgovore dvostruko brže u poređenju s prethodnim vodećim modelom Sbera. To direktno utječe na to koliko brzo korisnici vide odgovore čak i za složene upite koji zahtijevaju detaljno razmišljanje – rezultat se pojavljuje gotovo trenutno.
Ovo povećanje brzine postignuto je zahvaljujući arhitekturi Mixture of Experts (MoE). Model djeluje kao tim specijaliziranih stručnjaka, od kojih svaki rješava određene vrste zadataka. Samo relevantni "stručnjaci" odgovaraju na bilo koji upit, umjesto da cijeli model radi istovremeno.
Režim razgovora u realnom vremenu
GigaChat se sada samostalno povezuje na internet pretragu za ažuriranjima u realnom vremenu, čime se eliminira potreba da korisnici ručno uključuju ovu opciju. To osigurava tačne odgovore kada se raspravlja o nedavnim vijestima, berzanskim kotacijama i drugim dinamičkim podacima. Funkcionalnost pretrage uključuje namjenski rephraser – sistem koji preformuliše korisničke upite kako bi poboljšao relevantnost i konačni kvalitet odgovora.
Online pretraga sada je dostupna i u režimu glasovne komunikacije. Dijalozi su postali zaista interaktivni: korisnici mogu prekinuti model, razjasniti detalje ili promijeniti temu trenutno – bez kašnjenja u obradi promjena konteksta. Nakon završetka sesije razgovora, čuva se kompletan transkript dijaloga.
Samosvijest: GigaChat zna sve o sebi
Mehanizam samosvijesti implementiran je u GigaChatu, omogućavajući modelu da daje tačne odgovore u vezi s vlastitim karakteristikama. Kada odgovara na ovakva pitanja, model se oslanja na ažurnu dokumentaciju koja opisuje njegovu trenutnu verziju, podržane funkcionalnosti, ograničenja i posebnosti ponašanja. Time se eliminiraju tipični problemi uobičajeni kod jezičkih modela, poput davanja netačnih ili zastarjelih informacija o njihovim mogućnostima – na primjer, lažno tvrdeći da posjeduju nepostojeće funkcije ili ne prepoznajući postojeće.
Tumač koda: GigaChat kao analitičko okruženje
Integrirani tumač koda pretvara GigaChat u izolirano okruženje za izvršavanje programskog koda direktno unutar interfejsa asistenta. Prije uvođenja ove funkcije, model je mogao samo napisati kod i prikazati ga korisnicima; za izvršavanje i testiranje rezultata bili su potrebni vanjski alati. Sada GigaChat generira kod i izvršava ga odmah unutar sigurnog pješčanika, bez utjecaja na korisnikov sistem.
Tumač podržava učitane datoteke, izvodi napredne numeričke proračune, validira strukture podataka i kreira grafikone i dijagrame direktno u ćaskanju. To čini GigaChat sveobuhvatnim analitičkim alatom prikladnim za izvještaje, tabele i velike skupove podataka.
Proces obuke
Obuka je uključivala tri faze. U početnoj fazi, opseg znanja je proširen dodavanjem akademskih knjiga, materijala vezanih za matematiku i programiranje, povećanjem količine višejezičkih podataka – sada pokriva deset jezika. U srednjoj fazi, unaprijeđene su specijalizirane vještine: proširen je korpus koda, dodani su dodatni podaci uključujući fiziku, medicinu, finansije, zapise stvarnih dijaloga, te je ojačana sigurnost. Završno prilagođavanje zasnovano na primjerima (urednički tekstovi, dijalozi koji pokreću funkcije, sistemski promptovi) osiguralo je stabilne performanse u stvarnim uvjetima.
Zabilježena su značajna poboljšanja u odgovaranju na otvorena i zatvorena pitanja, kao i zadacima koji zahtijevaju sofisticirano logičko zaključivanje. Benchmark testovi za upotrebu na ruskom jeziku pokazali su visok nivo gramatičke ispravnosti, prirodnog toka govora, čitljivosti i strukturiranih odgovora. Poboljšanja su se proširila i na praktične industrijske scenarije: model je postao vještiji u pravnim, sajber sigurnosnim, medicinskim, finansijskim i trgovinskim zadacima – posebno onima koji uključuju specifičnosti ruskog jezika i sektorsku terminologiju. Značajan napredak postignut je u matematičkim proračunima i generiranju koda, čime se proširila primjenjivost u sektorima fintecha, obrazovanja i razvoja.
Vodeći model bit će javno objavljen
Sber čini izvorni kod i težine svog vodećeg modela GigaChat Ultra slobodno dostupnim. Prema procjenama stručnjaka kompanije, on već nadmašuje DeepSeek V3.1, Qwen3-235B i svog prethodnika GigaChat 2 Max u zadacima na ruskom jeziku, matematici i općem zaključivanju. Objavljivanjem repozitorija, organizacije od velikih banaka do malih startapa dobit će mogućnost da instaliraju neuronsku mrežu unutar svog privatnog okruženja i prilagode je korporativnim podacima, što predstavlja korak ka istinskoj tehnološkoj suverenosti.
Korisnici mogu besplatno isprobati ažurirani model u web verziji, Android aplikacijama dostupnim u RuStore i AppGallery, kao i u Telegram botu i MAX messengeru. Za aktiviranje glasovnog načina rada i memorije, potrebno je samo se prijaviti putem Sber ID-a i uključiti željene opcije u postavkama profila.