STUDIJA OTKRIVA

Vještačka inteligencija još nije spremna za kliničke odluke

Procijenili su LLM-ove na 29 standardizovanih kliničkih vinjeta koristeći novo razvijeni alat pod nazivom PrIME-LLM

Vještačka inteligencija još nije spremna za kliničke odluke. Pixabay

A. O.

14.4.2026

Generativnoj vještačkoj inteligenciji (AI) još uvijek nedostaju procesi rasuđivanja potrebni za sigurnu kliničku upotrebu, otkrila je nova studija.

Ukratko:

AI griješi u ključnim medicinskim procjenama

Ljudski nadzor i dalje neophodan

Najbolji modeli i dalje imaju ograničenja

Stručnjaci upozoravaju na rizike

AI nije zamjena za doktore

Tačnost raste uz više podataka, ali problemi ostaju.

AI chatbotovi su poboljšali svoju dijagnostičku tačnost kada su im predstavljene sveobuhvatne kliničke informacije, ali i dalje nisu uspjeli da postave odgovarajuću diferencijalnu dijagnozu u više od 80 posto slučajeva, prema istraživačima iz Mass General Brigham, neprofitne bolnice i istraživačke mreže sa sjedištem u Bostonu i jednog od najvećih zdravstvenih sistema u Sjedinjenim Državama.

Rezultati studije, objavljeni u medicinskom časopisu JAMA Network Open, otkrili su da modeli velikih jezika (LLM) ne ispunjavaju uslove potrebne za kliničku upotrebu, piše Euronews Health.

- Uprkos kontinuiranim poboljšanjima, standardni modeli velikih jezika nisu spremni za nenadziranu primjenu na kliničkom nivou - rekao je Marc Succi, koautor studije.

Diferencijalna dijagnoza ostaje "umjetnost medicine"

Dodao je da vještačka inteligencija još uvijek ne može replicirati diferencijalnu dijagnozu, koja je ključna za kliničko rasuđivanje i koju on smatra "umjetnošću medicine".

Diferencijalna dijagnoza je prvi korak za zdravstvene radnike u identifikaciji stanja, odvajajući ga od drugih sa sličnim simptomima.

Istraživački tim je analizirao funkcionisanje 21 LLM-a, uključujući najnovije dostupne verzije Claudea, DeepSeeka, Geminija, GPT-a i Groka.

Testiranje kroz realne medicinske slučajeve

Procijenili su LLM-ove na 29 standardizovanih kliničkih vinjeta koristeći novo razvijeni alat pod nazivom PrIME-LLM.

Alat procjenjuje sposobnost modela u različitim fazama kliničkog rasuđivanja: provođenje početne dijagnoze, naručivanje odgovarajućih testova, dolazak do konačne dijagnoze i planiranje liječenja.

Kako bi simulirali razvoj kliničkih slučajeva, istraživači su postepeno unosili informacije u modele, počevši od osnova kao što su dob pacijenta, spol i simptomi, prije nego što su dodali nalaze fizičkog pregleda i laboratorijske rezultate.

AI preskače ključni korak, ali dobija pomoć

Diferencijalna dijagnoza je ključna u stvarnom kliničkom okruženju za prelazak na sljedeći korak. Međutim, u studiji su modelima date dodatne informacije kako bi mogli preći na sljedeću fazu čak i ako ne uspiju u koraku diferencijalne dijagnoze.

Istraživači su otkrili da su jezički modeli postigli visoku tačnost u konačnim dijagnozama, ali su se loše pokazali u generisanju diferencijalnih dijagnoza i snalaženju u neizvjesnosti.

AI kao doktor: Test u realnim uslovima

Autor studije Arya Rao istakla je da se postupnim ocjenjivanjem LLM-ova, istraživanje ne tretira samo kao kandidate za polaganje ispita, već ih stavlja u poziciju doktora.

- Ovi modeli su odlični u postavljanju konačne dijagnoze nakon što su podaci kompletni, ali se muče na otvorenom početku slučaja, kada nema mnogo informacija - dodala je.

Više od 80 posto neuspjeha u ključnom koraku

Istraživači su otkrili da svi modeli nisu uspjeli dati odgovarajuću diferencijalnu dijagnozu u više od 80 posto slučajeva.

Pri konačnoj dijagnozi, stope uspjeha kretale su se od oko 60 posto do preko 90 posto, ovisno o modelu.

Većina LLM-ova pokazala je poboljšanu tačnost kada su, pored teksta, dostavljeni i laboratorijski rezultati i slike.

Najuspješniji AI modeli u studiji

Rezultati su identifikovali klaster s najboljim performansama koji je uključivao Grok 4, GPT-5, GPT-4.5, Claude 4.5 Opus, Gemini 3.0 Flash i Gemini 3.0 Pro.

Međutim, autori su primijetili da uprkos poboljšanjima zasnovanim na verzijama i prednostima modela optimizovanih za rasuđivanje, standardni LLM-ovi još uvijek nisu postigli nivo inteligencije potreban za sigurnu primjenu i ostaju ograničeni u demonstraciji naprednog kliničkog rasuđivanja.

Ključna poruka: Potreban je ljudski nadzor

- Naši rezultati potvrđuju da veliki jezički modeli u zdravstvu i dalje zahtijevaju 'čovjeka u toku' i vrlo strog nadzor' - istakla je Succi.

Susana Manso García, članica radne grupe za vještačku inteligenciju i digitalno zdravlje Španskog društva za porodičnu i društvenu medicinu, koja nije bila uključena u studiju, rekla je da nalazi nose jasnu poruku javnosti.

AI obećava, ali ne zamjenjuje doktore

- Sama studija insistira na tome da se oni [jezički modeli] ne bi trebali koristiti za donošenje kliničkih odluka bez nadzora. Stoga, iako vještačka inteligencija predstavlja obećavajući alat, ljudska klinička prosudba ostaje nezamjenjiva - rekla je.

- Preporuka javnosti je da ove tehnologije koristi s oprezom i, kada se suoči s bilo kakvim zdravstvenim problemom, uvijek se konsultuje sa zdravstvenim radnikom - prenosi Euronews Health.

# STUDIJA

# AI

# VJEŠTAČKA INTELIGENCIJA

# LIJEČENJE

# MEDICINA

Dodajte Avaz.ba u omiljene izvore na Google-u.

Vezane vijesti

Popularno

PRETPOSLJEDNJI MEČ SP

7 h 50 min

Spektakl sa deset golova u Majamiju: Engleska savladala Francusku i osvojila bronzu na Mundijalu

VELIKI GUBITAK

10 h 15 min

Povratničkoj porodici Gušić kod Han Pijeska, grom je ubio stado od kojeg žive

POTVRĐENO

9 h 24 min

Američki vojnici poginuli u iranskom napadu na bazu u Jordanu

SEAD MILJKOVIĆ

6 h 9 min

Abdićev autonomaš: SAD oduzele državljanstvo optuženom za ratne zločine u BiH

BIVŠI TRENER ZRINJSKOG

10 h 52 min

Štimac se pozvao na Silajdžićevu izjavu iz 2006: "Nije pravedno da neko Hrvatima bira njihovog predstavnika"

SJAJNE SCENE

8 h 17 min

Video / Halidovi "Ljiljani" odjekivali Novim Pazarom: Cijeli stadion pjevao u glas

DRAMA U AUSTRIJI

10 h 53 min

Djevojku iz BiH izvlačili vatrogasci nakon stravičnog udesa

NA POMOLU VELIKI TRANSFER

11 h 31 min

Poslije Muharemovića i Alajbegović stiže na Ostrvo: Engleski velikan želi bh. bisera

URAGAN

8 h 42 min

Mađar je razmontirao Orbanovu državu: Predsjednik potpisao vlastitu smjenu

HISTORIJSKI ZAOKRET

5 h 55 min

Trampova administracija planira finansirati desničarske grupe na Balkanu

NASLOVNICA VIJESTI CRNA HRONIKA BIZNIS SPORT SHOWBIZ LIFESTYLE SCI-TECH

PRETPLATA VREMENSKA PROGNOZA

SMRTOVNICE

KRIŽALJKA

STUDIJA OTKRIVA

Vještačka inteligencija još nije spremna za kliničke odluke

Procijenili su LLM-ove na 29 standardizovanih kliničkih vinjeta koristeći novo razvijeni alat pod nazivom PrIME-LLM

Vještačka inteligencija još nije spremna za kliničke odluke. Pixabay

A. O.

14.4.2026

Generativnoj vještačkoj inteligenciji (AI) još uvijek nedostaju procesi rasuđivanja potrebni za sigurnu kliničku upotrebu, otkrila je nova studija.

Ukratko:

AI griješi u ključnim medicinskim procjenama

Ljudski nadzor i dalje neophodan

Najbolji modeli i dalje imaju ograničenja

Stručnjaci upozoravaju na rizike

AI nije zamjena za doktore

Tačnost raste uz više podataka, ali problemi ostaju.

Rezultati studije, objavljeni u medicinskom časopisu JAMA Network Open, otkrili su da modeli velikih jezika (LLM) ne ispunjavaju uslove potrebne za kliničku upotrebu, piše Euronews Health.

- Uprkos kontinuiranim poboljšanjima, standardni modeli velikih jezika nisu spremni za nenadziranu primjenu na kliničkom nivou - rekao je Marc Succi, koautor studije.

Diferencijalna dijagnoza ostaje "umjetnost medicine"

Dodao je da vještačka inteligencija još uvijek ne može replicirati diferencijalnu dijagnozu, koja je ključna za kliničko rasuđivanje i koju on smatra "umjetnošću medicine".

Diferencijalna dijagnoza je prvi korak za zdravstvene radnike u identifikaciji stanja, odvajajući ga od drugih sa sličnim simptomima.

Istraživački tim je analizirao funkcionisanje 21 LLM-a, uključujući najnovije dostupne verzije Claudea, DeepSeeka, Geminija, GPT-a i Groka.

Testiranje kroz realne medicinske slučajeve

Procijenili su LLM-ove na 29 standardizovanih kliničkih vinjeta koristeći novo razvijeni alat pod nazivom PrIME-LLM.

AI preskače ključni korak, ali dobija pomoć

Istraživači su otkrili da su jezički modeli postigli visoku tačnost u konačnim dijagnozama, ali su se loše pokazali u generisanju diferencijalnih dijagnoza i snalaženju u neizvjesnosti.

AI kao doktor: Test u realnim uslovima

Autor studije Arya Rao istakla je da se postupnim ocjenjivanjem LLM-ova, istraživanje ne tretira samo kao kandidate za polaganje ispita, već ih stavlja u poziciju doktora.

- Ovi modeli su odlični u postavljanju konačne dijagnoze nakon što su podaci kompletni, ali se muče na otvorenom početku slučaja, kada nema mnogo informacija - dodala je.

Više od 80 posto neuspjeha u ključnom koraku

Istraživači su otkrili da svi modeli nisu uspjeli dati odgovarajuću diferencijalnu dijagnozu u više od 80 posto slučajeva.

Pri konačnoj dijagnozi, stope uspjeha kretale su se od oko 60 posto do preko 90 posto, ovisno o modelu.

Većina LLM-ova pokazala je poboljšanu tačnost kada su, pored teksta, dostavljeni i laboratorijski rezultati i slike.

Najuspješniji AI modeli u studiji

Rezultati su identifikovali klaster s najboljim performansama koji je uključivao Grok 4, GPT-5, GPT-4.5, Claude 4.5 Opus, Gemini 3.0 Flash i Gemini 3.0 Pro.

Ključna poruka: Potreban je ljudski nadzor

- Naši rezultati potvrđuju da veliki jezički modeli u zdravstvu i dalje zahtijevaju 'čovjeka u toku' i vrlo strog nadzor' - istakla je Succi.

AI obećava, ali ne zamjenjuje doktore

- Preporuka javnosti je da ove tehnologije koristi s oprezom i, kada se suoči s bilo kakvim zdravstvenim problemom, uvijek se konsultuje sa zdravstvenim radnikom - prenosi Euronews Health.

# STUDIJA

# AI

# VJEŠTAČKA INTELIGENCIJA

# LIJEČENJE

# MEDICINA

Dodajte Avaz.ba u omiljene izvore na Google-u.

Vezane vijesti

Marketing

Popularno

PRETPOSLJEDNJI MEČ SP

7 h 50 min

Uslovi korištenja

Politika privatnosti

Kontakt

ISSN 1840-3522.

Zabranjeno preuzimanje sadržaja bez dozvole izdavača.

Vještačka inteligencija još nije spremna za kliničke odluke

Diferencijalna dijagnoza ostaje "umjetnost medicine"

Testiranje kroz realne medicinske slučajeve

AI preskače ključni korak, ali dobija pomoć

AI kao doktor: Test u realnim uslovima

Više od 80 posto neuspjeha u ključnom koraku

Najuspješniji AI modeli u studiji

Ključna poruka: Potreban je ljudski nadzor

AI obećava, ali ne zamjenjuje doktore

AI iz Oxforda predviđa srčani zastoj godinama ranije

AI iz Oxforda predviđa srčani zastoj godinama ranije

Predstavljena studija “Položaj žena u sektoru sigurnosti i odbrane u BiH“: Od 23.471 uposlenih samo 21 posto žena

Studija koja zabrinjava sve: Nestaje na hiljade kilometara rijeka na Balkanu

NetWork 14 predstavlja prve Business Day sadržaje: od startup lekcija do AI-ja u obrazovanju

Amko market otvorio vrata u Fojnici: Novi prostor za kupovinu, druženje i nova radna mjesta

Techno Shop A1 Team: Novo ime na tržištu računarske opreme, iza kojeg stoji 15 godina iskustva

Telemach BH obilježava šest godina ulaganja u digitalnu i sportsku budućnost Bosne i Hercegovine

Goražde dobija još jedan Amko market – nova lokacija za još bržu i jednostavniju kupovinu

Spektakl sa deset golova u Majamiju: Engleska savladala Francusku i osvojila bronzu na Mundijalu

Povratničkoj porodici Gušić kod Han Pijeska, grom je ubio stado od kojeg žive

Američki vojnici poginuli u iranskom napadu na bazu u Jordanu

Abdićev autonomaš: SAD oduzele državljanstvo optuženom za ratne zločine u BiH

Štimac se pozvao na Silajdžićevu izjavu iz 2006: "Nije pravedno da neko Hrvatima bira njihovog predstavnika"

Video / Halidovi "Ljiljani" odjekivali Novim Pazarom: Cijeli stadion pjevao u glas

Djevojku iz BiH izvlačili vatrogasci nakon stravičnog udesa

Poslije Muharemovića i Alajbegović stiže na Ostrvo: Engleski velikan želi bh. bisera

Mađar je razmontirao Orbanovu državu: Predsjednik potpisao vlastitu smjenu

Trampova administracija planira finansirati desničarske grupe na Balkanu

Vještačka inteligencija još nije spremna za kliničke odluke

Diferencijalna dijagnoza ostaje "umjetnost medicine"

Testiranje kroz realne medicinske slučajeve

AI preskače ključni korak, ali dobija pomoć

AI kao doktor: Test u realnim uslovima

Više od 80 posto neuspjeha u ključnom koraku

Najuspješniji AI modeli u studiji

Ključna poruka: Potreban je ljudski nadzor

AI obećava, ali ne zamjenjuje doktore

AI iz Oxforda predviđa srčani zastoj godinama ranije

AI iz Oxforda predviđa srčani zastoj godinama ranije

Predstavljena studija “Položaj žena u sektoru sigurnosti i odbrane u BiH“: Od 23.471 uposlenih samo 21 posto žena

Studija koja zabrinjava sve: Nestaje na hiljade kilometara rijeka na Balkanu

NetWork 14 predstavlja prve Business Day sadržaje: od startup lekcija do AI-ja u obrazovanju

Amko market otvorio vrata u Fojnici: Novi prostor za kupovinu, druženje i nova radna mjesta

Techno Shop A1 Team: Novo ime na tržištu računarske opreme, iza kojeg stoji 15 godina iskustva

Spektakl sa deset golova u Majamiju: Engleska savladala Francusku i osvojila bronzu na Mundijalu

Povratničkoj porodici Gušić kod Han Pijeska, grom je ubio stado od kojeg žive

Američki vojnici poginuli u iranskom napadu na bazu u Jordanu

Abdićev autonomaš: SAD oduzele državljanstvo optuženom za ratne zločine u BiH

Štimac se pozvao na Silajdžićevu izjavu iz 2006: "Nije pravedno da neko Hrvatima bira njihovog predstavnika"

Video / Halidovi "Ljiljani" odjekivali Novim Pazarom: Cijeli stadion pjevao u glas

Djevojku iz BiH izvlačili vatrogasci nakon stravičnog udesa

Poslije Muharemovića i Alajbegović stiže na Ostrvo: Engleski velikan želi bh. bisera

Mađar je razmontirao Orbanovu državu: Predsjednik potpisao vlastitu smjenu

Trampova administracija planira finansirati desničarske grupe na Balkanu