AAren txatboten erantzun medikoen erdiak ez dira zehatzak

Ereduen arabera, Grokek emaitzarik txarrenak lortu zituen: erantzunen % 58 problematikoak izan ziren.

  Egilea: Lander Bolado
  Argazkia: Shutterstock.com
  Hitz kopurua: 243
  Irakurketa denbora: Minutu 1

Adimen artifizialeko txatbotek osasunari buruzko galderei ematen dizkieten erantzunen erdiak, gutxi gorabehera, ez dira zehatzak eta osatugabeak edo kaltegarriak izan daitezke. Hala ondorioztatu du Kaliforniako Berrikuntza Biomedikorako Lundquist Institutuko talde batek egindako eta BMJ Open aldizkarian argitaratutako ikerketa batek. Ikertzaileek erabilera masiboko AAren bost plataforma aztertu zituzten: Gemini (Google), DeepSeek, Meta AI, ChatGPT (OpenAI) eta Grok (xAI).

250 kontsulta diseinatu zituzten, desinformazioarekiko bereziki zaurgarriak diren bost arlotan banatuta: minbizia, txertoak, zelula amak, nutrizioa eta kirol-errendimendua. Kategoria bakoitzeko bi adituk erantzun bakoitza ebaluatu zuten eta honela sailkatu zituzten: arazorik gabeak, zertxobait problematikoak edo oso problematikoak. Erantzunen % 49,6k arazo motaren bat zuen, eta %19,6 oso problematikotzat jo zen, erabiltzaileak eraginkortasunik gabeko tratamenduetara bideratzeko edo kalteak eragiteko benetako gaitasuna zutelako, aholkuak profesional bati kontsultatu gabe jarraituz gero.

Aurkikuntza nabarmenetako bat ereduek informazioa aurkezteko erabiltzen duten tonua da. Txatbotek segurtasunez eta ziurtasunez erantzun zuten ia kasu guztietan. Nicholas Tiller ikertzaile nagusiak ohartarazten du autoritate-itxura horrek bereziki engainagarria dela, ereduek ez dutelako sortzen duten informazioa egiaztatzen. “Ez dute frogarik arrazoitzen, ezta aztertzen ere”, adierazi du. Entrenamendu-datuetatik abiatuta hitz-sekuentziak aurreikustean —artikulu zientifikoak zein Redditeko foroak barne—, sistemek sasizientziekin kontrastatutako baieztapenak parekatzen dituzte maiz, batzuen eta besteen artean bereizi gabe.

Ereduen arabera, Grokek emaitzarik txarrenak lortu zituen: erantzunen % 58 problematikoak izan ziren. Geminik, berriz, akats larrien kopururik txikiena erregistratu zuen.

Ikertzaileek ondorioztatu dutenez, hezkuntzarik eta arau-ikuskapenik gabeko tresna horien hedapenak desinformazioa murriztu beharrean areagotzeko arriskua du.