Da je korištenje ChatGPT-ja moguće i u svrhe lažiranja jasno je gotovo od početka. No, ipak se nije očekivalo da će se u temelju lažirati i znanstvene radove. Dakle, ne samo pisanje, već i podatke na kojima je rad temeljen. I sada se ispostavilo da ovaj model generativne umjetne inteligencije može upravo to. Okrene priču te sastavlja bazu podataka koja podupire znanstvenu tezu koju treba dokazati. Samo, postoji i način da se to otkrije a kako ispada izgleda da će se takve metode morati koristiti sve češće. Dakle, u časopisu Nature izašao je tekst o tome kako su znanstvenici iskoristili tehnologiju temeljenu na ChatGPT-ju kako bi stvorili lažne podatke o kliničkom istraživanju kako bi dali temelja nepotvrđenoj znanstvenoj tvrdnji. Taj se rad pojavio 9. studenog u časopisu JAMA Ophtalmology gdje se opisuje kako je modelom ChatGPT-4 što je njegova zadnja verzija uparenim s Advanced Data Analysis, modelom temeljenim na programskom jeziku Python, koji može napraviti statističku analizu i napraviti podatkovne vizualizacije. I tako se dobila baza podataka u kojoj su uspoređena dva kirurška postupka pri čemu je zaključeno da je jedan bolji od drugog. Ali je taj zaključak pogrešan, rezultat bi trebao biti obrnut. Giuseppe Giannaccare, suautor studije, koji je i očni kirurg na sveučilištu Cagliari u Italiji rekao je kako je cilj ovog rada pokazati upravo kako je umjetnom inteligencijom moguće u samo nekoliko minuta stvoriti bazu podataka koja nije temeljena na originalnim podacima a može je se usmjeriti u potpuno drugačijem smjeru u odnosu na dostupne znanstvene dokaze. To je razina više od korištenja umjetne inteligencije za stvaranje tekstova te se postojećim alatima ne može otkriti, i to je još jedna briga za znanstvenu zajednicu.

Ovdje je postalo očito da bilo koji znanstvenik ili grupa znanstvenika s pristupom takvim modelima može stvoriti lažna mjerenja ili baze podataka na izmišljenim pacijentima, lažirati odgovore na upitnike ili stvoriti i šire baze koje bi se temeljile na fingiranim pokusima na laboratorijskim životinjama. Iako, grupa je specijalista lakoćom otkrila da se radi o fabriciranoj bazi podataka. Konkretno se radilo o fiktivnoj bazi podataka koja bi prikazivala ljude s keratokonusom koji izaziva stanjivanje rožnice te može izazvati slabljenje vida. Za 15 do 20 posto oboljelih predviđena je transplantacija rožnice koja se provodi jednom od dvije postojeće operacije. Jedna je penetracijska keratoplastika te duboka anteriorna lamelarna keratoplastika. Autori su rada dali uputu modelu da napravi skup podataka koji podupire zaključak kako je druga vrsta operacije učinkovitija nego druga. Da bi to uspjeli tražili su da se pokaže takva statistička razlika koja se odnosi na oblik rožnice koja bi pokazala da postoje nepravilnosti kao i razlika u kvaliteti vida kod onih koji su pristupili testu. Umjetna je inteligencija stvorila fiktivnu bazu podataka koja je obuhvaćala 160 muških i 140 ženskih pacijenata koja je ukazivala da kod duboke anteriorne lamelarne keratoplastike dobijete oblikovaniju rožnicu te kvalitetniji vid. A obrnuto je već kada se pogledaju ranija klinička istraživanja. Što je zabrinjavajuće jest da je baza podataka napravljena iznenađujuće lako. No, ima načina i da se ovako duboka manipulacija prepozna. Iako ne sasvim lako. Novinari Naturea angažirali su stručnjake za provjeru autentičnosti koji u tu svrhu koriste protokole oblikovane u tu svrhu. I uočena je neusklađenost kod mnogih 'sudionika' između naznačenog spola i spola koji bi se obično očekivao prema njihovom imenu. Nadalje, nije pronađena nikakva korelacija između prijeoperacijskih i postoperativnih mjerenja sposobnosti vida i oblika rožnice.

Pregledana je i distribucija brojeva u nekim od stupaca u skupu podataka kako bi se provjerilo nenasumične uzorke. Vrijednosti oblika rožnice prošle su ovaj test, ali neke od vrijednosti dobi sudionika grupirane su na način koji bi bio krajnje neobičan u izvornom skupu podataka. Postojao je, naime, neproporcionalan broj sudionika čije su vrijednosti dobi završavale sa 7 ili 8. Autori lažirane studije priznaju da njihov skup podataka ima nedostatke koji bi se mogli otkriti pomnim ispitivanjem. Sve ovo vrlo je zabrinjavajuće jer provjera podataka u predloženim znanstvenim radovima jest temeljita ali se ne radi na način da otkrije umjetnom inteligencijom sintetizirane pofatke. Odnosno, sadašnji protokoli kojim se provjeravaju podaci nisu osmišljeni na takav način, nisu toliko detaljni da traže šablone pronađene u ovom 'lažiranom' radu, te će ih se morati nadograđivati.