GPT-4 sfidon doktorë ekspertë në testet e shikimit

18.04.2024

GPT-4 performoi më mirë sesa fillestarët duke gjetur 60 prej 87 pyetjeve. Pesë ekspertët kishin një mesatare të përbashkët prej 66.4 pyetjesh të gjetura saktë.

GPT-4 sfidon doktorë ekspertë në testet e shikimit Foto: Ilustrim

Ndërsa modelet AI vijojnë të avancojnë, e njëjta po ndodh edhe me dilemat sesi ato mund të vihen në shërbim të shoqërisë siç është fusha e mjekësisë.

Një studim i fundit nga Shkolla e Mjekësisë Klinike në Universitetin e Kembrixhit gjeti se GPT-4 performoi po aq mirë sa ekspertët e vlerësimit oftalmologjik.

Studimi i publikuar në PLOS Digital Health, thotë se hulumtuesit kanë testuar edhe modelin paraardhës GPT-3.5, PaLM2 të Google dhe Meta LLaMA përballë 87 pyetjeve. Pesë ekspertë, tre fillestarë dhe dy doktorë të pa specializuar ju nënshtruan të njëjtit testim.

GPT-4 performoi më mirë sesa fillestarët duke gjetur 60 prej 87 pyetjeve. Pesë ekspertët kishin një mesatare të përbashkët prej 66.4 pyetjesh të gjetura saktë.

PaLM 2 i Google gjetin 49 pyetje, GPT-3.5 gjeti 42 pyetje de modeli LLaMA i Google gjeti vetëm 28 pyetje. Ndërsa këto rezultate kanë përfitime të mundshme, ka edhe mjaft rreziqe dhe shqetësime.