
Çalışma, Kanıta Dayalı Tıbba Dayanan Yapay Zekâ Aracının Diğer Yapay Zekâ Araçlarını ve Çoğu Doktoru USMLE Sınavlarında Geçtiğini Gösteriyor
University at Buffalo’nun geliştirdiği SCAI adlı klinik yapay zekâ aracı, ABD Tıbbi Lisans Sınavı’nda (USMLE) doktorların ve diğer yapay zekâ araçlarının önüne geçti. %95,2’lik rekor doğruluk oranıyla, kanıta dayalı tıbba odaklanan bu araç, doktorların karar alma süreçlerini destekleyebilir. 13 milyon tıbbi veriyle donatılan SCAI, karmaşık tıbbi soruları insan benzeri akıl yürütmeyle yanıtlıyor ve hasta güvenliğini artırma potansiyeli taşıyor.
SCAI’nin Üstün Performansı
University at Buffalo’nun biyomedikal bilişim araştırmacıları tarafından geliştirilen güçlü bir klinik yapay zekâ aracı olan Semantic Clinical Artificial Intelligence (SCAI), ABD Tıbbi Lisans Sınavı’nın (USMLE) her üç aşamasında da dikkat çekici bir doğruluk sergiledi. JAMA Network Open dergisinde 22 Nisan 2025’te yayımlanan makaleye göre, SCAI, çoğu doktorun ve diğer tüm yapay zekâ araçlarının önüne geçerek USMLE 3. aşamada %95,2 doğruluk oranı elde etti. Karşılaştırma için, GPT4 Omni aynı sınavda %90,5 skor aldı.
SCAI Nedir ve Nasıl Çalışır?
SCAI, kanıta dayalı tıbba dayanan bir yapay zekâ aracı olarak, doktorların karar alma süreçlerini desteklemek için tasarlandı. Araştırmanın baş yazarı ve Jacobs Tıp ve Biyomedikal Bilimler Okulu’nda Biyomedikal Bilişim Bölüm Başkanı olan Dr. Peter L. Elkin, “SCAI, mevcut en doğru klinik yapay zekâ aracıdır ve doktorlar için kritik bir ortak olabilir” diyor. Araç, klinisyenlerin veya halkın tıbbi sorularına şu adreste yanıt veriyor: https://halsted.compbio.buffalo.edu/chat/.
Geleneksel Yapay Zekâdan Farkı
Çoğu yapay zekâ aracı, çevrimiçi verilerdeki istatistiksel ilişkileri kullanarak sorulara yanıt verir ve bu araçlar genellikle “üretici yapay zekâ” olarak adlandırılır. Ancak Dr. Elkin, bu modellerin bazen internetteki bilgileri kopyaladığını ve karmaşık akıl yürütme gerektiren sorularda yetersiz kaldığını belirtiyor. SCAI ise 13 milyon tıbbi veri ve bu veriler arasındaki tüm olası etkileşimleri içeren bir bilgi tabanına sahip. Semantik üçlüler (örneğin, “Penisilin, pnömokok pnömonisini tedavi eder”) kullanılarak oluşturulan semantik ağlar, SCAI’nin insan benzeri akıl yürütme yapmasını sağlıyor.
SCAI’nin Teknik Özellikleri
SCAI, doğal dil işleme yazılımı temel alınarak geliştirildi ve son tıbbi literatür, klinik kılavuzlar, genetik veriler, ilaç bilgileri, taburcu önerileri ve hasta güvenliği verileri gibi geniş bir bilgi yelpazesiyle zenginleştirildi. Olası önyargılı veriler (örneğin, klinik notlar) çalışmaya dahil edilmedi. Araç, şu teknikleri kullanıyor:
- Bilgi grafikleri: Tıbbi verilerdeki yeni bağlantıları ve gizli kalıpları bulmak için.
- Geri alma destekli üretim: Harici bilgi veritabanlarından bilgi alarak yanıtların doğruluğunu artırıyor ve “uydurma” (confabulation) eğilimini azaltıyor.
- Biçimsel semantik: Büyük dil modeline bağlam sağlayarak daha doğru yanıtlar üretiyor.
Doktorlarla İnsan-Yapay Zekâ İş Birliği
Dr. Elkin, SCAI’nin diğer büyük dil modellerinden farklı olarak doktorlarla diyalog kurabildiğini ve karar alma süreçlerine kendi akıl yürütmesiyle katkıda bulunabildiğini vurguluyor. “SCAI, tıbbi eğitim sırasında öğrenilen akıl yürütme biçimini taklit ederek karmaşık sorulara yanıt veriyor” diyor. Bu özellik, aracı yalnızca bir yardımcı araç olmaktan çıkarıp doktorlarla ortak bir çalışma partneri haline getiriyor.
Hasta Güvenliği ve Erişimde Potansiyel
SCAI, geniş veri tabanı sayesinde hasta güvenliğini artırma, sağlık hizmetlerine erişimi iyileştirme ve uzmanlık bakımını demokratikleştirme potansiyeline sahip. Örneğin, birincil bakım sağlayıcıları ve hatta hastalar, uzmanlık ve alt uzmanlık alanlarındaki tıbbi bilgilere kolayca erişebilir. Ancak Dr. Elkin, SCAI’nin doktorların yerini almayacağını, yalnızca onları destekleyeceğini vurguluyor: “Yapay zekâ doktorların yerini almayacak, ancak yapay zekâ kullanan bir doktor, kullanmayanı geçebilir.”
Çalışmanın Kapsamı ve Destek
Araştırma, Ulusal Sağlık Enstitüleri ve Gazi İşleri Bakanlığı tarafından finanse edildi. SCAI, USMLE sınavlarında doktorların bilgi, kavram ve hasta odaklı becerilerini ölçen soruları yanıtladı. Görsel bileşen içeren sorular testten çıkarıldı. Çalışmada University at Buffalo’dan Guresh Mehta, Frank LeHouillier, Melissa Resnick, Crystal Tomlin, Skyler Resendez ve Jiaxing Liu ile Roswell Park Kapsamlı Kanser Merkezi’nden Sarah Mullin ve Gazi İşleri Bakanlığı’ndan Jonathan R. Nebeker ve Steven H. Brown yer aldı.
Yayın Tarihi: 22 Nisan 2025
Kaynak: University at Buffalo
Referans: Elkin, P. L., Mehta, G., LeHouillier, F., et al. (2025). Semantic Clinical Artificial Intelligence vs Native Large Language Model Performance on the USMLE. JAMA Network Open, 8(4): e256359. DOI: 10.1001/jamanetworkopen.2025.6359
İlk yorum yapan siz olun