(SeaPRwire) –
By: Oliver Hawthorne
Risiko medis adalah ranah di mana kesalahan kecil bisa berakibat fatal. Namun, klaim terbaru dari OpenAI menantang batasan ini dengan tegas. GPT-5.5 Instant dinilai lebih akurat daripada jawaban yang ditulis oleh dokter manusia dalam uji coba kesehatan. Angka ini tidak muncul dari ruang hampa. Data ini berasal dari jutaan interaksi nyata pengguna.
Lebih dari 230 juta orang kini memanfaatkan ChatGPT untuk nasihat kesehatan setiap minggu. Mereka menggunakannya untuk membaca hasil laboratorium hingga mempersiapkan diri bertemu dokter. Karan Singhal memimpin upaya ini setelah sebelumnya membangun Med-PaLM di Google. Ia menggandeng lebih dari 200 dokter untuk membangun HealthBench. Alat evaluasi ini menjadi standar baru dalam mengukur kinerja AI di bidang medis.
Fakta teknis menunjukkan penurunan masalah faktual sebesar 71% dalam dua bulan terakhir. Ini berdasarkan lalu lintas produksi pesan kesehatan miliaran per minggu. Model ini dinilai memiliki lebih sedikit kegagalan mode. Dokter menilai AI lebih baik dalam mendeteksi tanda bahaya merah. AI juga lebih proaktif meminta konteks tambahan sebelum memberikan saran.
Di sisi lain, tantangan terbesar tetap ada. AI tidak memiliki rekam medis pasien seperti dokter sungguhan. Fitur ChatGPT Health yang diluncurkan Januari mencoba mengatasi ini. Pengguna bisa menghubungkan aplikasi kesehatan dan mengunggah catatan medis. Namun, fitur ini masih memiliki daftar tunggu. Sementara itu, gugatan hukum atas saran berbahaya dari GPT-4o masih berlangsung. OpenAI menolak tanggung jawab namun terus mengembangkan fitur kesehatan.
Author bio: Oliver Hawthorne, a Principal Correspondent permanently stationed at an international technology review, covering the intersection of artificial intelligence and global healthcare infrastructure.
