Studi Temukan ChatGPT-5 Sering Salah 1 dari 4 Kali, Ini Penyebabnya

Rabu, 24 September 2025 - 13:02 WIB

Oleh :

Trisya Frida

ChatGPT-5/GPT-5

Sumber :

Tangkapan Layar

Digital – Artificial Intelligence (AI) semakin banyak digunakan dalam kehidupan sehari-hari, mulai dari mencari informasi, membuat konten, hingga memberikan saran. Namun, meskipun terlihat pintar, ChatGPT-5 ternyata masih sering salah. Menurut studi terbaru dari OpenAI, chatbot ini bisa keliru sekitar 1 dari 4 kali.

Apa Itu Halusinasi AI?

Halusinasi AI terjadi ketika chatbot memberikan jawaban yang salah atau menyimpang jauh dari pertanyaan, namun tetap disampaikan dengan penuh percaya diri. Misalnya, ada kasus pengguna hanya meminta ide, tetapi ChatGPT tiba-tiba menghasilkan cerita fantasi panjang yang tidak relevan.

Kenapa ChatGPT-5 Sering Menebak daripada Mengaku Tidak Tahu?

Menurut riset OpenAI yang dilansir dari Tom’s Guide, akar masalahnya ada pada sistem evaluasi model AI. Dalam pengujian, chatbot yang menjawab “saya tidak tahu” justru mendapat nilai rendah. Sebaliknya, model yang selalu memberi jawaban,meski salah, cenderung mendapat peringkat lebih tinggi.

Model Baru Belum Tentu Lebih Jujur

Menariknya, studi juga menemukan bahwa model terbaru yang fokus pada penalaran, seperti o3 dan o4-mini, justru lebih sering halusinasi dibanding model lama. Alasannya, model ini menghasilkan lebih banyak klaim dan pernyataan, sehingga kemungkinan salah juga lebih besar.

Dengan kata lain, semakin pintar sebuah model dalam menjelaskan sesuatu, tidak berarti ia semakin jujur untuk mengakui keterbatasannya.

Solusi: Mengubah Cara Menilai AI

Para peneliti menyarankan agar sistem penilaian AI diubah. Alih-alih menghukum model karena berkata “saya tidak yakin”, seharusnya model diberi penghargaan jika bisa memberikan jawaban dengan tingkat kepastian yang jelas, atau bahkan menunda jawaban sampai ada sumber valid.

Jika perubahan ini diterapkan, chatbot di masa depan mungkin akan lebih sering berkata: “Saya rasa jawabannya ini, tapi saya tidak sepenuhnya yakin.” Meski terdengar lambat, pendekatan ini justru dapat mengurangi kesalahan berbahaya dan membuat interaksi AI lebih aman.

Apa Artinya Bagi Pengguna?

Jika Anda menggunakan AI populer seperti ChatGPT, Gemini, Claude, atau Grok, kemungkinan besar sudah pernah melihat halusinasi. Studi ini menegaskan bahwa masalah tersebut bukan sepenuhnya kesalahan model, melainkan hasil dari cara mereka diuji.

Bagi pengguna, ini menjadi pengingat bahwa jawaban AI sebaiknya dianggap sebagai saran awal, bukan kebenaran mutlak. Melakukan verifikasi informasi dan meminta sumber adalah langkah penting sebelum mempercayai hasil dari chatbot.

Sementara itu, bagi pengembang, riset ini menjadi sinyal bahwa sudah saatnya mengukur keberhasilan AI bukan dari seberapa banyak ia menjawab, tetapi seberapa jujur ia dalam mengakui keterbatasan.

Studi OpenAI menunjukkan bahwa ChatGPT-5 bisa salah 25% dari waktu penggunaannya. Kesalahan ini bukan terjadi begitu saja, tetapi karena sistem evaluasi yang lebih menghargai jawaban percaya diri ketimbang kejujuran.

Ke depan, jika sistem penilaian diubah, mungkin kita akan melihat chatbot yang lebih berhati-hati dan transparan. Sampai saat itu tiba, pengguna tetap harus kritis, melakukan cross-check, dan mengingat bahwa AI bukan pengganti logika serta verifikasi manusia.

Studi Temukan ChatGPT-5 Sering Salah 1 dari 4 Kali, Ini Penyebabnya

Apa Itu Halusinasi AI?

Kenapa ChatGPT-5 Sering Menebak daripada Mengaku Tidak Tahu?

Model Baru Belum Tentu Lebih Jujur

Solusi: Mengubah Cara Menilai AI

Apa Artinya Bagi Pengguna?

Sony RX1R III Resmi di Indonesia, Kamera Full-Frame Ringkas dengan Sentuhan AI

MediaTek Dimensity 9500 Resmi Dirilis: Lebih Kencang, Efisien, dan Canggih dengan AI

Rahasia Edit Foto di Gemini AI Biar Tetap Mirip Wajah Asli, Hasilnya Bikin Takjub!

Satu Prompt Rahasia Ini Bisa Membuat ChatGPT Jadi Lebih Pintar

Google Gemini Dapat 3 Fitur Baru Setelah Geser ChatGPT di App Store

Gemini Resmi Hadir di Google TV, Gantikan Google Assistant dengan Fitur AI yang Lebih Canggih

techno

ChatGPT Hadirkan Fitur Baru Premium, Hanya Bisa Dinikmati dengan Biaya Rp3 Juta per Bulan

techno

Daftar Kota Dengan Internet Paling Cepat di Indonesia, Nomor 2 Gak Disangka!

techno

Gemini Hadir di Google TV, Fitur AI Canggih yang Bikin Nonton Lebih Pintar

techno

Huawei Watch GT 6 Resmi Dirilis, Segera Hadir di Indonesia dengan Baterai 21 Hari dan Fitur Kesehatan Super Canggih

techno

Kesepakatan Fantastis! Nvidia Gelontorkan Rp1.663 Triliun untuk OpenAI, Saingi Dominasi Microsoft

techno

7 HP Flagship Tercanggih 2025: Performa Gila dan Kamera Juara!

hp

Samsung Galaxy A36 dan Galaxy A56 Mulai Terima Update Stabil One UI 8 Berbasis Android 16

hp

7 Alasan Kenapa Charger Laptop Cepat Rusak dan Cara Mencegahnya

laptop

5 HP Samsung Murah Sudah Pakai eSIM: Layar Super AMOLED 120Hz, Kamera OIS dan RAM 12GB!

hp

Review Infinix Hot 60 Pro: HP 2 Jutaan Rasa Flagship atau ZONK? Cek Kelebihan & Kekurangan yang Bikin Nyesel!

hp

Deretan Green Jobs Bergaji Tinggi hingga Tembus Rp5 Miliar Setahun, Minat?

cuan

7 HP Flagship Tercanggih 2025: Performa Gila dan Kamera Juara!

hp

Kondisi Ekonomi Bedu Sebelum Gugat Cerai Disorot: Terlilit Utang Hingga Jual Rumah, Saldo Tak Sampai Rp100 Ribu

Showbiz

Daftar Lengkap 28 Pemain Timnas Indonesia untuk Hadapi Arab Saudi dan Irak

Sport

Penyebab Marselino Ferdinan Dicoret Kluivert dari Timnas Indonesia Vs Arab Saudi dan Irak

Sport

4 Pemain Penting Timnas Indonesia Absen di R4 Kualifikasi Piala Dunia 2026

Sport

Heboh! Ternyata Ada Simpatisan FPI Jadi Tersangka Penghasutan Penjarahan

Berita

Bangunan Rumah Retak, Dapur Ambruk, Dampak Gempa Banyuwangi Mulai Terlihat

Mindset

Gempa 5,7 SR Guncang Banyuwangi, Atap Masjid Muttaqin Ambrol Desa Sidowangi

Banyuwangi

Jalan Batu Jomba Tapsel Lagi-lagi Amblas, Ijeck Dorong Pemerintah Segera Bangun Jalan Baru Demi Keselamatan Masyarakat

Medan

Biar Nggak Melempem, Begini Cara Buat Bakwan Jagung Tetap Enak

Padang

Hp

Laptop

Samsung

Chatgpt

Mesin cuci

6 Rekomendasi Humidifier Terbaik 2025: Udara Lebih Sehat, Tidur Nyenyak, Kulit Tetap Lembap

techno

Xiaomi Bikin Panas Pasar Tablet! Redmi Pad 2 Pro & Pad Mini Hadir dengan Fitur ‘Kelas Sultan’ Harga Ramah Kantong

techno

5 Mesin Cuci Rp 1 Jutaan Terbaik 2025, Hemat Listrik dan Awet untuk Jangka Panjang

techno