Telko.id – Perkembangan kecerdasan buatan (AI) terus menunjukkan lonjakan signifikan, termasuk dalam hal kemampuan kognitif yang kini mulai diukur menggunakan pendekatan seperti IQ.
Perusahaan pengembang kecerdasan buatan seperti OpenAI dan Anthropic saling berlomba untuk menghadirkan AI canggih dengan tingkat kepintaran yang terus ditingkatkan.
Saat dirilis, setiap perusahaan juga kerap membagikan hasil benchmark yang menunjukkan kepiawaian model AI terbarunya.
Praktik serupa dilakukan Tracking AI, platform yang secara khusus menguji dan membandingkan performa berbagai model AI.
Platform ini mengukur tingkat kepintaran model AI menggunakan tes IQ. Datanya kemudian divisualisasikan oleh perusahaan media independen, Visual Capitalist.
Tracking AI menggunakan tes IQ Mensa Norwegia untuk menguji tingkat kepintaran model AI dari setiap perusahaan. Pengujian yang dilakukan pada April 2026, melibatkan setidaknya 26 model AI dari berbagai perusahaan AI.
Hasil pengujian menunjukkan bahwa, model AI Grok-4.20 dari xAI dan OpenAI 5.4 Pro (Vision) dengan skor yang sama yaitu 145 menempati posisi teratas dengan skor tertinggi dibandingkan model lain.
Gemini 3.1 Pro Preview diurutan selanjutnya dengan skor 141.
Grok dinilai unggul dalam kemampuan memahami konteks kompleks, menyelesaikan soal logika tingkat lanjut, serta memberikan jawaban yang lebih konsisten dalam berbagai skenario pengujian.
Baca Juga:
- Google Cloud Hadirkan AI untuk Bantu Produksi Konten
- ChatGPT Images 2.0 Bikin Desain Jadi Lebih Praktis
Skor tertinggi model AI dalam pengujian ini terbilang telah meningkat dibandingkan dengan pengujian tahun 2025 lalu, dimana skor tertingginya hanya 135 poin.
Model-model ini umumnya diuji menggunakan berbagai benchmark yang mengukur kemampuan analisis, matematika, bahasa, serta penalaran abstrak. Hasilnya, perbedaan antar model semakin tipis, menandakan bahwa perkembangan AI kini bergerak sangat cepat dan kompetitif.
Penggunaan istilah “IQ” pada AI sebenarnya masih menjadi perdebatan. Berbeda dengan manusia, kecerdasan AI diukur berdasarkan performa pada tugas tertentu, bukan kemampuan umum yang menyeluruh.
Oleh karena itu, skor yang dihasilkan lebih tepat dianggap sebagai indikator kemampuan teknis dalam menyelesaikan masalah, bukan ukuran kecerdasan dalam arti luas.
Selain model AI dari perusahaan besar tersebut, pemain asal China juga mulai menunjukkan daya saing yang kuat. Dari sejumlah model yang diuji, Qwen 3.5 menjadi model AI asal China dengan peringkat tertinggi, menandakan kemampuannya sudah mampu bersaing di level global.
Berikut rincian daftar model AI dengan ‘IQ’ tertinggi
- Grok-4.20 Expert Mode – 145
- OpenAI GPT-5.4 Pro (Vision) – 145
- Gemini 3.1 Pro Preview – 141
- OpenAI GPT-5.4 Thinking (Vision) – 139
- OpenAI GPT-5.3 – 136
- Grok-4.20 Expert Mode (Vision) – 133
- OpenAI GPT-5.4 Thinking – 133
- Meta Muse Spark – 133
- Gemini 3.1 Pro Preview (Vision) – 132
- Qwen 3.5 – 130
- Claude 4.6 Opus – 130
- Kimi K2.5 – 127
- Manus – 115
- DeepSeek R1 – 112
- DeepSeek V3 – 111
- Gemini 3.1 Flash – 110
- Llama 4 Maverick – 110
- GPT-5.3 (Vision) – 109
- Claude 4.6 Sonnet – 106
- Bing Copilot – 101
- Perplexity – 97
- Mistral Medium 3.1 – 96
- Claude 4.6 Sonnet (Vision) – 94
- Claude 4.6 Opus (Vision) – 82
- Llama 4 Maverick (Vision) – 79
- GPT-5.4 Pro (non-vision) – 73
Meski demikian, peningkatan kemampuan ini menunjukkan bahwa AI semakin mendekati cara berpikir manusia dalam beberapa aspek.
Model AI kini tidak hanya mampu menjawab pertanyaan sederhana, tetapi juga dapat melakukan analisis kompleks, memahami konteks, hingga membantu pengambilan keputusan.
Perkembangan ini berarti layanan berbasis AI akan menjadi semakin cerdas dan responsif. Mulai dari asisten digital hingga tools produktivitas, kemampuan AI yang terus meningkat berpotensi memberikan pengalaman yang lebih akurat, cepat, dan relevan dalam berbagai kebutuhan sehari-hari.
Namun perlu dicatat bahwa skor ini hanya sebagai perbandingan saja, tidak menjadi patokan pasti kecerdasan AI secara menyeluruh. Pasalnya, tes berbasis IQ hanya mengukur satu aspek, yakni kemampuan penalaran pola, tidak mengukur aspek lainnya, dihimpun Visual Capitalist.


