Nvidia Klaim AI Hemat Memori GPU hingga 8x

2026, Februari 25

Telko.id – NVIDIA mengumumkan terobosan teknologi kecerdasan buatan yang memungkinkan model AI besar (model bahasa besar) menjalankan proses pemikiran (reasoning) dengan penggunaan memori pada GPU hingga delapan kali lebih rendah dibandingkan metode konvensional — namun tanpa mengorbankan hasil (akurasi).

Ini merupakan langkah penting dalam menangani salah satu tantangan terbesar dalam penerapan AI saat ini: biaya dan kebutuhan perangkat keras yang sangat tinggi.

Secara teknis, inovasi ini didasarkan pada teknik baru yang disebut Dynamic Memory Sparsification (DMS) , yang membuat AI bisa “mengelola” memori internalnya dengan lebih pintar.

Selama model AI berpikir atau menyelesaikan tugas kompleks, ia membuat semacam catatan sementara yang disebut KV cache — bagian memori ini sering menjadi penyebab utama GPU cepat penuh dan menjadi hambatan kinerja.

Dengan DMS, model dibor untuk menentukan data mana yang penting dan mana yang bisa dihapus tanpa merusak kualitas jawaban , serta menjalankan proses ini dengan penundaan singkat agar informasi penting tetap bertahan sebelum dibuang. Pendekatan semacam ini mirip dengan “perpustakawan pintar” yang tahu mana buku yang masih berguna dan mana yang bisa disimpan kembali supaya rak tetap rapi.

Nvidia Klaim AI Hemat Memori GPU hingga 8x

Daftar Dynamic Memory Sparsification, GPU, Nvidia, Nvidia DMS

Other Processor's

Dominasi Nvidia di China Mulai Tergerus Chip Lokal

MediaTek dan Starlink Hadirkan Layanan Satelit Darurat ke Ponsel

HP Ungkap Biaya Memori PC Naik Drastis Akibat Tren AI