DeepSeek Rilis V3.2-Exp, Klaim Tekan Biaya Inference 50%

30 September 2025

Telko.id – DeepSeek memperkenalkan model eksperimental baru bernama DeepSeek V3.2-Exp yang dirancang untuk menekan biaya inferensi yang jauh lebih rendah saat digunakan dalam operasi konteks panjang. DeepSeek menyebut model tersebut sebagai ‘langkah anatara menuju arsitektur generasi berikutnya’.

Arsitektur baru yang dimaksud kemungkinan akan menjadi peluncuran produk terpenting DeepSeek sejak model V3 dan R1 yang sempat mengejutkan publik.

Mengutip dari TechCrunch, Selasa (30/9/2025) fitur utama dalam model baru ini disebut DeepSeek Sparse Attention.

Mekanismenya cukup unik menggunakan modul Bernama Lighting Indexer untuk memprioritaskan bagian-bagian tertentu dari jendela konteks. Setelah itu, ada sistem lain Bernama fine-grained token selection yang memilih token paling relevan dari potongan tersebut untuk dimasukkan ke jendela perhatian model yang terbatas.

Dengan cara ini, model DeepSeek V3.2-Exp ini tetap bisa menangani konteks panjang tanpa membebani server terlalu besar. Berdasarkan uji awal, biaya panggilan API untuk operasi dengan konteks panjang bisa ditekan hingga 50%.

TINGGALKAN KOMENTAR Batal membalas

Silakan masukkan komentar anda!

Silakan masukkan nama Anda di sini

Anda telah memasukkan alamat email yang salah!

Silakan masukkan alamat email Anda di sini

ARTIKEL TERKAIT

BCA Luncurkan Aplikasi myBCA untuk Smartwatch, Transaksi Makin Cepat

Spotify Hadirkan Audio Lossless dan Paket Premium Baru

AWS dan Jane Goodall Institute Digitalisasi 65 Tahun Riset Primata

DeepSeek Rilis V3.2-Exp, Klaim Tekan Biaya Inference 50%

TINGGALKAN KOMENTAR Batal membalas

ARTIKEL TERBARU

HONOR 400 Bawa Fitur AI untuk Traveling Tanpa Drama

OPPO Umumkan Apex Guard, Standar Baru Kualitas Smartphone

BCA Luncurkan Aplikasi myBCA untuk Smartwatch, Transaksi Makin Cepat

Spotify Hadirkan Audio Lossless dan Paket Premium Baru

Galaxy Z Flip7 dan Gemini AI Solusi Bisnis Online Lebih Efisien