Mengapa lompatan kecerdasan buatan (AI) DeepSeek hanya membuat China berada di posisi terdepan untuk saat ini.
Para pengamat benar dalam mengatakan bahwa chatbot AI baru DeepSeek merupakan terobosan besar, tetapi jangan terlalu serius menanggapi semua hype tentang China yang kini mendominasi bidang ini.
Kekhawatiran berlebihan bahwa China kini mendominasi lanskap kecerdasan buatan (AI) adalah keliru. : Unsplash: Solen Feyissa Lisensi Unsplash
| Oleh: |
| Editor: |
| Jonathan K. Kummerfeld - The University of Sydney - - |
| Suzannah Lyons - Senior Commissioning Editor, 360info |
|
|
| Dean Southwell - Production Editor, 360info - - |
Para pengamat benar dalam mengatakan bahwa chatbot AI baru DeepSeek merupakan terobosan besar, tetapi jangan terlalu serius menanggapi semua hype tentang China yang kini mendominasi bidang ini.
`
Reaksispontan terhadap peluncuran chatbot AI perusahaan China DeepSeek secara keliru menganggap hal itu memberikan China keunggulan yang berkelanjutan dalam pengembangan kecerdasan buatan dan mengabaikan cara-cara kunci di mana hal itu dapat mendorong permintaan akan perangkat keras AI.
ModelDeepSeek diperkenalkan pada akhir Januari, menawarkan chatbot AI yang bersaing dengan model terkemuka OpenAI AS, o1, yang saat ini menggerakkan ChatGPT.
Model DeepSeek menawarkan kemajuan signifikan dalam penggunaan hardware, termasuk penggunaan chip yang jauh lebih sedikit dan kurang bertenaga dibandingkan model lain, serta efisiensi pembelajaran yang lebih tinggi, sehingga membuatnya jauh lebih murah untuk dikembangkan.
Pengumuman tersebut mendominasi siklus berita internasional, dan para pengamat sering menyarankan bahwa kedatangan DeepSeek akan secara dramatis mengurangi permintaan akan chip AI.
Pengumuman DeepSeek juga memicu penurunan tajam saham teknologi AS, yang menghapus hampir AU$1 triliun dari nilai produsen chip terkemuka Nvidia.
Reaksi dramatis ini mengabaikan empat cara inovasi DeepSeek sebenarnya dapat memperluas permintaan akan hardware AI:
Dengan mengurangi sumber daya yang dibutuhkan untuk melatih model, lebih banyak perusahaan akan dapat melatih model untuk kebutuhan mereka sendiri dan menghindari membayar premi untuk akses ke model-model besar teknologi.
Perusahaan teknologi besar dapat menggabungkan pelatihan yang lebih efisien dengan sumber daya yang lebih besar untuk meningkatkan kinerja lebih lanjut.
Peneliti akan dapat memperluas jumlah eksperimen yang mereka lakukan tanpa memerlukan sumber daya tambahan.
OpenAI dan penyedia model terkemuka lainnya dapat memperluas jangkauan model mereka, beralih dari satu model generik — pada dasarnya model serba bisa seperti yang kita miliki sekarang — ke berbagai model yang lebih spesifik, misalnya satu model yang dioptimalkan untuk ilmuwan versus model lain yang dirancang untuk penulis.
Apa yang membuat model DeepSeek begitu istimewa?
Peneliti di seluruh dunia telah mengeksplorasi cara-cara untuk meningkatkan kinerja model AI.
Inovasi dalam ide-ide inti telah dipublikasikan secara luas, memungkinkan peneliti untuk membangun atas karya satu sama lain.
DeepSeek telah menggabungkan dan mengembangkan berbagai ide, dengan kemajuan kunci dalam hardware dan cara kerja pembelajaran.
DeepSeek menggunakan hardware secara lebih efisien. Saat melatih model-model besar ini, begitu banyak komputer yang terlibat sehingga komunikasi di antara mereka dapat menjadi bottleneck. Komputer-komputer tersebut menjadi idle, membuang-buang waktu sambil menunggu komunikasi. DeepSeek mengembangkan cara baru untuk melakukan perhitungan dan komunikasi secara bersamaan, menghindari downtime.
DeepSeek juga membawa inovasi dalam cara pembelajaran bekerja. Semua model bahasa besar saat ini memiliki tiga fase pembelajaran.
Pertama, model bahasa belajar dari sejumlah besar teks, mencoba memprediksi kata berikutnya dan diperbarui jika membuat kesalahan. Kemudian, model belajar dari sejumlah contoh spesifik yang jauh lebih kecil, yang memungkinkan model bahasa besar dapat berkomunikasi dengan pengguna secara percakapan. Akhirnya, model belajar dengan menghasilkan output, dievaluasi, dan menyesuaikan diri sebagai respons.
Pada fase terakhir, tidak ada jawaban yang benar secara mutlak di setiap langkah pembelajaran. Sebaliknya, model belajar bahwa satu output lebih baik atau lebih buruk daripada yang lain.
Metode DeepSeek membandingkan sejumlah besar output pada fase terakhir pembelajaran, yang cukup efektif untuk memungkinkan fase kedua dan ketiga menjadi jauh lebih singkat dan mencapai hasil yang sama.
Secara keseluruhan, perbaikan ini secara dramatis meningkatkan efisiensi.
Bagaimana model DeepSeek akan mendorong pengembangan AI lebih lanjut?
Salah satu opsi adalah melatih dan menjalankan model AI yang sudah ada menggunakan peningkatan efisiensi DeepSeek untuk mengurangi biaya dan dampak lingkungan model tersebut sambil tetap dapat mencapai hasil yang sama.
Kita juga dapat menggunakan inovasi DeepSeek untuk melatih model yang lebih baik. Hal ini bisa berarti memperluas teknik-teknik ini ke lebih banyak hardware dan waktu pelatihan yang lebih lama, atau bisa berarti membuat berbagai model, masing-masing disesuaikan untuk tugas atau jenis pengguna tertentu.
Masih banyak hal yang belum kita ketahui.
Pekerjaan DeepSeek lebih terbuka daripada OpenAI karena telah merilis modelnya, namun tidak sepenuhnya terbuka seperti model OLMo dari Allen Institute for AI yang merupakan lembaga nirlaba, yang digunakan dalam chatbot Playground mereka.
Secara kritis, kita tahu sangat sedikit tentang data yang digunakan dalam pelatihan. Microsoft dan OpenAI sedang menyelidiki klaim bahwa sebagian data mereka mungkin digunakan untuk membuat model DeepSeek. Kita juga tidak tahu siapa yang memiliki akses ke data yang disediakan pengguna ke situs web dan aplikasi mereka.
Ada juga unsur sensor dalam model DeepSeek. Misalnya, model ini akan menolak membahas kebebasan berbicara di China. Kabar baiknya, DeepSeek telah mempublikasikan deskripsi metode mereka sehingga peneliti dan pengembang dapat menggunakan ide-ide tersebut untuk menciptakan model baru, tanpa risiko bias DeepSeek ditransfer.
Pengembangan DeepSeek merupakan langkah signifikan dalam perkembangan AI secara keseluruhan, tetapi bukan perubahan fundamental seperti peralihan ke machine learning pada 1990-an atau kemunculan jaringan saraf pada 2010-an.
Kemungkinan besar hal ini tidak akan menghasilkan keunggulan jangka panjang bagi DeepSeek dalam pengembangan AI.
Kesuksesan DeepSeek menunjukkan bahwa inovasi AI dapat terjadi di mana saja dengan tim yang secara teknis mumpuni dan didanai dengan baik. Peneliti di seluruh dunia akan terus bersaing, dengan keunggulan berpindah-pindah antara perusahaan.
Bagi konsumen, DeepSeek juga dapat menjadi langkah menuju kontrol yang lebih besar atas data pribadi Anda dan model yang lebih personal.
Baru-baru ini, Nvidia mengumumkan DIGITS, sebuah komputer desktop dengan daya komputasi cukup untuk menjalankan model bahasa besar.
Jika daya komputasi di meja Anda meningkat dan skala model menyusut, pengguna mungkin dapat menjalankan model bahasa besar yang berperforma tinggi sendiri, menghilangkan kebutuhan data untuk meninggalkan rumah atau kantor.
Dan hal itu kemungkinan besar akan mendorong penggunaan AI yang lebih luas, bukan sebaliknya.
Dr Jonathan K. Kummerfeld adalah dosen senior di Sekolah Ilmu Komputer Universitas Sydney. Ia bekerja di bidang pemrosesan bahasa alami, dengan fokus khusus pada sistem kolaborasi antara manusia dan model AI.
Diterbitkan awalnya di bawah lisensi Creative Commons oleh 360info™.
`
Artikel ini diterjemahkan menggunakan alat kecerdasan buatan otomatis yang berpotensi memiliki kesalahan, kesilapan dan ketidakakuratan. Berbagai upaya sudah dilakukan untuk memastikan kejelasan dan koherensi, terjemahan ini bisa saja tidak lengkap dalam menangkap nuansa, intonasi dan tujuan dari teks aslinya. Untuk versi yang tepat, silakan merujuk pada artikel aslinya.
`
Artikel ini pertama kali dipublikasikan tanggal 30 Jan 2025 di bawah lisensi Creative Commons oleh 360info™