Peringatan Keamanan Anthropic Berujung Bumerang, Pemerintah AS Blokir Model AI Terkuatnya

Pemerintah Amerika Serikat pada Jumat lalu memerintahkan Anthropic, salah satu pengembang kecerdasan buatan terkemuka, untuk segera memutus akses terhadap dua model AI paling kuatnya, Claude Fable 5 dan Claude Mythos 5.
Langkah ekstrem ini diambil dengan alasan kekhawatiran serius terhadap keamanan nasional, sebuah klaim yang telah dipatuhi Anthropic meski perusahaan meyakini pemerintah telah salah langkah dalam penilaiannya.
Arahan tersebut, yang diterima Anthropic pada Jumat pukul 17.21 ET, secara efektif memaksa perusahaan untuk menonaktifkan kedua model tersebut bagi semua pengguna di seluruh dunia.
Padahal, aturan kontrol ekspor pemerintah Amerika Serikat secara nominal hanya menargetkan warga negara asing, namun dampak penonaktifan ini jauh lebih luas; akses ke model Anthropic lainnya tetap tidak terpengaruh.
Penting untuk memahami signifikansi dari model-model ini, terutama Mythos, yang merupakan model AI paling mumpuni milik Anthropic.
Perusahaan ini telah memperkenalkannya secara terbatas sejak awal April karena kemampuannya yang luar biasa dalam menemukan kerentanan keamanan pada perangkat lunak, bahkan mengidentifikasi celah di setiap sistem operasi dan peramban web utama yang diujinya.
Alih-alih merilisnya secara luas, Anthropic meluncurkan program terkontrol bernama Project Glasswing, membagikannya kepada sekitar 50 organisasi terpilih, termasuk Amazon, Apple, Google, Microsoft, dan CrowdStrike, untuk digunakan dalam pekerjaan keamanan siber defensif.
Sementara itu, Fable 5 yang baru dirilis tiga hari sebelumnya, adalah jawaban Anthropic atas tekanan komersial yang nyata.
Model ini dirancang sebagai versi Mythos yang dilengkapi dengan pengaman untuk memblokir respons di area berisiko tinggi seperti keamanan siber dan biologi, sehingga dianggap cukup aman untuk rilis publik; menurut pengujian tolok ukur dari Vals AI, sebuah perusahaan pelacak kinerja teknologi AI, Fable 5 segera menjadi model AI paling mumpuni yang tersedia untuk umum.
Arahan pemerintah secara formal dibingkai sebagai tindakan kontrol ekspor untuk membatasi akses warga negara asing terhadap model-model tersebut.
Namun, dalam sebuah unggahan blog yang panjang, Anthropic menyatakan pemahamannya bahwa kekhawatiran mendasar justru terletak pada dugaan 'jailbreak' terhadap Fable 5, yakni upaya melewati batas keamanan sistem AI. Sejauh ini, pemerintah hanya memberikan bukti verbal tentang 'potensi jailbreak sempit yang tidak universal'—yang, menurut Anthropic, berupa pemberian perintah kepada model untuk membaca basis kode spesifik dan mengidentifikasi kelemahan perangkat lunak; Anthropic menambahkan bahwa 'tingkat kemampuan' semacam ini sudah tersedia secara luas di model lain yang dapat diakses publik, termasuk GPT-5.5 dari OpenAI, dan rutin digunakan oleh para profesional keamanan siber untuk tujuan defensif.
Argumen Anthropic yang lebih luas menegaskan bahwa pengamanan terkuatnya beroperasi melalui sistem klasifikasi independen yang berfungsi terpisah dari model itu sendiri.
Ini berarti, bahkan jika seseorang berhasil meyakinkan Fable untuk terus merespons di luar batasan, perlindungan mendasar terhadap luaran paling berbahaya tetap berada di tempatnya.
Meskipun demikian, tidak ada alasan tersebut yang cukup untuk menghentikan tindakan pemerintah, dan Anthropic tidak menyembunyikan rasa frustrasinya.
“Kami tidak setuju bahwa penemuan potensi jailbreak sempit harus menjadi alasan untuk menarik model komersial yang telah digunakan oleh ratusan juta orang,” tulis perusahaan itu. “Jika standar ini diterapkan di seluruh industri, kami percaya ini akan secara fundamental menghentikan semua penerapan model baru dari semua penyedia model terdepan.”
Anthropic secara luas diperkirakan akan mengejar penawaran umum perdana (IPO) tahun ini dan telah menambatkan sebagian besar identitas publiknya pada citra sebagai alternatif yang sadar keamanan dibandingkan para pesaingnya.
Ironisnya, kehati-hatian yang ditunjukkan Anthropic dalam membatasi Mythos — yang dipromosikan sebagai model yang begitu berbahaya sehingga tidak dapat dirilis secara publik — kini justru menarik perhatian pemerintah yang dapat mengganggu bisnisnya secara signifikan.
Sam Altman dari OpenAI tampaknya menikmati situasi ini, setidaknya.
Pada bulan April, ia mengatakan kepada podcaster Ashlee Vance bahwa penanganan Mythos oleh Anthropic sama dengan 'pemasaran berbasis ketakutan'; “Jelas ini adalah pemasaran yang luar biasa untuk mengatakan, ‘Kami telah membuat bom. Kami akan menjatuhkannya di kepala Anda. Kami akan menjual Anda tempat berlindung bom seharga USD 100 juta,” ujar Altman.
Altman, yang perusahaannya juga diperkirakan akan melakukan IPO sesegera mungkin, memang tidak memprediksi penutupan pemerintah, tetapi ia mengidentifikasi sesuatu yang kini kembali menghantam Anthropic: ketika Anda menghabiskan berbulan-bulan memberitahu dunia bahwa AI Anda sangat berbahaya, dunia – termasuk pemerintah AS – cenderung akan mendengarkan.
Baca juga tulisan lainnya dari Beritana Update
Penulis: Beritana Update
Editor: Beritana Editor







