Nova, AI Baru dari Amazon

Pada konferensi re:Invent pada hari Selasa, Amazon Web Services (AWS) memperkenalkan keluarga baru model AI generatif multimodal yang disebut Nova.
Model Nova mencakup empat versi generatif teks: Micro, Lite, Pro, dan Premier. Ketiga versi pertama tersedia untuk pelanggan AWS mulai hari Selasa, sementara Premier akan tersedia pada awal 2025, seperti yang diumumkan oleh CEO Amazon, Andy Jassy.
Selain itu, AWS meluncurkan model generasi gambar yang disebut Nova Canvas dan model generasi video yang dinamai Nova Reel.
Jassy menekankan bahwa "model perbatasan" mereka telah menunjukkan kemajuan signifikan dalam beberapa bulan terakhir, dan jika mereka menemukan nilai dalam model ini, pelanggan juga kemungkinan akan menemukan nilai yang sama.
Micro, Lite, Pro, dan Premier Model teks-generatif Nova, yang dioptimalkan untuk 15 bahasa (terutama bahasa Inggris), bervariasi dalam ukuran dan kemampuan.
Micro memproses dan menghasilkan teks dengan latensi terendah, menawarkan waktu respons tercepat.
Lite menangani input teks, gambar, dan video dengan efisien.
Pro menyeimbangkan akurasi, kecepatan, dan biaya untuk berbagai tugas.
Premier, yang paling canggih, dirancang untuk beban kerja yang kompleks.
Lite, Pro, dan Premier dapat menganalisis teks, gambar, dan video. Mereka cocok untuk tugas seperti meringkas dokumen dan rapat. AWS menempatkan Premier sebagai model "pengajar" untuk membuat model kustom, bukan sebagai solusi mandiri.
Micro dapat menangani hingga sekitar 100.000 kata dengan jendela konteks 128.000 token. Lite dan Pro dapat mengelola hingga sekitar 225.000 kata, 15.000 baris kode, atau 30 menit video dengan jendela konteks 300.000 token. Pada awal 2025, beberapa model Nova akan mendukung lebih dari 2 juta token.
Jassy mengklaim model Nova termasuk yang tercepat dan paling murah di kelasnya. Mereka tersedia di AWS Bedrock, di mana mereka dapat dioptimalkan untuk kecepatan dan efisiensi yang lebih baik.
Canvas dan Reel Canvas dan Reel mewakili upaya terbesar AWS dalam media generatif.
Canvas memungkinkan pengguna untuk membuat dan mengedit gambar dengan prompt, menawarkan kontrol untuk skema warna dan tata letak.
Reel membuat video hingga enam detik dari prompt atau gambar referensi, memungkinkan penyesuaian gerakan kamera untuk efek seperti pans dan rotasi 360 derajat.
Reel akan segera mendukung video dua menit.
Jassy menyoroti kontrol bawaan untuk penggunaan yang bertanggung jawab dalam kedua model, termasuk watermarking dan moderasi konten, yang bertujuan untuk membatasi konten berbahaya.
AWS telah menerapkan langkah-langkah keamanan untuk memerangi misinformasi dan risiko lainnya, meskipun rincian spesifiknya belum jelas.
Perusahaan tetap samar tentang data yang digunakan untuk melatih model ini, mengutip alasan persaingan. Sebagian besar vendor melindungi informasi ini untuk mempertahankan keunggulan kompetitif dan menghindari gugatan terkait IP.
AWS menawarkan kebijakan indemnifikasi untuk pelanggan jika sebuah model menghasilkan salinan yang dilindungi hak cipta.
Melihat ke depan, Jassy menyebutkan model speech-to-speech dan "any-to-any" yang akan datang pada tahun 2025. Model speech-to-speech akan menafsirkan isyarat verbal dan nonverbal, memberikan suara alami. Model any-to-any akan menangani input dan output dalam bentuk teks, ucapan, gambar, dan video, yang ditujukan untuk aplikasi seperti terjemahan dan pengeditan konten.
Pendekatan ini mewakili masa depan pengembangan dan penggunaan model AI, menurut Jassy.