Key Takeaway
- Sekumpulan pembangun baharu sedang membina model AI sumber terbuka.
- Kumpulan ini menggunakan model latihan bahasa besar-besaran yang akan dikeluarkan di bawah lesen terbuka.
- AI sumber terbuka boleh membantu menjadikan kuasa teknologi baharu yang berpotensi mengubah permainan kurang terdedah kepada berat sebelah dan ralat.
Terdapat banyak penyelidikan tentang kecerdasan buatan oleh syarikat besar (AI), tetapi satu kumpulan dalam talian mahu mendemokrasikan proses tersebut.
EleutherAI ialah kolektif penyelidik sukarela, jurutera dan pembangun yang ditubuhkan baru-baru ini yang memfokuskan pada penyelidikan AI sumber terbuka. Organisasi menggunakan pangkalan kod GPT-Neo dan GPT-NeoX untuk melatih model bahasa besar-besaran yang ia merancang untuk dikeluarkan di bawah lesen terbuka.
"Data sumber terbuka memberi manfaat kepada penyelidik kerana saintis mempunyai lebih banyak sumber percuma untuk digunakan untuk melatih model dan menyelesaikan penyelidikan," kata Edward Cui, Ketua Pegawai Eksekutif syarikat AI Graviti, kepada Lifewire dalam temu bual e-mel. Syarikatnya tidak terlibat dalam EueutherAI. "Kami tahu bahawa banyak projek AI telah ditahan oleh kekurangan umum data berkualiti tinggi daripada kes penggunaan sebenar, jadi adalah penting untuk mewujudkan panduan yang memastikan kualiti data, dengan bantuan komuniti yang mengambil bahagian."
Inilah Caranya
Permulaan EleutherAI adalah sederhana. Tahun lepas, seorang penyelidik AI bebas bernama Connor Leahy menyiarkan mesej berikut pada pelayan Discord: "Hai kawan-kawan, izinkan [SIC] berikan OpenAI untuk mendapatkan wang mereka seperti hari-hari yang indah."
Maka, kumpulan itu ditubuhkan. Ia kini mempunyai ratusan penyumbang yang menyiarkan kod mereka pada repositori perisian dalam talian GitHub.
Usaha AI sumber terbuka bukanlah perkara baharu. Malah, platform pengurusan aliran kerja Airbnb dan enjin penemuan data Lyft adalah hasil daripada menggunakan alat sumber terbuka untuk membolehkan pasukan data melakukan kerja yang lebih baik dengan data, kata Ali Rehman, pengurus projek untuk syarikat perisian CloudiTwins dalam temu bual e-mel dengan Lifewire.
"Sama seperti revolusi sumber terbuka telah membawa kepada transformasi pembangunan perisian, ia juga telah memacu pembangunan dan pendemokrasian sains data dan kecerdasan buatan," kata Rehman. "Sumber terbuka telah menjadi pemboleh kritikal penyelesaian sains data perusahaan, dengan majoriti saintis data menggunakan alat sumber terbuka."
Membuka Pintu
Membangunkan AI sumber terbuka boleh membantu menjadikan kuasa teknologi baharu yang berpotensi mengubah permainan kurang terdedah kepada berat sebelah dan ralat, sesetengah pemerhati berpendapat.
Penyelidikan AI kini terutamanya berlaku di tempat terbuka, dengan hampir semua syarikat, makmal penyelidikan dan universiti membentangkan keputusan mereka serta-merta dalam penerbitan ilmiah, Kush Varshney, seorang penyelidik AI di IBM, memberitahu Lifewire dalam temu bual e-mel.
"Komuniti terbuka ini penting, kerana ia menyediakan tahap semakan dan imbangan yang dipertingkatkan untuk memastikan AI sedang dikaji, dicipta, digunakan dan digunakan secara bertanggungjawab," tambah Varshney. "Ini amat kritikal dalam situasi di mana sistem ini boleh mempengaruhi kehidupan ahli masyarakat kita yang paling terdedah. Keterbukaan ini terpakai bukan sahaja pada pembelajaran mesin umum dan algoritma pembelajaran mendalam tetapi juga pada elemen AI yang boleh dipercayai."
Rehman berkata bahawa salah satu perbezaan kritikal antara perisian proprietari dan sumber terbuka ialah fleksibiliti dan penyesuaian. Penyelidikan AI proprietari akan menghadapi masalah dengan keselamatan, kemas kini dan pengoptimuman.
"Ini kerana pendekatan berasaskan komuniti sumber terbuka mendapat input berharga daripada ribuan pakar industri yang mengenal pasti potensi kelemahan keselamatan yang kemudiannya diperbaiki dengan lebih cepat," tambah Rehman."Konsensus masyarakat bermakna kualiti terjamin dan peluang baharu lebih mudah dikenal pasti."
Isu lain ialah penyelidikan AI proprietari tidak akan saling beroperasi, bermakna ia tidak boleh berfungsi dengan pelbagai format data dan berkemungkinan akan mempunyai kunci masuk vendor, yang menghalang syarikat daripada menguji dan mencuba perisian sebelum memberikan penyelesaian, Rehman berkata.
Tetapi bukan setiap aspek penyelidikan AI perlu menjadi sumber terbuka, Chris Kent, Ketua Pegawai Eksekutif syarikat AI perubatan Reveal Surgical, memberitahu Lifewire dalam temu bual e-mel. "Adalah penting untuk melindungi insentif ekonomi yang memacu pembangunan komersial aplikasi utama AI," katanya.
Walau bagaimanapun, penyelidikan terhadap AI memerlukan komponen sumber terbuka yang mantap, kata Kent. Beliau menambah bahawa sumber terbuka berfungsi untuk membina kepercayaan dan menggunakan set data yang tidak atau tidak sepatutnya dikawal oleh institusi atau syarikat tunggal.
"Pendekatan sumber terbuka ialah cara terbaik untuk mengenal pasti dan mengimbangi kecenderungan asas yang mungkin wujud dalam set latihan dan akan membawa kepada aplikasi AI yang lebih holistik, kreatif dan boleh dipercayai," kata Kent.