Tidak lama lagi, Anda Mungkin Tidak Tahu Anda Berbual dengan Komputer

Isi kandungan:

Tidak lama lagi, Anda Mungkin Tidak Tahu Anda Berbual dengan Komputer
Tidak lama lagi, Anda Mungkin Tidak Tahu Anda Berbual dengan Komputer
Anonim

Key Takeaway

  • Hari semakin hampir apabila anda tidak dapat membezakan pertuturan yang dijana komputer daripada perkara sebenar.
  • Google baru-baru ini melancarkan LaMDA, model yang boleh membolehkan perbualan yang lebih semula jadi.
  • Menghasilkan pertuturan seperti manusia juga memerlukan sejumlah besar kuasa pemprosesan.
Image
Image

Pada masa ini, mudah untuk mengetahui apabila anda bercakap dengan komputer, tetapi itu mungkin berubah tidak lama lagi kerana kemajuan terkini dalam AI.

Google baru-baru ini melancarkan LaMDA, model eksperimen yang didakwa syarikat itu boleh meningkatkan keupayaan pembantu AI perbualannya dan membolehkan perbualan yang lebih semula jadi. LaMDA berhasrat untuk bercakap secara normal tentang hampir semua perkara tanpa sebarang latihan terlebih dahulu.

Ia adalah salah satu daripada semakin banyak projek AI yang boleh membuatkan anda tertanya-tanya sama ada anda bercakap dengan manusia.

"Anggaran saya ialah dalam tempoh 12 bulan akan datang, pengguna akan mula terdedah kepada dan membiasakan diri dengan suara baharu yang lebih emosi ini, " James Kaplan, Ketua Pegawai Eksekutif MeetKai, pembantu suara maya AI perbualan dan carian enjin, kata dalam temu bual e-mel.

"Sebaik sahaja ini berlaku, pertuturan yang disintesis hari ini akan didengari kepada pengguna seperti pertuturan awal 2000-an yang kita dengar hari ini."

Pembantu Suara Dengan Perwatakan

LaMDA Google dibina pada Transformer, seni bina rangkaian saraf yang dicipta oleh Google Research. Tidak seperti model bahasa lain, LaMDA Google telah dilatih tentang dialog sebenar.

Sebahagian daripada cabaran untuk membuat pertuturan AI yang berbunyi semula jadi ialah sifat perbualan terbuka, Eli Collins dari Google menulis dalam catatan blog.

Image
Image

"Sembang dengan rakan tentang rancangan TV boleh berubah menjadi perbincangan tentang negara tempat rancangan itu difilemkan sebelum menyelesaikan perdebatan tentang masakan serantau terbaik negara itu," tambahnya.

Perkara sedang bergerak pantas dengan pertuturan robot. Eric Rosenblum, rakan kongsi pengurusan di Tsingyuan Ventures, yang melabur dalam AI perbualan, berkata bahawa beberapa masalah paling asas dalam pertuturan berbantukan komputer hampir diselesaikan.

Sebagai contoh, kadar ketepatan dalam memahami pertuturan sudah sangat tinggi dalam perkhidmatan seperti transkripsi yang dilakukan oleh perisian Otter.ai atau nota perubatan yang diambil oleh DeepScribe.

"Tetapi, sempadan seterusnya adalah lebih sukar," tambahnya.

"Mengekalkan pemahaman konteks, yang merupakan masalah yang melampaui pemprosesan bahasa semula jadi, dan empati, seperti komputer yang berinteraksi dengan manusia perlu memahami kekecewaan, kemarahan, ketidaksabaran, dsb. Kedua-dua isu ini sedang diusahakan, tetapi kedua-duanya agak jauh daripada memuaskan."

Rangkaian Neural Adalah Kunci

Untuk menjana suara seperti hidup, syarikat menggunakan teknologi seperti rangkaian saraf dalam, satu bentuk pembelajaran mesin yang mengklasifikasikan data melalui lapisan, Matt Muldoon, presiden Amerika Utara di ReadSpeaker, sebuah syarikat yang membangunkan perisian teks ke pertuturan, berkata dalam temu bual e-mel.

"Lapisan ini memperhalusi isyarat, menyusunnya ke dalam klasifikasi yang lebih kompleks," tambahnya. "Hasilnya ialah pertuturan sintetik yang kedengaran luar biasa seperti manusia."

Teknologi lain yang sedang dibangunkan ialah Pemindahan Prosody, yang melibatkan penggabungan bunyi satu suara teks ke pertuturan dengan gaya pertuturan yang lain, kata Muldoon. Terdapat juga pembelajaran pemindahan, yang mengurangkan jumlah data latihan yang diperlukan untuk menghasilkan suara teks-ke-pertuturan saraf baharu.

Kaplan berkata menghasilkan pertuturan seperti manusia juga memerlukan sejumlah besar kuasa pemprosesan. Syarikat sedang membangunkan cip pemecut saraf, yang merupakan modul tersuai yang berfungsi bersama dengan pemproses biasa.

"Peringkat seterusnya dalam ini akan meletakkan cip ini ke dalam perkakasan yang lebih kecil, kerana pada masa ini ia sudah pun dilakukan untuk kamera apabila AI untuk penglihatan diperlukan," tambahnya. "Tidak lama lagi, keupayaan pengkomputeran jenis ini tersedia dalam fon kepala itu sendiri."

Satu cabaran untuk membangunkan pertuturan dipacu AI ialah setiap orang bercakap secara berbeza, jadi komputer cenderung sukar memahami kita.

"Fikirkan aksen Georgia lwn. Boston lwn. Dakota Utara, dan sama ada bahasa Inggeris ialah bahasa utama anda atau tidak," kata Monica Dema, yang bekerja pada analitik carian suara di MDinc, dalam e-mel. "Berfikir secara global, adalah mahal untuk melakukan ini untuk semua wilayah di Jerman, China dan India, tetapi itu tidak bermakna ia tidak atau tidak boleh dilakukan."

Disyorkan: