Key Takeaway
- Semakin banyak program dapat memahami ucapan anda.
- Teknologi baharu menghasilkan bunyi audio tersuai di latar belakang semasa anda bercakap untuk mengelirukan perisian yang mungkin sedang mendengar.
-
Teknik baharu ini mencapai prestasi masa nyata dengan meramalkan serangan pada masa depan isyarat atau perkataan.
Banyak program boleh memahami pertuturan anda semasa panggilan telefon atau video, dan pakar mengatakan ia mungkin menimbulkan ancaman privasi.
Teknologi baharu yang dibangunkan oleh penyelidik Universiti Columbia, dipanggil Neural Voice Camouflage, mungkin menawarkan pertahanan. Ia menjana bunyi audio tersuai di latar belakang semasa anda bercakap, mengelirukan kecerdasan buatan (AI) yang mendengar dan menyalin suara.
"Kehadiran transkripsi AI menimbulkan isu kepercayaan, " Michael Huth, pengasas bersama Xayn, enjin carian yang melindungi privasi dan ketua Jabatan Pengkomputeran di Imperial College London, yang tidak terlibat dalam penyelidikan itu, memberitahu Lifewire dalam temu bual e-mel. "Peserta mesyuarat mungkin lebih berhati-hati tentang perkara yang mereka bangkitkan dan bagaimana ucapan mereka ditranskripsikan. Ini boleh menjadi perkara yang baik kerana ia boleh meningkatkan tingkah laku hormat, tetapi ia juga boleh menjadi perkara yang buruk kerana perbualan mungkin kurang terbuka kerana tempahan tentang teknologi yang digunakan."
Mendengar dan Belajar
Para penyelidik Columbia berusaha untuk mereka bentuk algoritma yang boleh memecahkan rangkaian saraf dalam masa nyata. Pendekatan baharu menggunakan "serangan ramalan"-isyarat yang boleh mengganggu mana-mana perkataan yang model pengecaman pertuturan automatik dilatih untuk ditranskripsikan. Di samping itu, apabila bunyi serangan dimainkan di udara, bunyi itu perlu cukup kuat untuk mengganggu mana-mana mikrofon "mendengar masuk" penyangak yang mungkin berada jauh.
"Cabaran teknikal utama untuk mencapai ini adalah untuk menjadikan semuanya berfungsi dengan cukup pantas, " kata Carl Vondrick, seorang profesor sains komputer di Columbia dan salah seorang pengarang kajian yang menerangkan pendekatan baharu itu, dalam satu berita. lepaskan. "Algoritma kami, yang berjaya menyekat mikrofon penyangak daripada mendengar perkataan anda dengan betul 80% pada setiap masa, adalah yang terpantas dan paling tepat di atas katil ujian kami."
Teknik baharu mencapai prestasi masa nyata dengan meramalkan serangan pada masa depan isyarat atau perkataan. Pasukan itu mengoptimumkan serangan, jadi ia mempunyai kelantangan yang serupa dengan bunyi latar belakang biasa, membolehkan orang di dalam bilik bercakap secara semula jadi dan tanpa berjaya dipantau oleh sistem pengecaman pertuturan automatik.
Peserta mesyuarat mungkin lebih berhati-hati tentang perkara yang mereka bangkitkan dan cara ucapan mereka ditranskripsikan.
Para saintis berkata teknik mereka berfungsi walaupun anda tidak tahu apa-apa tentang mikrofon penyangak itu, seperti lokasinya atau perisian komputer yang dijalankan padanya. Ia menyamarkan suara seseorang melalui udara, menyembunyikannya daripada sistem pendengaran ini dan tanpa menyusahkan perbualan antara orang di dalam bilik.
"Setakat ini, kaedah kami berfungsi untuk sebahagian besar perbendaharaan kata bahasa Inggeris dan kami merancang untuk menggunakan algoritma pada lebih banyak bahasa, serta akhirnya menjadikan bunyi bisikan tidak dapat dilihat sepenuhnya, " Mia Chiquier, pengarang utama daripada kajian itu dan seorang pelajar PhD di makmal Vondrick, berkata dalam siaran berita.
Menjaga Perbualan Anda Peribadi
Seolah-olah semua itu tidak mencukupi, iklan mungkin menyasarkan anda berdasarkan audio yang dikumpulkan daripada telefon pintar atau peranti rumah pintar anda juga.
"Dengan peranti seperti [Amazon Echo] dan rakan sejawatannya, peranti ini bukan sahaja sentiasa berada di rumah anda, sentiasa mendengar semua yang anda katakan atau lakukan, tetapi mereka-melalui pengumpulan data selama bertahun-tahun daripada pengguna mereka-mempunyai menyempurnakan pemprosesan bahasa semula jadi (menukar perkataan yang dituturkan kepada teks/data yang boleh digunakan untuk peranti melalui gabungan mikrofon, perisian dan AI), " kata Erik Haig, sekutu di Harbour Research, firma perundingan strategi dan pembangunan usaha niaga, dalam e-mel.
transkripsi AI bagi pertuturan perbualan kini merupakan bahagian standard perisian komersial standard, kata Huth. Contohnya, Microsoft Teams mempunyai pilihan mesyuarat rekod dengan transkripsi AI terbina dalam yang boleh dilihat oleh semua peserta dalam masa nyata. Transkrip lengkap boleh berfungsi sebagai rekod mesyuarat. Biasanya, transkrip sedemikian membenarkan pengambilan minit (aka pengambilan nota), di mana minit akan diluluskan pada mesyuarat seterusnya.
"Orang ramai mungkin bimbang untuk diintip apabila transkripsi AI dihidupkan," tambah Huth."Ini nampaknya hampir sama dengan kebimbangan untuk merakam perbualan tanpa persetujuan atau secara rahsia."
Tetapi tidak semua orang bersetuju bahawa peranti pintar adalah ancaman. Kebanyakan orang tidak perlu risau tentang program yang mendengar perbualan anda, Brad Hong, peneraju kejayaan pelanggan di firma keselamatan siber Horizon3, memberitahu Lifewire melalui e-mel. Dia berkata kebimbangan paling ketara sekarang bukanlah siapa yang merekodkan anda, tetapi bagaimana mereka menyimpan data.
"Semua cerita yang didengari tentang mikrofon pada komputer atau peranti mudah alih mereka diaktifkan, Alexa atau Google Home mendengarnya, malah pengawasan kerajaan, memang benar semua ini membuat perut orang biasa berkeroncong," tambah Hong. "Tetapi secara keseluruhannya, orang jarang berada dalam situasi yang sebenarnya memerlukan penyamaran suara mereka."