AI Akhirnya Dapat Membantu Menghentikan Ucapan Kebencian

Isi kandungan:

AI Akhirnya Dapat Membantu Menghentikan Ucapan Kebencian
AI Akhirnya Dapat Membantu Menghentikan Ucapan Kebencian
Anonim

Key Takeaway

  • Alat perisian baharu membolehkan AI memantau ulasan Internet untuk ucapan benci.
  • AI diperlukan untuk menyederhanakan kandungan internet kerana jumlah bahan yang sangat besar yang melebihi keupayaan manusia.
  • Tetapi sesetengah pakar mengatakan bahawa pemantauan AI terhadap pertuturan menimbulkan kebimbangan privasi.
Image
Image

Apabila ucapan kebencian dalam talian meningkat, sebuah syarikat berkata ia mungkin mempunyai penyelesaian yang tidak bergantung pada penyederhana manusia.

Pemula yang dipanggil Spectrum Labs menyediakan teknologi kecerdasan buatan kepada penyedia platform untuk mengesan dan menutup pertukaran toksik dalam masa nyata. Tetapi pakar mengatakan bahawa pemantauan AI juga menimbulkan isu privasi.

"Pemantauan AI selalunya memerlukan melihat corak dari semasa ke semasa, yang memerlukan mengekalkan data, " David Moody, sekutu kanan di Schellman, sebuah syarikat penilaian pematuhan keselamatan dan privasi, memberitahu Lifewire dalam temu bual e-mel. "Data ini mungkin termasuk data yang telah dibenderakan oleh undang-undang sebagai data privasi (maklumat pengenalan peribadi atau PII)."

Lagi Ucapan Kebencian

Spectrum Labs menjanjikan penyelesaian berteknologi tinggi kepada masalah pertuturan kebencian yang sudah lama berlaku.

"Secara purata, kami membantu platform mengurangkan usaha penyederhanaan kandungan sebanyak 50% dan meningkatkan pengesanan tingkah laku toksik sebanyak 10x ganda," dakwa syarikat di tapak webnya.

Spectrum berkata ia bekerjasama dengan institut penyelidikan dengan kepakaran dalam tingkah laku berbahaya khusus untuk membina lebih 40 model pengenalan tingkah laku. Platform penyederhanaan kandungan Guardian syarikat itu dibina oleh pasukan saintis data dan moderator untuk "menyokong melindungi komuniti daripada ketoksikan."

Terdapat keperluan yang semakin meningkat untuk cara memerangi ucapan kebencian kerana mustahil bagi manusia untuk memantau setiap trafik dalam talian, Dylan Fox, Ketua Pegawai Eksekutif AssemblyAI, syarikat permulaan yang menyediakan pengecaman pertuturan dan mempunyai pelanggan yang terlibat dalam memantau kebencian ucapan, memberitahu Lifewire dalam temu bual e-mel.

"Terdapat kira-kira 500 juta tweet sehari di Twitter sahaja," tambahnya. "Walaupun seseorang boleh menyemak tweet setiap 10 saat, twitter perlu menggaji 60 ribu orang untuk melakukan ini. Sebaliknya, kami menggunakan alat pintar seperti AI untuk mengautomasikan proses."

Tidak seperti manusia, AI boleh beroperasi 24/7 dan berpotensi menjadi lebih saksama kerana ia direka bentuk untuk menggunakan peraturannya secara seragam kepada semua pengguna tanpa sebarang kepercayaan peribadi mengganggu, kata Fox. Terdapat juga kos untuk mereka yang perlu memantau dan menyederhanakan kandungan.

"Mereka boleh terdedah kepada keganasan, kebencian dan perbuatan keji, yang boleh merosakkan kesihatan mental seseorang," katanya.

Spectrum bukanlah satu-satunya syarikat yang berusaha untuk mengesan ucapan kebencian dalam talian secara automatik. Sebagai contoh, Center Malaysia baru-baru ini melancarkan penjejak dalam talian yang direka untuk mencari ucapan kebencian di kalangan netizen Malaysia. Perisian yang mereka bangunkan dipanggil Tracker Benci-menggunakan pembelajaran mesin untuk mengesan ucapan benci dalam talian, terutamanya di Twitter.

Cabarannya ialah cara mencipta ruang di mana orang ramai benar-benar boleh berinteraksi antara satu sama lain secara membina.

Kebimbangan Privasi

Walaupun penyelesaian berteknologi seperti Spectrum mungkin menentang ucapan kebencian dalam talian, mereka juga menimbulkan persoalan tentang berapa banyak yang perlu dilakukan oleh komputer kepolisan.

Terdapat implikasi pertuturan bebas, tetapi bukan hanya untuk penceramah yang siarannya akan dialih keluar sebagai ucapan kebencian, Irina Raicu, pengarah etika internet di Markkula Center for Applied Ethics di Santa Clara University, memberitahu Lifewire dalam e-mel temu bual.

"Membenarkan gangguan atas nama 'kebebasan bersuara' telah mendorong sasaran ucapan sedemikian (terutama apabila ditujukan kepada individu tertentu) untuk berhenti bercakap-untuk meninggalkan pelbagai perbualan dan platform sepenuhnya, " kata Raicu."Cabarannya ialah cara mencipta ruang di mana orang ramai benar-benar boleh berinteraksi antara satu sama lain secara membina."

Pemantauan pertuturan AI tidak seharusnya menimbulkan isu privasi jika syarikat menggunakan maklumat yang tersedia secara umum semasa pemantauan, kata Fox. Walau bagaimanapun, jika syarikat membeli butiran tentang cara pengguna berinteraksi pada platform lain untuk mengenal pasti pengguna yang bermasalah, ini boleh menimbulkan kebimbangan privasi.

"Ia pasti boleh menjadi sedikit kawasan kelabu, bergantung pada aplikasi," tambahnya.

Image
Image

Justin Davis, Ketua Pegawai Eksekutif Spectrum Labs memberitahu Lifewire dalam e-mel bahawa teknologi syarikat boleh menyemak 2 hingga 5 ribu baris data dalam pecahan sesaat. “Paling penting, teknologi dapat mengurangkan jumlah kandungan toksik yang terdedah kepada moderator manusia,” katanya.

Kita mungkin berada di puncak revolusi dalam pemantauan AI dalam pertuturan dan teks manusia dalam talian. Kemajuan masa depan termasuk keupayaan pemantauan bebas dan autonomi yang lebih baik untuk mengenal pasti bentuk ucapan benci yang tidak diketahui sebelum ini atau mana-mana corak penapisan lain yang akan berkembang, kata Moody.

AI juga tidak lama lagi akan dapat mengenali corak dalam corak pertuturan tertentu dan mengaitkan sumber serta aktivitinya yang lain melalui analisis berita, pemfailan awam, analisis pola trafik, pemantauan fizikal dan banyak pilihan lain, tambahnya.

Tetapi sesetengah pakar mengatakan bahawa manusia sentiasa perlu bekerja dengan komputer untuk memantau ucapan benci.

"AI sahaja tidak akan berfungsi," kata Raicu. "Ia perlu diiktiraf sebagai satu alat yang tidak sempurna yang perlu digunakan bersama dengan respons lain."

Pembetulan 25/1/2022: Menambah petikan daripada Justin Davis dalam perenggan ke-5 dari penghujung untuk menggambarkan e-mel pasca penerbitan.

Disyorkan: