TECHNO

Kesenjangan bahasa di Internet di Amerika Serikat adalah masalah yang mendesak bagi orang Asia-Amerika


Chen mengatakan bahwa meskipun kebijakan pengeditan konten dari Facebook, Twitter, dan lainnya telah menyaring beberapa disinformasi yang paling jelas dalam bahasa Inggris, sistem sering kehilangan konten tersebut jika menggunakan bahasa lain. Sebaliknya, pekerjaan harus dilakukan oleh sukarelawan seperti timnya, yang mencari disinformasi dan dilatih untuk menjinakkan dan mengurangi penyebarannya. “Mekanisme ini bertujuan untuk menangkap kata-kata dan hal-hal tertentu yang tidak serta merta menangkap informasi yang menyesatkan dan menyesatkan ketika menggunakan bahasa yang berbeda,” tambahnya.

Layanan dan teknologi Google Terjemahan seperti Translatotron dan headset terjemahan waktu nyata menggunakan kecerdasan buatan untuk beralih antarbahasa. Tetapi Xiong percaya bahwa alat ini tidak cocok untuk Hmong, yang merupakan bahasa yang sangat kompleks di mana konteks sangat penting. “Saya pikir kami telah menjadi sangat puas dan bergantung pada sistem canggih seperti Google,” katanya. Mereka mengklaim bahwa mereka adalah “bahasa yang dapat diakses” dan kemudian saya membacanya dan mengatakan sesuatu yang sama sekali berbeda. ”

(Seorang juru bicara Google mengakui bahwa bahasa yang lebih kecil “menimbulkan pekerjaan terjemahan yang lebih sulit,” tetapi mengatakan perusahaan “telah berinvestasi dalam penelitian yang secara khusus mendapat manfaat dari terjemahan bahasa sumber daya rendah,” menggunakan pembelajaran mesin dan umpan balik komunitas.)

Sepanjang jalan

Tantangan bahasa online melampaui Amerika Serikat – dan, secara harfiah, ke kode dasar. Yudhanjaya Wijeratne adalah peneliti dan ilmuwan data di Sri Lanka Research Center LIRNEasia. Pada tahun 2018, ia mulai melacak botnet yang aktivitasnya di media sosial mendorong kekerasan terhadap Muslim: pada bulan Februari dan Maret tahun itu, serangkaian kerusuhan oleh umat Buddha dan masjid Sinhala Muslim menjadi sasaran di kota Ampara dan Kandy. Timnya telah mendokumentasikan “logika berburu” robot, membuat katalog ratusan ribu postingan media sosial Sinhala, dan memposting hasilnya ke Twitter dan Facebook. “Mereka akan mengatakan segala macam hal yang baik dan bermaksud baik – pada dasarnya pernyataan kaleng,” katanya. (Dalam sebuah pernyataan, Twitter mengatakan menggunakan tinjauan manusia dan sistem otomatis untuk “menerapkan aturan kami secara tidak memihak kepada semua orang yang bertugas, terlepas dari latar belakang, ideologi, atau penempatan pada spektrum politik”).

Baca Juga :   Parlemen UE Bergerak Maju Mengusulkan Pengurangan Emisi Karbon 60% di Tahun 2030

Setelah menghubungi MIT Technology Review, juru bicara Facebook mengatakan perusahaan telah meminta penilaian hak asasi manusia independen tentang peran platform dalam kekerasan di Sri Lanka, yang diterbitkan pada Mei 2020, dan telah memperkenalkan perubahan setelah serangan, termasuk mempekerjakan puluhan. Makelar konten berbahasa Sinhala dan Tamil. “Kami telah menerapkan teknologi proaktif untuk mendeteksi ujaran kebencian dalam bahasa Sinhala untuk membantu kami lebih cepat dan lebih efektif dalam mengidentifikasi konten yang berpotensi melanggar,” kata mereka.

“Apa yang dapat saya lakukan dengan tiga baris kode dengan Python dalam bahasa Inggris membutuhkan waktu dua tahun untuk meneliti 28 juta kata Sinhala.”

Yudhanjaya Wijeratne, LIRNEasia

Saat perilaku robot berlanjut, Wijeratne menjadi curiga terhadap vulgar. Dia memutuskan untuk melihat pustaka kode dan alat perangkat lunak yang digunakan perusahaan, dan menemukan bahwa mekanisme untuk memantau ujaran kebencian di sebagian besar bahasa selain bahasa Inggris belum dibuat.

“Faktanya, belum banyak penelitian yang dilakukan pada banyak bahasa seperti bahasa kami,” kata Wijeratne. “Apa yang dapat saya lakukan dengan tiga baris kode Python dalam bahasa Inggris membutuhkan waktu dua tahun untuk menggali 28 juta kata Sinhala untuk membangun kelompok inti, membangun alat dasar, dan kemudian meningkatkannya ke tingkat di mana saya berpotensi melakukan tingkat ini analisis teks “.

Setelah pelaku bom bunuh diri menargetkan gereja-gereja di Kolombo, ibu kota Sri Lanka, pada April 2019, Wegertine merancang alat untuk menganalisis ujaran kebencian dan disinformasi di Sinhala dan Tamil. Sistem yang disebut Watchdog adalah aplikasi seluler gratis yang mengumpulkan berita dan menghubungkan peringatan dengan cerita palsu. Peringatan datang dari relawan yang dilatih untuk memeriksa fakta.

Baca Juga :   Dewan Inggris Menghadapi Kesenjangan Pendanaan Rencana untuk Memotong Dukungan Disabilitas | Kebutuhan pendidikan khusus

Wegertine menegaskan bahwa pekerjaan ini lebih dari sekadar penerjemahan.

“Beberapa algoritme yang kami anggap remeh dan sering dikutip dalam penelitian, terutama dalam pemrosesan bahasa alami, menunjukkan hasil yang sangat baik untuk bahasa Inggris,” katanya. “Namun demikian, banyak algoritme yang identik, bahkan yang digunakan dalam bahasa yang berbeda satu sama lain hanya dalam beberapa derajat – baik itu Jerman Barat atau dari pohon bahasa Roman – dapat memberikan hasil yang sama sekali berbeda.”

Pemrosesan bahasa alami adalah dasar dari sistem pengeditan konten otomatis. Wijeratne menerbitkan makalah penelitian pada tahun 2019 yang meneliti perbedaan antara keakuratannya dalam berbagai bahasa. Dia berpendapat bahwa semakin banyak sumber daya komputasi yang ada untuk suatu bahasa, seperti kumpulan data dan halaman web, semakin baik algoritme dapat berfungsi. Bahasa dari negara atau masyarakat miskin dirugikan.

“Jika Anda sedang membangun, katakanlah, Empire State Building untuk bahasa Inggris, Anda memiliki cetak birunya. Dia berkata,” Anda memiliki bahan-bahannya. ” Untuk setiap bahasa lain, Anda tidak memiliki cetak birunya.

“Anda tidak tahu dari mana asal beton itu. Anda tidak memiliki baja atau pekerja juga. Jadi Anda duduk di sana sambil mengetuk satu batu bata pada satu waktu dan berharap cucu atau cucu Anda menyelesaikan proyek itu.”

Masalah yang mengakar

Gerakan untuk mempresentasikan cetak biru tersebut dikenal sebagai persamaan bahasa, dan ini bukanlah hal baru. American Bar Association menggambarkan keadilan bahasa sebagai “kerangka kerja” yang melindungi hak-hak orang “untuk berkomunikasi, memahami, dan memahami dalam bahasa yang mereka sukai dan rasakan dengan kejelasan dan kekuatan terbesar.”

Baca Juga :   Jack Vining: 10 Hal Terlucu yang Pernah Saya Lihat (Di Internet) | komedi



Source link