'Halo, Alexa': kisah suara-suara yang berbisik ke mesin

Ketika saya masih di sekolah menengah, Leticia Martín-Fuertes yakin bahwa dia ingin belajar ilmu komputer. Dia memilih sarjana muda teknologi dan, sebelum memasuki universitas, berbelok 180 derajat dan mulai belajar filologi klasik. "Dengan seberapa pintar kamu, bagaimana kamu akan belajar itu?", mereka memberitahunya. Tetapi Leticia melanjutkan dan, selama perlombaan, menemukan sektor yang sepertinya dibuat untuknya. Dia mencampur dua hal yang dia sukai, linguistik dan ilmu komputer. Itu adalah awal dari apa yang akan dia persembahkan, meskipun itu adalah sesuatu yang hampir tidak diketahui banyak orang: linguistik komputasi. Sekarang, bekerja untuk Google mengajarkan cara berbicara dengan asisten suara dan memahami bahasa kami.

Karya ini adalah salah satu cabang sektor yang paling dikenal dan baru mulai karena meningkatnya asisten suara. Saat kami mengucapkan frasa seperti "OK Google, nyalakan lampu", perangkat memahami kami dengan sempurna dan mengeksekusi apa yang kami minta. Tapi Bagaimana Anda mengajar peserta seperti Alexa, Siri atau Google Assistant?

“Salah satu bagian dari pekerjaan kami adalah bahwa mesin memahami kami ketika kami berbicara dengannya. Itu bisa dari apa yang Anda katakan, hubungkan dengan apa yang kita sebut a Saya mencoba, yang merupakan niat pengguna, apa yang ingin ia lakukan, ”jelasnya dalam sebuah wawancara dengan Hiperteks.

Yang baru ditambahkan setiap hari niat untuk menemukan kebutuhan pengguna dan membawa mereka lebih dekat dan lebih dekat dengan kehidupan sehari-hari setiap orang. Contoh dari ini niat itu bisa "Matikan lampu". Meskipun sebagian besar niat pengguna sudah terdaftar dan yang baru ditambahkan setiap hari, masih ada tantangan. Bicaralah dengan asisten suara tidak seperti memiliki percakapan di antara orang-orang, terlepas dari kenyataan bahwa teknologi maju setiap hari di sektor ini.

Jika ada kesalahpahaman dan ambiguitas dalam pembicaraan, dengan asisten suara tidak berbeda. "Jika kami ingin meminta Anda untuk membayar tagihan listrik dan kami mengatakan 'Kami akan membayar cahaya', tentu Anda mengerti" untuk membayar cahaya, "Martín-Fuertes mencontohkan. Jargon yang berbeda juga dapat menjadi tantangan tergantung pada negara berbahasa Spanyol di mana pengguna berada. Kulkas tidak sama dengan kulkas, terutama jika Anda berada di Spanyol atau Meksiko. Oleh karena itu, ahli bahasa komputasi harus mengantisipasi dan mengajarkan mesin semua kemungkinan sinonim dari kata yang sama, bahkan dengan bahaya bahwa suatu istilah terlalu ambigu.

Namun, perusahaan telah berhasil meningkatkan identifikasi berbagai aksen dan bantuan yang tidak menjadi masalah bagi pengguna. Dalam hal ini, Ahli bahasa Alexa, asisten suara dari Amazondijelaskan untuk Hiperteks bahwa orang-orang London mengucapkan kata-kata dengan cara yang sangat berbeda dari Glasgow, dan hal yang sama terjadi di Spanyol. “Kami membutuhkan Alexa untuk dapat memahami sejumlah besar aksen di seluruh Spanyol. Seorang klien dari Córdoba akan mengucapkan hal-hal yang sangat berbeda dari seorang klien dari Santiago de Compostela. Tim telah bekerja sangat keras untuk meningkatkan pemahaman mereka. "

Tapi Apa yang ada di balik prestasi ini?

Linguistik komputasi adalah salah satu bagian kunci yang berkontribusi pada pengembangan kecerdasan buatan, yang telah lama berhenti menjadi bagian dari fiksi ilmiah menjadi teknologi untuk penggunaan sehari-hari. Sistem ini bekerja dengan menganalisis sejumlah besar data, dari mana mereka mengekstrak pola yang memungkinkan mereka untuk membuat keputusan yang diprogramkan kepada mereka. Lorena Fernández, insinyur dan direktur identitas digital di Universitas Deusto (Bilbao), berpikir tentang mereka seolah-olah mereka adalah mahasiswa.

Mereka mempelajari informasi dalam buku teks yang diberikan kepada mereka, tetapi guru juga penting, yang memberi tahu mereka apa yang masuk dalam ujian dan parameter apa yang penting. ”

Perumpamaan ini mengungkapkan kunci pembelajaran yang dilakukan oleh mesin, di mana informasi yang mereka latih dan definisi parameter apa yang paling penting membentuk cara “berpikir” konkret. Tetapi meskipun tampaknya itu adalah proses sempurna, di mana tidak ada ruang untuk kesalahan, ini tidak terjadi.

"Aku kurang memahami wanita."

Setelah dua tahun tinggal di Australia, Louise Kennedy memutuskan untuk mengambil langkah dan akhirnya mengajukan permohonan tempat tinggal permanen di negara yang selama itu memungkinkannya mengabdikan dirinya untuk pekerjaan impiannya: dokter hewan kuda. Untuk memenuhi syarat untuk jenis visa ini, Louise harus lulus tes tingkat bahasa Inggris, sesuatu yang, pada prinsipnya, tidak akan menjadi masalah bagi seorang wanita Irlandia dengan dua gelar yang diperoleh dalam bahasa Inggris seperti dia. Atau begitulah yang saya pikirkan.

Setelah membuktikan tanpa kesulitan kemampuannya dalam membaca dan menulis, dokter hewan muda tidak mencapai skor yang diminta oleh pemerintah dalam tes kelancaran mulut, memperoleh 74 dari 79 poin yang diperlukan untuk lulus ujian. Tetapi mengapa Louise tidak dapat meyakinkan otoritas terkait tentang kemampuannya untuk berbicara dalam bahasanya sendiri dengan benar?

Untuk melaksanakan ujiannya, Louise percaya Pearson, satu dari lima perusahaan yang secara resmi terakreditasi untuk melakukan tes akses visa permanen, tetapi satu-satunya yang menggunakan perangkat lunak pengenalan suara untuk ujian lisan. Masalahnya adalah perangkat lunak lebih mudah mengenali suara pria dari pada feminin Bias teknologi yang jelas telah membuat Louise kemungkinan mengakses tempat tinggal permanen di Australia, memaksanya untuk meminta visa lain yang lebih mahal agar bisa tinggal di negara itu bersama suami dan putranya.

Kecerdasan buatan mengembangkan parameter normal mereka dari data yang mereka peroleh dari masyarakat, sesuatu yang harus mengarah reproduksi prasangka mereka dan kecenderungan, kecuali upaya sengaja dilakukan untuk memperbaikinya. Lorena Fernández percaya bahwa "alasan mendasar dari semua ini adalah bahwa database memiliki lebih banyak data pria kulit putih dan lebih sedikit data suara wanita atau minoritas." Nyatakan itu itu adalah kesalahan untuk memberikan teknologi “aura netralitas dengan yang tampaknya mereka akan membuat keputusan yang lebih baik daripada seseorang, untuk percaya bahwa mereka tidak akan menimbulkan niat atau bias ”.

Jelas bahwa teknologinya tidak sepenuhnya netral, tetapi Apakah masuk akal bahwa mesin itu? Aurora Martínez Rey, PhD dalam Teknologi Informasi, berpendapat bahwa "mengembangkan teknologi 'cerdas' sehingga tidak bertindak ketika telah diprogram untuk itu, tidak masuk akal." Sementara itu, Fernández mengatakan bahwa "tidak ada netralitas", tetapi dalam hal apa pun, itu harus dibedakan antara disengaja dan tidak disengaja. Kehadiran bias yang tidak diinginkan dalam teknologi lebih umum dari yang kita bayangkan dan kadang-kadang, seperti Louise, konsekuensi dari ini kegagalan bisa melampaui kesalahpahaman dengan Siri.

'Halo, Alexa': kisah suara-suara yang berbisik ke mesin 1

Luke Porter / Unsplash

Jika, seperti dalam buku teks sekolah yang dirujuk oleh Fernández, basis data penuh dengan suara laki-laki, tetapi mereka memiliki beberapa contoh suara perempuan, algoritma pembelajaran akan lebih terlatih untuk mengenali dan memahami suara-suara mantan daripada yang terakhir. Untuk mengurangi bias dalam asisten suara, dan kecerdasan buatan pada umumnya, itu penting untuk menggabungkan keragaman sejak awal. "Kata kuncinya di sini adalah intersectionality," kata Fernández. Sesuatu yang melibatkan memiliki database yang mencerminkan keragaman sosial gender, ras, kelas, dll., Tetapi juga dengan benar menentukan parameter penting untuk pengambilan keputusan.

Bahasa mendefinisikan cara berpikir kita dan merupakan tiket yang memungkinkan kita memasuki masyarakat melalui komunikasi. Untuk Carolina Arrieta, PhD dalam Linguistik Terapan dan profesor di UDIMA, "bahasa adalah kesaksian masyarakat dan pada saat yang sama memiliki dampak pada itu", sehingga perlu bahwa mesin belajar berkomunikasi selengkap mungkin. Mempertimbangkan netralitas tata bahasa, untuk Arrieta yang penting "adalah kejadian bahasa dalam masyarakat dan masyarakat dalam bahasa", yaitu, dampak bahasa itu pada orang. Selain dimasukkannya keanekaragaman, ia berkomitmen untuk "tidak pernah melupakan pekerjaan manusia, yang sangat penting untuk membantu mesin menafsirkan data."

Gadis dari Australia itu adalah salah satu korban mesin yang miring dan terbatas. Meskipun kami sebelumnya mengomentari pendapat salah satu pakar tentang netralitas palsu, beberapa teknisi telah mengambil langkah-langkah untuk memastikan bahwa bahasa asisten suara tidak ditandai oleh genre tertentu. Dalam kasus Google, ahli bahasa komputasi memiliki pedoman khusus untuk tidak menangani pengguna baik sebagai pria atau wanita. "Alih-alih" Selamat datang, "kami mencoba membalikkannya dan berkata," Saya menyambut Anda. "Ini dilakukan agar tidak ada gender yang diasumsikan," kata Leticia Martín-Fuentes.

Pekerja Google menambahkan bahwa dia mendukung solusi seperti memasukkan "e" dalam kosakata agar tidak menentukan jenis kelamin orang tersebut. Di masa depan, jika orang menggunakannya lebih dan lebih, ia melanjutkan, mungkin menyebar dan tata bahasanya bisa diubah, meskipun untuk saat ini masih merupakan bahasa khusus.

Dalam hal ini, Carmen Torrijos, ahli bahasa komputasi di Institute of Knowledge Engineering (IIC), melaporkan bahwa setiap rangkaian kata yang diajarkan ke mesin – disebut "corpus" – ditinjau oleh beberapa orang. Oleh karena itu, harus ada konsensus tentang konten yang akan diajarkan. "Kami ingin dia belajar dengan baik dan bukankah itu bias belajar karena kalau tidak hasilnya juga akan bias. Itulah sebabnya kami sangat berhati-hati dengan apa yang kami perkenalkan dalam model, sehingga representatif, umum dan ada konsensus tentang apa yang sedang dipelajari, untuk memiliki model universal, ”katanya dalam wawancara dengan Hiperteks di kantor IIC.

Karena itu, ia menambahkan bahwa saatnya akan tiba ketika Anda harus memasukkan bahasa yang jauh lebih inklusif meskipun, pada saat itu, harus ada konsensus yang jauh lebih besar di tingkat sosial.

Spanyol, seperti yang dinyatakan kanon

Namun perdebatan tidak berakhir di sini. Haruskah kita mengajar mesin-mesin Spanyol sesuai dengan SAR atau juga bentuk yang lebih sehari-hari dan umumnya lebih digunakan?

Para ahli berkonsultasi dengan Hiperteks mereka sepakat bahwa mayoritas mereka mengajarkan mesin-mesin bahasa se netral mungkin. Pertama, karena keputusan ini sejalan dengan tujuan asisten suara dan, dalam kata-kata Martín-Fuertes, tidak dianjurkan bahwa cara bicaranya menarik banyak perhatian karena dapat menyesatkan pengguna. Sementara itu, Luis Alfonso Ureña, pakar Bahasa dan Sistem Komputer di University of Jaén, menganjurkan melakukan penggunaan bahasa yang benar. "Jika kita membuat produksi buruk dari suatu istilah dan menganggapnya dalam sistem jenis ini, kita dapat menyebarkan penyalahgunaan belokan dan ekspresi," katanya dalam sebuah wawancara.

'Halo, Alexa': kisah suara-suara yang berbisik ke mesin 2

Jonas Leupe / Unsplash

Menurut Lorena Fernández, mereka adalah "ini perangkat lunak mereka yang harus melayani masyarakat dan masyarakatlah yang harus menjadi sumber belajar, "walaupun dia bersikeras bahwa itu harus dilakukan tanpa mengabaikan aturan tata bahasa. Di sisi lain, Carolina Arrieta berpendapat bahwa" konteks adalah segalanya. "Untuknya, tata bahasa harus dipelajari dengan presisi, tetapi bidang leksikal mengakui fleksibilitas yang lebih besar. "SAR tidak bersifat preskriptif, (…) ini adalah register dari bahasa Spanyol" dan mesin-mesin harus mengetahui penggunaan sosial dari bahasa tersebut, bahkan jika mereka salah atau diskriminatif. "Mereka seharusnya tahu, tetapi mereka harus tahu bahwa penggunaannya secara sosial dihukum."

Untuk SAR, debat ini tidak diketahui dan telah diputuskan lakukan pengukuran Anda sendiri untuk mendorong penggunaan bahasa dengan baik. Pada akhir 2019 ia mempromosikan, bersama dengan Telefónica, proyek Bahasa Spanyol dan Inteligensi Buatan (LEIA) berfokus pada bidang kecerdasan buatan dan teknologi saat ini.

Perusahaan seperti Google berkolaborasi dalam proyek ini, AmazonMicrosoft Twitter dan Facebook. Mitra teknologi juga telah menandatangani deklarasi niat melalui mana mereka telah berkomitmen untuk menggunakan bahan RAE seperti kamus mereka, tata bahasa atau ejaan dalam pengembangan asisten suara mereka, chatbot dan sumber daya lainnya, sesuai dengan informasi yang disediakan oleh Telefónica.

"Sebuah layanan sedang dibuat untuk umum dan itu sebabnya diperhitungkan bahwa tidak ada kesalahan dibuat dan bahwa tidak ada slang konkret, karena pada tingkat sosial Anda punya komitmen", jelas Nerea Suárez, ahli bahasa komputasi di bidang kecerdasan buatan Aura, asisten suara Telefónica.

Di Google mereka telah mencapai apa yang oleh sebagian orang dianggap sebagai jalan tengah. Ini terdiri dari mengajar asisten suara untuk berbicara dalam bahasa Spanyol "netral" dan "formal" tetapi, sebaliknya, ahli bahasa mulai mengajarkan semua jenis kosa kata sehingga mereka juga bisa mengerti bahasa yang lebih sehari-hari. Misalnya, beberapa pengguna membuat rutinitas sehingga ketika mereka mengatakan "Selamat pagi" atau "Selamat malam" asisten akan mengatur alarm atau memberikan informasi tentang waktu, waktu, dll. Alih-alih "Selamat malam", asisten juga bisa memahami frasa lain seperti "Aku akan ke amplop". Meskipun asisten suara mulai diajarkan bahasa yang lebih sehari-hari, praktik-praktik ini tidak tersebar luas di semua perusahaan teknologi.

Dalam apa beberapa telah mencoba Amazon sedang mencoba Alexa berbicara seolah-olah dia dari Spanyol. "Kami telah bekerja keras untuk melatihnya dalam fonetik regional sehingga dia dapat secara akurat menyebutkan nama-nama tempat penting, orang-orang dan acara di semua wilayah negara," jelas juru bicara asisten.

Contoh fonetik adalah, misalnya, cara orang Spanyol mengucapkan bahasa Inggris. Jika kami meminta Alexa untuk memainkan lagu dari daftar putar kami yang judulnya dalam bahasa Inggris, Anda perlu mengerti bagaimana penduduk asli mengucapkan lagu-lagu ini dan nama-nama seniman asing.

Dan bahkan lebih: "Alexa perlu tahu hal – hal yang paling penting bagi pelanggan Spanyol, dan memiliki kepribadian dan pengetahuan lokal"Itu berarti mengetahui liburan, kota, tokoh kunci Anda, jika Anda memiliki selebritas, buku, puisi favorit.

"Dia memiliki setoran besar lelucon murahan, tahu ucapannya, dan tahu informasi sepakbola seperti La Liga, Liga Eropa, Liga Champions, dan acara olahraga penting lainnya," jelasnya. Amazon untuk Hiperteks.

'Halo, Alexa': kisah suara-suara yang berbisik ke mesin 3

Franck V / Unsplash

Apakah wanita dari huruf dan pria dari sains?

Sebuah sektor yang bergabung dengan dua ras yang sangat berlawanan, satu surat, yang lain dari ilmu. Itu memadukan beberapa teknik kerja dan tim dengan profil dan pengetahuan yang berbeda. Inilah tepatnya yang tidak diajarkan di sekolah dan apa yang menyebabkan sebagian besar ahli bahasa komputer, setidaknya mulai, otodidak. Seperti Carmen Torrijos, yang mempelajari karier humaniora dan baru kemudian ia mengetahui tentang sektor ini. “Tidak membantu kita memiliki rencana teknologi bahasa nasional jika tidak ada rencana universitas yang menawarkan pelatihan untuk ahli bahasa komputer. Ketika saya mulai tidak ada pelatihan formal, dan itu belum bertahun-tahun yang lalu, ”jelasnya.

Masalah yang sama terjadi secara terbalik karena alternatif ini tidak diajarkan kepada para insinyur yang dapat berspesialisasi dalam pemrosesan bahasa. Di setiap perusahaan yang berspesialisasi dalam linguistik komputasi, dua profil yang berlawanan ini bekerja bersama setiap hari. Torrijos menyoroti pentingnya kerja tim sehingga di mana satu tidak tiba, yang lain tidak. Tim-tim ini beragam, kebanyakan ahli bahasa adalah wanita dan insinyur adalah pria. Dalam kedua kasus tersebut, pencampuran pengetahuan adalah kunci, meskipun itu bukan proses yang mudah.

Meskipun kita berada di abad ke-21, bagi sebagian orang topiknya tetap sama dibandingkan dengan abad terakhir. Leticia Martín-Fuertes harus mendengarkan berapa banyak orang di lingkungannya yang mengatakan kepadanya bahwa ia terlalu pintar untuk belajar filologi klasik dan bahwa ia dapat bercita-cita untuk berkarir di bidang sains. Dan, banyak orang lain yang akhirnya mempelajari hal yang sama dengan Martín-Fuertes, yang dipekerjakan oleh Adecco untuk Google, kemudian harus berintegrasi ke dalam dunia teknologi yang sepenuhnya dan, kebanyakan, manusia.

Terkadang Anda menjadi kompleks karena Anda tidak tahu apa-apa, tetapi bukan Anda, ini sangat sulit. Anda tidak memiliki pelatihan dan sedang belajar dari dalam, ”jelas Torrijos.

Di luar kejutan budaya yang diderita oleh seorang humanis ketika memasuki dunia teknologi, ahli bahasa IIC menghargai bahwa pada akhirnya itu adalah situasi yang memperkaya Anda karena semuanya terlihat dengan cara yang berbeda.

Beberapa orang mungkin berpikir bahwa ahli bahasa komputasi adalah karier yang kurang dikenal. Tapi ini untuk tinggal di sini. Pada saat pencapaian teknologi menjadi hal yang penting dan ketika komunikasi dengan mesin, terutama dengan asisten suara, semakin menjadi bagian dari kehidupan kita sehari-hari, sektor ini adalah salah satu yang paling inovatif dan menjanjikan.

Dalam hal ini, Antonio Rodríguez de las Heras, profesor di Universitas Carlos III Madrid dan direktur kehormatan Institut Kebudayaan dan Teknologi universitas ini, melihat teknologi sebagai peluang untuk melampaui diri kita saat ini. "Manusia meninggalkan kemampuan alaminya dalam ciptaan buatannya." Menurutnya, "artefak memperkuat kapasitas yang dituangkan ke dalam buatan." Apa yang kami kirimkan ke mesin, tidak lain adalah warisan kami. Namun, di dalamnya kita juga memiliki kemampuan untuk memperbaiki diri sendiri. “(Mesin-mesin) muncul di hadapan kita sebagai cermin, tentu saja buram, tetapi di mana kita bisa saling mengenali”, Dan pengakuan ini akan mengarahkan kita untuk mempertimbangkan kembali nilai-nilai kita dan bagian mana dari kita yang ingin kita sampaikan.

“Tiba hari ini di ambang kreasi buatan yang sama kuatnya dengan kecerdasan buatan, kita menghadapi tantangan yang jauh melebihi apa pun yang artefak telah tujukan kepada pencipta mereka, (…) kita menghadapi tantangan untuk memutuskan bagaimana kita inginkan menjadi. Pertanyaannya adalah, Apakah kita akan kehilangan kesempatan ini?

Pos terkait

Back to top button