Azken asteetan Hego Euskal Herriko 4 lurraldeetan zehar ibili naiz, Librezaleko kide bezala DBH eta Batxilergoko 1.700 ikasle baino gehiagori software librea zer den azaldu eta Common Voice egitasmoaren berri emanez. Urriaren 29an egin genuen lehen aurkezpena Iruñeako Baluarten ospatutako Sarean euskaraz jardunaldien III. edizioan. Ondoren, aurten lehen aldiz antolatu diren Xare euskarazko kultura digitalaren I. jardunaldietan eman diogu jarraipena birari:
- urriak 31n Durangoko Plateruenan
- azaroak 27an Gasteizko Oihanederren
- abenduak 17an, Donostiako EHUren campusean.
Jarraian “Common Voice: Teknologiarekin euskaraz komunikatzeko auzolan digitala” hitzaldietan hizketagai izandakoak azalduko dizkizuet. Erabilitako aurkezpena hemen aurki dezakezue (iturburu-kodea).
Librezale eta Hezkuntzan ere Librezale
Librezale zer den ba al dakiten galdetuz hasi ditut hitzaldiak. Ezezkoa izan da beti gazteen erantzuna. Librezale, software librea eta euskara ardatz dituen boluntario taldea da eta taldekideen lanari esker erabil ditzakegu euskaraz Firefox, Thunderbird, LibreOffice, Ubuntu, Linux Mint… eta beste hainbat proiektu. Bereziki poztu nintzen, Iruñeko atsedenaldian gazte bat gerturatu eta WordPress-en itzulpenean parte hartu nahi zuela esan zidanean. Matrix eta Telegram taldeen eta posta-zerrendaren bidez koordinatzen ginela erantzun nion eta ongietorria izango zela. Laster batean hasi zen WordPress euskaratzen laguntzen 🙂
Jarraian, Microsoft eta Google bezalako enpresa pribatu erraldoiak hezkuntzan hartzen ari diren pisuarekin kezkatutako guraso, irakasle eta eragileek sortutako Hezkuntzan ere Librezale taldearen berri eman diet. Iametzak ere kezkaz bizi du gaia eta hortaz, bat egiten dugu duela gutxi aurkeztu zuten manifestuarekin.
Software librea
Libre hitza hainbestetan aipatu eta gero, hurrengo pausoa software librearen oinarrizko 4 askatasunak azaltzea da, noski:
- Softwarea edozein helbururekin erabiltzeko askatasuna
- Softwarea aztertu eta norbere beharretara egokitzeko askatasuna
- Softwarea kopiatu eta kopiak banatzeko askatasuna
- Softwarea hobetu eta hobetutako bertsioa banatzeko askatasuna
Ahots laguntzaile komertzialen arazoak
Sarreratxo honen ondoren hitzaldiaren mamiari ekin diot: ahots laguntzaileak. Gero eta ohikoagoa da makinekin elkar eragiteko ahotsa erabiltzea eta horretarako hainbat sistema daude: Google Assistant, Apple Siri, Microsoft Cortana, Amazon Alexa… Baina ahots laguntzaile komertzial horiek hainbat arazo dituzte:
- Hizkuntza zabalduenetan bakarrik erabil daitezke. Atzean dituzten enpresa handiek etekin ekonomikoei soilik begiratzen diete eta hizkuntza txikiak ez dira bideragarriak haientzat. Alternatibarik sortu ezean euskaldunok erdaraz mintzatu beharko diegu telebista, sakelako telefono eta bestelako gailuei. Berdin gertatuko zaie beste hizkuntza txikien ehunka milioi pertsonei ere mundu osoan.
- Ez dute ahots aniztasuna kontutan hartzen. Hizkuntza nagusi bat hitz egiteak ez du ziurtatzen gailuak zure ahotsa ulertuko duenik. Azentuarekin hitz egiten baduzu edo emakumezkoa bazara zailtasun gehiago izango dituzu, historikoki motor horiek entrenatzeko erabili diren ahots gehienak klase ertaineko gizon zurienak izan baitira.
- Gure ahotsen grabazioak zerbitzarira bidaltzen dituzte eta kasu batzuetan pertsonek entzuten dituzte. Pribatutasun aldetik amesgaizto bat dira. “Gure borondatez” etxean edo patrikan sartu ditugun espioiak dira. Jabedun softwarea direnez erabiltzaileok ezin dugu jakin gure ahots grabazioekin gailuan zer egiten den eta ez daukagu zerbitzarian gertatzen denaren gaineko inongo kontrolik.
2019ko lehen hilabeteetan, kazetarien ikerketei eta enpresa handi horietako langileen filtrazioei esker, oso zabaldua zegoen eta enpresek ukatzen zuten susmo bat baieztatu zen, “zerbitzua hobetzeko” aitzakian pertsonek entzuten dituztela grabazioetako batzuk. Banan bana GAFAMeko enpresa guztiak erori ziren:
- Googlek ordura arte ukatzen bazuen ere, langileek Assistant-ek egindako grabazioak entzuten zituztela onartu zuen.
- Amazonen langile batzuk filtratu zutenez Alexak egindako grabazioak entzuten 9 orduko txandak egiten zituzten egunero.
- Facebookek onartu zuen langileak erabiltzen zituela audio txatak transkribatzeko. Irlandako Datuen Babeserako Komisioak ikerketa abiarazi zuen Europako pribatutasun legeak urratzen zituelakoan.
- Applek kontratatutako langileek xehetasun medikuak, sexu harremanak, droga tratuak… zituzten Sirik grabatutako elkarrizketak entzun zituztela onartu zuten. Filtrazioen arabera kokapen datuak, kontaktuaren xehetasunak eta aplikazioaren datuak lotuta zituzten grabazioek.
- Microsoftek onartu zuen Cortanak egindako grabazioak langileek entzuten dituztela eta momentuz behintzat ez ziela aukerarik ematen erabiltzaileei uko egiteko.
Geroztik beren produktuen pribatutasuna hobetuko dutela agindu dute baina fidatu gaitezke?
Common Voice – Teknologiarekin euskaraz aritzeko auzolan digitala
Common Voice ahotsaren ezagutza teknologia hobeak eta guztientzat irisgarriak sortzeko helburua duen Mozilla Fundazioaren ekimen bat da.
Ahots laguntzaile komertzialekin alderatuz hainbat abantaila ditu:
-
Ahalik eta hizkuntza gehienetan egongo da erabilgarri, potentzialki edozein hizkuntzatan. 37 hizkuntza ari dira ahots grabaketak egiten dagoeneko eta beste 70 gehiago horretarako prestaketak egiten. Teknologiari gure ama hizkuntzan hitz egiteko aukera emango digu euskaldunoi eta gurea bezalako munduko beste hainbat hizkuntza komunitateri.
- Ahots mota guztiak hartu nahi ditu kontuan. Horregatik euskarazko ahots errekonozimendua entrenatzeko ahalik eta ahots anitzenak nahi ditugu: emakumeak eta gizonezkoak, adin guztietakoak, euskaldun berriak eta euskaldun zaharrak, Euskal Herriko txoko guztietakoak…
- Pribatutasunari lehentasuna emango dio, gure ahotsa ez du inora bidaliko. Ahots prozesamendua gailuan bertan egingo da. Gure ahotsa ez da inora bidalia, aztertua edo monitorizatua izango. Software libreko proiektuek teknologia beste modu batean sortu daitekeela erakusten dute, herritarren beharrak eta eskubideak helburu bezala jarriz.
Common Voice-ra hizkuntza bat gehitzeko 2 pauso egin behar dira:
- 5 eta 10 hitz arteko 5.000 esaldi bildu behar dira lehenik (CC0 lizentzia eduki behar dute). Librezaleko kideek 2.000 esaldi baino gehiago idatzi zituzten eskuz. Beharrezko kopurutik urrun geundela ikusita ARGIAri eskatu genion laguntza eta proiektu honetarako jabetza publikoan utzitako ia 4.000 esaldirekin osatu zen bilduma.
- Testu horiek irakurriz 10.000 ahots-ordu grabatu eta balioztatu behar dira ondoren.
Bigarren pauso horretan gaude orain, lan itzela denez auzolan digitalerako deia egin zuen Librezalek. Auzolan horren barnean grabazio maratoia antolatu genuen Librezale eta Hirikilabs-ekin elkarlanean 2019ko apirilaren 9an.
Auzolanean parte hartzea oso erraza da, ez dago ezer instalatu beharrik, nahikoa da mugikor edo ordenagailuko nabigatzaile batean labur.eus/auzolandigitala webgunea irekitzea. Bertan 2 zeregin daudela ikusiko duzu:
- Hitz egin atalean, ahots grabazioak egin ditzakezu. Horretarako, nahikoa da agertzen zaizkizun esaldiak ozen irakurtzea. Bosteko sorta bat osatzean grabazioak berrikusi eta sakatu Bidali botoia.
- Entzun atalean, besteek egindako grabazioak balioztatzen lagundu dezakezu. Grabazioa entzun eta esandakoa testuarekin bat badator sakatu Bai botoia, bestela sakatu Ez botoia.
Auzolan digital erraldoi honetan parte hartzera gonbidatzen zaituztet. Guztion artean lortuko dugu teknologiarekin euskaraz, etikoki eta pribatutasuna errespetatuz komunikatu ahal izatea. Animo!
Artikulu honek Creative Commons Aitortu-PartekatuBerdin 4.0 Nazioartekoa (CC BY-SA 4.0) lizentzia dauka. Kopiatu, moldatu, zabaldu eta argitaratzeko libre zara, beti ere, nire egiletza aitortzen baduzu eta baldintza beretan egiten baduzu.