Eusko Jaurlaritzak bultzatutako Euskorpus proiektuak adimen artifizialaren iraultzara eramango du euskara, gero eta gizarte digitalagoan euskararen etorkizuna bermatuz

0

Gaur goizean, Imanol Pradales lehendakaria buru izan duen Euskorpus ekimenaren aurkezpena egin da Gipuzkoako Parke Teknologikoko Eraikin Nagusian. Bertan, Ibone Bengoetxea lehendakariordeak, Mikel Jauregi eta Juan Ignacio Pérez Iglesias sailburuek, Eusko Jaurlaritzako beste ordezkari batzuek eta ingurune digitaletan euskara eta euskal kultura zaintzeko eta sustatzeko konpromisoa duten ekosistema publiko eta pribatuko beste enpresa batzuek ere hartu dute parte. Aurkezpena Bernard Etxepareren Linguae Vasconum Primitiae liburuko bertsoetako batetik ateratako ‘Heufcara Iagi adi mundura’ (Euskara jagi adi mundura) lelopean egin da. Liburu hori euskaraz argitaratu zen lehen lana izan zen, 1545. urtean. Horrela, euskara adimen artifizialera eramateko eman beharreko jauzi kualitatiboa euskara inprimategietan erabiltzen hasi zen unearekin alderatu nahi izan da.

Imanol Pradales lehendakariak azpimarratu duenez, «Euskorpusek, Adimen Artifizialaren eta hizkuntzaren teknologien potentzial osoa euskararen, gure enpresen eta ikerketaren zerbitzura jarriko du. Horretarako, gure gaitasun guztiak lerrokatuko ditugu, lankidetza publiko-pribatuaren bidez, euskarazko testuen corpus digitala hobetzeko».

Aurkezpen-ekitaldian Euskorpora elkartea ere eman dute ezagutzera. Haren helburu nagusia Euskorpus ekimena garatzea izango da, euskara esparru digitalean sustatu eta bermatzeko, euskararen corpus digitala bilduz, sortuz eta modu aktibo eta metodikoan garatuz; era berean, euskararentzako kode irekiko oinarrizko ereduak sustatzea ere bilatuko du, hura kontserbatu, mantendu eta ehun industrialean zein sozialean haren inpaktua eragiteko, hizkuntza-baliabide digitalen Europako esparruari lotuta.

Azken batean, Euskorpusi esker, euskarazko datu-paketeak garatuko dira, fabrikatzaileek internetera konektatutako gailuetan inportatu ahal izan ditzaten, euskaraz funtzionatzeko gaitasuna emanez. Horrela, smartphoneek, tabletek, smartwatchek, aplikazioek edo laguntzaile digitalek -hala nola Sirik eta Alexak- erabiltzaileekin euskaraz elkarreragiteko gaitasuna izango dute, adimen artifiziala euskalduntzeko prozesu batekin, Adimen Artifizialeko tresnen erabiltzaileek hizkuntza horretan erabili ahal izan ditzaten. Inbertsio horrekin, gainera, adimen artifizialaren eta datuaren kudeaketaren euskal ekosistema ere dinamizatuko da.

Euskorporako presidente Julian Florezek nabarmendu duenez, «ingurune digital berrietan euskararen presentzia zaintzeko ardura eta betebeharra dugu, baita adimen artifizialeko sistemen eta euskararen zerbitzura dauden hizkuntzaren teknologien ahalmen guztia aprobetxatzekoa ere. Hori da gure apustua, erronka handia da, eta badakigu gauzak nola egin, eta horretarako ondo kokatuta gaude».

Era berean, Vicomtecheko Ahotsa eta Hizkuntza Naturala Prozesatzeko Teknologien zuzendari Arantza del Pozok azpimarratu duenez, «hizkuntza-baliabideak modu koordinatuan biltzea funtsezkoa da euskaraz hizkera eta hizkuntzako teknologien garapena bultzatzeko, eta horrela, mundu digitalean beste hizkuntzen maila berean egotea bermatzeko».

Euskorpus proiektua

Lehendakariak gaur ezagutzera eman duen Euskorpus proiektua funtsezko tresna da euskarazko corpus digital hori sortzeko. Euskorpus abian da, eta, Industria, Trantsizio Energetiko eta Jasangarritasunaren Sailaren bidez, 5,55 milioi euroko hasierako aurrekontu-zuzkidura du. 2025erako 2 milioi euro esleituta ditu, eta 2026rako beste 3 milioi euro. Gainera, Kultura eta Hizkuntza Politika Sailak eta Zientzia, Unibertsitate eta Berrikuntza Sailak ere parte hartzen dute proiektuan, 550.000 euroko ekarpena eginez hasieran.

Inplikazio hirukoitz hori Eusko Jaurlaritzak egiten duen gogoetaren ondorio da; izan ere, bere ustez, corpus hori sortzea estrategikoa da, hizkuntzaren teknologiek ere euskaraz erantzun dezaten, digitalizazio handiko gizarte batean dauden eta izango diren zerbitzuak behar bezain kalitatezkoak izateko. Testuinguru horretan, Euskorpus ekimenaren helburua da euskara merkatu digitalean beste hizkuntzen antzeko baldintzetan egotea, eta, hizkuntza-baliabideak «industrializatzeko» proiektua denez, horretarako funtsezkoa da babes publikoa.

Euskararen corpus digitala hiru fase nagusitan gauzatuko da: lehenengo fasea plangintzarena eta definizioarena izango da, eta bertan corpusaren tipologia eta garatu beharreko ereduak zehaztuko dituen bulego teknikoa eratuko da, eta haren onura jaso dezaketen sektore, aplikazio eta zerbitzu estrategikoak zehaztuko dira.

Bigarren fasean, euskarazko corpus linguistikoen bilduma bultzatu, kode irekien oinarrizko ereduen garapena bultzatu, eta biltegiratze segururako, saiakuntzetarako eta balidaziorako azpiegiturak bultzatu nahi dira.

Azkenik, hirugarren fasean, biltzen diren hizkuntza-corpusak eta kode irekiko oinarrizko ereduak enpresetara, gizartera eta Europako beste datu-plataforma batzuetara transferitzea eta bertan ustiatzea bultzatuko da.

Euskorpus aurkezteko ekitaldia enpresei Euskorpora elkartean inplikatzeko deia eginez amaitu da, proiektuari bultzada eta hedapen zabalagoa ematen laguntzeko. Aurrerantzean, lankidetza publiko-pribatuaren bidez, Eusko Jaurlaritzak Euskorpus proiektua aberasteko ahaleginak landu eta koordinatuko ditu, horretarako baliabide ekonomikoak zein bestelako baliabide operatiboak lerrokatuz.

Euskorporaren batzarra

Euskorpus proiektua aurkezteko ekitaldiaren aurretik, Euskorpora elkarteak batzarra egin du. Bertan, enpresa berriek bat egin dute elkartearekin, eta horrela geratu da elkartea osatzen duten enpresa eta erakunde publiko zein pribatuen zerrenda: Vicomtech, EREIL Technologies SL, TREBE Language Technologies, Euskaltzaindia, Eusko Jaurlaritza, Baleuko, MIXER, EiTB, CAF, MCC, Petronor, Euskaltel Fundazioa, Kutxabank, PWC, eta Logikaline.