Eusko Jaurlaritzak 1,68 milioi euro bideratuko ditu UPV/EHUko HiTZ ZENTROra hizkuntza teknologian ikertzeko eta ingurune digitalean euskararen presentzia areagotzeko

0
  • IKER-GAITU izeneko proiektuan ikertuko diren teknika berriek helburu hauek ditu: euskararen gaitasun maila era automatikoan antzematea; ahots pertsonalizatuen teknologia desgaitasuna duten pertsonengana iristaraztea; ahots espontaneoaren transkripzioa edota euskara elkarrizketa-sistema ahaltsuenen parera iristea.
  • HiTZ zentroak CLARIAH-EUS sarea sortu du, Europako CLARIN eta DARIAH azpiegitura zientifikoetan erkatuta. 137 ikertzailek eta euskara ikertzen ari diren 11 ikerketa-talde edo erakundek babesten dute, Humanitate, Arte eta Zientzia Sozialetan ikerketa sustatzeko eta datu eta tresna digitalen erabilera elkarrekin partekatzeko.

Eusko Jaurlaritzak 1.680.000 euroko dirulaguntza emango dio Euskal Herriko Unibertsitateko (UPV/EHU) HiTZ ZENTROari alor digitalean euskararen presentzia handitzeko helburua izango duten teknika berriak ikertzeko eta hizkuntza teknologiaren inguruko sarea indartzeko. Horrela azaldu dute Kultura eta Hizkuntza Politika sailburu Bingen Zupiriak eta UPV/EHUko errektore Eva Ferreirak gaur Donostian kokatuta dagoen HiTZ ZENTROAn egin duten bisitaren ostean.

Egungo eta etorkizuneko teknologiek testuzko eta ahozko datu-masa erraldoiak eskatzen dituzte hizkuntza bakoitzeko. Aldiz, euskarak eta hizkuntza txikiagoek eskaini ahal dituzten datuak ez dira nahikoak gaur egun teknologia horiek behar adina kalitatea izateko. Horregatik, “ezinbestekoa” da hizkuntza teknologian ikertzea euskarak gero eta ohikoagoak izango diren teknologietan presentzia izateko eta beste hizkuntzen parera eramateko.

Horrela, Eusko Jaurlaritzak HiTZ ZENTROAri bideratutako dirulaguntzaren bitartez bi proiektu landuko dira. Alde batetik, IKER-GAITU hizkuntza teknologiak ikertu teknika berriak lortzeko (1,5 milioi euro) eta bestetik, CLARIAH-EUS sarea osatu eta sendotu (180.000 euro).

IKER-GAITUri dagokionez, landu nahi diren teknika berri horiek hurrengo helburu hauek dituzte:

  1. Euskararen gaitasun maila, idatzizkoa eta ahozkoa, era automatikoan atzemango duen sistema;
  2. Ahots pertsonalizatuen teknologia desgaitasuna duten pertsonengana iristaraztea;
  3. Ahots espontaneoaren transkripzioa, euskara eta gaztelera nahasten direnean eta hainbat hiztun daudenean ere jardungo dena;
  4. Testuzko elkarrizketa-sistema ahaltsuenak (egungo chatGPT edo GPT4 bezalakoak) euskaraz ere beste hizkuntzen pare aritzea.

Bestalde, bigarren proiektuari dagokionez, CLARIAH-EUS izeneko sarearen laguntza izango dute. CLARIAH-EUS 137 ikertzailek eta euskara ikertzen ari diren 11 ikerketa-talde edo erakundek babestutako sarea bezala jaio da, pertsonen, datuen, baliabideen eta tresnen sarea, alegia. Honek hainbat diziplinatako jendea batzen du (Humanitateak, Artea eta Zientzia Sozialak, besteak beste) eta horrek sinergia gehiago sortzea ekarriko ditu materialak, edukiak eta ezagutzak partekatzeko. Lau ikertzailek proiektua koordinatuko dute eta horretaz gain, sarea edukiz hornitu, erabiltzaileen arteko lankidetza sustatu zein ikertzaileen eskaerak bideratuko dituzte. CLARIAH-EUS Europako sare handi baterako leiho bat da, Europako CLARIN-ERIC eta DARIAH-ERIC azpiegitura zientifikoen parte da eta honek aukera emango die ikertzaileei Europako azpiegitura horietan dauden baliabide eta tresna guztiak eskuratzeko, honako helburu hauek jarraituz:

  1. Euskara eta euskaraz ikertzeko baliabide digital eta aurreratuen inbentario eguneratua mantenduko du.
  2. Humanitate Digitaletan eta Zientzia Sozialetan ikertuko duen komunitatearen proiektuak sustatuko ditu eta zabalkunderako plaza garrantzitsua izango da.
  3. Europako CLARIN eta DARIAH azpiegituretan parte hartzeko bidea urratuko du, baita horietan garatu diren tresnak eta baliabideak erabili eta gure komunitatean erabilienak direnak euskarara egokitzeko lana egingo du.

Bingen Zupiria Kultura eta Hizkuntza Politika sailburuak azaldu duenez, “eremu digitalean hizkuntza hegemonikoak dira jaun eta jabe, batez ere ingelesa. Beharrezkoa da euskarak ere bere tokia izatea eta hizkuntza horiekiko distantzia murrizten joatea. Gure eguneroko jardunean gero eta presentzia handiagoa duen digitalizazio horretan gure hizkuntzak ere bere tokia behar du, bestela beste batzuek hartuko dute espazio hori”. Horretarako, ezinbestekotzat jo du hizkuntza teknologia lantzea: “eredu izan nahi dugu, trakzio lana egin nahi dugu hizkuntza teknologiaren eremuan. Euskarak kalitateko hizkuntza teknologia garatzeko behar dituen tresna eta baliabideak sortu eta interesa dutenen eskura jarri nahi ditugu. Sektorearen garapena ere bultzatu nahi dugu lehiakortasuna eta kalitatezko enplegua sustatuz. Hau dena UPV/EHUko HiTZ ZENTROAri egiten diogun eskariaren muinean dago.”

Euskal Herriko Unibertsitateko errektore Eva Ferreirak adierazi duenez, “euskararen garapen zientifiko eta intelektuala ezin da ulertu Euskal Herriko Unibertsitatearen funtsezko ekarpenik gabe. Eta hala onartzen du Eusko Jaurlaritzak. Bada azpimarratu nahi dut akordio hau sinatzeak dakarren lankidetza esparru zehatza. Benetako iraultza teknologikoa bizi dugu eta, azken batean, iraultza hori intelektuala eta soziala ere bada. Errealitate materialari errealitate birtuala gehitzen zaio. Gaur egun jada ez dago bizirik iraungo duen giza errealitaterik mundu digitalean korrespondentzia egokirik ez badu.  Eta ondorioa begi-bistakoa da: euskarak hor egon behar du. Eta indartsu egon behar du gainera, baliabide egokiekin. Aurrera eramango ditugun proiektuek presentzia hori indartuko dute”.

Eneko Agirre HiTZ zentroko zuzendariak ikerkuntzaren beharra azpimarratu du: “Egungo teknologiak hiztun askoko hizkuntzatan oso ondo lan egiten du, baina hiztun gutxiagokoetan kalitate eskasagoa du. Adibidez, gure zentroan egindako ikerketa batek erakutsi du egun dagoen testu masarekin ezin direla elkarrizketa-sistemen motore diren hizkuntza-eredu ahaltsuenak euskararako entrenatu, eta ahotsarekin ere beste hainbeste gertatzen da”. Esan duenez “Horren aurrean, elkarrizketa-sistema eta ahotsarekin lan egiten dituzten ereduak eraikitzeko metodo berrietan ikertzen ari gara, eta horren osagarri bezala testuzko eta ahozko datu-masak biltzen. Ikerkuntza zentro publikoa garen heinean, eraikitzen ditugun eredu eta algoritmo guztiak inguruko zentro teknologiko eta enpresekin era librean partekatuko dira, emandako aurrerapausoak lehenbailehen iritsi daitezen gizartera”. Bukatzeko, elkarlanaren beharra aipatu du: “Euskal gizarteak euskarazko hizkuntza teknologia propioa eta kalitatezkoa nahi badu, testu eta ahotsen datu-bilketa masiboa abiatu beharra dago, eta erakunde publiko eta pribatuen ezkuzabaltasuna gako izango da horretan, euskararen onurarako”.

Gaur HiTZ ZENTROA kokatuta dagoen Informatika Fakultatea bisitatu dute zentroko 70 ikerlariak gertutik ezagutzeko eta bertan dauden materialak ikusteko. Bisitan, Hizkuntza Politika sailburuorde Miren Dobaran izan da. Jaurlaritzak emandako dirulaguntza 2023-2025 epealdian burutuko da eta bitartean, batzorde bat eratuko da xehetasun eta emaitzak berrikusteko eta ebaluatzeko.