Opentrad: Gaztelaniatik euskararako itzulpen automatikoa sarean
Sarean dago jada euskararekin funtzionatzen duen lehen itzultzaile automatikoaren demo edo probetako bertsioa: Opentrad. Gaztelania lotzen du galiziera, katalana eta euskararekin, baina besteetan ez bezala, euskararen kasuan norabide bakarrean, gaztelaniatik euskarara.
Maiatzaren 30an aurkeztuko da, Bartzelonan, itzulpen automatikoko Opentrad proiektua. Kataluniako Unibertsitate Politeknikoan izango da aurkezpena, goizeko 11:30ean. Transferentzia sintaktikoko sistema da Opentrad, kode irekikoa, gaztelania, katalana/valentziera, galegoa eta euskerarekin erabiltzeko balio duena.
Web orrian duzue ikusgai Opentraden funtzionamendua: testuak, dokumentuak (HTML, RTF eta TXT) eta web orriak itzul ditzakezue. SourceForgeren bidez banatzen dira programa eta datu horiek. Eleka Ingeniaritza Linguistikoa izan da proiektuaren buru, eta beste bi enpresa eta lau unibertsitate hauekin elkarlanean jardun du: : Elhuyar Fundazioa, imaxin|software, Euskal Herriko Unibertsitatea, Vigoko Unibertsitatea, Alacanteko Unibertsitatea eta Kataluniako Unibertsitate Politeknikoarekin. Espainiako Industria, Turismo eta Merkataritza Ministerioaren laguntza izan du proiektuak.
Itzulpen automatikoko proiektua da Opentrad, transferentzia sintaktikoan oinarritua eta kode irekikoa. Gaztelania, katalana/valentziera, galiziera eta euskararekin erabiltzeko balio du. Testuak edo dokumentuak itzultzen ditu Opentradek, baita web orrien edukia ere, haietan nabigatzen ari garela. Hizkuntza-pare hauek badute dagoeneko jarduera-prototipoa:
Gaztelania (es) « » Katalana (ca).
Gaztelania (es) « » Galegoa (gl)
Gaztelania (es) » Euskara (eu) (gaztelaniatik euskarara itzultzen du sistemak, baina ez alderantziz).
Abiadura handiko bi itzultze-motor ditu sistemak, C++-en programatuak biak: transferentzia sintaktiko partzialekoa da bata (Apertium), elkarrengandik hurbilekoak diren hizkuntza-bikoteetarakoa (es-ca, es-gl); bestea, berriz (Matxin), transferentzia sintaktiko osokoa da, elkarrengandik hurbilekoak ez diren hizkuntzetarako egina(es-eu).XMLn gordetzen dira sistemako hizkuntza guztietako datu linguistiko elebakar eta eleaniztunak, modulu-diseinu batekin. Diseinu horri esker, errazagoa da datuen elkarreragiketa eta programa-fluxura integratzea. Kode irekian egina da sistema; hori dela eta, softwarea garatzen duen enpresa orok sartu ahal du Opentrad bere sistemetan. Horixe da, hain justu ere, helburua: zenbait programa eta ingurunetara hedatzea itzulpen automatikoaren erabilera.
Hiru enpresak eta lau unibertsitatek hartu dute parte proiektu honetan, Eleka Ingeniaritza Linguistikoa S.L. buru zela. Elekaz gain Elhuyar Fundazioa eta Galiziako imaxin|software enpresa jardun dira.. Unibertsitateei dagokienez, berriz, Euskal Herriko Unibertsitatea, Alacanteko Unibertsitatea (Valentzia), Kataluniako Unibertsitate Politeknikoa eta Vigoko Unibertsitatea aritu dira Opentrad proiektuan.
2004an ekin zion lanari enpresa- eta unibertsitate-partzuergoak, eta 2006ko lehen hiruhilekoan iritsi dira lehenbiziko emaitzak. Maiatzaren 30ean, asteartea, goizeko 11:30ean, emango da emaitza horien berri, Bartzelonan, Kataluniako Unibertsitate Politeknikoko Aula Master aretoan.
Espainiako Industria, Turismo eta Merkataritza Ministerioak finantzatu du Opentraden zati bat, PROFIT programaren bidez.