Opentrad, el primer traductor automàtic entre les quatre llengües oficials de l’Estat
El projecte ha estat desenvolupat conjuntament per la Universitat Politècnica de Catalunya, la Universitat del País Basc, la Universitat d’Alacant, la Universitat de Vigo, Eleka Ingeniaritza Linguistikoa, la Fundació Elhuyar i Imaxin Software.
Opentrad el primer sistema de traducció automàtica en programari lliure per a castellà, gallec, català i basc.
Aquest conjunt de programes i dades es distribueixen a través de SourceForge, el principal repositori internacional de programari lliure.
El projecte ha estat desenvolupat per un consorci format per un equip de la Universitat Politècnica de Catalunya (UPC) juntament amb les universitats del País Basc, d’Alacant i de Vigo, i les empreses Eleka Ingeniaritza Linguistikoa, que lidera el projecte, Elhuyar Fundazioa (País Basc) i Imaxin Software (Galícia). El projecte ha comptat amb el suport del Ministeri d’Indústria, Turisme i Comerç, a través del seu programa PROFIT.
Opentrad és un projecte de traducció automàtica basat en transferència, de codi obert i en funcionament per al castellà, gallec, català i euskera. Opentrad permet traduir els textos o documents que l’usuari indiqui, així com navegar per pàgines web traduint-ne el contingut al mateix temps que es navega. Els parells de llengües que compten ja amb un prototipus operatiu són:
• castella (es) <—-> català (ca)
• castellà <—-> gallec (gl)
• castellà —> euskera (eu), de moment, el sistema només tradueix del castellà a l’euskera i no a l’inrevés.
El sistema es basa en dos motors de traducció d’alta velocitat programats en C: un de transferència sintàctica parcial (anomenat Apertium) per a parells de llengües pròximes (es-ca, es-gl) i un altre de transferència sintàctica completa (anomenat Matxin) per a parells de llengües divergents (es-eu). Les dades lingüístiques monolingües i multilingües per a totes les llengües integrants del sistema s’emmagatzemen en XML, amb un disseny modular que facilita la interoperabilitat de les dades i la seva integració en el flux del programa. El sistema s’ha desenvolupat seguint la filosofia del codi obert, amb la qual cosa qualsevol empresa de desenvolupament de programari pot integrar Opentrad en els seus sistemes. Es tracta d’impulsar l’ús i la integració de la traducció automàtica en diferents programes i entorns.
El consorci constituït per les quatres universitats i les tres empreses va començar a treballar el 2004 i els primers resultats han arribat el primer trimestre del 2006. Han explicat el projecte Lluís Padró, investigador del Centre de Tecnologia i Aplicacions del Llenguatge i de la Parla (TALP) de la UPC; Mikel Forcada, de la Universitat d’Alacant; Xavier Gómez, de la Universitat de Vigo; Iñaki Alegria, de la Universitat del País Basc; Iñaki Arantzabal, d’Eleka Ingenieritza Linguistikoak; José Ramon Richel, d’Imaxin Software; Josu Waliño, de la Fundación Elhuyar.