Investigadores de la Universitat d'Alacant y la Universitat Oberta de Catalunya trabayen en comuña nesti oxetivu en collaboración cola Academia de la Llingua Asturiana (ALLA).
L'asturianu, l'aragonés y l'aranés, idiomes con menos recursos en datos pal entrenamientu de sistemes de traducción automática que'l castellanu y el restu de llingües estatales con reconocimientu oficial, son oxetu d'una xera compartida de torna p'ampliar el corpus disponible. Una iniciativa que lleva'l nome de 'Traducción a llingües romances de baxos recursos d'España', yá en marcha.
Pa ello, los sos impulsores, los proyeutos Lightweight Neural Translation Technologies for Low-resource Languages (LiLowLa) de la universidá alicantaina y TAN-IBE: Neural Machine Translation for the Romance Languages of the Iberian Peninsula de la barcelonesa cuenten col sofitu de l'ALLA, Academia Aragonesa de la Lengua (Instituto de l’Aragonés) y l'Institut d’Estudis Aranesi. En concreto, traduxeron del castellanu a los sos idiomes les frases de la base de datos FLORES+.
Pa esta iniciativa emplegáronse corpus creaos dafechu pa esta xera y revisaos de forma manual poles diferentes instituciones, un total de 997 oraciones. Conteníos que servirán p'algamar los oxetivos de la mesma: ampliar les llendes del desarrollu de sistemes de traducción automática cuando la cantidá de recursos ye mui escasa y esplorar la tresferibilidá ente llingües romances con esta carauterística, dar cola meyor manera d'utlizar modelos preentrenaos y crear corpus disponibles públicamente pal desarrollu y evaluación de la traducción automática.
Pa esta xera solicítase agora la collaboración de científicos y desarrolladores. Amás de FLORES+, emplégase nel proyeutu como datos d'entrenamientu y desarrollu OPUS y PILAR (Pan-Iberian Language Archival Resource).
Too pa que nin l'asturianu nin l'aragonés nin l'aranés queden atrás nel desendolcu d'una ferramienta de presente clave pal futuru de los idiomes nel entornu dixital.