Ber2Tek: traducción multimedia e identificación del lenguaje

Por -

Ber2Tek

El proyecto de investigación Ber2Tek ha sido realizado por el consorcio formado por el centro tecnológico VICOMTECH-IK4, la Fundación Tecnalia Research and Innovation, los grupos Aholab e IXA de la UPV/EHU y Elhuyar, gracias a la aportación económica de los departamentos de Desarrollo Económico y Competitividad y Educación, Política Lingüística y Cultura del Gobierno Vasco, a través del programa Etortek.

El objetivo principal del proyecto Ber2Tek ha sido investigar las tecnologías de la lengua y del habla, convertir los resultados de la investigación en aplicaciones y ponerlas al alcance de los usuarios. Para mostrar cómo pueden ayudar dichas tecnologías a la industria de la lengua, se han creado tres demos, dirigidas a los sectores de los contenidos digitales, la traducción y la enseñanza de idiomas. En opinión desus promotores, «es indudable que la industria de la lengua, y especialmente la relacionada con el euskera, necesita contar con tecnologías avanzadas para competir en un contexto tan globalizado, interconectado y multilingüe como el actual«.

Para el sector de los contenidos digitales, han preparado una demo que muestra en qué consiste la tecnología de extracción de opiniones y análisis de sentimientos. La demo parte de un texto, analiza si hay alguna opinión subjetiva en él, y, si la hay, deduce automáticamente si esa opinión es positiva o negativa. Dicha tecnología puede tener muchas aplicaciones y es especialmente interesante para las empresas, puesto que les informa de lo que se dice en la red sobre ellas y sus productos (en muchos sitios y en varios idiomas). Para desarrollar la demo, han partido de la hemeroteca de críticas con la que cuenta el sitio web armiarma.eusKritiken hemeroteka«), donde se recogen más de 5.000 críticas en euskera publicadas en diversos medios de comunicación y otras publicaciones escritas. A cada una de esas críticas se le ha adjudicado una puntuación de forma automática, aplicando para ello la tecnología de extracción de opiniones en euskera que hemos desarrollado en Ber2Tek. Si seleccionamos el autor, la obra, el año u otro parámetro en el sitio web de la demo, podemos ver gráficamente las puntuaciones, y podemos analizar la crítica, así como las palabras positivas y negativas que incluye (la tecnología se basa en esas palabras para adjudicar luego una puntuación).

Para el sector de la traducción, han preparado un buscador multimedia. Mediante la tecnología del reconocimiento de voz, se han transcrito automáticamente varios vídeos grabados en castellano y euskera. Gracias a los textos escritos obtenidos, podemos hacer búsquedas en dichos vídeos e incluso ir directamente al momento exacto en que se dice en el vídeo la palabra que buscamos.

Además, las transcripciones se traducen automáticamente al castellano, al euskera o al inglés; por lo tanto, se pueden crear de forma automática los subtítulos en dichos idiomas. Partiendo de esas traducciones, gracias a la tecnología de síntesis del habla, se puede crear el audio correspondiente; es decir, se puede hacer el doblaje automáticamente. Y, además, cuando se trate de vídeos de determinados conferenciantes, el doblaje puede imitar la voz del hablante, gracias a la tecnología de transformación de la voz.

Finalmente, para el sector de la enseñanza, han desarrollado una demo de un tutor personal. Hace 3 años, al final del proyecto BerbaTek, mostraron una demo similar, pero esta ofrece más posibilidades. Además, aquella era una aplicación de escritorio, y esta es una aplicación en línea que puede probar cualquiera. El tutor de la demo es un avatar 3D, con el que nos comunicamos mediante la voz, en euskera (habla en euskera y entiende lo que se le dice en euskera). El tutor hace de guía en los ejercicios creados automáticamente para practicar las formas verbales, la declinación o la comprensión textual; evalúa nuestra pronunciación; podemos consultarle la conjugación de un verbo, preguntarle cómo se escribe un número, pedirle que busque una palabra en el diccionario y nos mostrará los resultados de varios diccionarios…

Antes del proyecto Ber2Tek, el consorcio formado por los 5 agentes trabajó en el proyecto BerbaTek (2009-2011), y desarrolló otras tres demos. Asimismo, antes de ese proyecto, participó, entre 2006 y 2008, en el proyecto Anhitz, cuyo resultado fue una demo de un experto virtual en ciencias.

Finalmente, entre 2002 y 2004, los miembros del consorcio trabajaron juntos en el proyecto Hizking XXI.

EuskadiTecnologia

Portal sobre Nuevas Tecnologias en Euskadi y Navarra coordinado por Enrique Rodal enriquerodal@euskaditecnologia.com

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.