top of page

El crecimiento exponencial en el mundo digital de las lenguas menos habladas gracias a Microsoft



Existen diversas lenguas que han muerto con sus interpretadores del pasado, por ejemplo Boa Sr, quien era la última conexión con la cultura pre-neolítica de 65 mil años atrás, con origen en las islas Andamán en el oceano Índico. Este es uno de los muchos casos en los que muchas lenguas han muerto por no ser valoradas en el tiempo. De hecho, según estudios, cada dos semanas se pierde un idioma en alguna parte del mundo.


Este es el caso específico de los mundas, quienes son una comunidad de apróximadamente 1 millón de personas que están repartidas por todos los estados orientales de Jharkhand, Orisa y Bengala Occidental. Muchas personas de esta comunidad alegan que no pudieron aprender el Mundarí (el nombre oficial de su lengua) porque sus padres normalmente trabajaban en otros estados y no se hablaba el lenguaje natal en casa, siendo la Dra. Meenakshi Munda uno de esos casos en los que se fue perdiendo la identidad de su cultura por el poco conocimiento de su lengua.


Pese a que estas comunidades si aprenden otros idiomas dominantes como el bengalí, el hindi y el odiya, el mundarí es muy poco hablado por su escaso contenido digital, siendo casi nula su presencia en el Internet y eso hace que hayan menos incentivos para que las personas realmente quieran seguir expandiendo este lenguaje.


Lo interesante de este caso es que los investigadores de Microsoft Research (MSR) en India se dedicaron a entender este suceso y han trabajado en ecosistemas digitales para distintas lenguas que han quedado en el pasado como el mundarí, siendo el objetivo principal que ninguna persona en este mundo esté excluida del uso de la tecnología solo por hablar un idioma que no es tan conocido. La encargada de este proyecto es Kalika Bali, quien es experta en procesamiento del lenguaje natural y tiene subcampo en lingüística e inteligencia artificial (IA), centrándose en entrenar sistemas informáticos para la comprensión de idiomas tanto hablados como escritos. Kalika y su equipo están activamente creando espacios con comunidades locales y hablantes nativos para la obtención de datos que sirvan de base para consturir una tecnología de Inteligencia Artificial para aportar al idioma, para crear un conjunto de inforación precisa y culturalmente relevante y para, no menos importante, involucrar a la comunidad en este proceso digital de su cultura.


A este proyecto se le llamó Proyecto ELLORA (Enabling Low Resource Languages) que tiene la finalidad de preservar una lengua para la posteridad y de la misma forma, garantizar que los usuarios que utilizan este idioma puedan interactuar en el mundo digital. Este proyecto comenzó en el 2015 y comenzó por lo básico: determinar los recursos disponibles y transformarlos en material digital. Lo segundo fue establecer niveles entre las lenguas, siendo un nivel superior como el inglés o el español las lenguas ricas en recursos y los niveles inferiores siendo lenguajes menos desarrollados.


En ELLORA se encargan de recopilar las herramientas necesarias para estas lenguas, creando modelos lingüísticos que puedan satisfacer las necesidades digitales de sus hablantes. Una de las maneras en las que este proyecto se ha podido llevar a cabo es por el trabajo conjunto con el Indian Institute of Technology Kharagpur, los cuales en el 2018 patrocinaron un estudio para comprender qué necesitaban realmente estas comunidades para mantener vivas sus lenguas, y lo que empezó como una simple curiosidad de mantener un idioma vivo, resultó en sofisticados proyectos tecnológicos.


Uno de los proyectos más sofisticados es una nueva tecnología llamada “Traducción Automática Interneuronal” (INMT, del inglés Interneural Machine Translation) que ayuda a predecir la siguiente palabra cuando alguien está traduciendo del hindi al mundarí. Además de esto, este propósito ha desarrollado otras iniciativas como ayudar a otras comunidades como los Gondi y los Idu Mishmi, quienes tienen solo 12.000 hablantes de su lengua y buscan la incorporación de su idioma y de sus hablantes en el mundo digital.


En ASP queremos mantenerte informado con todas las noticias relevantes sobre la innovación tecnológica en el 2023 y cómo afecta en nuestra cultura global. Si quieres saber más, te ofrecemos nuestro seguimiento en www.asptg.com.

¡Hasta luego!


3 visualizaciones0 comentarios

Comments


bottom of page