Next Tech

Análisis geolingüístico: patrimonio lingüístico con Microsoft Power BI

6 Mins de lectura

“La lengua es en cierto modo la manifestación externa del espíritu de los pueblos.” (Guillermo de Humboldt)

Cuando hablamos de la lengua oral, como manifestación externa, hay que tener en cuenta la dicotomía que se cela tras el concepto de lengua, conformado por el binomio lenguaje y cultura.  Estos dos términos están fuertemente vinculados y constituyen nuestra forma de hablar. Pero ¿se pueden analizar las lenguas y sus diferentes variantes desde un enfoque analítico, a través de herramientas de Business Intelligence como Microsoft Power BI?

Tal como decía Hernández Campoy «los estudios sobre la movilidad espacial de la población pueden servirnos para determinar dónde, cómo y por qué se desplazan las lenguas, y, más concretamente, la difusión de los cambios lingüísticos y las innovaciones tanto en el espacio como en el tiempo”.
En este mundo tan globalizado es fácil olvidarnos de la gran fragmentación y diferencias que presenta una lengua como el español (castellano). Por ello, hace casi dos siglos se empezaron a realizar estudios lingüísticos que derivaron en los llamados Atlas lingüísticos.

¿Qué es un atlas lingüístico?

Un atlas lingüístico es un libro con mapas temáticos relativos al lenguaje hablado en una determinada área. En sus páginas podemos encontrar dichos, refranes, frases hechas, vocablos, imágenes de herramientas, utensilio o vestimenta, y dibujos. En cada atlas se recoge una parte importante del patrimonio lingüístico y etnológico-cultural de una comarca, provincia, región o país.

Los límites del Atlas lingüístico

En el siglo XIX, se publicaron los primeros atlas lingüísticos como el Atlas lingüístico de Europa cuyo primer tomo fue publicado en 1841 por Bernardino Biondelli o el ALPI (Atlas Lingüístico de la Península Ibérica) a mediados del siglo XX.

Página del atlas de la península Ibérica (ALPI)

En un primer momento, los proyectos eran mastodónticos. Los autores, al igual que en las enciclopedias, querían incluir mucha información dentro de estos libros. El problema principal era el espacio debido a que un libro, aunque sea muy grande y se pueda fraccionar, sigue siendo algo finito y limitado. Además, el atlas se tenía que realizar totalmente a mano, lo que hacía que estas obras tuviesen unos altos costos, fuesen difíciles de realizar y de difundir a posteriori.
Por esta razón, con el tiempo se fue considerando la opción de crear atlas regionales que, en conjunto, pudiesen conformar un atlas nacional, como es el caso de los atlas lingüísticos de Manuel Alvar, catedrático de la Universidad de Zaragoza, el cual realizó muchos atlas de este tipo en España para luego exportar su modelo a Latino América.

El punto de partida. El ALEANR

Un claro ejemplo, que servirá para explicar con mayor detalle todo lo inherente al análisis geolingüístico, es el ALEANR (Atlas Lingüístico y Etnográfico de Aragón, Navarra y Rioja) obra que fue realizada por Manuel Alvar y sus colaboradores Tomás Buesa y Antonio Llorente (todos ellos de la Universidad de Zaragoza), quienes, a través de un amplio cuestionario de 2568 preguntas, recogieron una ingente cantidad de voces orales de Aragón, Navarra y la Rioja, que aparecen distribuidas en doce tomos, por un total de 1758 mapas.

Página del ALEANR

 

En esta obra, se recopilan muchísimos datos sobre Aragón, Navarra y Rioja. No obstante, cabe señalar que, a pesar de la gran importancia y valor que tiene el ALEANR, actualmente, es una obra de difícil acceso ya que no presenta una versión digital, consultable en la red. Además, de esta obra solo se hicieron unas pocas copias, por lo que acceder a uno de sus tomos es bastante complejo.

Transición digital

Hoy en día, en plena era digital y con una sociedad siempre más interesada por los nuevos productos electrónicos y softwares de todo tipo, en la que disponemos de acceso a la red de forma ilimitada, es impensable fomentar, amplificar y generar interés por este tipo de cuestiones, simplemente con los formatos de publicación tradicionales. Por tanto, al igual que en otros sectores, también en campos de la lingüística, se necesita una modernización y digitalización, de acuerdo con los tiempos vigentes.

De hecho, los primeros intentos de digitalización de los atlas empezaron en los años 80. En lo que respecta a España, tenemos el ALPI Digital (todavía sigue desarrollándose) el ALECMAN (Atlas Lingüístico de Castilla – La Mancha) cuyos mapas se han escaneado al igual que el ALDC (Atles Lingüístic del Domini Català), pero son muy pocos los atlas que permiten realizar un filtrado con diferentes niveles de granularidad para luego poder analizar dicha información con gráficas, mapas o tablas.
Pero, por extraño que parezca, en pleno siglo XXI, no hay una herramienta, una página web, una aplicación, etcétera, que permita el exhaustivo análisis de una lengua o variedad lingüística. En la gran mayoría de los casos siguen usándose estos atlas a partir de los cuales se realizan estudios por parte de investigadores y docentes universitarios.

Por esta razón, en 2018, empecé mi proyecto ALEPZ (Atlas lingüístico y etnográfico de la provincia de Zaragoza) gracias al apoyo de la Universidad de Zaragoza (UNIZAR) y la Institución «Fernando el Católico» (IFC), órgano que surge como un “servicio de alta cultura aragonesa”, cuyos fines estatutarios son el estudio y promoción de la cultura y ciencia aragonesas, y la difusión en Aragón de las expresiones de la cultura y ciencia universales.
A mediados de 2019, publicamos la primera parte de esta obra, lo que supone un gran avance en este aspecto.

Puedes consultar el ALEPZ aquí.

Ejemplo de estudio de formas lingüísticas por área

¿Qué es el ALEPZ?

El ALEPZ pretende ser una herramienta que ayude en este proceso de reforma y de cambio de paradigma dentro de la geolingüística, imprescindible para generar mayor atracción e interés por esta rama de la lingüística, digitalizando e informatizando todos los datos presentes en el ALEANR (por ahora de la provincia de Zaragoza) y, por ende, difundirlo de la manera más ágil y directa posible. Además, el ALEPZ es un claro ejemplo de cómo se pueden aprovechar las herramientas de Business Intelligence, como Microsoft Power BI, para la explotación y consulta de todos los datos presentes en obras como el ALEANR, creando visualizaciones con mapas y gráficas que, de forma organizada y filtrada, aceleraran y simplifican todos los procesos de organización de materiales y estudio de los mismos.

 

Ejemplo de búsqueda por segmento fonético

¿Qué supone una herramienta como el ALEPZ?

Se trata de una herramienta pionera. Representa una importante reformulación del concepto de atlas lingüístico digital.
En los atlas tradicionales obtener los resultados sobre una determinada cuestión conlleva un análisis de 4 o 5 horas para un investigador experimentado, mientras que, con una herramienta como el ALEPZ, en pocos clics podemos obtener esa información, ordenada y clasificada. En pocos minutos se puede realizar el estudio de una zona en concreto de la provincia de Zaragoza, y tener una visión panorámica.

Ventajas

Lo más destacable es:

  • Agilidad de búsqueda y recopilación de información. Se puede cotejar un gran volumen de datos en muy poco tiempo;
  • Accesibilidad para un público amplio (incluyendo la transcripción ortográfica) ya que estas obras, antiguamente, iban destinadas a un público restringido;
  • Comprensión ágil de la información gracias a tablas, gráficas, mapas u otros elementos visuales;
  • Identificar patrones y tendencias. Se pueden comparar las hablas de dos zonas y ver cuáles son los elementos comunes, fonemas, etcétera.

Desventajas

  • Crear las bases de datos. La única forma de crear estas bases de datos para su posterior explotación es copiando a mano palabra por palabra. Esto implica un trabajo duro y minucioso que solo pueden realizar perfiles con conocimientos en fonética y fonología, o que tengan una formación específica para estudiar cuestiones relacionadas con la lengua y su conformación.

Conclusión

La geolingüística es una rama de mucho interés, fundamental para analizar las lenguas y sus variedades, que por ahora no ha tenido una verdadera transformación digital. No obstante, con proyectos como el ALEPZ, con el debido respaldo de instituciones o empresas privadas, se puede avanzar a través de herramientas de Business Intelligence.

Las aportaciones más significativas que ofrece este tipo proyectos son:

  • Ofrecer a la población una parte importante del patrimonio cultural y lingüístico de una zona de España. Con la esperanza de que esto se incremente en los próximos años a escala nacional, lo que representaría un hito histórico;
  • Digitalizar una ingente cantidad de datos recogidos en atlas como el ALEANR y crear bases de datos para su futura explotación en herramientas de análisis de datos como Power BI;
  • Modernizar y revolucionar por completo este sector gracias al motor de búsqueda centralizado, la posibilidad de implementar imágenes, descripciones, mapas interactivos, datos digitales, etcétera. Es decir, los atlas se convierten en elementos “vivos” que pueden crecer año tras año con la introducción de nuevos datos;
  • Acercar a las nuevas generaciones a estos temas con un nuevo enfoque, de acuerdo con los tiempos vigentes;
  • Ayudar en la investigación para futuros estudios sobre temas de lingüística, dialectología, gramática histórica, etcétera;
  • Crear nuevas salidas profesionales. Perfiles que tengan formación de humanidades e interés por la tecnología, la estadística y la explotación de datos, y que quieran dedicarse a crear o seguir desarrollando este tipo de herramientas.

 

Ricardo Tranquilli
1 posts

Sobre el autor
Consultor BI y Visual developer en Data&Analytics. Filólogo Hispánico y Autor del ALEPZ.
Artículos

Visualización y análisis de datos, integración de tecnologías big data, machine learning e inteligencia artificial

Hiberus cuenta entre sus tecnologías diferenciales con una unidad especializada en servicios de Data & Analytics. Ofrecemos soluciones integrales de consultoría estadística y análisis de datos con especialización por áreas de conocimiento.

¿Te ayudamos?

Artículos relacionados
DestacadosDigitalNext Tech

La transformación digital en los servicios financieros comienza con el poder del dato

2 Mins de lectura
En la ‘nunca normalidad’ que se ha impuesto tras el estallido de la pandemia derivada del Covid19, las entidades financieras y aseguradoras…
Next Tech

Adaptación de Scrum para el desarrollo de soluciones de Business Analytics con CRISP-DM

7 Mins de lectura
Scrum es sin lugar a dudas el framework para organización de equipos de trabajo más utilizado del mundo. Sin embargo, en entornos…
Next Tech

3 formas de usar Inteligencia Artificial en Power BI sin escribir código

4 Mins de lectura
“La inteligencia artificial es la capacidad de un sistema para interpretar correctamente datos externos, para aprender de dichos datos y emplear esos…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *