Ciencias + Letras: Aplicaciones tecnológicas en la lingüística
LA LINGÜÍSTICA COMPUTACIONAL
Ángela Almela Sánchez-Lafuente
Profesora de Filología Inglesa y Vicedecana de Estudios de la Facultad de Letras (Universidad de Murcia).
En la intersección entre lengua y derecho: introducción a la lingüística forense
En este vídeo, tras definir brevemente la lingüística forense, explicamos en qué consiste el lenguaje probatorio (Language as evidence), ya que es de la que nos ocupamos en mi grupo de investigación en la Universidad de Murcia, LACELL, así como en el Institute for Linguistic Evidence, del que soy directora de investigación.
Seguir leyendo
Existen cuatro ejes de investigación fundamentales en lingüística forense: identificación, que trata de responder a la pregunta “¿quién es la fuente?”; clasificación de textos, que trata de responder a la pregunta “¿qué tipo de texto es?”; intertextualidad, que busca responder a la pregunta “¿cuál es la relación entre los textos?”; y evaluación por perfil lingüístico, que trata de responder a la pregunta “¿de qué tipo de fuente proviene la comunicación?”.
A continuación, ofrecemos algunos ejemplos de delitos relevantes en esos cuatro ejes, y explicamos brevemente los distintos métodos que existen para resolver estas cuestiones de lingüística forense, como por ejemplo la estilística forense, que seguramente muchos conozcáis a través del popular caso del terrorista americano conocido como Unabomber. Otro método es la estilometría forense, desarrollada a partir de la identificación de autorías de obras literarias y la clasificación de texto basada en aprendizaje automático o “machine learning”, aplicada en la historia reciente a cuestiones como la autoría de las obras de Shakespeare. Por último, pondremos un ejemplo ilustrativo del método que nosotros aplicamos en el Institute for Linguistic Evidence: se trata de la lingüística forense computacional, cuyo máximo exponente es la empresa ALIAS Technology, dirigida por la Dra. Carole Chaski. Este método está fundamentado en la teoría lingüística y en la lingüística computacional, y el caso que se resume en nuestro vídeo fue el primero en el que este método se admitió como prueba pericial para la resolución de un caso de homicidio en Estados Unidos. ¡Esperamos que os parezca interesante!
En la intersección entre lengua y derecho: introducción a la lingüística forense
En este vídeo, tras definir brevemente la lingüística forense, explicamos en qué consiste el lenguaje probatorio (Language as evidence), ya que es de la que nos ocupamos en mi grupo de investigación en la Universidad de Murcia, LACELL, así como en el Institute for Linguistic Evidence, del que soy directora de investigación.
Seguir leyendo
Existen cuatro ejes de investigación fundamentales en lingüística forense: identificación, que trata de responder a la pregunta “¿quién es la fuente?”; clasificación de textos, que trata de responder a la pregunta “¿qué tipo de texto es?”; intertextualidad, que busca responder a la pregunta “¿cuál es la relación entre los textos?”; y evaluación por perfil lingüístico, que trata de responder a la pregunta “¿de qué tipo de fuente proviene la comunicación?”.
A continuación, ofrecemos algunos ejemplos de delitos relevantes en esos cuatro ejes, y explicamos brevemente los distintos métodos que existen para resolver estas cuestiones de lingüística forense, como por ejemplo la estilística forense, que seguramente muchos conozcáis a través del popular caso del terrorista americano conocido como Unabomber. Otro método es la estilometría forense, desarrollada a partir de la identificación de autorías de obras literarias y la clasificación de texto basada en aprendizaje automático o “machine learning”, aplicada en la historia reciente a cuestiones como la autoría de las obras de Shakespeare. Por último, pondremos un ejemplo ilustrativo del método que nosotros aplicamos en el Institute for Linguistic Evidence: se trata de la lingüística forense computacional, cuyo máximo exponente es la empresa ALIAS Technology, dirigida por la Dra. Carole Chaski. Este método está fundamentado en la teoría lingüística y en la lingüística computacional, y el caso que se resume en nuestro vídeo fue el primero en el que este método se admitió como prueba pericial para la resolución de un caso de homicidio en Estados Unidos. ¡Esperamos que os parezca interesante!
Ver infografía
Ángela Almela Sánchez-Lafuente
Profesora de Filología Inglesa y Vicedecana de Estudios de la Facultad de Letras (Universidad de Murcia).
LINGÜÍSTICA DE CORPUS Y TECNOLOGÍA PARA EL BIEN SOCIAL
María Ester Saiz de Lobado García
Profesora ayudante Dra. Dpto Filología Inglesa, Área de Traducción e Interpretación, Universidad Autónoma de
Madrid.
Feminismo y lingüística del corpus
Feminismo y lingüística del corpus
Ver infografía
María Ester Saiz de Lobado García
Profesora ayudante Dra. Dpto Filología Inglesa, Área de Traducción e Interpretación, Universidad Autónoma de
Madrid.
Lingüística de corpus y tecnología para el bien social
Gema Alcaraz Mármol
Profesora Contratada Doctor Interina de la Facultad de Educación de Toledo. Dpto. de Filología Moderna en la UCLM.
Jorge Soto Almela
Profesor del dpto. de Filología Inglesa de la Universidad de Alicante.
El estudio de fenómenos sociales a través de software específicos
Hoy en día la tradicional división de ciencias y letras ha quedado obsoleta. Un ejemplo es el tipo de investigación que se explica en este vídeo, donde las matemáticas y la lingüística se unen para explorar fenómenos sociales de actualidad. En la combinación de lingüística y matemáticas se puede ver lo que se llama ‘data for social good’, una corriente en la que enmarcamos lo que hacemos: lingüística para el bien social.
Seguir leyendo
Nuestra investigación utiliza programas informáticos específicos para el análisis cuantitativo de la lengua. En esta ocasión, os explicamos cómo analizamos el fenómeno migratorio por parte de los medios de comunicación. Y es que la lengua se puede cuantificar. Transformamos la lengua en números para poder identificar patrones que nos dicen cómo se representan las personas migrantes en los medios.
Para poder sacar conclusiones válidas, compilamos corpus de millones de palabras extraídas de noticias sobre migración para luego analizarlas con herramientas de lingüística cuantitativa. Nuestros resultados muestran que los medios de comunicación representan a las personas migrantes como cifras, objetos, desastres naturales, carga económica o delincuentes. Es decir, pueden ser todas esas cosas, excepto simples seres humanos. Expresiones como “devolver refugiados”, “ola o avalancha de inmigrantes” son muy recurrentes, y de hecho se han convertido en frases hechas que forman ya parte de nuestro vocabulario y constituyen lo que se llama lenguaje inmigracionalista o inmigracionalismo (un concepto que surge de la suma de inmigración y sensacionalismo). El software utilizado para analizar el corpus de noticias también nos permitió descubrir que el número y el tipo de palabras deshumanizantes presentes en los medios no han hecho más que incrementar a lo largo de la última década. En 2015, de hecho, casi un 20% de las palabras que acompañaban al término “refugiado” tenían carácter deshumanizante.
Esas palabras, que conforman ya expresiones hechas en muchos casos, van influyendo en nuestra manera de expresarnos y de ver la realidad. Ese es el poder de la lengua, capaz de normalizar un discurso sensacionalista que termina calando en la opinión pública.
El estudio de fenómenos sociales a través de software específicos
Hoy en día la tradicional división de ciencias y letras ha quedado obsoleta. Un ejemplo es el tipo de investigación que se explica en este vídeo, donde las matemáticas y la lingüística se unen para explorar fenómenos sociales de actualidad. En la combinación de lingüística y matemáticas se puede ver lo que se llama ‘data for social good’, una corriente en la que enmarcamos lo que hacemos: lingüística para el bien social.
Seguir leyendo
Nuestra investigación utiliza programas informáticos específicos para el análisis cuantitativo de la lengua. En esta ocasión, os explicamos cómo analizamos el fenómeno migratorio por parte de los medios de comunicación. Y es que la lengua se puede cuantificar. Transformamos la lengua en números para poder identificar patrones que nos dicen cómo se representan las personas migrantes en los medios.
Para poder sacar conclusiones válidas, compilamos corpus de millones de palabras extraídas de noticias sobre migración para luego analizarlas con herramientas de lingüística cuantitativa. Nuestros resultados muestran que los medios de comunicación representan a las personas migrantes como cifras, objetos, desastres naturales, carga económica o delincuentes. Es decir, pueden ser todas esas cosas, excepto simples seres humanos. Expresiones como “devolver refugiados”, “ola o avalancha de inmigrantes” son muy recurrentes, y de hecho se han convertido en frases hechas que forman ya parte de nuestro vocabulario y constituyen lo que se llama lenguaje inmigracionalista o inmigracionalismo (un concepto que surge de la suma de inmigración y sensacionalismo). El software utilizado para analizar el corpus de noticias también nos permitió descubrir que el número y el tipo de palabras deshumanizantes presentes en los medios no han hecho más que incrementar a lo largo de la última década. En 2015, de hecho, casi un 20% de las palabras que acompañaban al término “refugiado” tenían carácter deshumanizante.
Esas palabras, que conforman ya expresiones hechas en muchos casos, van influyendo en nuestra manera de expresarnos y de ver la realidad. Ese es el poder de la lengua, capaz de normalizar un discurso sensacionalista que termina calando en la opinión pública.
Ver infografía
Gema Alcaraz Mármol
Profesora Contratada Doctor Interina de la Facultad de Educación de Toledo. Dpto. de Filología Moderna en la UCLM.
Jorge Soto Almela
Profesor del dpto. de Filología Inglesa de la Universidad de Alicante.