Five ways to model text using networks
Algunos ejemplos de cómo las palabras se conectan entre sí en un texto, formando una red.Mientras que palabras como "vértice" y "vértices" están conectadas por su forma compartida, palabras como "textos", "oraciones" y "palabras" están conectadas debido a sus significados.Crédito: SciencePOD

El crecimiento explosivo de los "chatbots" de IA en los últimos años y su capacidad para generar texto que simula la escritura humana, a menudo con mucha precisión, ha centrado la atención en cómo se estructura el texto.

Una forma útil de analizar texto es pensar en él como una red, y los métodos de análisis de redes que son familiares para los matemáticos e informáticos pueden ser poderosos en lingüística.

La teoría de redes se puede utilizar de diferentes maneras para modelar la relación entre palabras en un bloque de texto, vinculando patrones analíticos con la coherencia y algunos aspectos más subjetivos de la calidad de la escritura.

Davi Alves Oliveira y Hernane Borges de Barros Pereira de la Universidad del Estado de Bahía, Bahía, Brasil, han comparado cinco métodos para representar oraciones como redes, demostrando que cada uno tiene valor para aplicaciones específicas.Este análisis ha sido ahorapublicadoenLa revista física europea B.

Su investigación se centra en una propiedad del texto llamada cohesión, que es esencialmente lo que hace que un bloque de texto funcione como un todo, en lugar de como una colección de oraciones aleatorias.Su cohesión se construye en gran medida a partir de las relaciones entre palabras."Imaginemos un texto como un mapa, con palabras como ciudades... [y] conectamos las palabras según cómo se relacionan entre sí", explica Oliveira."Esto nos permite explorar cómo los usuarios del lenguaje eligen estratégicamente palabras para construir una estructura cohesiva".

La teoría de redes se basa en nodos conectados por bordes que definen las relaciones entre ellos.Oliveira y Pereira presentan cinco formas diferentes de definir estos nodos y bordes en el texto y luego utilizan herramientas de análisis de redes para medir la fuerza y ​​el patrón de las conexiones.

En algunos modelos, las palabras individuales se reemplazan comomediante lemas o palabras base (por lo que "texto" representaría tanto "textos" como "textuales") y/o palabras de enlace como "y" o "el" eliminado;Los bordes pueden conectar palabras consecutivas o palabras en la misma oración.

"Este [análisis] nos permite ver cómo la elección de palabras se influye entre sí y contribuye al significado y la estructura general del texto", agrega Oliveira.

La coherencia, y también aspectos más subjetivos de la calidad de la escritura, como la claridad y la fluidez, pueden vincularse a los patrones de red.Esto sugiere que los análisis de los investigadores pueden tener aplicaciones prácticas para profesores de idiomas, escritores y traductores.

Más información:Davi Alves Oliveira et al, Modelado de textos con redes: comparación de cinco enfoques para la representación de oraciones,La revista física europea B(2024).DOI: 10.1140/epjb/s10051-024-00717-0

Citación:Cinco formas de modelar texto usando redes (5 de agosto de 2024)recuperado el 5 de agosto de 2024de https://techxplore.com/news/2024-08-ways-text-networks.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.