journalists
Crédito: Unsplash/CC0 Dominio público

¿Qué serían las noticias sin las fuentes adecuadas?Para contar una historia convincente, los periodistas necesitan encontrar narrativas de interés periodístico e información confiable.Esta información normalmente proviene de un amplio conjunto de publicaciones, registros oficiales y expertos, todos con sus propios prejuicios, conocimientos, opiniones y antecedentes.El grupo de candidatos para entrevistas es abundante pero abrumador.

La inteligencia artificial, sin embargo, puede servir de guía.

Investigadores del Instituto de Ciencias de la Información de la USC están creando un motor de recomendación de fuentes diseñado para sugerir referencias a los periodistas."En la práctica, elanalizaría un texto o tema determinado y sugeriría fuentes relevantes mediante referencias cruzadas con una base de datos de posibles entrevistados, expertos o recursos informativos", dijo Emilio Ferrara, profesor de informática y comunicación en la Escuela de Ingeniería Viterbi de la USC. "La herramientapodría proporcionar datos de contacto, áreas de especialización y trabajos previos de las fuentes", añadió.

El desarrollo de la herramienta está dirigido por Alexander Spangher, doctor en informática.Estudiante de la USC Viterbi que anteriormente trabajó como científico de datos en el New York Times.Mientras estaba inmerso en la industria del periodismo, Spangher fue testigo de la presión de las redacciones tradicionales."No he hablado con ningún periodista local que no estuviera totalmente sobrecargado", comentó."Ha habido desiertos de noticias y cierres de periódicos. Son áreas como ésta para las que realmente queremos ayudar y desarrollar herramientas".

Motivado por proporcionar recursos útiles para los periodistas, Spangher está creando varios dispositivos de inteligencia artificial, incluido un sistema de recomendación de fuentes precedido ensu papel, "Identificación de fuentes de información en artículos noticiosos", que fue aceptado en elConferencia 2023 sobre métodos empíricos en el procesamiento del lenguaje naturaly ahora está publicado en elarXivservidor de preimpresión.

Para crear un modelo de IA que pueda sugerir fuentes, los investigadores primero sentaron las bases: ¿cómo utilizan actualmente los periodistas humanos las fuentes al escribir noticias?Para estudiar esto, reunieron un conjunto de datos de oraciones de más de mil artículos de noticias y anotaron la fuente de la información, así como la categoría de fuente (por ejemplo, "citas directas", "citas indirectas", "trabajos publicados" y "citas judiciales").actas").

Sin embargo, mil artículos de noticias comentados no fueron datos suficientes para que los investigadores sacaran conclusiones firmes sobre las innumerables formas en que los periodistas utilizan las fuentes en todos los géneros informativos.Pero fue suficiente entrenar un modelo de lenguaje (LM) para continuar con el proceso de anotación."Los modelos de lenguaje son marcos de IA que procesan y comprendenanalizando grandes volúmenes de texto en busca de patrones y contexto", explicó Ferrara, autor principal del artículo.

Los LM que entrenaron los investigadores pudieron detectar atribuciones de fuentes con un 83% de precisión, revelaron los autores.Ahora equipados con estos LM, anotaron aproximadamente 10.000 artículos de noticias y profundizaron en la comprensión de la composicionalidad de la redacción de noticias: ¿cuándo y cómo utilizan actualmente los periodistas las fuentes?

Los modelos de IA encontraron que, en promedio, aproximadamente la mitad de la información en los artículos de noticias provino de fuentes y, en cada artículo, generalmente hay una o dos fuentes principales (es decir, aquellas que contribuyen con el 20% o más de la información del artículo) yde dos a ocho menores (los que menos aportan)."La IA también descubrió que la primera y la última oración eran las que tenían más probabilidades de tener una fuente", explicó Spangher, y agregó que los periodistas a menudo comienzan con información citada y cierran con una cita para despedir al lector.

Los investigadores desafiaron su nuevo algoritmo con una prueba más: ¿podrían detectar si faltaba una fuente?Si la IA puede reconocer cuando falta información, entonces se puede configurar para saber cuándo recomendar a un experto en particular para completar el panorama completo.

Al analizar 40.000 artículos con algunas fuentes eliminadas al azar, los modelos de IA notaron fácilmente cuando una fuente importante estaba ausente pero tenían dificultades con las menores.Aunque pueden ser las menos cruciales para una historia, las fuentes menos obvias también pueden ser las recomendaciones más valiosas que una IA podría hacer algún día, dijo Spangher.

"Vas a dibujar muchosde los participantes principales, pero las voces suplementarias proporcionarán color y detalles adicionales al artículo", señaló. "Será un desafío lograr que el motor reconozca y recomiende fuentes menores, pero pueden ser las más útiles."

Los investigadores también creen que la herramienta será importante si puede recomendar fuentes de forma diversa."Puede presentar a los periodistas voces nuevas y diversas más allá de su red habitual, reduciendo así la dependencia de fuentes familiares y potencialmente aportando nuevas perspectivas", dijo Ferrara.

Sin embargo, todo sistema de IA es propenso a sufrir sesgos si no se diseña adecuadamente, añadió."Para garantizar la diversidad en las bases de datos fuente, los estándares deben incluir representación de una amplia gama de datos demográficos, disciplinas y perspectivas", señaló.

Jonathan May, profesor asociado de investigación de ciencias de la computación en la USC Viterbi e investigador principal del ISI, imagina un futuro en el que el motor de abastecimiento impulse el proceso de presentación de informes, permitiendo a los periodistas ser más eficientes.

"Tecnología que puede ayudarnos a hacer"Y ser lo mejor que podamos ser creativos es algo bueno", dijo May, coautora del artículo. "Por eso tengo esperanzas en ello".

El equipo planea colaborar con periodistas para recopilar comentarios para futuras mejoras.

"Con proyectos como este, realmente disfruto hablando con periodistas y comprendiendo sus necesidades, puntos de vista y lo que piensan que funcionará o no", dijo Spangher."Cualquier solución al periodismo local requerirá la unión de un grupo de personas diferentes con diferentes orígenes".

Más información:Alexander Spangher et al, Identificación de fuentes de información en artículos de noticias,arXiv(2023).DOI: 10.48550/arxiv.2305.14904

Información de la revista: arXiv

Citación:Cómo la IA puede ayudar a los periodistas a encontrar fuentes diversas y originales (19 de diciembre de 2023)recuperado el 19 de diciembre de 2023de https://techxplore.com/news/2023-12-ai-journalists-diverse-sources.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.