New study reveals impact of chatGPT on public knowledge sharing
Una serie temporal ampliada de las publicaciones semanales en Stack Overflow.La figura destaca el lanzamiento de ChatGPT y la conclusión de los datos utilizados en los análisis estadísticos, respectivamente.Después de mayo de 2023, la disminución de la actividad de publicación continúa, aunque a un ritmo más lento.Crédito: María del Río-Chanona, Nadzeya Laurentsyeva, Johannes Wachs

Un nuevo estudiopublicadoenNexo PNASrevela que la adopción generalizada de grandes modelos de lenguaje (LLM), como ChatGPT, ha llevado a una disminución significativa en el intercambio de conocimiento público en plataformas como Stack Overflow.El estudio destaca una reducción del 25% en la actividad de los usuarios en el popular sitio de preguntas y respuestas sobre programación dentro de los seis meses posteriores al lanzamiento de ChatGPT, en comparación con plataformas similares donde el acceso a ChatGPT está restringido.

"Los LLM son tan poderosos, tienen un valor tan alto y tienen un gran impacto en el mundo. Uno comienza a preguntarse sobre su futuro", dice la primera autora María del Rio-Chanona, miembro asociado de la facultad del Complexity Science Hub (CSH).).

"Nuestro estudio planteó la hipótesis de que, en lugar de publicar preguntas y recibir respuestas en plataformas públicas como Stack Overflow, donde todos pueden verlas y aprender de ellas, las personas preguntan de forma privada en ChatGPT. Sin embargo, los LLM como ChatGPT también están capacitados en este ámbito abierto y público.datos, que están reemplazando de alguna manera. Entonces, ¿qué va a pasar?", agrega Del Rio-Chanona, quien también es profesor asistente en el University College de Londres, e investigador asociado en el Instituto para el Nuevo Pensamiento Económico de la Oxford Martin School.y el Instituto Bennett de Políticas Públicas de la Universidad de Cambridge.

Las implicaciones son importantes.

"En nuestros hallazgos, notamos cada vez menos preguntas y respuestas en Stack Overflow después del lanzamiento de ChatGPT. Esto tiene implicaciones bastante grandes. Esto significa que puede que no haya suficientes datos públicos para entrenar modelos en el futuro", advierte Del Rio-Chanona.En este estudio trabajó junto con Nadzeya Laurentsyeva, de la Universidad Ludwig Maximilian de Munich;y Johannes Wachs, miembro de la facultad de CSH y profesor de la Universidad Corvinus de Budapest.

"Stack Overflow es una base de datos de conocimientos inmensamente valiosa a la que puede acceder cualquier persona con conexión a Internet. Personas de todo el mundo aprenden de las preguntas y respuestas que otras personas publican", afirma Wachs.

De hecho, incluso los modelos de IA como ChatGPT están entrenados en contenido generado por humanos, como publicaciones de Stack Overflow.Irónicamente, el desplazamiento de la creación de contenido humano por la IA hará que sea más difícil entrenar futuros modelos de IA.Generalmente se piensa que el uso de datos generados por IA para entrenar nuevos modelos funciona mal, un proceso comparable a hacer una fotocopia de una fotocopia.

Un paso de lo público a lo privado

Los hallazgos también señalan escenarios que van más allá de los meros cambios tecnológicos y tocan también el tejido de nuestras estructuras económicas y sociales.Los usuarios pueden volverse menos propensos a contribuir a plataformas de conocimiento abiertas a medida que interactúan más con LLM como ChatGPT, lo que resulta en la transferencia de datos valiosos desde repositorios públicos a sistemas de inteligencia artificial de propiedad privada, explican Del Rio-Chanona y sus colegas.

"Esto representa un cambio significativo de conocimiento del ámbito público al privado", afirman los investigadores.Según ellos, esto también podría profundizar la ventaja competitiva de los pioneros en la IA, concentrando aún más el conocimiento y el poder económico.

Todos los niveles de experiencia y calidad.

Del Rio-Chanona y sus colegas descubrieron que la disminución en la creación de contenido en Stack Overflow afectaba a usuarios de todos los niveles de experiencia, desde principiantes hasta expertos.También observaron que la calidad de las publicaciones no disminuyó significativamente, según lo medido por los comentarios de los usuarios, lo que indica que los LLM están desplazando tanto las contribuciones de baja como de alta calidad.

Además, el estudio mostró que la actividad de publicación en algunos lenguajes de programación, como Python y Javascript, cayó significativamente más que el promedio de la plataforma.

"Los resultados sugieren que la gente está haciendo preguntas sobre Python y Javascript, dos de los más utilizados, en ChatGPT en lugar de Stack Overflow", dice Del Rio-Chanona.

Más información:R Maria del Rio-Chanona et al, Los modelos de lenguaje grandes reducen el intercambio de conocimiento público en plataformas de preguntas y respuestas en línea,Nexo PNAS(2024).DOI: 10.1093/pnasnexus/pgae400

Citación:El ascenso de ChatGPT está vinculado a la disminución del intercambio público de conocimientos en plataformas de preguntas y respuestas en línea (2024, 25 de septiembre)recuperado el 26 de septiembre de 2024de https://techxplore.com/news/2024-09-chatgpt-linked-decline-knowledge-online.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.