Sin textos, la asignación automática de errores sigue funcionando bien: estudio

2024-08-26 16:02:49

La asignación automática de errores ha sido bien estudiada en la última década.Como los informes de errores textuales suelen describir los fenómenos de los errores y sus posibles causas, los ingenieros dependen en gran medida de estos informes para corregir los errores.Los investigadores dependen en gran medida del contenido textual de los informes de errores para localizar los archivos con errores.Sin embargo, los ruidos en los textos traen inesperadamente impactos adversos a las asignaciones automáticas de errores, principalmente debido a la insuficiencia de las técnicas clásicas de procesamiento del lenguaje natural (PLN).

Without texts, automatic bug assignment still work well — Crédito:*Fronteras de la informática*(2024).DOI: 10.1007/s11704-024-3299-6

Para adquirir una comprensión profunda de los efectos de las características textuales y las características nominales, un equipo de investigación dirigido por Zexuan Li publicó suinvestigaciónenFronteras de la informática.El equipo reprodujo una técnica de PNL, TextCNN, para saber si una técnica de PNL mejorada puede conducir a un mejor rendimiento de las características textuales.Los resultados revelan que las características textuales no superan a otras características incluso con la técnica relativamente avanzada.

El equipo explora más a fondo las características influyentes para los enfoques de asignación de errores y brinda una explicación desde una perspectiva estadística.

Encuentran que las características influyentes seleccionadas son todas características nominales que indican la preferencia de los desarrolladores.Los resultados experimentales muestran que las funciones nominales pueden lograr resultados competitivos sin utilizar texto.

En la investigación, se esforzaron por responder tres preguntas.Primero, ¿qué tan efectivas son las características textuales con técnicas de PNL basadas en aprendizaje profundo?Reproducen TextCNN y comparan la efectividad de las características textuales con el grupo de características nominales.

En segundo lugar, ¿cuáles son las características influyentes para los enfoques de asignación de errores y por qué son influyentes?Emplean el método contenedor y la estrategia bidireccional ampliamente utilizada.Al entrenar repetidamente un clasificador con diferentes grupos de características, este juzga la importancia de las características según la métrica.Especulan que las características nominales pueden contribuir a reducir el alcance de la búsqueda del clasificador y verificar la especulación mediante un método estadístico.

En tercer lugar, ¿hasta qué punto las características influyentes seleccionadas pueden mejorar la asignación de errores?Entrenan modelos con clasificadores fijos en grupos cambiantes de características y realizan dos clasificadores populares (Decision Tree y SVM) en cinco grupos de características.

El experimento utilizó cinco proyectos de diferentes tamaños y tipos como conjuntos de datos.Los resultados demuestran que la técnica de PNL mejorada tiene una mejora limitada y las características clave seleccionadas alcanzan una precisión del 11 al 25% según dos clasificadores populares.

El trabajo futuro puede centrarse en introducir archivos fuente para construir un gráfico de conocimiento entre estas características influyentes y palabras descriptivas para una mejor integración de las características nominales.

Más información:Zexuan Li et al, Asignaciones automáticas de errores sin textos: un estudio,Fronteras de la informática(2024).DOI: 10.1007/s11704-024-3299-6

Proporcionado porRevistas de fronteras

Citación:Sin textos, la asignación automática de errores sigue funcionando bien: estudio (26 de agosto de 2024)recuperado el 26 de agosto de 2024de https://techxplore.com/news/2024-08-texts-automatic-bug-assignment.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.