journalists
크레딧: Unsplash/CC0 공개 도메인

적절한 출처가 없으면 뉴스 기사가 어떻게 될까요?설득력 있는 이야기를 전달하려면 기자는 뉴스 가치가 있는 이야기와 신뢰할 수 있는 정보를 찾아야 합니다.이러한 정보는 일반적으로 각자의 편견, 전문 지식, 의견 및 배경을 가진 다양한 출판물, 공식 기록 및 전문가로부터 나옵니다.인터뷰 후보자 풀은 풍부하지만 탐색하기에는 압도적입니다.

그러나 인공 지능은 가이드 역할을 할 수 있습니다.

USC 정보 과학 연구소(USC Information Sciences Institute)의 연구원들은 언론인에게 참고 자료를 제안하도록 설계된 출처 추천 엔진을 만들고 있습니다."실제로는USC 비터비 공과대학 컴퓨터 과학 및 커뮤니케이션 교수인 에밀리오 페라라(Emilio Ferrara)는 "주어진 텍스트나 주제를 분석하고 인터뷰 대상자, 전문가 또는 정보 자원의 데이터베이스를 상호 참조하여 관련 소스를 제안할 것"이라고 말했습니다.연락처, 전문 분야, 출처의 이전 작업을 제공할 수 있다”고 덧붙였다.

이 도구의 개발은 컴퓨터 과학 박사인 Alexander Spangher가 주도하고 있습니다.이전에 New York Times에서 데이터 과학자로 일했던 USC Viterbi 학생입니다.저널리즘 산업에 푹 빠져 있던 Spangher는 전통적인 뉴스룸의 압박을 목격했습니다."나는 완전히 과장되지 않은 단 한 명의 지역 언론인과도 이야기를 나눈 적이 없습니다"라고 그는 말했습니다."뉴스 사막과 신문이 문을 닫았습니다. 우리가 정말로 지원하고 도구를 구축하고 싶은 것은 바로 이와 같은 영역입니다."

기자들에게 유용한 리소스를 제공하려는 동기를 지닌 Spangher는 소스 추천 시스템을 포함하여 다양한 AI 장치를 만들고 있습니다.그의 논문, "뉴스 기사에서 정보 출처 식별"이 승인되었습니다.2023년 자연어 처리 실증적 방법에 관한 컨퍼런스이제 다음 페이지에 게시되었습니다.arXiv사전 인쇄 서버.

출처를 제안할 수 있는 AI 모델을 만들기 위해 연구자들은 먼저 기초를 다졌습니다. 인간 언론인들은 현재 뉴스 작성에서 출처를 어떻게 사용하고 있습니까?이를 연구하기 위해 그들은 천 개가 넘는 뉴스 기사에서 문장 데이터 세트를 수집하고 정보의 출처와 소싱 범주(예: "직접 인용문", "간접 인용문", "출판된 저작물" 및 "법원"에 주석을 달았습니다.소송 절차").

그러나 주석이 달린 수천 개의 뉴스 기사는 저널리스트가 보도 장르 전반에 걸쳐 출처를 사용하는 수많은 방식에 대해 연구자들이 확고한 결론을 도출하기에는 데이터가 충분하지 않았습니다.하지만 주석 프로세스를 계속하려면 언어 모델(LM)을 훈련하는 것만으로도 충분했습니다."언어 모델은 처리하고 이해하는 AI 프레임워크입니다.패턴과 맥락에 대해 대량의 텍스트를 분석함으로써" 논문의 수석 저자인 Ferrara가 설명했습니다.

연구자들이 훈련한 LM은 83%의 정확도로 소스 속성을 탐지할 수 있다고 저자는 밝혔습니다.이제 이러한 LM을 갖춘 그들은 약 10,000개의 뉴스 기사에 주석을 달고 뉴스 작성의 구성성을 이해하는 데 더 깊이 파고들었습니다. 언론인은 현재 소스를 언제, 어떻게 사용합니까?

AI 모델은 평균적으로 뉴스 기사 정보의 약 절반이 출처에서 왔으며 각 기사에는 일반적으로 1~2개의 주요 출처(즉, 기사 정보의 20% 이상을 기여하는 출처)가 있음을 발견했습니다.2~8개의 작은 항목(덜 기여하는 항목)."AI는 또한 첫 번째와 마지막 문장이 출처일 가능성이 가장 높다는 것을 발견했습니다."라고 Spangher는 설명했습니다. 기자들은 종종 인용된 정보로 시작하고 독자를 보내기 위해 인용문으로 마무리한다고 덧붙였습니다.

연구원들은 한 가지 더 테스트하여 새로운 알고리즘에 도전했습니다. 소스가 누락되었는지 감지할 수 있습니까?정보가 부족한 시점을 AI가 인식할 수 있다면 전체 그림을 완성하기 위해 특정 전문가를 추천해야 할 시기를 알 수 있도록 구성할 수 있습니다.

일부 출처를 무작위로 삭제한 4만 개의 기사를 분석한 결과, AI 모델은 주요 출처가 없으면 쉽게 알아차렸지만 사소한 출처에는 어려움을 겪었습니다.Spangher는 스토리에 있어 가장 덜 중요한 소스일 수도 있지만, AI가 언젠가 만들 수 있는 가장 가치 있는 추천이 될 수도 있다고 Spangher는 말했습니다.

"너 많이 그릴 거야.주요 참가자의 목소리가 있지만 보충 목소리는 기사에 추가 색상과 세부 정보를 제공할 것입니다."라고 그는 말했습니다. "엔진이 사소한 출처를 인식하고 추천하도록 하는 것은 어려울 것이지만 가장 도움이 될 수 있습니다."

연구원들은 또한 이 도구가 소스를 다양하게 추천할 수 있다면 중요할 것이라고 생각합니다.페라라는 "기자들에게 일반적인 네트워크를 넘어 새롭고 다양한 목소리를 소개할 수 있어 친숙한 소스에 대한 의존도를 줄이고 잠재적으로 새로운 관점을 가져올 수 있다"고 말했습니다.

그러나 모든 AI 시스템은 적절하게 설계되지 않으면 편향되기 쉽다고 그는 덧붙였습니다.그는 "소스 데이터베이스의 다양성을 보장하기 위해 표준에는 광범위한 인구 통계, 분야 및 관점의 표현이 포함되어야 합니다"라고 말했습니다.

USC Viterbi의 컴퓨터 과학 연구 부교수이자 ISI 수석 연구원인 Jonathan May는 소싱 엔진이 보고 프로세스를 활성화하여 언론인이 보다 효율적으로 작업할 수 있도록 하는 미래를 상상합니다.

"우리가 할 수 있는 기술그리고 우리가 창의적으로 최선을 다하는 것은 좋은 일입니다."라고 논문의 공동 저자인 May가 말했습니다. "그래서 제가 희망을 품고 있습니다."

팀은 언론인과 협력하여 추가 개선을 위한 피드백을 수집할 계획입니다.

Spangher는 "이와 같은 프로젝트를 통해 언론인과 대화하고 그들의 요구 사항, 관점, 그들이 생각하는 것이 효과가 있거나 없을 것이라고 생각하는 것을 이해함으로써 정말 큰 보람을 느낍니다"라고 말했습니다."지역 저널리즘에 대한 어떤 해결책이라도 다양한 배경을 가진 다양한 사람들이 함께 모이는 것이 필요합니다."

추가 정보:Alexander Spangher 외, 뉴스 기사의 정보 소스 식별,arXiv(2023).DOI: 10.48550/arxiv.2305.14904

저널 정보: arXiv

소환:언론인이 다양하고 독창적인 출처를 찾는 데 AI가 도움이 되는 방법(2023년 12월 19일)2023년 12월 19일에 확인함https://techxplore.com/news/2023-12-ai-journalists-diverse-sources.html에서

이 문서는 저작권의 보호를 받습니다.사적인 학습이나 조사를 목적으로 하는 공정한 거래를 제외하고는 어떠한 행위도 허용되지 않습니다.서면 허가 없이 일부를 복제할 수 있습니다.콘텐츠는 정보 제공 목적으로만 제공됩니다.