연구원들은 훈련과 성능을 안정화하는 새로운 생성적 적대 네트워크 모델을 개발합니다.

2024-10-16 23:06:49

최근에는 인공지능(AI)과 딥러닝 모델이 빠르게 발전하면서 쉽게 접근할 수 있게 되었습니다.이를 통해 전문 지식이 없는 사람도 AI를 활용해 다양한 업무를 수행할 수 있게 됐다.이러한 모델 중에서 생성적 적대 신경망(GAN)은 훈련 데이터와 동일한 특성을 가진 새로운 데이터 인스턴스를 생성하는 데 뛰어난 성능을 발휘하여 이미지, 음악 및 텍스트 생성에 특히 효과적입니다.

generative adversarial networks — 신용: Pixabay/CC0 공개 도메인

GAN은 두 가지로 구성됩니다.신경망즉, 무작위 노이즈로부터 시작하여 새로운 데이터 분포를 생성하는 생성기와 생성된 데이터 분포가 "진짜"(훈련 데이터와 일치)인지 "가짜"인지 확인하는 판별기입니다.훈련이 진행됨에 따라 생성기는 현실적인 분포를 생성하는 능력이 향상되고, 판별기는 생성된 데이터를 가짜로 식별하는 능력이 향상됩니다.

GAN은 손실 함수를 사용하여 가짜 분포와 실제 분포 간의 차이를 측정합니다.그러나 이 접근 방식은 기울기 소멸 및 불안정한 학습과 같은 문제를 발생시켜 안정성과 효율성에 직접적인 영향을 미칠 수 있습니다.구조적 수정 및 손실 함수 조정을 포함하여 GAN 개선에 상당한 진전이 있었음에도 불구하고 생성기가 제한된 다양성을 생성하는 그래디언트 소실 및 모드 붕괴와 같은 문제는 계속해서 적용 가능성을 제한합니다.

이러한 문제를 해결하기 위해 대한민국 중앙대학교 전기전자공학부의 이민혁 조교수가 이끄는 연구팀은 새로운 전략을 개발했습니다."예술가에게 풍경화를 그리는 법을 가르치는 것을 상상해 보십시오. 일관된 지도를 통해 유사한 장면을 생성할 수 있습니다. 이는 기계 학습에서 모드 붕괴라고 불리는 현상입니다. 이를 방지하기 위해 PMF-GAN 모델은 판별기의 기능을 개선하여 지나치게 유사한 출력을 생성하는 생성기에 불이익을 줍니다., 이를 통해 다양성을 촉진합니다."라고 이 박사는 설명합니다.

그들의 연구 결과는 저널에 게재되었습니다.응용소프트컴퓨팅2024년 10월.

PMF-GAN 프레임워크에는 두 가지 주요 개선 사항이 도입되었습니다.첫째, 커널 최적화를 사용하여 판별기의 기능을 개선하여 모델 붕괴 및 그래디언트 소실 문제를 해결하는 데 상당한 이점을 제공합니다.커널은 데이터를 고차원 공간으로 변환하는 수학 함수로, 복잡한 데이터에서도 패턴을 더 쉽게 감지할 수 있습니다.판별기의 출력은 커널 함수를 통해 처리되어 커널 밀도 추정(KDE)을 생성합니다.

둘째, PMF-GAN은 히스토그램 변환이라는 수학적 기술을 KDE 출력에 적용하여 결과를 보다 직관적으로 분석할 수 있습니다.훈련 중에 모델은 커널-히스토그램으로 변환된 가짜 분포와 실제 분포 간의 차이(PMF 거리라고 하는 측정값)를 최소화합니다.

특히 이 접근 방식을 사용하면 다양한 수학적 거리 함수와 커널 함수를 사용할 수 있습니다.이러한 유연성을 통해 PMF-GAN은 다양한 데이터 유형 및 학습 목표에 맞게 조정될 수 있습니다.또한 PMF-GAN은 기존의 개선된 GAN 아키텍처에 통합되어 더 나은 성능을 제공할 수 있습니다.

실험에서 PMF-GAN은 여러 데이터 세트의 시각적 품질 및 평가 지표 측면에서 여러 기본 모델보다 성능이 뛰어났습니다.Animal FacesHQ 데이터 세트의 경우 기존 WGAN-GP 모델에 비해 Inception 점수가 56.9%, FID(Fréchet Inception Distance) 점수가 61.5% 향상된 것으로 나타났습니다.

"유연성과성능 개선PMF-GAN이 제시하는 것은 다양한 기술 및 디지털 분야에서 합성 데이터를 생성할 수 있는 새로운 가능성을 열어줍니다.~ 안에건강 관리, 보다 안정적이고 다양한 이미지 생성으로 이어질 것입니다.또한 영화, 비디오 게임, 가상 현실 경험을 위한 더욱 사실적이고 다양한 컴퓨터 생성 영상을 가능하게 합니다."라고 Lee 박사는 말합니다.

"AI로 생성된 콘텐츠가 우리 일상 생활에서 점점 더 보편화됨에 따라 우리의 방법은 콘텐츠의 품질과 다양성을 향상시키고 AI가 계속해서 인간의 창의성과 문제 해결을 위한 귀중한 도구가 되도록 보장할 것입니다."

추가 정보:서장원 외, 커널-히스토그램 변환 및 확률 질량 함수 거리를 사용한 안정화된 GAN 모델 훈련,응용소프트컴퓨팅(2024).DOI: 10.1016/j.asoc.2024.112003

제공자:중앙대학교

소환:연구원들은 훈련과 성능을 안정화하는 새로운 생성적 적대 네트워크 모델을 개발합니다(2024년 10월 16일)2024년 10월 16일에 확인함https://techxplore.com/news/2024-10-generative-adversarial-networks-stabilizes.html에서

다른 언어 버전도 참조하세요: English | 简中 | 正體 | 日本語 | 한국인 | हिंदी | Español