반응형

분류

  • 데이터 분포를 학습하여 샘플을 생성하는 확률 생성 모델 (probabilistic generative model)

정의

  • 데이터를 점차적으로 노이즈화하는 forward process와, 원래 데이터를 복원하는 reverse denoising process로 구성된 확률 기반 생성 모델

특징

  • 수학적으로 Markov Process에 기반한 연속적 상태 변화 모델
  • 실제 학습 시에는 신경망을 사용해 reverse process를 근사
  • Stable Diffusion, Imagen (Google), DALLE-2 (GPT) 등의 모델이 diffusion 을 기반으로 함

 

DALLE-2
최신 diffusion model 들간의 비교 (tencent 에서 제안한 instant character 논문의 성능 향상을 보이려함)

 

반응형
반응형

참고 논문 :

 

An overview of gradient descent optimization algorithms

Gradient descent optimization algorithms, while increasingly popular, are often used as black-box optimizers, as practical explanations of their strengths and weaknesses are hard to come by. This article aims to provide the reader with intuitions with rega

arxiv.org

참고 사이트 :

Gradient Descent Variants 정리

 

딥러닝(Deep learning) 살펴보기 2탄

지난 포스트에 Deep learning 살펴보기 1탄을 통해 딥러닝의 개요와 뉴럴 네트워크, 그리고 Underfitting의 문제점과 해결방법에 관해 알아보았습니다. 그럼 오늘은 이어서 Deep learning에서 학습이 느린

seamless.tistory.com

 

 

Gradients Descent Variants 정리

Gradients Descent Optimization Algorithms정리

그래서 어떤 Gradients Descent Optimizer 를 써야 하는가? (2017 기준)

if you care about fast convergence and train a deep or complex neural network, you should choose one of the adaptive learning rate methods.

 

"빠른 수렴을 원하거나, 복잡한 뉴럴 네트워크에서 훈련하면 적응적 학습율 알고리듬 중 하나를 사용하는 것이 좋다."

이는 논문에 제시된 saddle point 문제를 해결하는 차이를 나타낸 그림으로 충분히 납득이 된다.

 

Insofar(2017 기준), Adam might be the best overall choice.

 

"2017 기준으로 Adam 이 전반적으로 가장 좋은 선택이다."

반응형

'AI' 카테고리의 다른 글

Diffusion Models 요약  (1) 2025.06.01

+ Recent posts