[논문 리뷰] ViViT: A Video Vision Transformer
Google Research ICCV 2021 Paper: https://arxiv.org/abs/2103.15691 Git: https://github.com/google-research/scenic/tree/main/scenic/projects/vivit Introduction Transformer는 Multi-headed s...
Google Research ICCV 2021 Paper: https://arxiv.org/abs/2103.15691 Git: https://github.com/google-research/scenic/tree/main/scenic/projects/vivit Introduction Transformer는 Multi-headed s...
Microsoft Research ICML 2022 Paper: https://arxiv.org/abs/2106.08254 Git: https://github.com/microsoft/unilm/tree/master/beit Introduction Computer Vision에서 Transformer가 뛰어난 성능을 달성했지만, ...
Opan AI ICML 2021 Paper: https://arxiv.org/abs/2102.12092 Git: https://github.com/openai/DALL-E?tab=readme-ov-file Project Page: https://openai.com/research/dall-e Introduction 최근 다양한...
Kakao Brain CVPR 2023 Paper: https://arxiv.org/abs/2212.00785 Git: https://github.com/kakaobrain/tcl Project Page: https://huggingface.co/spaces/khanrc/tcl Introduction Open-world sem...
Stable Diffusion이라 불리는 이 논문은 2022년 발표된 Image Generation 모델이다. 이 모델은 Latent Diffusion 모델의 구조를 갖고 있다. 기존의 Diffusion 기반 모델들과 달리 Stable Diffusion은 고해상도 이미지 합성이 가능하다. 이 글에서 Latent Diffuion의 기본 구조부터 Stab...
Diffusion model은 VAE, GAN과 같은 Generative model(생성 모델)의 일종으로, 기존의 생성 모델에 비해 안정적이고 뛰어난 성능을 보여주고 있다. GAN은 adversarial training 방식으로 인해 이미지 생성 diversity가 떨어질 뿐 아니라 mode collapse 문제 등 불안정한 특성을 가지고 있다. V...
VAE(Variational Auto Encoder)는 GAN과 같이 Generative model(생성 모델)의 한 종류이다. 생성모델의 근본이라고 볼 수 있는 모델이다. VAE의 구조와 목적, VAE의 Loss Function 유도 과정까지 정리해보자. Variational Auto Encoder VAE는 input image를 Enco...
Machine Learning Task는 크게 두 종류로 분류해볼 수 있다. 이미지 출처:https://www.turing.com/kb/generative-models-vs-discriminative-models-for-deep-learning Discriminative model: 데이터 $X$가 주어졌을 때 라벨 $Y$가 나타날 조건부...
Open AI ICML 2021 Paper: https://arxiv.org/abs/2103.00020 Git: https://github.com/OpenAI/CLIP Project: https://openai.com/research/clip Introduction and Motivating Work Raw-text로부터 pr...
2022년 Google Research에서 발표한 Image Generation 논문이다. Google Research; CVPR 2022; Paper: https://arxiv.org/abs/2202.04200 Git: https://github.com/google-research/maskgit Project Page: https:/...