-
[Upstage AI Lab 3기] 컴퓨터비전 학습 내용인공지능 AI/패스트캠퍼스 부트캠프 Upstage AI Lab 3기 2024. 8. 21. 17:51
목차
컴퓨터비전 분야 학습했던 내용을 카테고리별로 분류해보았다.
정말 방대한 분야이고, 복습해야할 내용도 많지만, 핵심적인 내용을
나는 크게 세 가지 분야로 나누고 싶다.- 고정된 이미지에서 탐색 분야
- 실시간 이미지에서 탐색 분야
- 이미지 생성 분야
고정된 이미지에서 탐색 분야
- CNN 계열 (Convolutional Neural Networks)
CNN은 이미지의 공간적 계층 구조를 학습하여, 각 계층에서 특징 맵(feature map)을 추출하고, 이를 바탕으로 이미지를 분석한다. 주요 CNN 모델로는 LeNet, AlexNet, VGGNet, ResNet, Inception 등이 있다. CNN은 이미지의 저수준(low-level)부터 고수준(high-level)까지의 특징을 학습하는 데 뛰어난 성능을 보인다. - Transformer 계열
Transformer 모델은 자연어 처리에서 처음 도입되었으나, 최근 Vision Transformer(ViT)와 같은 변형을 통해 이미지 처리에도 적용되고 있다. Transformer 계열 모델은 이미지 패치를 입력으로 받아, 각 패치 간의 관계를 학습하여 이미지를 분석한다. CNN에 비해 더 큰 맥락(context) 정보를 효과적으로 처리할 수 있으며, 특히 대규모 데이터셋에서 강력한 성능을 발휘한다. ViT, Swin Transformer, DeiT 등이 대표적인 모델이다.
실시간 이미지에서 탐색 분야
- YOLO (You Only Look Once)
YOLO의 주요 특징은 전체 이미지를 한 번만 처리하여 객체를 탐지한다. 이로 인해 매우 빠른 속도로 객체 탐지가 가능하며, 실시간 응용에 적합하다. YOLO는 다양한 버전으로 발전해왔으며, 최신 버전에서는 더 높은 정확도와 효율성을 제공한다. 실시간 비디오 분석, 자율주행, 보안 감시 등 다양한 분야에서 사용된다.
이미지 생성 분야
- VAE(Variational Autoencoders)
이미지에서 보여지는 특징들을 구분하고, 특징마다 샘플링하여 새로운 이미지를 생성한다. - GANs(Generative Adversarial Networks)
생성자는 가짜 이미지를 진짜처럼 속이기 위해 점점 더 사실적인 이미지를 생성하려고 하며, 판별자는 생성자가 만든 이미지가 실제 이미지와 얼마나 유사한지 판단한다. 이 과정을 통해 생성자는 매우 사실적인 이미지를 생성할 수 있게 된다. - Diffusion Models
노이즈를 추가하면서, 학습하고, 노이즈를 제거하면서, 이미지를 생성한다.
#패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab #국비지원 #패스트캠퍼스업스테이지에이아이랩 #패스트캠퍼스업스테이지부트캠프
'인공지능 AI > 패스트캠퍼스 부트캠프 Upstage AI Lab 3기' 카테고리의 다른 글
[Upstage AI Lab 3기] Data Centric AI 학습 내용 (1) 2024.10.02 [Upstage AI Lab 3기] Dialogue Summarization | 일상 대화 요약 대회 (7) 2024.09.24 [Upstage AI Lab 3기] Document Type Classification 대회 (0) 2024.08.14 [Upstage AI Lab 3기] Upstage Machine Learning Regression 대회 (0) 2024.07.25 [Upstage AI Lab 3기] 학습 과정 중간 회고 (0) 2024.07.15