습관을 애정한다

2. Image Classification

by 습관중독

CNN으로 가는 기초이론으로 이미지 분류를 학습.
주요내용은 2가지이며, 둘다 과제1로 부여되는 과제들임.

A. 문제제기: 고양이 이미지 분류 샘플과제
B. K-NN 알고리즘
C. Linear Classification
ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ

A. 이미지 분류 샘플과제로써, CIFAR-10 데이터셋 중 고양이 레이블 인식하기
1) 난관
i) Background Clutter(배경의 방해)
ii) Illumation(빛, 조명의 방해)
iii) Occlusion(고양이 형체의 일부만 보이는 경우)
iv) Deformation(고양이 자세의 변화)
v) Intraclass Variation(고양이 종과 색깔의 다양성)

2) 해결방법
i) 1강에서 언급된 Edges를 활용한 방법 등이 있으나 한계 많음
ii) 머신러닝
a. 다양한 데이터셋 최대한 모은다
b. 이미지 학습
c. 지도학습

B. K-NN 분류
1) 개념: K에서 최근접 갯수를 조절하여 가장 근접한 클래스에 접근하는 방식으로, 
기존의 데이터를 활용하여 가장 비슷한 값을 예측하는 알고리즘
2) 클래스 결정방법(하이퍼파라미터)
i) K: 이웃값. KNN 알고리즘은 주변 값들을 이용하기 때문에 측정하고자 하는 위치와 얼마나 많은 주변 값(k)을 참고할지에 따라서 결괏값이 달라진다.
ii) L1/L2 거리로 결정
- L1: Manhattan distance (두 점 사리를 바둑판처럼 직각 이동)
- L1: Euclidean distance (두 점 사이의 직선거리)
3) CIFAR 10 데이터셋 활용: 50000개의 train 데이터 / 10000개의 test 데이터
4) 데이터셋 활용방법
i) 데이터셋 자체 그대로 활용: 절대하지 말 것
ii) train - test: train 데이터가 test 데이터에 작동할지 확신 불가
iii) train - validation - test: 이게 많이 쓰이는 방법
5) K-fold 검증: K의 값을 변환시켜가면서 가장 정확한 prediction 보이는 값 그래프. 
K=7일 때가 가장 정확
6) KNN의 실전 적용능력: 실전에서는 이미지 분류엔 잘 작동하지 않는다.
=> L1/L2가 같다고 해서 두 이미지가 같다고 볼 수 없기 때문.(Boxed = Shifted = Tinted)

C. Linear Classification
f(x, W) = Wx + b
많이 학습시키면 W와 b에 해당 클래시 이미지 분류에 가장 적합한 가중치, 바이어스 값이 저장될 것이다라는 개념

블로그의 정보

습관을 애정한다

습관중독

활동하기