[컴퓨터 비전 파이프라인]
1. 데이터 입력(이미지, 영상 등)
2. 전처리(이미지 표준화, 색변환 등)
3. 특징 추출(이미지 구별 정보)
4. 분류기(추출된 특징 학습 후 대상 예측 및 분류)
* 특징 feature : 사물을 식별할 수 있는 정보( 모양, 색 등)
* 분류기는 모든 특징을 순서대로 살펴보고 이미지 속 대상이 속할 가능성이 가장 높은 크래스를 결정
* 정확도 개선?
- 더 많은 이미지 입력
- 노이즈 많이 제거
- 더 나은 특징 추출
- 모델의 하이퍼파라미터 튜닝
[이미지]
- 2차원 영역을 정의하는 x, y 변수의 함수 형태
- pixel :이미지의 기본 구성 요소
- intensity : 이미지 내 각 좌표의 빛의 강도
- grayscale 이미지에서 검정? 0, 흰색? 255
- 픽셀은 0~255 사이 갑승로 빛의 강도 intensity of light F(x,y)를 의미
- RGB 색상 체계 img : F(x, y)=[R(x,y), G(x,y), B(x,y)]
* 이미지 변환 함수
- 어둡게 : G(x, y) = 0.5*F(x,y)
- 밝게 : G(x, y) =2*F(x, y)
- 위치 150픽셀 아래로 : G(x, y) = F(x, y+150)
- 회색 -> 흰/검으로 변환 : G(x, y) = { 0 if F(x,y) < 130, 255 otherwise }
* 24X24 크기 이미지
- 24픽셀 X 24픽셀로 총 576픽셀로 구성된 이미지
* 컬러 이미지
- 컬러 이미지의 경우 3가지 색의 강도를 나타냄
- R, G, B 3개의 행렬로 구성됨
- 700X700 이미지의 경우 (700,700,3)
[이미지 전처리]
1. 컬러 -> 회색조로 변환
- 계산 복잡도를 낮춤
- 응용 분야에서 색이 중요한 요소가 아니라면 변환
- 사물의 모양이나 특징은 대부분 밝기(빛의 강도)만으로도 알 수 있음
2. 이미지 표준화
- 입력 이미지 크기 맞추기
3. 데이터 증강
- 배율 조정, affine, 회전
[특징 추출 feature extraction]
- 컴퓨터 비전의 핵심 요소
- 딥러닝이 나오고 나서 대상을 명시적으로 정의하지 않아도 됨
- 특징은 속성 property와 특성 characteristic을 말함
- 측정 가능한 데이터
- 중요 성질을 반복성 repeatability 임
* 좋은 특징이란?
- 특징에 의해 머신러닝의 성능이 결정됨
- 다른 것과 구별됨
- 추적과 비교가 쉬움
- 배율, 밝기, 각도가 달라도 일관적임
- 노이즈가 많은 이미지, 대사으이 일부만 찍힌 이미지에서도 관찰 가능
* 직접 추출한 특징?
- 사람이 선택한 특징을 SVM, AdaBoost와 같은 분류기에 입력해 예측 결과를 얻을 수 있음
- 사람이 선택한 특징
1) 기울기 방향성 히스토그램 HOG
2) Haar Cascades
3) scale SIFT
4) speeded-up robust feature, SURF
* 딥러닝에서의 특징?
- 신경망이 자동으로 특징을 추출
- 뉴런 간의 연결에 부여된 가중치를 통해 출력에 미치는 특징의 중요도 학습
- 신경망은 특징 추출과 분류기의 기능을 합친 것
- 신경망의 층수가 깊을수록 데이터셋에서 더 많은 특징을 학습할 수 있음