본문 바로가기

STUDY/Computer Vision

꼭 알아야 할 컴퓨터 비전 기초 개념

728x90

[컴퓨터 비전 파이프라인]

1. 데이터 입력(이미지, 영상 등)

2. 전처리(이미지 표준화, 색변환 등)

3. 특징 추출(이미지 구별 정보)

4. 분류기(추출된 특징 학습 후 대상 예측 및 분류)

 

* 특징 feature : 사물을 식별할 수 있는 정보( 모양, 색 등)

* 분류기는 모든 특징을 순서대로 살펴보고 이미지 속 대상이 속할 가능성이 가장 높은 크래스를 결정

* 정확도 개선? 

   - 더 많은 이미지 입력

   - 노이즈 많이 제거

   - 더 나은 특징 추출

   - 모델의 하이퍼파라미터 튜닝

 

[이미지]

- 2차원 영역을 정의하는 x, y 변수의 함수 형태

- pixel :이미지의 기본 구성 요소

- intensity : 이미지 내 각 좌표의 빛의 강도

- grayscale 이미지에서 검정? 0, 흰색? 255

- 픽셀은 0~255 사이 갑승로 빛의 강도 intensity of light   F(x,y)를 의미

- RGB 색상 체계 img : F(x, y)=[R(x,y), G(x,y), B(x,y)]

 

* 이미지 변환 함수 

   - 어둡게 : G(x, y) = 0.5*F(x,y)

   - 밝게 : G(x, y) =2*F(x, y)

   - 위치 150픽셀 아래로 : G(x, y) = F(x, y+150)

   - 회색 -> 흰/검으로 변환 : G(x, y) = { 0 if F(x,y) < 130, 255 otherwise }

 

* 24X24  크기 이미지

  - 24픽셀 X 24픽셀로 총 576픽셀로 구성된 이미지

 

* 컬러 이미지

   - 컬러 이미지의 경우 3가지 색의 강도를 나타냄

   - R, G, B 3개의 행렬로 구성됨

   - 700X700 이미지의 경우 (700,700,3)

 

[이미지 전처리]

1. 컬러 -> 회색조로 변환

- 계산 복잡도를 낮춤

- 응용 분야에서 색이 중요한 요소가 아니라면 변환

- 사물의 모양이나 특징은 대부분 밝기(빛의 강도)만으로도 알 수 있음

 

2. 이미지 표준화

- 입력 이미지 크기 맞추기

 

3. 데이터 증강

- 배율 조정, affine, 회전

 

[특징 추출 feature extraction]

- 컴퓨터 비전의 핵심 요소

- 딥러닝이 나오고 나서 대상을 명시적으로 정의하지 않아도 됨

- 특징은 속성 property와 특성 characteristic을 말함

- 측정 가능한 데이터

- 중요 성질을 반복성 repeatability 임

 

* 좋은 특징이란?

   - 특징에 의해 머신러닝의 성능이 결정됨

   - 다른 것과 구별됨

   - 추적과 비교가 쉬움

   - 배율, 밝기, 각도가 달라도 일관적임

   - 노이즈가 많은 이미지, 대사으이 일부만 찍힌 이미지에서도 관찰 가능

 

* 직접 추출한 특징?

   - 사람이 선택한 특징을 SVM, AdaBoost와 같은 분류기에 입력해 예측 결과를 얻을 수 있음

   - 사람이 선택한 특징

     1) 기울기 방향성 히스토그램 HOG

     2) Haar Cascades

     3) scale SIFT

     4) speeded-up robust feature, SURF

 

* 딥러닝에서의 특징?

   - 신경망이 자동으로 특징을 추출

   - 뉴런 간의 연결에 부여된 가중치를 통해 출력에 미치는 특징의 중요도 학습

   - 신경망은 특징 추출과 분류기의 기능을 합친 것

   - 신경망의 층수가 깊을수록 데이터셋에서 더 많은 특징을 학습할 수 있음

 

 

 

 

 

 

 

 

 

 

 

728x90