비전, 영상 처리에서 나오는 용어
Detecion: 말그대로 탐지하는 것, 하나의 영상에서 대상을 찾음
Recognition: 대상이 무엇인지 식별하는 것
얼굴 인식을 할 때 얼굴을 찾고 (detecion) 찾은 얼굴이 누구인지 식별(Recognition)한다.
Tracking: 특정 대상의 위치 변화를 추적하는 것으로 history 정보 필요
detection에서는 현재의 입력값으로 대상을 찾을 수 있어야하기에 객체모델 , 검출 알고리즘이 영상 속 다양한 변화를 커버할 수 있어야한다.
이번 우리 팀 프로젝트( 파리 올림픽 영상 속 인물 인식 후 선수 정보 보여주기)는 컴퓨터 비전 부분을 선택하게 되었고 그 중 Detection 방법을 사용할 것이다.
Detection이란 ?
사진이나 비디오 프레임과 같은 디지털 이미지에서 특정 클래스를 감지하는데 사용되는 computer vision 작업이다.
어디에 어떤 객체가 있음을 알려주는 것
1. R-CNN
: Regions with Convolutional Neuron Networks features
설정한 region을 cnn의 입력값(feature)로 활용해 objection detection 수행하는 신경망
딥러닝을 기반한 Detection 모델
최초로 딥러닝을 적용한 모델이지만 성능이 안좋음
2. YOLO
:You Only Look Once
기존 R-CNN 모델 보다 처리가 빨라서 영상을 스트리밍하는 동시에 객체를 부드럽게 구분할 수 있는 정도
R-CNN과 달리 최대한 정확성을 높이는 것보다 실시간으로 객체를 탐지하는 것이 목표였던 모델
단 하나의 인공 신경망으로 처리해서 다른 모델에 비해서 간단했음 -> 실시간 객체탐지 가능했던 이유