본문 바로가기

AI Study/computer vision

(3)
[Computer vision] YOLO (You only look once) 모델 1. YOLO란? YOLO란 you only look once의 약자로, object detection 분야에서 많이 알려진 모델이다. 2015년에 Joseph Redmon(조셉 레드몬)이 워싱턴 대학에서 2015년도에 yolo v1 버전을 발표했으며 그 당시에 object detection은 대부분 Faster R-CNN이 가장 좋은 성능을 내고있었다. 그가 공개한 YOLO에서 가장 주목을 받았던 점은 객체 감지를 실시간으로 한다는 것이다. yolo는 처음으로 one-stage-detection 방법을 고안하여 실시간으로 객체 감지를 가능하게 한 모델이다. 기존 Object Detection은 Classification 문제를 2단계로 나눠서 검출하여 정확도는 높지만 여러번 호출함으로써 속도가 느려지는..
[ComputerVision] Linear Regression, Logistic Regression 기본적으로 알아야할 것: supervised Learning: 정답이 있다. upsupervised Learing: 정답이 없다. 1. Regression regression은 continous하고 depth estimation 즉 영상의 깊이 정보를 추정한다. classs는 discrete하고 semantic segmentation 즉 영상을 의미적으로 다른 부분으로 분할한다. ex. 1-1) regression의 목표 예측: 새로운 input에 대해 ouput을 예측한다. 분석: input과 output의 관계를 설명한다. 1-2) regression의 데이터 셋 input은 차원이 있는 벡터이고 (D) output은 수이다. Yn은 n-th output이고, Xn은 벡터 D이다. (여기서 n은 데이..
[ComputerVision] 공간 도메인과 주파수 도메인 기초 1. 디지털 이미지의 기초 1-1) 샘플링 & 양자화 샘플링: 수많은 데이터 가운데 유한한 개수의 데이터를 뽑아내는 것, 카메라 화소가 높다는 것은 어떤 장면에 대한 빛의 패턴 신호를 높은 주파수로 샘플링하는 것을 의미한다. 양자화: 아날로그 형태로 되어있는 신호나 정보를 디지털화, 아날로그에서는 0과 1 사이에는 무수히 많은 숫자가 존재하는데, 현실적으로 다 표현할 수 없기 때문에 근접한 값으로 설정 이미지 생성: 광원이 어떤 에너지 소스가 빛을 내고 물체에서 반사된다. imaging system을 통하여 아날로그 신호들이 sampling과 quantization을 통하여 디지털정보로 저장된다. 결론) 화소가 높아질수록 좋아진다 = 샘플링 간격이 좁아지고, qauntization 간격이 좁아진다. 1-..