Scientia Conditorium

컴퓨터 비전 배워보자 001 - 개요 본문

인공지능/컴퓨터 비전

컴퓨터 비전 배워보자 001 - 개요

크썸 2023. 1. 26. 01:14

컴퓨터 비전과 컴퓨터 그래픽스 차이

 

컴퓨터 비전 : 시각적 인지 부분을 다루는 분야
인공지능 시스템 세계의 물리적 모델을 이미지와 영상을 이용해 구축한 세계를 인식하고 이해하는 방법을 연구하는 학문

 

시각적 인지(Visual perception)
기본적으로 시야나 시각적 입력으로 패턴을 관찰하는 행위
단순히 주변 환경을 스캔하는 것만으로는 인지라고 말할 수 없으며,
시각적 입력을 통해 주변을 실질적으로 인식하는 시스템을 시각적 인지를 갖췄다고 한다

기존 : 이미지 처리 기법
현재 : 이미지를 통해 어떤 일이 일어났는지 이해하는 것
-> 사람의 시각 시스템을 흉내낼 수 있도록 인공 지능 비전 시스템에서 눈의 역할을 하는 감지 장치
뇌의 기능을 맡아 이미지 특징과 패턴을 학습하는 해석 장치

딥러닝 기법
뉴런으로 구성된 층에 데이터를 통과시켜 데이터를 여러 번 변환하는 방법으로 표현(representation)

이미지 분류(Image Classification)
미리 정의한 유한한 수의 레이블을 이미지에 부여하는 과업
합성곱 신경망(Convolutional Neural Network, CNN)을 활용하여 입력받은 이미지를 여러 조각으로 나눈 다음
각 조각을 대상으로 인식된 사물에 대한 레이블을 부여하는 방법
사물 인식과 위치 파악을 동시에 수행
대표적인 알고리즘은 YOLO(You Only Look Once), SSD(Single-Shot Detector), Faster R-CNN 등

 

CNN

Gradient-based learning applied to document recognition

위 논문을 기점으로 CNN의 발전 계기가 된 LeNet 아키텍쳐에 대해 설명


딥러닝 간단 이해
인간의 뉴런 구조를 소프트웨어적으로 본떠 만든 것
이미지 인식은 시각 신경, 음성인식은 청각 신경처럼 만듦
인공신경망을 여러층 겹치면 깊이가 깊어져서(depth) 딥러닝이라 부름
딥러닝의 결과물인 모델파일은 가중치라는 실수, 정수값의 집합
통계적 머신러닝 + 인공신경망 = 딥러닝

인공신경망은 행렬로 표현함
행렬 연산은 빠르게 할 수 있는 장치가 그래픽카드이고 그래서 딥러닝 학습에 GPU를 쓰는 것
사실 3D 게임 연산이 전부 행렬 연산임

 

머신 러닝(1959)
Field of study that gives computers the ability to learn without being explicitly programmed
- Arthur Samuel

 

지도학습(Supervised Learning)

시행 착오를 통한 학습(Training by trial and error)

Supervied Learning의 3가지
특정 값을 도출해내는 것 - regression
pass 혹은 non pass 등으로 분류하는 것 - binary classification
여러개의 값들도 분류하는 것 - multi-label classification

반드시 학습하는 데이터가 필요함

우리는 분류를 주로 다룰것이기 떄문에
모두를 위한 딥러닝 5-1 - Logistic Classification의 가설 함수 정의부터 보면 되긴 함

'인공지능 > 컴퓨터 비전' 카테고리의 다른 글

컴퓨터 비전을 배워보자 002 - 퍼셉트론  (0) 2023.02.05