Day 32. Image classification & Semantic segmentation

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

hojeomi blog

Day 32. Image classification & Semantic segmentation 본문

AI/Course

Day 32. Image classification & Semantic segmentation

호저미 2021. 3. 10. 00:18

2021 03 09

image classification
(영상 인식에 대해)

- problem with deeper layers에 대해
0 Alexnet -> VGGNet으로 갈수록 깊어지는데 이를 통해 더 깊을 수록 더 좋은 성능인 것이 밝혀짐
1 하지만 더 깊어질수록 Gradient vanishing/exploding, computationally complex, degradation problem(과거에는 오버피팅 문제였는데 층이 깊어질수록 이 문제가 생김)
2 GoogLeNet: 여러 convolutions을 수평적으로 쌓음 -> 계산복잡도가 높아지기 때문에 1x1 convolutions 사용
3 ResNet: 많이 쌓을수록 좋은 것을 발견함 -> 기존에는 층을 많이 쌓을 수 없었던 문제가 있었음 -> 이전에는 층이 깊어질수록 오버피팅 될 것이라고 생각함(iteration이 커질수록 트레이닝 에러가 작아질 것) -> ResNet 저자들 왈: 네트워크 depth를 더 쌓기 어려운 문제는 오버피팅이 아니다, 최적화가 잘 안된 문제다 -> 해결책: Shortcut connection
- 성능이 좋은 이유: 2^n만큼 인풋과 아웃풋을 연결하는 경우의 수가 있음 -> 중간의 오류를 패스하는 모든 경로들

semantic segmentation에 대해
- semantic segmentation은 사진이 주어졌을 때 사진 내 각 픽셀을 카테고리로 분류하는 task(image classification은 사진이 주어졌을 때 사진 전체를 카테고리로 분류)
0 semantic segmentation이란?
이미지 분류를 영상 단위로 하는 것이 아닌 픽셀 단위로, 하나의 픽셀이 사람에 속하는지, 오토바이에 속하는지 등 구분 -> 영상 속에 있는 물체의 마스크를 생성하게 되는데 같은 클래스이지만 서로 다른 물체를 구분하지는 않음 -> 사람이 여러명이면 모두 같은 색으로 구분
1 어디에 사용하는가?
medical images, autonomous driving

- semantic segmentation architectures
0 Fully Convolution Network(FCN)
입력과 출력까지 미분가능한 뉴런네트워크의 형태로 구성되서, 입출력 쌍만 있으면 학습할 수 있음
1 Fully connected vs. Fully convolutional
Fully connected(FC layer): 공간정보를 고려하지 않고 fix dimensional 벡터가 주어지면 또 다른 fix dimensional 벡터가 생성됨
Fully convolutional: 1x1 convolution -> activation map이 입출력
2 이전 레이어에서 activation map이 출력이 되면 AlexNet에서는 flattening을 통해 긴 벡터 하나로 펴줌 -> 영상의 공간정보를 고려하지 않고 하나로 합쳐짐 -> FCN에서는 각 채널에 대해(각 위치에 대해) 벡터 하나씩
3 upsampling?
- segmentaion을 이용하면 출력값이 적음 -> 입력값은 크기 때문에 저해상도 문제가 생김 -> 이를 해결하기 위해 upsampling layer 사용
- 작은 activation map을 원래 입력 사이즈에 맞춰주기 위해 upsampling layer사용 -> 일단은 작게 만들어서 receptive field를 최대한 키워둔 후 upsampling???
4 upsampling & convolution 같이 사용하는 방법: 중첩 문제 최소화 -> 하나의 레이어로 한번에 처리

'AI > Course' 카테고리의 다른 글

Day 37. 모델 경량화 (0)	2021.03.16
Day 33. (0)	2021.03.11
Day 31. Computer Vision 기초 (0)	2021.03.09
Day 27. 서비스 향 AI 모델 개발 & AI 시대의 커리어 빌딩 (0)	2021.03.02
Day 24. 정점 표현 & 추천시스템(심화) (0)	2021.02.25

'AI/Course' Related Articles

Comments

hojeomi blog 호저미 님의 블로그입니다.

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

hojeomi blog

hojeomi blog

Day 32. Image classification & Semantic segmentation 본문

Day 32. Image classification & Semantic segmentation

'AI > Course' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역