Problem Solving with Algorithms

728x90
반응형

전체 강의 보기

[AI 인공지능 머신러닝 딥러닝] - 꽂히는 딥러닝 | 전체 강의 소개

 

꽂히는 딥러닝 | 전체 강의 소개

꽂히는 딥러닝 플레이리스트는 “수학·이론·직관”을 한 번에 잡으면서도, 처음부터 끝까지 흐름 있게 딥러닝을 배우고 싶은 사람에게 잘 맞는 입문·기본 강의 묶음입니다. 혁펜하임 특유의

inner-game.tistory.com

 

 

 

 

 

꽂히는 딥러닝

 

 

7장(7-1~7-4)은 “이미지에 특화된 딥러닝”인 CNN을, 탄생 배경부터 구조·효율성·직관까지 한 번에 잡아 주는 구간입니다. 이 범위를 듣고 나면 CNN 논문에 나오는 컨볼루션 레이어 그림과 용어들을 훨씬 부드럽게 읽을 수 있게 됩니다.

 

 

 

7-1강. 합성곱 신경망(CNN)입니다

7-1강은 먼저 완전연결 신경망이 이미지에 그대로 적용되면 파라미터 수가 기하급수적으로 폭증하고, 트레이닝 데이터에는 과도하게 맞지만 새로운 이미지에는 약한 오버피팅 문제가 생긴다는 이야기에서 시작합니다. 강아지 사진 예시를 통해, 사람은 “털 한 올 한 올”이 아니라 윤곽·귀·눈·코 같은 특징을 보고 판단하는데, 풀리커넥티드 레이어는 이런 공간적 구조를 고려하지 못한 채 모든 픽셀을 다 연결해 버린다는 한계를 짚습니다.

이 문제를 해결하기 위한 구조로 컨볼루션 연산을 도입합니다. 1D·2D 컨볼루션을 간단한 함수 예시와 함께 설명하면서, “필터를 뒤집고 슬라이딩하며 곱해서 더한다”는 직관을 심어 주고, 이미지에서는 작은 필터를 움직이며 윤곽·에지 같은 로컬 특징을 뽑아내는 과정으로 이해하면 된다고 정리합니다.

Sobel 필터 같은 간단한 에지 검출 예시를 통해, 수평·수직 방향의 픽셀 차이가 큰 곳에서 출력이 크게 나오고, 그 결과로 윤곽선이 강조된 이미지가 얻어진다는 것을 시각적으로 보여 줍니다. 마지막에는 CNN이 이런 필터를 사람이 설계하는 대신 학습으로 찾아낸다는 점, 즉 “머신에게 사람보다 더 좋은 필터를 만들어 보라고 시키는 것”이 CNN의 핵심 아이디어라는 메시지를 남깁니다.

 

 

 

7-2강. Stride와 Max Pooling입니다

7-2강은 CNN의 효율성을 책임지는 두 요소, 스트라이드(stride)와 맥스 풀링(max pooling)에 집중합니다. 먼저 스트라이드는 필터를 한 칸씩, 혹은 두 칸씩 “듬성듬성” 움직이는 개념으로, 사람도 그림을 볼 때 픽셀 하나하나를 확대해서 보지 않고 한 덩어리로 본다는 비유로 설명합니다.

 

 

필터가 커버하는 로컬 영역 안에만 정보가 모여 있기 때문에, 굳이 한 픽셀씩 세밀하게 움직이지 않고 일정 간격으로 건너뛰어도 중요한 특징은 충분히 잡힌다는 점을 강조합니다. 이렇게 하면 feature map의 해상도가 줄어들고 계산량이 크게 감소해, 깊은 CNN을 더 효율적으로 쌓을 수 있게 됩니다.

 

 

맥스 풀링은 필터를 통과한 feature map에서 일정 영역(예: 2×2) 안의 값 중 가장 큰 값만 골라 가져오는 연산으로 소개됩니다. 이 과정은 일종의 다운샘플링 역할을 하며, 이미지 크기를 단계적으로 줄이면서도 “가장 두드러진 특징”만 남겨 공간적 위치 정보에 약간의 불변성을 부여해 줍니다. 결과적으로 스트라이드와 맥스 풀링은 CNN이 이미지 크기와 상관없이 점점 더 추상적인 특징을 뽑아 나갈 수 있도록 돕는 효율화 장치로 정리됩니다.

 

 

 

7-3강. 이제 CNN 논문도 읽을 수 있게 됩니다입니다

7-3강은 CNN 구조를 “신경 다발을 효율적으로 끊어낸 것”이라는 한 문장으로 요약하면서, 컨볼루션 레이어를 완전연결 신경망 관점에서 다시 해석해 줍니다. 원래라면 모든 픽셀과 뉴런이 다 연결돼야 하는 부분을, 작은 필터(커널)가 지역적으로만 연결되도록 제한함으로써 파라미터 수를 크게 줄이고, 동시에 공간 구조를 반영하는 네트워크가 된다는 점을 강조합니다.[^2]

RGB 이미지처럼 여러 채널을 가진 입력에서는 필터도 동일한 채널 수를 가지는 작은 큐브(예: 3×3×3) 형태가 되고, 이 큐브를 전체 이미지 위로 슬라이딩하며 곱하고 더해 하나의 feature map을 만든다는 과정을 그림과 함께 설명합니다. 필터를 여러 개 쓰면 각 필터마다 다른 패턴(수직·수평 에지, 텍스처 등)에 민감한 feature map이 생기고, 이들이 쌓이면서 깊이가 있는 “특징 공간”을 이룬다는 점도 보여 줍니다.[^2]

후반부에는 실제 CNN 논문에 나오는 “입력 크기, 필터 크기, stride, 필터 개수, 출력 feature map 크기” 표기들을 하나씩 해석해 주며, 왜 특정 레이어에서 feature map의 폭·높이가 줄고 깊이가 늘어나는지 식과 예제로 설명합니다. 덕분에 독자는 논문 속 컨볼루션 블록을 “큐브를 곱해서 더한 뒤, 여러 필터를 겹쳐 만든 특징 맵들”이라는 이미지로 자연스럽게 이해할 수 있습니다.

 

 

 

 

 

7-4강. 컨볼루션 레이어가 왜 좋은 걸까요?입니다

7-4강은 앞선 내용을 한 번 정리하면서, 컨볼루션 레이어의 장점을 세 가지 관점에서 요약해 줍니다. 첫째, 파라미터 공유 덕분에 동일한 필터가 이미지 전체에 적용되어, 같은 패턴(예: 눈 모양)이 어디에 있든 잘 감지할 수 있고 파라미터 수도 크게 줄어듭니다. 둘째, 지역 연결(local connectivity) 구조 때문에 인접한 픽셀 간의 상관관계를 잘 포착할 수 있어, 이미지의 공간적 구조를 그대로 활용할 수 있습니다.

 

 

셋째, 여러 층의 컨볼루션과 풀링을 거치면서 “에지 → 모서리 → 패턴 → 높은 수준의 개체”로 이어지는 계층적 특징 추출이 가능해진다는 점을 강조합니다. 즉, 앞단 레이어들은 간단한 로컬 패턴을, 뒷단 레이어들은 그 조합으로 복잡한 개체 개념을 표현하게 되어, 최종적으로는 fully-connected + softmax 층에서 강아지·고양이·트럭 같은 클래스를 구분할 수 있게 된다는 흐름입니다.

 

 

이 네 편(7-1~7-4)을 통해 독자는 CNN을 단순히 “이미지에 좋은 모델”로 외우는 것이 아니라, 컨볼루션·스트라이드·풀링·필터 뎁스·파라미터 공유의 구조적 이유로 이해하게 되며, 이후 ResNet·VGG 같은 CNN 기반 논문을 읽을 때도 훨씬 든든한 기반을 갖게 됩니다.

 

 

 

다음 글

[AI 인공지능 머신러닝 딥러닝] - 꽂히는 딥러닝 | 8강 보편 근사 정리(Universal Approximation Theorem)

 

꽂히는 딥러닝 | 8강 보편 근사 정리(Universal Approximation Theorem)

8강은 “왜 신경망이 이렇게까지 잘 맞는가?”에 대한 이론적 답을 주는 보편 근사 정리(Universal Approximation Theorem)를, 깍두기 비유로 직관적으로 풀어낸 영상입니다. 한 줄로 말하면 “충분히 많

inner-game.tistory.com

 

 

이 블로그의 관련 글

[AI 인공지능 머신러닝 딥러닝] - 이지 딥러닝 - 혁펜하임 | Easy! 딥러닝 - 무료 강의 및 책 소개

 

이지 딥러닝 - 혁펜하임 | Easy! 딥러닝 - 무료 강의 및 책 소개

한국어로 딥러닝 공부해봤다는 사람중에 안들어 본 사람이 없을것 같은 이지 딥러닝 시리즈 입니다. 이 강의는 유투브로 제공되며 책도 있습니다. 이지 딥러닝 유투브 강의이지 딥러닝 유투브

inner-game.tistory.com

 

 

 

[AI 인공지능 머신러닝 딥러닝/Python | PyTorch] - 인스톨! 파이토치 강의 소개 | 전체 강의 소개 및 0강 오레인테이션

 

인스톨! 파이토치 강의 소개 | 전체 강의 소개 및 0강 오레인테이션

혁펜하임 PyTorch 강의 오리엔테이션 요약혁펜하임 채널의 '[PyTorch] 0강. 오리엔테이션' 영상은 채널 5주년 기념으로 '인스톨! 파이토치' 강의를 소개하는 내용입니다. 강의자는 최근 출간한 '이지

inner-game.tistory.com

 

 

 

[AI 인공지능 머신러닝 딥러닝] - 인공지능 딥러닝 기초 완전정복: 유튜브로 배우는 신경망·딥러닝·실습코딩 가이드

 

인공지능 딥러닝 기초 완전정복: 유튜브로 배우는 신경망·딥러닝·실습코딩 가이드

안녕하세요! 오늘은 제가 최근에 시청한 유튜브 플레이리스트 “인공신경망기초-신박Ai”를 바탕으로, 인공지능(Artificial Intelligence; AI) 기초에 대해 공부한 내용을 정리하여 티스토리 블로그 포

inner-game.tistory.com

 

728x90
반응형
반응형

공유하기

facebook twitter kakaoTalk kakaostory naver band
250x250