본문 바로가기

Study/빅데이터분석기사

[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(딥러닝 분석)

SMALL

안녕하세요! 데코입니다!

오늘은 빅데이터 분석기사 필기 공부를 하면서

고급 분석기법 파트에 있는 "딥러닝 분석" 내용을 정리하려고 합니다!

 

(출처 : 이기적 빅데이터 분석기사 필기 - 2023년 수험서)


1. 딥러닝 분석의 개념 

1) 인공신경망(ANN : Artificial Neural Network)

 • 인공신경망은 기계학습과 생물학의 신경망(뇌)을 통해 영감을 얻은 통계학적 학습 알고리즘

 

 • 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜 생성된 모델 전반을 의미

 

 •인공신경망의 문제점
   - 계산속도의 저하 : 1980년대는 연산이 발달하지 않았지만, 현대에서는 많이 발전함


   - 초기치의 의존성 : 최초 시작점의 선택에 따라 수렴, 발산, 진동 등 다양한 형태로 결과가 바뀌는 문제


   - 과적합 문제 : 트레이닝 셋에만 최적화되어 실제 테스트와 예상 결과의 괴리가 발생

2) 딥러닝(Deep Learning)

 • 여러 비선형 변환기법의 조합을 통해 높은 수준의 추상화를 시도하는 기계 학습 알고리즘의 집합


 • 큰 틀에서 사람의 사고방식을 컴퓨터에게 가르치는 기계학습의 한 분야


 • 인공신경망의 단점(계산속도의 저하, 과적합 문제) 등이 극복되면서 재조명되고 부각된 기계학습

 

3) 딥러닝의 원리

 • 기존에는 신경망의 학습 수준을 높이기 위해 하나의 은닉층에 은닉 노드의 수를 늘려서 구성

기존 일반 신경망(은닉층 1개)

 • 이후 은닉층 자체를 여러 개로 만들어 여러 단계를 거치도록 신경망을 구성하여 정확도 향상을 이룸

딥러닝(은닉층 2개 이상)

   - 노드 : 신경계 뉴런, 가중치와 입력값으로 활성함수를 통해 다음 노드로 전달


   - 가중치 : 신경계 시냅스, 노드와의 연결계수


   - 활성함수 : 임계값을 이용, 노드의 활성화 여부를 결정,

                      뇌 속 뉴런에서 입력 신호가 일정 크기 이상일 때만 신호를 전달하는 메커니즘을 모방한 함수
                      ex) 시그모이드(sigmoid), 탄젠트 쌍곡선합수(tanh), 정류선형유닛함수(ReLU) 등 존재

 

 

2. 딥러닝 분석 알고리즘

1) 심층 신경망(DNN : Deep Neural Network)

 • 심층신경망은 입력층(Input layer)과 출력층(Output layer) 사이에 여러 개의 은닉층(hidden layer)들로 이뤄진 인공 신경망

 

2) 합성곱 신경망(CNN : Convolutional Neural Network)

 • 합성곱 신경망은 최소한의 전처리를 사용하도록 설계된 다계층 펴센트론(multilayer perceptrons)의 일종

 

 • 합성곱 신경망(CNN)은 하나 또는 여러 개의 합성곱 계층과 그 위에 올려진 일반적인 인공 신경망 계층들로 이루어져 있으며, 가중치와 통합 계층(pooling layer)들을 추가로 활용

 

 • CNN은 2차원 구조의 입력 데이터를 충분히 활용 가능(영상, 음성 등)

 

 • CNN은 오차 역전파를 통해 훈련 가능

3) 순환 신경망(RNN : Recurrent Neural Network)

 • 순환 신경망은 인공신경망을 구성하는 유닛 사이의 연결이 순환적 구조를 갖는 신경망을 의미


 • 순환 신경망은 순방향 신경망(Feed forward Neural Network)과 달리, 임의의 입력을 처리하기 위해 신경망 내부의 메모리를 활용할 수 있음

   - 위의 특성에 의해 순환 신경망은 필기체 인식(Handwriting Recognition)과 같은 분야에 활용


 • 순환 신경망은 시퀀스 데이터를 모델링하기 위해 등장

   - 기존의 뉴럴 네트워크와 다른 점은 '기억'을 갖고 있다는 부분

 

   - '기억'은 지금까지의 입력 데이터를 요약한 정보라고 볼 수 있음


   - 새로운 입력이 들어올 때마다 네트워크는 자신의 기억을 조금씩 수정하며 모든 입력을 처리

 

   - 처리가 완료되고 네트워크에 남겨진 기억은 시퀀스 전체를 요약하는 정보

     ex) 이전의 내역을(기억)을 바탕으로 새로운 내역을 이해

 

 • 대표적으로 LSTM, 완전 순환망(Fully Recrrent Network) 등 존재

 


오늘은 빅데이터분석기사 필기시험을 준비하면서

딥러닝 분석에 관한 내용을 정리해보았습니다!

 

딥러닝은 대표적인 블랙박스 모형으로, 이렇게 짧게 설명하기도 어려운 영역이라고 생각이 듭니다!

 

필기시험에도 딥러닝에 대하여 자세한 내용을 물어보지는 않을 것 같아서 책에서 너무 심화된 내용은 제거하기도 했어요!

 

설명이 어려운 부분 혹은 잘 이해가 안 가는 부분

그리고 더 궁금한 내용이 있다면

 

언제든지 댓글로 남겨주세요!

빠르게 궁금증을 해결해드릴게요!

 

공감과 댓글은 큰 힘이 됩니다!

읽어주셔서 감사합니다! :)

LIST