안녕하세요! 데코입니다!
오늘은 빅데이터 분석기사 필기 공부를 하면서
고급 분석기법 파트에 있는 "딥러닝 분석" 내용을 정리하려고 합니다!
(출처 : 이기적 빅데이터 분석기사 필기 - 2023년 수험서)
1. 딥러닝 분석의 개념
1) 인공신경망(ANN : Artificial Neural Network)
• 인공신경망은 기계학습과 생물학의 신경망(뇌)을 통해 영감을 얻은 통계학적 학습 알고리즘
• 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜 생성된 모델 전반을 의미
•인공신경망의 문제점
- 계산속도의 저하 : 1980년대는 연산이 발달하지 않았지만, 현대에서는 많이 발전함
- 초기치의 의존성 : 최초 시작점의 선택에 따라 수렴, 발산, 진동 등 다양한 형태로 결과가 바뀌는 문제
- 과적합 문제 : 트레이닝 셋에만 최적화되어 실제 테스트와 예상 결과의 괴리가 발생
2) 딥러닝(Deep Learning)
• 여러 비선형 변환기법의 조합을 통해 높은 수준의 추상화를 시도하는 기계 학습 알고리즘의 집합
• 큰 틀에서 사람의 사고방식을 컴퓨터에게 가르치는 기계학습의 한 분야
• 인공신경망의 단점(계산속도의 저하, 과적합 문제) 등이 극복되면서 재조명되고 부각된 기계학습
3) 딥러닝의 원리
• 기존에는 신경망의 학습 수준을 높이기 위해 하나의 은닉층에 은닉 노드의 수를 늘려서 구성
• 이후 은닉층 자체를 여러 개로 만들어 여러 단계를 거치도록 신경망을 구성하여 정확도 향상을 이룸
- 노드 : 신경계 뉴런, 가중치와 입력값으로 활성함수를 통해 다음 노드로 전달
- 가중치 : 신경계 시냅스, 노드와의 연결계수
- 활성함수 : 임계값을 이용, 노드의 활성화 여부를 결정,
뇌 속 뉴런에서 입력 신호가 일정 크기 이상일 때만 신호를 전달하는 메커니즘을 모방한 함수
ex) 시그모이드(sigmoid), 탄젠트 쌍곡선합수(tanh), 정류선형유닛함수(ReLU) 등 존재
2. 딥러닝 분석 알고리즘
1) 심층 신경망(DNN : Deep Neural Network)
• 심층신경망은 입력층(Input layer)과 출력층(Output layer) 사이에 여러 개의 은닉층(hidden layer)들로 이뤄진 인공 신경망
2) 합성곱 신경망(CNN : Convolutional Neural Network)
• 합성곱 신경망은 최소한의 전처리를 사용하도록 설계된 다계층 펴센트론(multilayer perceptrons)의 일종
• 합성곱 신경망(CNN)은 하나 또는 여러 개의 합성곱 계층과 그 위에 올려진 일반적인 인공 신경망 계층들로 이루어져 있으며, 가중치와 통합 계층(pooling layer)들을 추가로 활용
• CNN은 2차원 구조의 입력 데이터를 충분히 활용 가능(영상, 음성 등)
• CNN은 오차 역전파를 통해 훈련 가능
3) 순환 신경망(RNN : Recurrent Neural Network)
• 순환 신경망은 인공신경망을 구성하는 유닛 사이의 연결이 순환적 구조를 갖는 신경망을 의미
• 순환 신경망은 순방향 신경망(Feed forward Neural Network)과 달리, 임의의 입력을 처리하기 위해 신경망 내부의 메모리를 활용할 수 있음
- 위의 특성에 의해 순환 신경망은 필기체 인식(Handwriting Recognition)과 같은 분야에 활용
• 순환 신경망은 시퀀스 데이터를 모델링하기 위해 등장
- 기존의 뉴럴 네트워크와 다른 점은 '기억'을 갖고 있다는 부분
- '기억'은 지금까지의 입력 데이터를 요약한 정보라고 볼 수 있음
- 새로운 입력이 들어올 때마다 네트워크는 자신의 기억을 조금씩 수정하며 모든 입력을 처리
- 처리가 완료되고 네트워크에 남겨진 기억은 시퀀스 전체를 요약하는 정보
ex) 이전의 내역을(기억)을 바탕으로 새로운 내역을 이해
• 대표적으로 LSTM, 완전 순환망(Fully Recrrent Network) 등 존재
오늘은 빅데이터분석기사 필기시험을 준비하면서
딥러닝 분석에 관한 내용을 정리해보았습니다!
딥러닝은 대표적인 블랙박스 모형으로, 이렇게 짧게 설명하기도 어려운 영역이라고 생각이 듭니다!
필기시험에도 딥러닝에 대하여 자세한 내용을 물어보지는 않을 것 같아서 책에서 너무 심화된 내용은 제거하기도 했어요!
설명이 어려운 부분 혹은 잘 이해가 안 가는 부분
그리고 더 궁금한 내용이 있다면
언제든지 댓글로 남겨주세요!
빠르게 궁금증을 해결해드릴게요!
공감과 댓글은 큰 힘이 됩니다!
읽어주셔서 감사합니다! :)

'Study > 빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(앙상블 분석) (39) | 2023.02.21 |
---|---|
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(비정형 데이터 분석) (14) | 2023.02.14 |
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(베이즈 추론) (28) | 2023.01.30 |
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(시계열분석) (40) | 2023.01.26 |
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(다변량 분석) (25) | 2023.01.24 |