본문 바로가기

SMALL

분류 전체보기

(133)
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(비정형 데이터 분석) 안녕하세요! 데코입니다! 오늘은 빅데이터 분석기사 필기 공부를 하면서 고급 분석기법 파트에 있는 "비정형 데이터 분석" 내용을 정리하려고 합니다! (출처 : 이기적 빅데이터 분석기사 필기 - 2023년 수험서) 1. 비정형 데이터 개념 - 비정형 데이터(Unstructured-Data)는 데이터 세트가 아닌 하나의 데이터가 수집 데이터로 객체화되어 있음 ex) 텍스트 데이터, 이미지, 동영상 (1) 데이터 수집 난이도 (2) 데이터 처리 아키텍처 (3) 데이터의 잠재적 가치 - 정형 데이터
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(딥러닝 분석) 안녕하세요! 데코입니다! 오늘은 빅데이터 분석기사 필기 공부를 하면서 고급 분석기법 파트에 있는 "딥러닝 분석" 내용을 정리하려고 합니다! (출처 : 이기적 빅데이터 분석기사 필기 - 2023년 수험서) 1. 딥러닝 분석의 개념 1) 인공신경망(ANN : Artificial Neural Network) • 인공신경망은 기계학습과 생물학의 신경망(뇌)을 통해 영감을 얻은 통계학적 학습 알고리즘 • 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜 생성된 모델 전반을 의미 •인공신경망의 문제점 - 계산속도의 저하 : 1980년대는 연산이 발달하지 않았지만, 현대에서는 많이 발전함 - 초기치의 의존성 : 최초 시작점의 선택에 따라 수렴, 발산, 진동 등 다양한 ..
[SQL] 조건에 맞는 도서와 저자 리스트 구하기(프로그래머스/MySQL/Level 2) 안녕하세요! 데코입니다! 오늘은 프로그래머스 코딩테스트 연습에 있는 "조건에 맞는 도서와 저자 리스트 구하기" 문제를 포스팅하려고 합니다! 바로 포스팅 시작할게요! :) (출처 : https://school.programmers.co.kr/learn/courses/30/lessons/144854) 1. 문제 : 조건에 맞는 도서와 저자 리스트 구하기(Lv. 2) 2. 문제 설명 다음은 어느 한 서점에서 판매 중인 도서들의 도서 정보(BOOK), 저자 정보(AUTHOR) 테이블입니다. 'BOOK' 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다. [ 테이블 구조('BOOK') ] COLUMN NAME TYPE NULLABLE DESCRIPTION BOOK_ID INTEGER FAL..
[Tips] pymysql 내 포맷팅을 이용한 sql 쿼리 조회 오류(python/ProgrammingError 오류 해결 방법) 안녕하세요! 데코입니다! 오늘은 파이썬에서 pymysql 내 포맷팅(Formatting)을 활용해서 SQL 쿼리를 작성하다 발생한 오류를 설명하고 이를 해결하는 방법을 포스팅하려고 합니다! 1. 오류 발생 배경 및 오류 메시지 제가 pymysql을 이용해 DB를 연동하고 sql쿼리로 데이터를 추출하는데 위와 같은 오류를 만났어요! 아래와 같이 어제와 오늘 날짜를 '%Y-%m-%d H:i:s' 형식으로 생성했습니다! # 데이터 예시 yesterday = ‘2023-01-29 08:44:40’ today = ‘2023-01-30 08:44:40’ 이후 포맷팅을 활용하여 SQL BETWEEN 문에 두 날짜를 넣도록 스트링 쿼리를 작성하였고 쿼리를 조회한 결과 아래와 같은 오류 메시지를 발견했습니다! 2. 오류..
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(베이즈 추론) 안녕하세요! 데코입니다! 오늘은 빅데이터 분석기사 필기 공부를 하면서 고급 분석기법 파트에 있는 "베이즈 추론" 내용을 정리하려고 합니다! (출처 : 이기적 빅데이터 분석기사 필기 - 2023년 수험서) 1. 베이즈 추론 1) 베이즈 추론 정의 - 베이즈 추론(베이지안 추론, Bayesian Inference)은 통계적 추론의 한 방법 - 추론 대상의 사전 확률과 추가적인 정보를 통해 해당 대상의 사후 확률을 추론하는 방법 - 베이즈 추론은 베이즈 확률론을 기반으로 하며, 이는 추론하는 대상을 확률변수로 보아 그 변수의 확률분포를 추정하는 것을 의미 - 많은 현대적 기계 학습 방법은 객관적 베이즈 원리에 따라 만들어짐 - 어떤 가설의 확률을 평가하기 위해서 사전 확률을 먼저 밝히고 새로운 관련 데이터에 ..
[SQL] 조건에 맞는 도서 리스트 구하기(프로그래머스/MySQL/Level 1) 안녕하세요! 데코입니다! 오늘은 프로그래머스 코딩테스트 연습에 있는 "조건에 맞는 도서 리스트 구하기" 문제를 포스팅하려고 합니다! 바로 포스팅 시작할게요! :) (출처 : https://school.programmers.co.kr/learn/courses/30/lessons/144853) 1. 문제 : 조건에 맞는 도서 리스트 구하기(Lv. 1) 2. 문제 설명 다음은 어느 한 서점에서 판매 중인 도서들의 도서 정보(BOOK) 테이블입니다. 'BOOK' 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다. [ 테이블 구조 ] COLUMN NAME TYPE NULLABLE DESCRIPTION BOOK_ID INTEGER FALSE 도서 ID CATEGORY VARCHAR(N) FA..
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(시계열분석) 안녕하세요! 데코입니다! 오늘은 빅데이터 분석기사 필기 공부를 하면서 고급 분석기법 파트에 있는 "시계열분석" 내용을 정리하려고 합니다! (출처 : 이기적 빅데이터 분석기사 필기 - 2023년 수험서) 1. 시계열분석 의미 - 시계열 자료(data)를 분석하고 여러 변수들 간의 인과관계를 분석하는 방법론 - 시계열자료의 구분, 정상성 구분에 따른 분석모형 그리고 회귀 분석에 대해 이해 필요 - 시계열 자료를 이용하여 미래에 대해 예측 또는 제어하는 것이 주 이용 목적 2. 시계열 자료의 개념 1) 시계열 자료 - 시간의 흐름에 따라서 관측되는 데이터를 의미 - 시계열 자료를 이용하여 미래에 대해 예측 또는 제어하는 것이 주 이용 목적 (1) 이산시계열 : 관측값들이 이산적인 형태로 분리되어 존재 (2) ..
[빅데이터분석기사/빅분기/필기 정리] 고급 분석기법(다변량 분석) 안녕하세요! 데코입니다! 오늘은 빅데이터 분석기사 필기 공부를 하면서 고급 분석기법 파트에 있는 "다변량 분석" 내용을 정리하려고 합니다! (출처 : 이기적 빅데이터 분석기사 필기 - 2023년 수험서) 1. 다변량 분석의 의미 - 다변량 분석은 다수의 측정치를 동시에 분석하는 모든 통계적 방법(여러 변수를 동시에) - 다변량 분석 기법은 일변량(단변량) 분석과 이변량분석의 확장형태 ex) 일변량분성 : t-검정, ANOVA(분산분석), 회귀분석 등이 존재 이변량분석 : 상관분석 등이 존재 - 통계적으로 종속변수의 관계성을 고려하여 여러 개의 일변량분석을 동시에 수행함을 의미 2. 다변량 분석 용어 정리 1) 종속 기법(Dependence Methods) : 변수들을 종속변수와 독립변수로 구분 후 독립변..

LIST