안녕하세요! 데코입니다!
오늘은 프로그래머스 코딩테스트 연습에 있는 "데이터 분석" 문제를 포스팅하려고 합니다!
바로 포스팅 시작할게요! :)
(출처 : https://school.programmers.co.kr/learn/courses/30/lessons/250121)
1. 문제 : 데이터 분석(PCCE 기출문제)
2. 문제 설명
AI 엔지니어인 현식이는 데이터를 분석하는 작업을 진행하고 있습니다.
데이터는 ["코드 번호(code)", "제조일(date)", "최대 수량(maximum)", "현재 수량(remain)"]으로
구성되어 있습니다.
현식이는 이 데이터들 중 조건을 만족하는 데이터만 뽑아서 정렬하려 합니다.
예를 들어 다음과 같이 데이터가 주어진다면
data = [[1, 20300104, 100, 80], [2, 20300804, 847, 37], [3, 20300401, 10, 8]]
이 데이터는 다음 표처럼 나타낼 수 있습니다.
code | date | maximum | remain |
1 | 20300104 | 100 | 80 |
2 | 20300804 | 847 | 37 |
3 | 20300401 | 10 | 8 |
주어진 데이터 중 "제조일이 20300501 이전인 물건들을 현재 수량이 적은 순서"로 정렬해야 한다면
조건에 맞게 가공된 데이터는 다음과 같습니다.
data = [[3,20300401,10,8],[1,20300104,100,80]]
정렬한 데이터들이 담긴 이차원 정수 리스트 data와
어떤 정보를 기준으로 데이터를 뽑아낼지를 의미하는 문자열 ext,
뽑아낼 정보의 기준값을 나타내는 정수 val_ext,
정보를 정렬할 기준이 되는 문자열 sort_by가 주어집니다.
data에서 ext 값이 val_ext보다 작은 데이터만 뽑은 후,
sort_by에 해당하는 값을 기준으로 오름차순으로 정렬하여 return 하도록 solution 함수를 완성해 주세요.
단, 조건을 만족하는 데이터는 항상 한 개 이상 존재합니다.
[ 제한사항 ]
● 1 ≤ data의 길이 ≤ 500
▶ data[i]의 원소는 [코드 번호(code), 제조일(date), 최대 수량(maximum), 현재 수량(remain)] 형태입니다.
▶ 1 ≤ 코드 번호≤ 100,000
▶ 20000101 ≤ 제조일≤ 29991231
▶ data[i][1]은 yyyymmdd 형태의 값을 가지며, 올바른 날짜만 주어집니다. (yyyy : 연도, mm : 월, dd : 일)
▶ 1 ≤ 최대 수량≤ 10,000
▶ 1 ≤ 현재 수량≤ 최대 수량
● ext와 sort_by의 값은 다음 중 한 가지를 가집니다.
▶ "code", "date", "maximum", "remain"
▶ 순서대로 코드 번호, 제조일, 최대 수량, 현재 수량을 의미합니다.
● val_ext는 ext에 따라 올바른 범위의 숫자로 주어집니다.
● 정렬 기준에 해당하는 값이 서로 같은 경우는 없습니다.
[ 입출력 예 ]
date | ext | val_ext | sort_by | result |
[[1, 20300104, 100, 80], [2, 20300804, 847, 37], [3, 20300401, 10, 8]] | "date" | 20300501 | "remain" | [[3,20300401,10,8],[1,20300104,100,80]] |
solution 함수는 가장 많은 방문객 수와 두 번째로 많은 방문객 수의 차이를 return 합니다.
[ 유의 사항 ]
● cpp를 응시하는 경우 리스트는 배열과 동일한 의미이니 풀이에 참고해주세요.
ex) 번호가 담긴 정수 리스트 numbers가 주어집니다.
=> 번호가 담긴 정수 배열 numbers가 주어집니다.
● java를 응시하는 경우 리스트는 배열, 함수는 메소드와 동일한 의미이니 풀이에 참고해주세요.
ex) solution 함수가 올바르게 작동하도록 한 줄을 수정해 주세요.
=> solution 메소드가 올바르게 작동하도록 한 줄을 수정해 주세요.
3. 문제 풀이
def solution(data, ext, val_ext, sort_by):
answer = []
# 컬럼 정보
col_info = {
"code" : 0,
"date" : 1,
"maximum" : 2,
"remain" : 3
}
# ext 값이 val_ext보다 작은 데이터만 추출 및 적재
for i in data:
if i[col_info[ext]] < val_ext:
answer.append(i)
# sort_by 컬럼 기준으로 오름차순 정렬
answer.sort(key = lambda x : x[col_info[sort_by]])
return answer
작성한 python 코드에 대해서 설명해 볼게요!
# 문제 풀이 설명
문제 설명에 있었던 함수 3개를 먼저 보았어요! (solutuon(data, ext, val,_ext, sort_by) )
data인 배열이 들어오면
ext값이 val_ext보다 작은 데이터만을 가져와야 합니다.
첫 번째는 answer 리스트를 생성해 주었어요!
이 리스트는 함수의 마지막에서 필요로 한 데이터들을 담아 결과로 출력하게 합니다!
컬럼 정보를 담은 col_info변수를 딕셔너리 형태로 저장해 주었어요!
"code"는 열의 인덱스 0, "date"는 인덱스 1, "maximum"는 인덱스 2, "remain"은 인덱스 3에 해당합니다.
이 정보는 나중에 데이터에서 특정 열에 접근하기 위해 사용됩니다.
# 컬럼 정보를 담은 col_info 생성
col_info = {
"code" : 0,
"date" : 1,
"maximum" : 2,
"remain" : 3
}
data에 있는 모든 원소를 반복문을 통해 확인을 하고,
ext값이 val_ext보다 작은 데이터인 경우에는 answer 리스트에 append 해줍니다.
# ext 값이 val_ext보다 작은 데이터만 추출 및 적재
for i in data:
if i[col_info[ext]] < val_ext:
answer.append(i)
마지막으로, 정렬 기준이 되는 열을 기준으로 데이터를 오름차순으로 정렬해 주었어요!
lambda 함수와 sort_by 변수를 기준으로 정렬이 이뤄지도록 아래와 같이 코드를 작성했습니다!
그리고 answer 값을 retrun 하게 해 주었습니다!
# sort_by 컬럼 기준으로 오름차순 정렬
answer.sort(key = lambda x : x[col_info[sort_by]])
4. 문제 풀이 후기
이번 문제는 문제에서 주어진 조건에 맞게
solution() 함수 안에 코드를 작성하는 문제입니다.
컬럼에 맞는 컬럼정보를 0~3까지 부여해 주고, 이를 조건에 맞는 데이터를 추출할 때 이용합니다.
매개변수에 맞게 값을 비교해야 하니, 이렇게 컬럼 정보를 저장 후 비교하는 것은
코드 작성에서 많이 활용하는 부분이어서 참고하시면 좋을 것 같아요!
크게 어려운 부분이 없어서 제가 따로 코멘트할 것은 없습니다!
이번 포스팅은 프로그래머스에 있는
PCCE 기출문제 python 문제를 풀어보았습니다!
앞으로도 python 관련한 문제들도 많이 포스팅하려고 합니다!
설명이 어려운 부분 혹은 잘 이해가 안 가는 부분
그리고 더 궁금한 내용이 있다면
언제든지 댓글로 남겨주세요!
빠르게 궁금증을 해결해 드릴게요!
공감과 댓글은 큰 힘이 됩니다!
오늘도 블로그 방문해 주시고
포스팅 읽어주셔서 감사합니다!
'Skill Sets > Python' 카테고리의 다른 글
[Python] 공항 방문객(프로그래머스/python/COS Pro 2급) (42) | 2024.02.17 |
---|---|
[Python] 총점(프로그래머스/python/COS Pro 2급) (54) | 2024.01.07 |
[Python] n부터 m까지 자연수의 합(프로그래머스/python/COS Pro 2급) (59) | 2023.12.22 |
[Python] 음양 더하기(프로그래머스/python/Level 1) (55) | 2023.12.09 |
[Python] 핸드폰 번호 가리기(프로그래머스/python/Level 1) (76) | 2023.10.09 |