본문 바로가기

전체 글110

월간데이터노트 4월 : 2025 데이터 분석가 채용 공고 트렌드 분석 분석 배경데이터 분석가 직무로 취업을 준비하면서 다양한 기업들의 신입 데이터 분석가 채용 공고를 모아보기 시작수집한 채용 공고를 체계적으로 분석해보며 데이터 분석가 신입에게 요구되는 역량과 경험에는 주로 어떤 것들이 있는지 파악하여나의 부족한 부분을 명확히 파악하고 채워나가는 방향성을 잡 기 위함이지만 사실 월간데이터노트 발표를 위해 분석해보고 싶었습니다. (솔직) 분석 목적요즘 데이터 분석가 신입 공고에 요구되는 역량과 키워드 흐름을 파악한다.채용 공고 텍스트에 숨겨진 패턴을 기반으로 취업 준비 방향성 제시한다. 데이터 개요 : 경력 사항, 고용 형태, 입사 전형 경력 사항신입(경력무관) > 3년 이상 > 2년 이상 > 1년 이상 순경력사항유형 수신입20개6개월 이상1개1년 이상6개2년 이상9개3년 이.. 2025. 4. 26.
[4] 게임 개발사의 주력 플랫폼 찾기 Advent of SQL 2024 > 게임 개발사의 주력 플랫폼 찾기Video Game Sales with Ratings 데이터베이스는 1980년부터 2016년까지 출시된 게임들의 다양한 정보가 포함되어 있습니다. 포함된 정보에는 게임 개발사 정보와 각 게임의 플랫폼, 게임의 판매량 정보도 있습니다. 게임 분야에는 많은 플랫폼이 있기 때문에 하나의 개발사가 모든 플랫폼에 게임을 출시하는 것은 생각보다 어려운 일 입니다. 각 게임 개발사는 주력 플랫폼을 정해두고 해당 플랫폼 위주로 게임을 출시합니다. 따라서, 개발사마다 주력 플랫폼은 보통 판매량이 가장 많은 플랫폼으로 생각할 수 있습니다.games 테이블, companies 테이블, platforms 테이블을 조회해 각 게임 개발사의 주력 플랫폼과 해당 .. 2025. 4. 15.
[4] 전력 소비량 이동 평균 구하기 Advent of SQL 2024 > 전력 소비량 이동 평균 구하기2017년 1월 1일 0시부터 2017년 2월 1일 0시까지 10분 단위로 3개 발전소 전력 소비량의 1시간 범위 단순 이동 평균을 계산하는 쿼리를 작성해주세요. 평균을 내기 위한 데이터의 범위가 1시간보다 작은 경우 해당 범위에 포함되는 측정 값만 평균 계산에 포함시켜주세요. 쿼리 결과에는 아래 컬럼이 포함되어 있어야 하고, 이동 평균 값은 소수점 셋째 자리에서 반올림 해 둘째 자리까지 표시되어야 합니다. -- 2017년 1월 1일 0시부터 2017년 2월 1일 0시까지-- 10분 단위-- 3개 발전소 -- 전력 소비량의 1시간 범위 단순 이동 평균-- 평균을 내기 위한 데이터의 범위가 1시간보다 작은 경우 -- 해당 범위에 포함되는.. 2025. 4. 15.
월별 리텐션 분석 (DuckDB : SQL) DuckDB + Pandas 연동필요한 라이브러리 설치pip install duckdb pandas  순서설명1pd.read_parquet()로 DataFrame 불러오기2duckdb.connect()로 인메모리 DB 연결3.register("테이블명", df)로 테이블처럼 등록4con.execute(...).df()로 SQL 쿼리 실행 후 DataFrame으로 반환# Parquet 파일 로드df_view = pd.read_parquet('view.parquet')df_visit = pd.read_parquet('visit.parquet')# DuckDB 인스턴스 생성 (메모리 DB)con = duckdb.connect(database=':memory:')# 데이터프레임을 DuckDB에 테이블처럼 등록c.. 2025. 4. 4.