[Study] Data Science
-
[ADP] 데이터분석 전문가 21회 필기 후기[Study] Data Science/기타 2021. 5. 27. 16:10
한국데이터산업진흥원에서 주관하는 자격 시험인 ADP(데이터분석전문가)를 준비하고 있다. 합격여부에 관계없이 2021년 5월 22일에 진행된 21회 ADP필기 후기를 정리해보고자 한다. 1. 시험 자격 및 개요 시험 자격 - 데이터산업진흥원(https://www.dataq.or.kr/www/sub/a_05.do)에서 공지하고 있는 자격은 다음과 같다. - 이 중에 하나만 충족한다면 시험응시가 가능하다. - 나의 경우, '19년에 ADsP를 응시해서 합격한 경험이 있었기에 자격보유 기준을 충족해 응시할 수 있었다. 시험개요 - ADsP와는 달리 ADP는 필기와 실기로 이루어져있고, 실기는 필기를 통과한 후 2년 내 응시가 가능하다. - ADP 필기시험 범위는 아래의 총 5개의 영역으로 구성되어있으며, 서술형..
-
추천시스템의 기본 알고리즘[Study] Data Science/머신러닝&딥러닝 2021. 3. 11. 19:51
오늘은 추천시스템의 기본 알고리즘인 콘텐츠 기반 필터링(Content based Filtering)과 협업 필터링(Collaborative Filtering)에 대해 정리해보고자 한다. 1. 콘텐츠 기반 필터링(Content based Filtering) 콘텐츠 기반 필터링은 "사용자가 특정한 아이템을 선호할 때, 해당 아이템과 유사한 다른 아이템을 추천"하는 방식이다. 예를 들어, 사용자가 A라는 영화에 좋은 평점을 부여했다고 가정하자. 영화A의 특징을 추출하자면, 000감독의 액션장르 영화이다. 그렇다면 사용자에게는 A와 유사한 000감독의 또 다른 영화인 B를 추천해주는 것이다. 장점 : 다른 사용자의 데이터가 필요하지 않고, 추천할 수 있는 아이템의 범위가 넓다. 단점 : 기록이 없는 신규 사용자..
-
[Kaggle] Simple RNN을 활용한 주식 가격 예측[Study] Data Science/Kaggle 리뷰 2021. 2. 7. 16:48
Kaggle의 데이터셋을 활용해 RNN을 간단히 구현해보았다. 1. 데이터 탐색 및 전처리 - 데이터셋을 Colab으로 불러온 과정은 생략한다. - 불러온 파일 nyse.zip을 압축해제하면, 다음과 같은 4가지의 csv파일이 있다. Archive: nyse.zip inflating: fundamentals.csv #기본적인 종목에 대한 재무정보 inflating: prices-split-adjusted.csv #prices에서 주식분할 등의 조정이 반영된 데이터 inflating: prices.csv #일자, 종목, 시가, 종가, 저가, 고가, 거래량 inflating: securities.csv 1) 기본적으로 분석에 필요한 모듈을 import하고, csv 파일의 형태를 살펴본다. import os ..
-
Kaggle 데이터를 API를 통해 Colab으로 가져오기[Study] Data Science/기타 2021. 1. 26. 18:08
기본적인 딥러닝을 구현해보고자, 이미지처리에서 유명한 예제 데이터인 를 선택했다. 데이터셋을 다운받아 로컬에서 실습하기에는 다소 무리가 있는 듯 했고, 구글 Colab을 통해 코드를 실행해보고자 했다. 그래서 Kaggle 데이터를 구글 Colab으로 가져오는 과정을 리뷰해보고자 한다. 1. Kaggle의 본인 Account에 들어가 API Token 생성하기 - kaggle 로그인 후, 우측 상단의 계정 모양에서 Account 클릭한다. - API 메뉴에서 "Create New API Token" 버튼을 누르면 "kaggle.json" 파일이 자동적으로 다운로드 된다. 2. Google Colab에 접속하여, Kaggle을 설치 및 확인하기 !pip install kaggle from google.col..