공공 데이터
1강 공공데이터 포털 및 데이터셋 소개
목표
- 공공데이터를 찾는 방법을 이해하고, 분석할 데이터셋을 알아보자.
공공데이터
실습파일
2강 데이터 로드 및 미리보기
목표
- 라이브러리를 불러오고, pandas로 데이터를 가져온다.
핵심키워드
read_csv()
shape
head()/tail()
info()
columns
dtypes
주요 코드
주요 라이브러리불러오기
# pandas 불러오기 impoort pandas as pd # 수치계산/다차원배열처리 라이브러리 import numpy as np # 데이터 시각화 라이브러리 import seaborn as sns # 데이터 시각화 라이브러리 import matplotlib.pyplot as plt
데이터 로드
# 데이터를 df 변수에 담고, df.shape로 모양보기 df = pd.read_데이터확장자("data경로/파일명.확장자,low_memory=False) df.shape
데이터 미리보기
# 앞에서부터 5개의 데이터를 기본값으로 봄. ()안 숫자 기입시 추가 확인 df.head() # 뒤에서 부터 5개 보기 df.tail()
- 데이터 요약하기
df.info() # 컬럼명 보기 df.columns # 데이터 타입 확인하기 df.dtypes
실습파일
'[STUDY] > [NAVER_boostcourse]' 카테고리의 다른 글
결측치 다루기 (0) | 2024.08.10 |
---|---|
데이터 분포 확인 퀴즈 (0) | 2024.08.10 |
아나콘다 파일 경로 설정 (0) | 2024.08.02 |
판다스 치트시트를 활용한 기초 퀴즈 (0) | 2024.07.31 |
Pandas 치트시트를 활용한 기초 (0) | 2024.07.31 |