파일 경로 설정
- 강의 자료 : https://www.boostcourse.org/ds112/lecture/59936
- 참고 링크 : 공공데이터포털
- 목차
- 학습목표
- 핵심키워드
- 강의 내용
- 추가 심화 학습 - GPT4
- 키워드 정리
- 학습 확인을 위한 간단한 퀴즈 - GPT4
1. 학습목표
- 데이터 파일의 경로를 설정하는 방법을 학습한다.
2. 핵심 키워드
- %mv
- %pwd
- %ls
- pd.read_csv
- cp949
3. 강의 내용
데이터분석을 시작하시는 분들이 처음에 가장 어렵게 느끼시는 것이 파일 경로 설정입니다.
다소 복잡해 보이더라도 이번 학습내용을 차근차근 따라오시다 보면
어느덧 능숙하게 하고계신 모습을 발견하실 수 있을 것입니다.
1) 'file-path-setting'의 이름을 가진 주피터 노트북 파일을 만들어 줍니다.
2) 공공데이터포털(도로교통공단_교통사고 정보)로 들어가셔서 데이터를 다운받아 줍니다.
3) 다운받은 파일을 주피터 노트북에서 작업하고 있는 폴더로 가져오기
%mv /Users/~~~/~~~/도로교통공단_교통사고다발지역_20191010.csv .
파일을 다운 받은 폴더의 경로를 적어주세요.
파일을 다운 받은 위치의 경우 개인마다 다르기 때문에 자신에 맞게 작성해주셔야 합니다.
제일 끝에 한 칸을 띄우고 . 을 꼭 적어주셔야 합니다!
주피터 노트북 파일이 있는 폴더 경로를 확인하려면 주피터 노트북 상에서 %pwd를 실행하시면 됩니다.
4) 판다스로 csv파일 불러오기pd.read_csv("도로교통공단_교통사고다발지역_20191010.csv", encoding="cp949")
소괄호() 안에서 shift + tab 키를 누르면 도움말을 볼 수 있습니다.
csv파일을 불러올 때 한글파일 인코딩을 하지 않으면 오류가 나기 때문에 encoding="cp949"를 함께 적어주셔야 합니다.
"euc-kr"을 적는 방법도 있지만 일부 한글은 깨지기 때문에 "cp949"를 사용하시는 것을 추천드립니다.
5) 데이터 파일의 경우 따로 폴더를 만들어서 관리하는 것을 추천드립니다.
4. 추가심화학습
주피터노트북 내에서 경로를 변경하는 방법
import os # 변경하고자 하는 디렉토리 경로 new_dir = r'C:\Users\원하는경로' # 디렉토리 변경 os.chdir(new_dir) # 현재 디렉토리 확인 print(os.getcwd())
노트북의 설정파일을 변경한다.
- 주피터 노트북의 설정 파일(jupyter_notebook_config.py)을 편집
- 설정파일이 없다면 cmd를 통해 생성(.jupyter 폴더 아래에 생성됨)
jupyter notebook --generate-config
- c.NotebookApp.notebook_dir 설정을 변경합니다.
c.NotebookApp.notebook_dir = r'C:\Users\원하는경로'
- 버전에 따라 c.ServerApp.root_dir을 사용하기도 함.
c.NotebookApp.notebook_dir = r'C:\Users\원하는경로'
5. 추가 키워드정리
6. 간단한 퀴즈
'[네이버부스트코스] > [데이터 사이언스]' 카테고리의 다른 글
결측치 다루기 (0) | 2024.08.10 |
---|---|
데이터 분포 확인 퀴즈 (0) | 2024.08.10 |
공공데이터 사용 (0) | 2024.08.03 |
판다스 치트시트를 활용한 기초 퀴즈 (0) | 2024.07.31 |
Pandas 치트시트를 활용한 기초 (0) | 2024.07.31 |