[네이버부스트코스]/[데이터 사이언스]

아나콘다 파일 경로 설정

eunma 2024. 8. 2. 20:32

파일 경로 설정


1. 학습목표

  • 데이터 파일의 경로를 설정하는 방법을 학습한다.

2. 핵심 키워드

  • %mv
  • %pwd
  • %ls
  • pd.read_csv
  • cp949

3. 강의 내용

데이터분석을 시작하시는 분들이 처음에 가장 어렵게 느끼시는 것이 파일 경로 설정입니다.

다소 복잡해 보이더라도 이번 학습내용을 차근차근 따라오시다 보면

어느덧 능숙하게 하고계신 모습을 발견하실 수 있을 것입니다.

1) 'file-path-setting'의 이름을 가진 주피터 노트북 파일을 만들어 줍니다.
2) 공공데이터포털(도로교통공단_교통사고 정보)로 들어가셔서 데이터를 다운받아 줍니다.
3) 다운받은 파일을 주피터 노트북에서 작업하고 있는 폴더로 가져오기

  %mv /Users/~~~/~~~/도로교통공단_교통사고다발지역_20191010.csv .
  • 파일을 다운 받은 폴더의 경로를 적어주세요.

  • 파일을 다운 받은 위치의 경우 개인마다 다르기 때문에 자신에 맞게 작성해주셔야 합니다.

  • 제일 끝에 한 칸을 띄우고 . 을 꼭 적어주셔야 합니다!

  • 주피터 노트북 파일이 있는 폴더 경로를 확인하려면 주피터 노트북 상에서 %pwd를 실행하시면 됩니다.
    4) 판다스로 csv파일 불러오기

    pd.read_csv("도로교통공단_교통사고다발지역_20191010.csv", encoding="cp949")
  • 소괄호() 안에서 shift + tab 키를 누르면 도움말을 볼 수 있습니다.

  • csv파일을 불러올 때 한글파일 인코딩을 하지 않으면 오류가 나기 때문에 encoding="cp949"를 함께 적어주셔야 합니다.

  • "euc-kr"을 적는 방법도 있지만 일부 한글은 깨지기 때문에 "cp949"를 사용하시는 것을 추천드립니다.
    5) 데이터 파일의 경우 따로 폴더를 만들어서 관리하는 것을 추천드립니다.

4. 추가심화학습

  • 주피터노트북 내에서 경로를 변경하는 방법

    import os
    # 변경하고자 하는 디렉토리 경로
    new_dir = r'C:\Users\원하는경로'
    # 디렉토리 변경
    os.chdir(new_dir)
    # 현재 디렉토리 확인
    print(os.getcwd())
  • 노트북의 설정파일을 변경한다.

    1. 주피터 노트북의 설정 파일(jupyter_notebook_config.py)을 편집
    2. 설정파일이 없다면 cmd를 통해 생성(.jupyter 폴더 아래에 생성됨)
      jupyter notebook --generate-config
    3. c.NotebookApp.notebook_dir 설정을 변경합니다.
      c.NotebookApp.notebook_dir = r'C:\Users\원하는경로'
    4. 버전에 따라 c.ServerApp.root_dir을 사용하기도 함.
      c.NotebookApp.notebook_dir = r'C:\Users\원하는경로'

5. 추가 키워드정리


6. 간단한 퀴즈