1. gdown package
- 외부의 파일을 가지고 올때 사용하고, 코랩에서도 사용가능하다
- 코랩이 아니라, 다른 일반적인 python 프로젝트에서도 사용이 가능하다
- 실행을 하면 /content/남산도서관~~.csv형태의 위치에 저장됨
L 해당 파일을 코랩실행(90분 유효시간)이 종료되면 삭제된다.
L quiet옵션은 하단에 출력되는 메세지의 출력 여부이다.
- 아래처럼 이미지 파일등도 호출해서 다운로드 받을수 있습니다.
- 코랩의 서버 구조는 linux 구성처럼 되어 있고, /content하위 폴더에 sample_data폴더가 있는것을 알수 있다.
2. chardet 패키지 관련
- 문자의 인코딩 방식을 알아내는 패키지를 사용합니다.
- 보통 선언된 변수의 타입을 알아볼때 type을 주로 사용합니다.
그러면 csv의 파일을 읽고 나서도 type()함수를 사용해도 되는지 확인해봤습니다.
- type으로 조회시 인코딩 방식은 출력되지 않고, bytes타입에 대해서만 정보를 획득할수 있습니다.
- chardet.detect를 사용하려면, bytes or bytearray 타입으로 형변환이 필요합니다.
■ 기본미션
☞ p. 81의 확인 문제 4번 풀고 인증하기
문제) 판다스 read_csv()함수의 매개변수 설명이 옳은 것은 무엇인가요?
① header 매개변수의 기본값은 1로 csv파일의 첫번째 열 이름으로 사용합니다.
② names 매개변수에 행 이름을 리스트로 지정할 수 있습니다.
L names은 열에 대한 정의를 해서 틀린 항목입니다.
③ encoding매개변수에 csv파일의 인코딩 방식을 지정할 수 있습니다.
④ dtype매개변수를 사용하려면 모든 열의 데이터 타입을 지정해야 합니다.
L 필요한 사항만 선택적으로 정의할수 있습니다.
해설)
header의 기본값은 infer입니다.
- header=3을 입력하면, header에 3번째 라인의 행이 header의 역활로 들어가게 됩니다.
■ 선택미션
☞ p. 71 ~ 73 남산 도서관 데이터를 코랩에서 데이터프레임으로 출력하고 화면 캡처하기
'study' 카테고리의 다른 글
혼공 분석 3주차 (0) | 2022.12.28 |
---|---|
혼공 분석 2주차 (0) | 2022.12.28 |
혼공 파이썬 6주차 (0) | 2022.08.20 |
혼공 파이썬 5주차 (0) | 2022.08.13 |
혼공 파이썬 4주차 (0) | 2022.07.31 |