본문 바로가기

study

혼공 분석 1주차

1. gdown package

 - 외부의 파일을 가지고 올때 사용하고, 코랩에서도 사용가능하다

 - 코랩이 아니라, 다른 일반적인 python 프로젝트에서도 사용이 가능하다

 - 실행을 하면 /content/남산도서관~~.csv형태의 위치에 저장됨

    L 해당 파일을 코랩실행(90분 유효시간)이 종료되면 삭제된다.

    L quiet옵션은 하단에 출력되는 메세지의 출력 여부이다. 

 

 - 아래처럼 이미지 파일등도 호출해서 다운로드 받을수 있습니다.

 

 - 코랩의 서버 구조는 linux 구성처럼 되어 있고, /content하위 폴더에 sample_data폴더가 있는것을 알수 있다.

 

2. chardet 패키지 관련

 - 문자의 인코딩 방식을 알아내는 패키지를 사용합니다.

 - 보통 선언된 변수의 타입을 알아볼때 type을 주로 사용합니다.

    그러면 csv의 파일을 읽고 나서도 type()함수를 사용해도 되는지 확인해봤습니다.

 - type으로 조회시 인코딩 방식은 출력되지 않고, bytes타입에 대해서만 정보를 획득할수 있습니다.

 

- chardet.detect를 사용하려면, bytes or bytearray 타입으로 형변환이 필요합니다.

 

■ 기본미션

☞ p. 81의 확인 문제 4번 풀고 인증하기

문제) 판다스 read_csv()함수의 매개변수 설명이 옳은 것은 무엇인가요?

① header 매개변수의 기본값은 1로 csv파일의 첫번째 열 이름으로 사용합니다.

② names 매개변수에 행 이름을 리스트로 지정할 수 있습니다.

    L names은 열에 대한 정의를 해서 틀린 항목입니다.

③ encoding매개변수에 csv파일의 인코딩 방식을 지정할 수 있습니다.

④ dtype매개변수를 사용하려면 모든 열의 데이터 타입을 지정해야 합니다.

    L 필요한 사항만 선택적으로 정의할수 있습니다. 

 

해설)

header의 기본값은 infer입니다.

 

- header=3을 입력하면, header에 3번째 라인의 행이 header의 역활로 들어가게 됩니다.

 

 

■ 선택미션

☞ p. 71 ~ 73 남산 도서관 데이터를 코랩에서 데이터프레임으로 출력하고 화면 캡처하기

 

'study' 카테고리의 다른 글

혼공 분석 3주차  (0) 2022.12.28
혼공 분석 2주차  (0) 2022.12.28
혼공 파이썬 6주차  (0) 2022.08.20
혼공 파이썬 5주차  (0) 2022.08.13
혼공 파이썬 4주차  (0) 2022.07.31