시계열 (chap11)
시간 내에서 특정 순간의 타임스탬프 2000년 1월, 2020년도 전체 같은 고정된 기간 시작과 끝 타임스탬프로 표시되는 시간 간격 실험 혹은 경과시간 pandas는 표준 시계열 도구와 데이터 알고리즘을 제공 날짜, 시간 자료형, 도구 날짜와 시간 자료형 : datatime, time datetime : 날짜+시간+마이크로초까지 포함 (2021-09-15 18:10:31.862057) datetime(2011, 1, 7) : 2011-01-07 00:00:00 datetime(2008, 6, 24, 8,15,20,10) : 2008-06-24 08:15:20.000010 년, 월, 일, 시, 분, 초, 밀리세컨드 로 구성된다. timedelta 시간에 대해서 해당 일자에 +,- 을 수행한다. 여기서 사용..
데이터 준비하기:조인,병합,변형 (chap8)
Pandas의 계층적인 색인 개념을 통해서, 데이터를 관리하자!! 계층적 색인 다중(둘이상)의 색인 단계를 정할수 있다. 높은차원의 데이타를 낮은 차원의 형식으로 처리함 Series의 index를 List의 List(or 배열)로 색인을 구성할수 있다. 2개의 차이를 보면, 왼쪽 색인 영역이 2개 생긴다고 보면 된다. 하위 계층을 선택하는 것도 가능 해당 데이타에서 1,2,3 Level의 추출하기 unstack, stack함수 : 행,열을 변경하여서 새롭게 배열 구성 T함수도 행,열을 변경하는 것인데, 여기서 동작은 되지 않는다. 인덱스는 크게 4가지 형태로 구성할수 있다. swaplevel : 계층의 순서를 바꾸고 정렬하기 frame.swaplevel('key1', 'key2') 실제 데이타가 변경 되..
pandas 시작하기 (chap5)
주제 : pandas # 자료구조 Series와 DataFrame가 있다. Series tmp = pd.Series([1,2,-5,-2]) tmp.values tmp.index tmp = pd.Series([1,2,-5,-2], index=['a','b','c','d']) index를 통해서 색인을 할당할수 있다 data = {"a" : 1, "b":2, "c":3} tmp = pd.Series(data) // 이런식으로 index를 별도로 명명하지 않고 생성 가능 일련의 객체를 담을 수 있는 1차원 배열 같은 자료 구조 고정길이의 정령된 사전형이라고 개념을 잡기 파이선의 사전형(Dictionary)와 비슷한 개념 색인이라는 데이타 앞에 연관 이름 존재 (기본 적으로 0부터 할당되어짐) 색인을 통해서 값..