Pandas: 데이터 집계와 그룹연산

2019-05-02
  • 하나 이상의 키(함수, 배열, DataFrame의 컬럼 이름)을 이용해서 pandas 객체를 여러 조각으로 나누는 방법
  • 합계, 평균, 표준편차, 사용자 정의 함수 같은 그룹 요약 통계를 계산하는 방법
  • 정규화, 선형회귀, 등급 또는 부분집합 선택 같은 집단 내 변형이나 다른 조작을 적용하는 방법
  • 피벗데이블과 교차 알람표를 구하는 방법
  • 변위치 분석과 다른 통계 집단 분석을 수행하는 방법

각 그룹 색인은 아래와 같이 다양한 형태가 될 수 있으며, 모두 같은 타입일 필요도 없다.

  • 그룹으로 묶을 축과 동일한 길이의 리스트나 배열
  • DataFrame의 컬럼 이름을 지칭하는 값
  • 그룹으로 묶을 값과 그룹 이름에 대응하는 사전이나 Series 객체
  • 축 색인 혹은 색인 내의 개별 이름에 대해 실행되는 함수