Pandas Data Cleaning
2019-10-30
Sample 1
Table: payments 결제가 완료된 경우 True, 아닌 경우 False인 컬럼 생성
Business Developer
Table: payments 결제가 완료된 경우 True, 아닌 경우 False인 컬럼 생성
import pandas as pd
df = pd.read_csv("../documents/dp_live.csv")
df.head(3)
특정한 테이블에서 특정한 조건을 만족하는 데이터를 추출한 후 특정한 조건을 만족한 그룹화된 특정 열 및 집계함수를 나타냄. 원하는 행을 필터링할 때는 WHERE
조건절, 행이 아닌 그룹화된 변수에 대해 필터링할 경우에는 HAVING
을 사용함. WHWERE 조건절의 조건은 데이터가 그룹화되기 전에 필터링하고, HAVING절의 조건은 데이터가 그룹화된 후 필터링함 즉, WHERE 조건절에 의해 1차 필터링된 대상을 그룹화하여 HAVING절이 2차 필터링하는 것임. 그룹화하면 데이터를 논리적 집합으로 나누어서 데이터의 특성을 요약할 수 있음.
CVP분석은 조업도와 원가의 변화가 이익에 어떠한 영향을 미치는가를 분석하는 기법으로서, 기업의 단기이익계획수립에 광범위하게 사용
예로 일정한 판매량에서 얻을 수 있는 이익, 일정한 목표이익을 달성하는데 필요한 매출액, 제품의 가격결정, 생산과 판매계획 수립, 가격의 변화 및 원가의 변화가 이익과 손익분기점에 미치는 영향 등을 파악할 때 사용