Level 1 Pandas Series, NaN
2019-09-17
pandas Series
import pandas as pd
odd = [1, 3, 5, 7, 9]
pd_odd = pd.Series(odd)
print(pd_odd)
pandas Series는 python의 list와 유사한 형태로,
pandas Series로 사용해야 pandas의 기능을 사용할 수 있음
pd.Series() 함수를 사용하며, python의 list, numpy의 array가 인자로 입력
.values
: value를 array로 확인
.index
: index의 범위값 확인
pd_odd.values
pd_odd.index
Series의 index 설정
pd.Series(odd, index = ['a', 'b', 'c', 'd', 'e'])
Series의 이름 설정
pd.Series.name = series 이름
Series index의 이름 설정
pd.Series.index.name = index 이름
Series의 index 값 변경
pd_odd.index = ['1', '2', '3', '4', '5']
pd_odd.mean()
pd_odd.sum()
pd_odd.describe()
Nan(Not a Number)
import numpy as np
odd = [1, 3, 5, 7, 9]
odd = pd.Series(odd)
odd.dtypes
# dtype('int64')
odd = [1, 3, 5, 7, 9, np.nan]
odd.dtypes
# dtype('float64')
데이터 분석 시 의미 없는 값은 Nan으로 처리 필요
키, 몸무게 분석 등에 음수 값이 표함된 경우 등