앞서 Pandas에 대해 전반적으로 알아보았다.
앞으로는 데이터를 다루는 데 있어 자주 사용하는 Pandas.Series의 함수를 정리하도록 하겠다.
첫 번째 Series의 함수는 isnull()이다.
이 함수는 Series의 데이터 값이 NA여부를 판단하여 데이터가 True or False로 나와있는 bool로 되어있는 Series로 반환한다. 여기에서 NA는 None과 numpy.NaN과 같은 것을 의미한다.
import pandas as pd
import numpy as np
a = pd.Series([1,np.NaN,3,4,None],
index = ['a','b','c','d','e'])
a.isnull()
#결과
a False
b True
c False
d False
e True
dtype: bool
한 가지 주의해야 할 점은 numpy.inf는 Pandas.isnull()에서 NA값으로 정의하지 않는다
a = pd.Series([1,np.NaN,3,4,np.inf],
index = ['a','b','c','d','e'])
a.isnull()
#결과
a False
b True
c False
d False
e False
dtype: bool
따라서 다음과 같이 Pandas.options.mode.use_inf_as_na를 True로 바꾸어 주어야 한다.
pd.options.mode.use_inf_as_na = True
a = pd.Series([1,np.NaN,3,4,np.inf],
index = ['a','b','c','d','e'])
a.isnull()
#결과
a False
b True
c False
d False
e True
dtype: bool
'Python > pandas' 카테고리의 다른 글
1-2. Pandas.Series - index를 이용한 데이터 다루기 (0) | 2022.03.12 |
---|---|
1-1. Pandas.Series - parameter 설명 (0) | 2022.03.10 |
0. Pandas 소개 (0) | 2022.03.09 |