앞서 Pandas에 대해 전반적으로 알아보았다.

 

앞으로는 데이터를 다루는 데 있어 자주 사용하는 Pandas.Series의 함수를 정리하도록 하겠다.

 

첫 번째 Series의 함수는 isnull()이다.

 

이 함수는 Series의 데이터 값이 NA여부를 판단하여 데이터가 True or False로 나와있는 bool로 되어있는 Series로 반환한다. 여기에서 NA는 None과 numpy.NaN과 같은 것을 의미한다.

 

import pandas as pd
import numpy as np

a = pd.Series([1,np.NaN,3,4,None],
              index = ['a','b','c','d','e'])

a.isnull()

#결과
a    False
b     True
c    False
d    False
e     True
dtype: bool

 

한 가지 주의해야 할 점은 numpy.inf는 Pandas.isnull()에서 NA값으로 정의하지 않는다

 

a = pd.Series([1,np.NaN,3,4,np.inf],
              index = ['a','b','c','d','e'])
              
a.isnull()

#결과
a    False
b     True
c    False
d    False
e    False
dtype: bool

 

따라서 다음과 같이 Pandas.options.mode.use_inf_as_na를 True로 바꾸어 주어야 한다.

 

pd.options.mode.use_inf_as_na = True

a = pd.Series([1,np.NaN,3,4,np.inf],
              index = ['a','b','c','d','e'])

a.isnull()

#결과
a    False
b     True
c    False
d    False
e     True
dtype: bool

'Python > pandas' 카테고리의 다른 글

1-2. Pandas.Series - index를 이용한 데이터 다루기  (0) 2022.03.12
1-1. Pandas.Series - parameter 설명  (0) 2022.03.10
0. Pandas 소개  (0) 2022.03.09

+ Recent posts