프로그래밍/파이썬(Python)

[Pandas] isna()와 isnull()의 차이

정정훈훈 2024. 9. 22. 15:02
반응형

isna()와 isnull()은 pandas에서 결측값을 확인할 때 사용하는 함수로, 동일한 기능을 수행합니다. 사실상 차이가 없으며, 두 함수는 서로 대체 가능합니다.

기능:

  • 두 함수 모두 NaN(Not a Number)이나 None과 같은 결측값을 True로, 결측값이 아닌 경우 False로 표시합니다.
  • 이 함수들은 데이터프레임, 시리즈, 혹은 다른 pandas 객체에서 결측값을 찾을 때 사용됩니다.

차이점:

  • isna(): pandas에서 더 직관적인 이름으로 제공하는 함수이며, "NA"라는 표현을 강조하기 위해 사용됩니다. 이는 "결측값(N/A)"을 나타내는 용어를 사용하고 있습니다.
  • isnull(): 더 오래된 함수로, pandas의 초기 버전부터 사용되어 왔으며, 여전히 지원되고 있습니다. "null"이라는 표현을 강조합니다.

코드 예시:

둘 다 같은 결과를 반환합니다.

python
코드 복사
import pandas as pd import numpy as np data = pd.Series([1, 2, np.nan, 4, None]) # Using isna() print(data.isna()) # Using isnull() print(data.isnull())

출력 결과:

두 함수 모두 동일한 결과를 보여줍니다.

python
코드 복사
0 False 1 False 2 True 3 False 4 True dtype: bool

결론: isna()와 isnull()은 기능적으로 차이가 없으며, 둘 중 어느 것을 사용해도 무방합니다. 다만, pandas 문서에서는 점차 isna()를 더 권장하는 경향이 있습니다.

 
4o
반응형