Data Science/python

[Python] 사이킷런 train_test_split 결측 에러 처리

joonizz 2023. 1. 27. 14:22

기본적으로 사용하는 사이킷런의 train_test_split을 하다가 에러가 발생하였다.

 

<train_test_split 코드>

train_X, test_X, train_y, test_y = train_test_split(X, y, stratify = y, test_size=0.3, random_state=42)

 

<에러 코드>

TypeError: '<' not supported between instances of 'str' and 'NoneType'

 

 

찾아보니 리스트 정렬시에 None이포함되어있을경우 발생하는 에러라고 한다.

 

<해결방법>

y에 결측치를 제거한 후 다시 수행한다! 

df= df.dropna(subset = ['y'])