Data Science/python
[Python] 사이킷런 train_test_split 결측 에러 처리
joonizz
2023. 1. 27. 14:22
기본적으로 사용하는 사이킷런의 train_test_split을 하다가 에러가 발생하였다.
<train_test_split 코드>
train_X, test_X, train_y, test_y = train_test_split(X, y, stratify = y, test_size=0.3, random_state=42)
<에러 코드>
TypeError: '<' not supported between instances of 'str' and 'NoneType'
찾아보니 리스트 정렬시에 None이포함되어있을경우 발생하는 에러라고 한다.
<해결방법>
y에 결측치를 제거한 후 다시 수행한다!
df= df.dropna(subset = ['y'])