Page 31 -
P. 31
그림 1-13 붓꽃 데이터셋의 꽃받침 너비와 길이로 그린 점차트
1
머신 러닝과 신경망 개론
점차트에서 몇 가지 재미있는 점을 찾을 수 있다. 우선 붓꽃 품종에 따라 sepal_width와 sepal_
length의 관계가 다르다. 부채붓꽃(setosa)은 sepal_width와 sepal_length가 상당한 선형 관계를
가지는 반면, 버시칼라(versicolor)와 버지니카(virginica)는 sepal_length가 부채붓꽃보다 대체로 훨
씬 더 크다. 따라서 sepal_width와 sepal_length는 붓꽃 품종을 구별하는 머신 러닝 모델에 반드
시 포함할 중요한 특징임을 알 수 있다.
다음으로 히스토그램을 그려 데이터 분포를 조사해 보자. 점차트와 마찬가지로 DataFrame.plot.
hist() 함수를 사용해 손쉽게 그릴 수 있다.
df['petal_length'].plot.hist(title='Histogram of Petal Length')
plt.show()
43
신경망교과서_07.indd 43 2020-05-19 오전 9:04:32