Page 31 -
P. 31

그림 1-13 붓꽃 데이터셋의 꽃받침 너비와 길이로 그린 점차트


                                                                                                      1










                                                                                                      머신 러닝과 신경망 개론

















                    점차트에서 몇 가지 재미있는 점을 찾을 수 있다. 우선 붓꽃 품종에 따라 sepal_width와 sepal_
                    length의 관계가 다르다. 부채붓꽃(setosa)은 sepal_width와 sepal_length가 상당한 선형 관계를
                    가지는 반면, 버시칼라(versicolor)와 버지니카(virginica)는 sepal_length가 부채붓꽃보다 대체로 훨
                    씬 더 크다. 따라서 sepal_width와 sepal_length는 붓꽃 품종을 구별하는 머신 러닝 모델에 반드
                    시 포함할 중요한 특징임을 알 수 있다.

                    다음으로 히스토그램을 그려 데이터 분포를 조사해 보자. 점차트와 마찬가지로 DataFrame.plot.

                    hist() 함수를 사용해 손쉽게 그릴 수 있다.

                      df['petal_length'].plot.hist(title='Histogram of Petal Length')
                      plt.show()

















                                                                                                  43





     신경망교과서_07.indd   43                                                                     2020-05-19   오전 9:04:32
   26   27   28   29   30   31   32   33   34   35   36