Page 28 -
P. 28
DataFrame으로 가져오는 데 성공했다면 이제 데이터를 다룰 준비가 됐다. 먼저 가볍게 훑어 보
자. 데이터를 본격적으로 사용하기 전에 데이터 유형을 잘 파악하는 게 중요하다.
print(df.info())
그림 1-9 붓꽃 데이터셋 정보
데이터셋에는 로우가 150개, 숫자 칼럼이 네 개(sepal_length, sepal_width, petal_length,
petal_width) 있다. 마지막 칼럼은 숫자가 아닌 범주형 변수로, 꽃의 클래스(즉, 꽃의 품종) 정보
를 나타낸다.
또는 describe() 함수로 숫자 칼럼의 통계 정보를 조회할 수도 있다.
print(df.describe())
그림 1-10 붓꽃 데이터셋의 통계 정보 조회
40
신경망교과서_07.indd 40 2020-05-19 오전 9:04:32