Yet Never Lose Faith

- Good to Great , Jim Collins

How To Preprocess Image Data 자세히보기

데이터분석 2

[데이터 탐색] 데이터 탐색에 유용한 함수 2탄 - boxplot(), unique()

이번 포스팅에서는 데이터 탐색에 쓰이는 함수 2가지를 알아본다. 샘플 데이터 로드 from sklearn.datasets import load_breast_cancer cancer = load_breast_cancer() cancer 사이킷 런에서 제공하는 위스콘신 유방암 데이터 세트를 사용했다. 유방암 데이터 세트에는 유방암 세포의 특징 10개에 대해 평균, 표준오차, 최대 이상치가 기록되어 있다. 또한 각 세포가 악성종양(1)인지 정상종양(0)인지에 대한 정보가 target 데이터에 담겨있다. boxplot() # 박스플롯 그리기 import matplotlib.pyplot as plt plt.boxplot(cancer.data) plt.xlabel('feature') plt.ylabel('value..

[Weekly DA!] 2017년 자연재해 피해는 어느 지역이 가장 심했을까?

안녕하세요. 태풍 '미탁'이 한반도를 휩쓸었어요. 피해보신 분들, 하루 빨리 복구되길 진심으로 바랄게요. 이번주는 자연재해 관련 데이터를 분석해보려고 해요. 1. DataSet 구하기 국가통계포털 > 주제별통계 > 사회 > 자연재해현황 ①시도별 재해현황 ②시도별 피해복구액 2015~2017년의 데이터가 수집돼있어요. 최신데이터를 사용하기 위해 '시점' 탭에서 2017년만 선택한 후, 다운로드했어요. 2. 데이터 전처리 import pandas as pd def data_preprocessing(path) : # 1. 인덱스 처리 data = pd.read_excel(path, index_col = 0) # 2. 합계 행 제거 data = data.drop('합계') # 3. 데이터 스케일 축소 data[..

카테고리 없음 2019.10.03