210727_시각화(Matplot, Seaborn)
Matplot을 이용한 시각화 파이썬으로 데이터를 시각화 하는데에는 Matplotlib 라이브러리를 가장 많이 사용한다. Matplotlib 은 파이썬에서 2D 형태의 그래프, 이미지 등을 그릴때 사용하는 것으로 실제 과학 컴퓨팅 분야나 인공지능 분야에서도 많이 사용 됨. Matplotlib 모듈에는 다양한 모듈들이 많이 있는데 그 중에서 가장 기본이 되는 pyplot이 서브모듈이다. 직선 그래프 import matplotlib.pyplot as plt # 1. plot() : 직선 혹은 꺽은선의 그래프를 그릴 때 사용 # 꺽은선 그래프 plt.plot([1,2,3,4],[1,4,9,16]) # x, y축 plt.show() # 직선그래프 plt.plot([10,20,30,40]) plt.show() #..
2021. 7. 27.
210723_GroupBy, Pivot Tables
DataFrame - 데이터 그룹핑하기 통계자료에서 많이 사용한다. 그룹핑 시켜서 합을 도출하거나 혹은 평균값을 구하거나 등 import numpy as np import pandas as pd from pandas import DataFrame import matplotlib.pyplot as plt np.random.seed(100) df = DataFrame({ 'Gender':['Female','Male','Female','Male','Female','Male','Female','Female'], 'Smoking':['Smoker', 'Smoker', 'Smoker', 'Non-Smoker','Non-Smoker','Non-Smoker','Non-Smoker','Smoker'], 'JumpHeig..
2021. 7. 24.
210720_Numpy (array, random, 인덱싱, 슬라이싱)
AI : 머신러닝/딥러닝(더 deep하게 들어간다) NN -> FNN, ANN, DNN, CNN(여기서 부터 딥러닝이시작) → UGG, UNGT 1. 데이터분석 Numby / Pandas (Series, DataFrame - 데이터프레임 정수) Matplot/seaborn : 시각화 Featuer Engineering Data PreProcessing Visualization 2. 머신러닝 머신에서 기기가 학습한다. 머신이 학습하기위해 머신에 데이터를 제공해야한다 (big data) bigdata는 Feature, 전처리가 되어있어야한다. 1) 학습의형태 지도학습 : 기업에서 추구 Decision Tree, Random Forest, Boostring, Linear, Sum 비지도학습 Clastrerin..
2021. 7. 20.