主要分类
- clustering
- classification
- regression
- dimension reduction
ML流程
- 获取数据,下载raw data
- 清洗数据, 去noise,正则化,标准化
- 拿数据去训练模型
- 测试数据集
- 提升算法准确度
%matplotlib inline # ipython图形在网页中展示
Esitmator框架
model=EstimotorObject() # 实例化一个model,比如svm,RF
model.fit(dataset.data,dataset.target) #拟合这个数据集
model.predict(dataset.data) # 在测试数据集预测
model.transfrom(dataset.data) # 非监督学习
# 举例
from sklearn.linear_model import LinearRegression
model=LinearRegression()
监督学习
model.predict()
model.predict_proba() # 属于每个类别的概率
model.score() # 模型效果
非监督学习
model.transform()
model.fit_transfrom() # 一步fit和predict。