0%

绪论：初识机器学习

Posted on 2019-04-19 Edited on 2021-12-27 In 机器学习笔记

绪论：初识机器学习

T 解决某一任务T

E 从经验E中学习

P 进行某一性能度量

监督学习算法：

我们给算法一个数据集，其中包含了正确答案，算法的目的就是给出更多的正确答案，

回归问题(Regression problem)：我们想要预测连续的数值输出
- 如：预测房价
分类问题(Classification problem)：设法预测一个离散值输出 0 或 1 (或者2个以上的输出值)
- 使用了特征或者说属性
- 可能会有处理很多特征的算法
- 如：医疗数据预测肿瘤

无监督学习（unsupervised）：

对于给定的数据集，无监督学习算法可能判定，该数据集包含两个不同的簇，就是聚类算法

数据都有相同的标签或者都没有标签
聚类算法的例子：Google news, 基因组学，大型计算机集群（找出那些机器趋向于协同工作），社交网络分析（判断哪些人相互认识，在同一个社交圈），市场细分应用（更具客户信息，将客户分到不同的细分市场），天文数据分析
我们只告诉算法这儿有一堆数据，不知道这些数据是是什么，是什么类型，自动找出这些数据的类型，按得到的类型把这些个体分成簇。
没有把数据集的正确答案给算法

鸡尾酒会问题