绪论:初识机器学习
T 解决某一任务T
E 从经验E中学习
P 进行某一性能度量
监督学习算法:
我们给算法一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案,
回归问题(Regression problem):我们想要预测连续的数值输出
- 如:预测房价
分类问题(Classification problem):设法预测一个离散值输出 0 或 1 (或者2个以上的输出值)
- 使用了特征或者说属性
- 可能会有处理很多特征的算法
- 如:医疗数据预测肿瘤
无监督学习(unsupervised):
对于给定的数据集,无监督学习算法可能判定,该数据集包含两个不同的簇,就是聚类算法
- 数据都有相同的标签或者都没有标签
- 聚类算法的例子:Google news, 基因组学,大型计算机集群(找出那些机器趋向于协同工作),社交网络分析(判断哪些人相互认识,在同一个社交圈),市场细分应用 (更具客户信息,将客户分到不同的细分市场), 天文数据分析
- 我们只告诉算法这儿有一堆数据,不知道这些数据是是什么,是什么类型,自动找出这些数据的类型,按得到的类型把这些个体分成簇。
- 没有把数据集的正确答案给算法

- 鸡尾酒会问题