0%

绪论:初识机器学习

绪论:初识机器学习

T 解决某一任务T

E 从经验E中学习

P 进行某一性能度量

监督学习算法:

我们给算法一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案,

  • 回归问题(Regression problem):我们想要预测连续的数值输出

    • 如:预测房价
  • 分类问题(Classification problem):设法预测一个离散值输出 0 或 1 (或者2个以上的输出值)

    • 使用了特征或者说属性
    • 可能会有处理很多特征的算法
    • 如:医疗数据预测肿瘤
无监督学习(unsupervised):

对于给定的数据集,无监督学习算法可能判定,该数据集包含两个不同的簇,就是聚类算法

  • 数据都有相同的标签或者都没有标签
  • 聚类算法的例子:Google news, 基因组学,大型计算机集群(找出那些机器趋向于协同工作),社交网络分析(判断哪些人相互认识,在同一个社交圈),市场细分应用 (更具客户信息,将客户分到不同的细分市场), 天文数据分析
  • 我们只告诉算法这儿有一堆数据,不知道这些数据是是什么,是什么类型,自动找出这些数据的类型,按得到的类型把这些个体分成簇。
  • 没有把数据集的正确答案给算法

  • 鸡尾酒会问题