机器学习定义:
1、在没有明确设置的情况下,使计算机具有学习能力的研究领域(Arthur Samuel 1959, 跳棋游戏)
2、一个适当的学习问题定义如下,计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过 P测定在T上的表现因经验E而提高(Tom Mitchell 1998)
机器学习算法:
监督学习、无监督学习(最常用的两种)
强化学习、推荐系统
监督学习:
给算法一个数据集,其中包含了正确答案,算法的目的是给出更多正确答案
连续值:回归问题,即选择合适的函数拟合数据
离散值:分类问题,可能输出多个结果
无监督学习
给算法一个数据集,其中不包含标签信息或者标签相同,算法的目的是找到其中的某种结构
聚类算法:根据数据的分布特征,将数据分成不同的簇
应用:google新闻、基因组学、组织大型计算机集群、社交网络、市场划分、天文数据分析等
鸡尾酒会算法:从混合音频源中分离音频