程序员的AI书:从代码开始
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1 机器学习简介

机器学习主要有三大类别:监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)、增强学习(Reinforcement Learning),下面对这三大类别进行简要介绍。

1.监督学习

监督学习是机器学习中应用最广泛也最可靠的技术。简单来说,监督学习的目的就是通过标注好的数据进行模型训练,从而期望利用训练好的模型对新的数据进行预测或分类。在这里,“监督”(Supervised)这个词意味着我们已经有标注好的已知数据集。

监督学习的应用场景非常广泛,常见的垃圾邮件过滤、房价预测、图片分类等都是适合它的领域,但其最大弱点就是需要大量标注数据,前期投入成本极高。

2.无监督学习

相对于需要大量标注数据的监督学习,无监督学习无须标注数据就能达到某个目标。注意,并不是所有场景都适合采用无监督学习,无监督学习经常被用于以下两方面。

◎ 聚类(Clustering):在聚类场景下使用无监督学习的频率可能是最高的。例如给出一堆图片,把相似的图片划分在一起。我们既可以预设一个类别总数进行自动划分(即半监督学习,Semi-supervised);也可以预设一个差异阈值,然后对所有图片进行自动聚类。

◎ 降维(Dimensionality Reduction):在数据特征过多、维度过高时,我们通常需要把高维数据降到合理的低维空间处理,并期望保留最重要的特征数据。主成分分析(Principal Component Analysis,PCA)就是其中最为常见的算法应用。

3.增强学习

无论是监督学习还是无监督学习,其训练基础都来源于数据本身。而增强学习最大的特点就是需要与环境有某种互动关系,这也促使人们在增强学习的研究中利用类似电子游戏的环境来模拟互动并进行AI训练。例如,DeepMind在2015年提出的利用DQN学习ATARI游戏的操作,以及OpenAI的Gym等。

增强学习的实现和应用场景比较特殊,尽管某些大型公司已经在推荐系统、动态定价等场景中尝试应用增强学习,但仍只限于实验性质,有兴趣的读者可以自行阅读其他资料进行学习,在本书中不对增强学习进行讲解。