机器学习学习笔记（一）——什么是机器学习

1 什么是机器学习

学习：获取技术，从观察中积累得到经验
观察 -> 学习 -> 技巧

机器学习：获取技术，从数据中积累/计算得到经验
数据 -> 机器学习 -> 技巧

所以到底什么是技巧呢？

技巧 <-> 增进某一种表现（比如：预测的精确度）

机器学习：增进某一种表现，从数据中积累/计算得到经验
数据 -> 机器学习 -> 增进某一种表现

机器学习：让机器自己学习

简单来说，就是两大原因：

一些应用场景：

相当于对电脑“授之以渔，而非授之以鱼”

以上三个要素都有，才有可能使用机器学习

银行要不要发信用卡给某个顾客

顾客资料：

抽象化：

总结下来就是：
$${(x_n,y_n)} ; from ; f \to \fbox{ML} \to g$$

更详细的流程：
Learning Flow for Credit Approval
从左上角开始，理想公式 f 产生资料（这个过程是不知道的），把资料喂给机器学习演算法（机器学习的核心），最后机器学习告诉我们结果（我们希望 g 和 f 越像越好）
需要强调的两件事：

换句话说，我们把可能的 g 放在一个集合中，由机器学习演算法挑选出最合适的 g。如下图：
The Learning Model
所以机器学习演算法有两个输入：资料和候选的 g
机器学习模型 = A + H

对机器学习更具体的定义：
Practical Definition of Machine Learning
从资料出发，由机器学习演算法算出假说 g，我们希望 g 很接近 f

机器学习（Machine Learning，ML）：希望用资料找出一个假说 g 与目标 f 很像
数据挖掘（Data Learning，DL）：希望用（非常大量的）资料找出一些有趣有用的事情

所以，如果“有趣有用的事情”和那个“g”一样，那么 ML = DL
如果“有趣有用的事情”和那个“g”相关，那么 ML 和 DL 可以互相帮助

通常，传统意义上的数据挖掘希望在非常大量的资料中进行非常有效地计算

机器学习（Machine Learning，ML）：希望用资料找出一个假说 g 与目标 f 很像
人工智能（Artificial Intelligence，AI）：希望电脑做出一些智能行为

机器学习找出 g，可以进行预测，这是一个很智能的行为，从这个角度来说，ML 是实现 AI 的一种方法

机器学习（Machine Learning，ML）：希望用资料找出一个假说 g 与目标 f 很像
统计（Statistics）：用资料做一些本来不知道的推论

g 是一个推论，f 是一个不知道的东西，从这个角度来说，统计是实现 ML 的一种方法

统计更重视数学