Python贝叶斯分析(第2版)
上QQ阅读APP看书,第一时间看更新

1.1.2 贝叶斯建模

模型是对给定系统或过程的一种简化描述。这些描述只关注系统中某些重要的部分,因此,大多数模型的目的并不是解释整个系统。这也是为什么更复杂的模型并非总是更好的模型。

模型分为很多种,本书主要关注贝叶斯模型。贝叶斯建模过程可以总结为以下3步。

(1)给定一些数据以及这些数据是如何生成的假设,然后通过组合一些概率分布来设计模型。大多数情况下,这些模型是粗略的近似,不过正是我们所需要的。

(2)根据贝叶斯定理将数据添加到模型里,然后把数据和假设结合起来推导出逻辑结果,这就是根据数据调整模型。

(3)检查模型是否有意义可以依据不同的标准,包括数据、我们在这方面的专业知识,有时还通过比较几个模型来评价模型。

通常,实际的建模过程并非是严格按照这3个步骤的顺序进行的。我们会在一些特定点重复这些步骤:可能是犯了一个愚蠢的编程错误,也可能是找到了某种改进模型的方法,又或者是需要增加更多的数据或收集不同的数据集。

贝叶斯模型是基于概率构建的,因此也称作概率模型。为什么基于概率呢?因为概率这个数学工具能够很好地模拟不确定性,接下来让我们进一步了解概率这个工具。