秋招的竞争一年比一年激烈,尤其是算法和数据分析岗位,公司的笔试和面试题也涉及大量知识点,从微积分,线性代数,概率论,信息论到深度学习,基础算法编程题。考题也十分多样化,难以预测。小七直到现在仍旧没有拿到任何一家公司的 offer。
概率论与数理统计作为算法/数据分析岗位必备的数学基础知识,几乎是各大场笔试 / 面试的必考范围。本系列文章将系统总结这方面的例题和常考知识点。
贝叶斯定理贝叶斯定理的内容十分简单:

P(A) 为先验概率,这个公式可以理解为是在计算:当 B 条件已知时,原本的先验概率 P(A) 会发生什么样的变化。
贝叶斯定理的考题通常比较固定,下面是今年(2019年)拼多多 学霸批数据分析笔试题,也是一道典型的贝叶斯定理考题:
求解这类问题时,先把已知条件和要求的结果用数学形式表达出来:
之后将需要求解的条件概率 P(B|C) 用贝叶斯公式展开:
最后将已知条件带入求解,在求底数(这里是 P(C))时通常会使用全概率公式展开:
二项分布和多项分布
n 重伯努利实验,以得到 1 的次数为随机变量,该随机变量服从二项分布。在二项分布中,每次独立重复实验的结果只能为两个(即为伯努利试验),多项分布是二项分布的推广,每次独立重复实验的结果可以为 m 个。
二项分布(多项分布)在笔试中常考,但是要和超几何分布的问题区分清楚。在二项分布(多项分布)中,每次实验必须是相互独立的,对应在题目中:
如果每次任取之后不放回,则服从超几何分布。
另外,服从二项分布(多项分布)还需要每次实验的结果互斥,且概率和为 1。一般情况下,题目中都会暗含这些条件。
下面看一道二项分布的经典笔试题。
首先每次取出的球的颜色只能为两种情况:红色或蓝色。即单次实验为伯努利实验,且题目中提示为有放回抽取,实验相互独立。因此服从二项分布。
二项分布的公式如下:
这道题的求解过程如下:
二项分布的公式可以这样理解:一红一蓝同时发生,即 (2/3)(1/3),另外有先抽出红球在抽出蓝球和弦抽出蓝球再抽出红球两种情况,不妨理解为从两个位置里选一个位置放红球,即 C(2, 1)。
再来看一个多项分布的例子:
多项分布的公式如下:
这道题求解过程如下:
多项分布公式的理解和二项分布非常相似,即一种特定顺序的情况发生的概率乘以可能的顺序数。
下面这道题相对更加复杂。
求解过程如下:
本文介绍了概率论与数理统计中,贝叶斯定理、二项分布、多项分布的知识点和例题,对于多项分布而言,每次抽取都是有放回的。然而在笔试题中,经常会遇到无放回的情况(比如一次抽取多个工厂车间零件),这类问题如何求解呢?
在下一节中,我们将详细总结概率论中其他笔试面试常考的 离散分布,和典型的 连续分布。
概率论的常考内容中,除了经典的离散分布,连续分布以及相关性质,还包括了 数学期望、方差 等基本概念;
统计学中, 参数估计 和 假设检验 经常容易出现。参数估计中,对点估计和区间估计的理解,MLE 和 MAP 的区别;假设检验中 t-test,f-test,p value 等都是常考点。
另外,由于概率论与数理统计和机器学习算法之间的密切关系,二者也经常被一起问到。面试算法 / 数据分析岗位的小伙伴们赶紧准备起来吧!
本文作者:宫业奇
著作权归力扣(LeetCode)所有,如需转载请联系。