在日常生活和各个领域中,我们经常会遇到一些具有“成功”或“失败”两种结果的随机试验。比如抛硬币,结果要么是正面(成功),要么是反面(失败);检查产品质量,要么是合格(成功),要么是不合格(失败)。二项分布就是专门用来描述这类只有两种可能结果的独立重复试验的概率分布模型。掌握二项分布的计算和应用,对于我们理解和解决许多实际问题具有重要意义。
二项分布是一种离散概率分布,它描述了在 $n$ 次独立重复的伯努利试验中,成功的次数 $X$ 的概率分布。这里的伯努利试验是指每次试验只有两种可能结果(通常称为“成功”和“失败”),且每次试验中成功的概率 $p$ 保持不变,失败的概率为 $q = 1 - p$。
若随机变量 $X$ 服从参数为 $n$ 和 $p$ 的二项分布,记为 $X \sim B(n, p)$,则 $X$ 取值为 $k$($k = 0, 1, 2, \cdots, n$)的概率计算公式为:
[P(X = k) = C{n}^{k}p^{k}(1 - p)^{n - k}]
其中,$C{n}^{k}=\frac{n!}{k!(n - k)!}$ 表示从 $n$ 个不同元素中取出 $k$ 个元素的组合数。
若 $X \sim B(n, p)$,则 $X$ 的期望 $E(X) = np$,方差 $D(X) = np(1 - p)$。期望表示在 $n$ 次试验中成功的平均次数,方差反映了成功次数相对于期望的离散程度。
假设我们抛一枚均匀的硬币 5 次,求恰好出现 3 次正面的概率。
这里 $n = 5$,$p = 0.5$,$k = 3$。
首先计算组合数 $C{5}^{3}=\frac{5!}{3!(5 - 3)!}=\frac{5\times4\times3!}{3!\times2\times1}=10$。
然后根据二项分布公式可得:
[P(X = 3) = C{5}^{3} \times 0.5^{3} \times (1 - 0.5)^{5 - 3}=10\times0.125\times0.25 = 0.3125]
在 R 语言中,有专门的函数来计算二项分布的概率。
# 计算恰好出现 3 次正面的概率
dbinom(3, size = 5, prob = 0.5)
# 计算出现正面次数小于等于 3 的概率
pbinom(3, size = 5, prob = 0.5)
# 生成 10 个服从二项分布 B(5, 0.5) 的随机数
rbinom(10, size = 5, prob = 0.5)
在上述代码中:
dbinom(k, size = n, prob = p)
用于计算 $P(X = k)$;pbinom(k, size = n, prob = p)
用于计算 $P(X \leq k)$;rbinom(m, size = n, prob = p)
用于生成 $m$ 个服从二项分布 $B(n, p)$ 的随机数。某工厂生产的产品合格率为 0.9,现随机抽取 10 件产品进行检测,求至少有 8 件合格的概率。
# 至少有 8 件合格的概率等于 8 件合格、9 件合格和 10 件合格的概率之和
prob <- 1 - pbinom(7, size = 10, prob = 0.9)
prob
某种疾病的诊断准确率为 0.8,现在对 20 个疑似患者进行诊断,求诊断正确的人数在 15 到 18 之间的概率。
# 诊断正确的人数在 15 到 18 之间的概率
prob <- pbinom(18, size = 20, prob = 0.8) - pbinom(14, size = 20, prob = 0.8)
prob
概念 | 描述 | 公式 |
---|---|---|
二项分布定义 | $n$ 次独立重复伯努利试验中成功次数的概率分布 | $X \sim B(n, p)$ |
概率计算公式 | $X$ 取值为 $k$ 的概率 | $P(X = k) = C_{n}^{k}p^{k}(1 - p)^{n - k}$ |
期望 | $n$ 次试验中成功的平均次数 | $E(X) = np$ |
方差 | 成功次数相对于期望的离散程度 | $D(X) = np(1 - p)$ |
R 语言函数 | 计算概率和生成随机数 | dbinom 、pbinom 、rbinom |
二项分布在实际生活中有广泛的应用,通过掌握其计算方法和性质,我们可以解决许多与“成功 - 失败”试验相关的概率问题。希望本文能帮助你更好地理解和应用二项分布。