【卡方公式是什么】卡方检验是一种常用的统计学方法,用于判断实际观测值与理论期望值之间的差异是否具有统计显著性。它常用于分类数据的分析,比如检验两个变量之间是否存在关联、或者检验样本分布是否符合某种理论分布。
卡方公式是卡方检验的核心,其基本形式如下:
$$
\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}
$$
其中:
- $ O_i $ 表示第 $ i $ 个类别的实际观测频数;
- $ E_i $ 表示第 $ i $ 个类别的理论期望频数;
- $ \sum $ 表示对所有类别进行求和。
通过计算卡方值,并将其与卡方分布表中的临界值比较,可以判断差异是否具有统计意义。
卡方公式总结
项目 | 内容 |
公式名称 | 卡方公式(Chi-square formula) |
公式表达式 | $ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} $ |
适用场景 | 分类数据的独立性检验、拟合优度检验等 |
主要用途 | 判断实际观测值与理论值之间是否存在显著差异 |
输入数据 | 实际观测频数、理论期望频数 |
输出结果 | 卡方统计量(χ²值) |
判断依据 | 与卡方分布表对比,判断是否拒绝原假设 |
卡方公式的应用举例
假设我们想检验一个骰子是否公平,进行了60次投掷,得到以下结果:
面数 | 实际观测频数(O) | 理论期望频数(E) |
1 | 12 | 10 |
2 | 8 | 10 |
3 | 10 | 10 |
4 | 11 | 10 |
5 | 9 | 10 |
6 | 10 | 10 |
根据卡方公式计算:
$$
\chi^2 = \frac{(12-10)^2}{10} + \frac{(8-10)^2}{10} + \frac{(10-10)^2}{10} + \frac{(11-10)^2}{10} + \frac{(9-10)^2}{10} + \frac{(10-10)^2}{10}
= \frac{4}{10} + \frac{4}{10} + 0 + \frac{1}{10} + \frac{1}{10} + 0 = 0.4 + 0.4 + 0.1 + 0.1 = 1.0
$$
然后查卡方分布表,自由度为5(6个面减1),在显著性水平为0.05时,临界值为11.07。因为1.0 < 11.07,所以不能拒绝原假设,即骰子是公平的。
小结
卡方公式是统计学中一种重要的工具,用于分析分类数据的分布情况。通过计算实际观测值与理论期望值之间的差异,帮助我们判断数据是否符合预期模型或是否存在显著关系。掌握卡方公式的使用,有助于在实际研究中做出更科学的结论。