统计学核心概念:大数定律、中心极限定理及参数估计

该思维导图总结了统计学核心概念,包括大数定律(弱大数定律和强大数定律)、中心极限定理及其数学表达。 它进一步阐述了统计量(样本均值、方差、标准差)和抽样分布(t分布、卡方分布、F分布)。 最后,概述了参数估计中的点估计(最大似然估计)和区间估计(置信区间),并强调理论与实践结合、数据批判性思维和选择合适统计方法的重要性。

源码
# 统计学核心概念
## 大数定律与中心极限定理
### 大数定律
- **弱大数定律** 
  - 定义与条件
    - 独立同分布随机变量
    - 有限期望 \(\mu\) 和方差 \(\sigma^2\)
  - 结果
    - 样本均值
      - 概率收敛于总体均值 \(\mu\)
      - \[
      \lim_{n \to \infty} P\left( \left| \overline{X}_n - \mu \right| < \epsilon \right) = 1 \quad \text{for any } \epsilon > 0
      \]
- **强大数定律** 
  - 定义与条件
    - 独立同分布随机变量
  - 结果
    - 几乎必然收敛
      - \[
      \overline{X}_n \xrightarrow{\text{a.s.}} \mu \quad \text{as } n \to \infty
      \]
### 中心极限定理
- 定义与条件
  - 独立同分布随机变量
  - 均值 \(\mu\) 和方差 \(\sigma^2\)
- 结果
  - 标准化样本均值
    - 趋近于标准正态分布
    - \[
    \frac{\overline{X}_n - \mu}{\sigma / \sqrt{n}} \xrightarrow{d} N(0, 1) \quad \text{as } n \to \infty
    \]
## 统计量及抽样分布
### 统计量
- **样本均值** 
  - 定义
    - \(\overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i\)
- **样本方差** 
  - 定义
    - \(S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2\)
- **样本标准差** 
  - 定义
    - \(S = \sqrt{S^2}\)
### 抽样分布
- **t分布** 
  - 使用条件
    - 样本量小且总体标准差未知
  - 统计量
    - \(T = \frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t_{n-1}\)
- **卡方分布** 
  - 定义
    - 样本方差的标准化形式
  - 统计量
    - \(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2_{n-1}\)
- **F分布** 
  - 定义
    - 两个样本方差的比值
  - 统计量
    - \(\frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F_{n_1-1, n_2-1}\)
## 参数估计
### 点估计
- **最大似然估计(MLE)** 
  - 方法
    - 通过最大化似然函数估计参数
    - \(\hat{\theta}_{MLE} = \arg \max_{\theta} L(\theta; x_1, x_2, \ldots, x_n)\)
### 区间估计
- **置信区间** 
  - 定义
    - 基于样本统计量构建的区间
  - 计算
    - \[
    \text{CI}_{\mu} = \overline{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}
    \]
## 自我学习总结与反思
- 理论与实践
  - 结合的重要性
- 数据的理解
  - 样本数据如何反映总体特征
- 信息提取
  - 从样本数据进行统计推断
- 参数估计
  - 理论应用
- 公式理解
  - 理解和记忆与背后逻辑
- 数据批判性思考
  - 重要性与合理假设
- 统计方法选择
  - 解决复杂问题的
图片
统计学核心概念:大数定律、中心极限定理及参数估计