统计学基础:从数据收集到推断与分析方法
该思维导图概述了《统计学基础》的核心内容,包括统计学的定义、数据类型、基本概念,如总体与样本、参数与统计量等。还讨论了数据收集方法、误差类型,以及数据整理与描述统计的技术。统计推断部分涵盖了参数估计和假设检验,介绍了核心定理。最后,涵盖了概率分布及分析方法,如相关分析和方差分析(ANOVA),强调了统计学在数据分析中的重要性与应用。
源码
# 统计学基础
- 统计学概述
- 统计学的定义
- 目标
- 描述现有数据(描述统计)
- 推断未知数据(统计推断)
- 分类
- 描述统计
- 数据整理
- 图表展示
- 集中趋势与离散趋势分析
- 推断统计
- 参数估计
- 假设检验
- 预测总体特征
- 数据类型
- 按计量尺度
- 分类数据
- 无序(如性别)
- 顺序数据
- 有序(如学历)
- 数值型数据
- 连续(如身高)
- 离散(如温度)
- 按收集方式
- 观测数据
- 自然状态下收集
- 实验数据
- 控制变量下收集(如A/B测试)
- 基本概念
- 总体与样本
- 总体
- 研究对象的全体
- 样本
- 总体中抽取的代表性部分
- 参数与统计量
- 参数
- 描述总体特征的指标(如总体均值μ)
- 统计量
- 描述样本特征的指标(如样本均值X̄)
- 变量与标志
- 变量
- 可变的数值特征(如销售额)
- 品质标志
- 文字描述
- 数量标志
- 数值表现
- 数据收集与误差
- 调查方法
- 全面调查
- 普查(如人口普查)
- 非全面调查
- 抽样调查
- 概率抽样
- 简单随机抽样
- 分层抽样
- 整群抽样
- 重点调查
- 选择关键单位
- 典型调查
- 选取代表性单位
- 误差类型
- 抽样误差
- 由随机抽样引起
- 可通过增加样本量减小
- 非抽样误差
- 调查设计错误
- 回答偏差
- 测量误差
- 需通过质量控制减少
- 数据整理与描述统计
- 数据整理
- 频数分布
- 组距
- 组中值
- 直方图
- 累计频数分布
- 卵形线
- 百分率累计
- 集中趋势
- 均值
- 算术均值
- 几何均值
- 调和均值
- 中位数
- 偶数个数据取中间均值
- 众数
- 出现频率最高的值
- 离散趋势
- 极差
- 最大值 - 最小值
- 方差与标准差
- 衡量数据分散程度
- 离散系数
- σ/μ
- 用于不同均值数据比较
- 统计推断
- 参数估计
- 点估计
- 直接使用样本统计量估计总体参数(如X̄估计μ)
- 区间估计
- 置信区间公式
- 基于Z分布或t分布
- 95%置信度对应Z=1.96
- t值依自由度调整
- 假设检验
- 步骤
- 提出原假设H0与备择假设H1
- 选择检验统计量
- Z
- t
- 卡方等
- 计算P值并与显著性水平α比较
- 错误类型
- 第一类错误
- 弃真
- 第二类错误
- 取伪
- 核心定理
- 大数定律
- 样本量越大,样本均值趋近总体均值
- 中心极限定理
- 样本均值的分布趋近正态分布
图片
