内容简介
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的*有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。本书系统地介绍了数据分析的统计理论基础内容,共5章。第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析的,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形的功能及使用场景。
本书以数据分析的统计理论基础为主题,大多数知识点都列举了生活中的实用案例,适合高等院校学生、公司职员、个体商户和企业管理者学习参考。《游戏数据分析实战》的特色是以详细案例为主,通过SPSS、Excel等工具逐步展示实施步骤。通过手把手的方式让读者快速掌握游戏数据分析方法。
作者简介:
谢运恩微信公众号“SPSS生活统计学”创建者,资深数据分析师,拥有多年的统计教育和数据分析咨询经验,尤其擅长数据分析技术在传统行业的落地实施。
李安富
微信公众号“SPSS生活统计学”创建者,国内知名大学统计学专业教师,资深数据分析师,擅长将枯燥无味的统计公式用诙谐幽默的方式教授给学生。
目 录:
第1章生活在数据时代
1.1 数据分析无处不在
1.1.1 常用的国家统计指标
1.1.2 制造业的数据分析应用
1.1.3 营销领域的数据分析应用
1.1.4 医疗行业的数据分析应用
1.2 人人都能成为数据分析师
1.2.1 数据分析过程
1.2.2 数据分析工具
1.2.3 数据分析师的成长之路
第2章
耳熟能详的数据你真的了解吗
2.1 数据的类型
2.1.1 数据的结构属性分类
2.1.2 数据的连续性特征分类
2.1.3 数据的测量尺度分类
2.2 数据描述的三个维度
2.3 数据的集中趋势描述
2.3.1 算术平均值
生活案例:使用算术平均值了解公司的待遇水平
2.3.2 几何平均值
生活案例:使用几何平均数识别生产线上的隐形损耗
2.3.3 众数
生活案例:使用众数制订服装企业的生产计划
2.3.4 中位数
生活案例:使用中位数识破招聘启事的工资陷阱
2.4 数据的离散程度描述
2.4.1 极差
生活案例:使用极差描述气温的变化幅度
2.4.2 平均偏差
生活案例:使用平均偏差评价生产线的稳定性
2.4.3 方差和标准差
生活案例:使用标准差(方差)提高巧克力生产线的工艺水平
2.4.4 变异系数
生活案例:使用变异系数客观评定员工绩效
2.4.5 四分位极差
2.5 数据的分布形态描述
2.5.1 概率
生活案例:概率是赌场老板制定游戏规则的法宝
2.5.2 概率分布
2.5.3 离散型概率分布:二项分布
生活案例:产品抽检的二项分布应用
2.5.4 离散型概率分布:多项分布
生活案例:预测足球比赛结果的多项分布应用
2.5.5 离散型概率分布:超几何分布
生活案例:超市抽奖活动的超几何分布概率
2.5.6 离散型概率分布:泊松分布
生活案例:使用泊松分布进行杂货店的库存管理
生活案例:使用二项分布和泊松分布分析准备的试卷数量是否足够
2.5.7 连续型概率分布:指数分布
生活案例:指数分布告诉你,为什么电子产品只保修三年
2.5.8 连续型概率分布:均匀分布
生活案例:使用均匀分布分析家具物流的送货时间
2.5.9 连续型概率分布:正态分布
生活案例:使用正态分布分析研究生毕业论文的完成时间
生活案例:使用峰度与偏度检验政府精准扶贫效果
2.5.10 正态分布作为二项分布近似
生活案例:使用正态分布和二项分布分析足球比赛的猜边概率
2.5.11 正态分布作为泊松分布近似
生活案例:使用正态分布和泊松分布分析民营电缆厂的良品率
第3章
数据分析的“内核”:推断分析
3.1 见微知着的抽样
3.1.1 抽样的意义
3.1.2 抽样方法
3.1.3 样本推断的理论基础
3.2 数据的处理
3.2.1 数据处理的不良案例
3.2.2 正确的数据存储形式
3.3 样本到总体的桥梁:抽样分布
3.3.1 抽样分布的定义
3.3.2 Z分布
3.3.3 T分布
3.3.4 切比雪夫定理
3.3.5 卡方分布
3.3.6 F分布
3.4 数据分析的第一板“斧”:参数估计
3.4.1 参数估计的类型
3.4.2 Z分布与总体均值的区间估计
生活案例:估算西部儿童看电视时间的置信区间
生活案例:估算大学生每日体育锻炼时间的置信区间
生活案例:购买保险公司产品的消费者年龄置信区间
3.4.3 T分布与总体均值的区间估计
生活案例:酱料厂罐装产品重量的置信区间
3.4.4 切比雪夫定理与总体均值的区间估计
生活案例:心脏搭桥手术后,患者住院时间的置信区间
3.4.5 卡方分布与总体方差的区间估计
生活案例:使用T分布和Z分布分析食品包装上的营养成分表
3.4.6 F分布与两个总体方差比的区间估计
生活案例:比较不同超市的电子秤精度
3.4.7 两个总体均值差的区间估计
生活案例:比较水稻新品种在不同地区的产量
生活案例:比较不同睡眠时间对记忆力的影响
生活案例:研究新药对睡眠质量的影响
生活案例:比较两家航空公司的起飞延误时间
生活案例:蒲公英的降脂作用
3.4.8 总体比率的区间估计
生活案例:移动支付的普及程度调查
3.4.9 样本容量的确定
生活案例:管理制药厂的供应商
生活案例:出口苹果的重量控制
生活案例:电视节目的收视率调查
3.5 数据分析的第二板“斧”:假设检验
3.5.1 假设检验的理论基础
3.5.2 单样本的假设检验
生活案例:使用单样本Z检验分析笔记本电池的续航能力改进效果
生活案例:使用单样本T检验分析新型麻醉剂的麻醉效果
生活案例:使用卡方检验管理饮料工厂的产品质量
3.5.3 两样本的假设检验
生活案例:机场对不同航空公司航班的起飞时间管理
生活案例:新药的临床实验
生活案例:新药的副作用研究
生活案例:自动化生产线的工艺调整
3.5.4 多样本的假设检验与方差分析
生活案例:使用单因素方差分析研究新水稻品种的性状
生活案例:使用无交互两因素方差分析研究员工的绩效管理方式
生活案例:使用有交互两因素方差分析研究员工绩效的管理方式
3.6 数据分析的第三板“斧”:非参数检验
3.6.1 非参数检验
3.6.2 卡方检验
生活案例:使用卡方检验分析讲座的到场人数是否存在异常波动
生活案例:使用卡方检验分析不同年龄人群对汽车颜色的喜好
3.6.3 Wilcoxon符号秩检验
生活案例:使用Wilcoxon符号秩检验分析职业影评人的打分差异
第4章
数据分析的终极目的:“为我所用”
4.1 “相关”是继续分析的前提
4.1.1 相关关系
4.1.2 相关分析
生活案例:使用相关分析理解“总理指数”
生活案例:使用偏相关分析研究上网时间是否真的影响学习成绩
生活案例:使用距离相关分析研究汽车的性价比
4.2 “回归”是相关分析的归宿
4.2.1 回归分析综述
4.2.2 简单线性回归分析
生活案例:简单线性回归分析用于货运总量预测国内生产总值
生活案例:货运总量预测国内生产总值的置信区间
生活案例:货运总量与国内生产总值回归模型的效果检验
4.2.3 多元线性回归分析
生活案例:使用多元线性回归分析优化快递业务员的路线
4.3 发现事物随时间变化的规律
4.3.1 时间序列分析综述
4.3.2 长期趋势分析
生活案例:使用移动平均法预测玩具公司的销售量
生活案例:使用加权移动平均法预测玩具公司的销售量
生活案例:使用指数平滑法预测玩具公司的销售量
生活案例:使用指数平滑法预测玩具公司的销售量
生活案例:使用回归方程法预测创业公司的销售额
4.3.3 季节变动趋势分析
生活案例:创业公司销售额的季节变动趋势分析
4.3.4 循环变动和不规则变动
生活案例:公司销售量的循环变动分析
4.3.5 时间序列分析应用
第5章
给数据披上靓丽“外衣”:数据可视化
5.1 数据的可视化
5.1.1 数据可视化工具
5.1.2 常用的统计图
5.2 条形图、直方图和饼图
5.2.1 条形图
5.2.2 直方图
5.2.3 饼图
5.3 线图与面积图
5.3.1 线图
5.3.2 面积图
5.4 散点图
5.5 高低图与箱线图
5.5.1 高低图
5.5.2 箱线图
5.6 时间序列图
5.7 帕累托图
5.8 P-P概率图和Q-Q概率图
5.8.1 P-P概率图
5.8.2 Q-Q概率图
《人人都会数据分析——从生活实例学统计》文字版电子书[PDF]