图书介绍

缺失数据的灵活填补方法 英文影印注释版【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

缺失数据的灵活填补方法 英文影印注释版
  • (荷)史蒂夫·范·布伦著;刘俊,夏爱生,索文莉,鞠涛注释 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111584162
  • 出版时间:2018
  • 标注页数:316页
  • 文件大小:45MB
  • 文件页数:357页
  • 主题词:统计数据-数据处理-高等学校-教材-英文

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

缺失数据的灵活填补方法 英文影印注释版PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第Ⅰ部分 基础篇1

1 概述3

1.1 数据缺失问题3

1.1.1 现行的方法3

1.1.2 关于缺失数据的观点变化5

1.2 关于MCAR、MAR和MNAR的概念6

1.3 并不总奏效的简单方法8

1.3.1 个案剔除法8

1.3.2 成对剔除法9

1.3.3 均值替代法10

1.3.4 回归替代法11

1.3.5 随机回归替代法13

1.3.6 LOCF和BOFC方法14

1.3.7 示性变量法15

1.3.8 小结15

1.4 多元数据填补简述16

1.4.1 步骤16

1.4.2 采用多元填补的原因17

1.4.3 案例18

1.5 本书的目的20

1.6 本书未涵盖的内容20

1.6.1 预防方法21

1.6.2 权重程序21

1.6.3 基于似然的处理方法22

1.7 本书的结构23

1.8 练习23

2 多元填补25

2.1 多元填补的历史25

2.1.1 数据填补25

2.1.2 多元数据填补25

2.1.3 延伸文献27

2.2 不完整数据的概念28

2.2.1 关于不完整数据的观点28

2.2.2 数据缺失的原因29

2.2.3 本书采用的符号(系统)30

2.2.4 关于MCAR、MAR和MNAR31

2.2.5 可忽略性与不可忽略性33

2.2.6 忽略的内在含义34

2.3 采用多元填补的理由和时机35

2.3.1 多元填补的目的35

2.3.2 变量的三个来源36

2.3.3 适宜性填补38

2.3.4 填补模型的领域40

2.3.5 方差比率41

2.3.6 自由度42

2.3.7 数值的例子43

2.4 统计区间与检验44

2.4.1 梯度推断与多参数推断的抉择44

2.4.2 梯度推断44

2.5 评价标准45

2.5.1 数据填补并非预测45

2.5.2 仿真设计与效能检测47

2.6 何时采用多元填补48

2.7 填补多少?49

2.8 练习51

3 单变量缺失数据53

3.1 如何生成多元填补53

3.1.1 预测方法55

3.1.2 预测+干扰方法55

3.1.3 预测+干扰+参数不确定性55

3.1.4 第二类预测56

3.1.5 观测数据的图像56

3.1.6 结论56

3.2 正态线性分布下的数据填补57

3.2.1 概述57

3.2.2 算法57

3.2.3 运行结果59

3.2.4 生成MAR型缺失数据63

3.2.5 结论64

3.3 非正态分布下的数据填补65

3.3.1 概述65

3.3.2 t-分布下的数据填补66

3.3.3 案例67

3.4 预测性均值匹配68

3.4.1 概述68

3.4.2 计算详述70

3.4.3 算法73

3.4.4 结论74

3.5 数据分类75

3.5.1 概述75

3.5.2 完美预测76

3.6 其他数据类型78

3.6.1 计数数据78

3.6.2 半连续数据79

3.6.3 被删除的、删节的和被四舍五入的数据79

3.7 分类与回归树82

3.7.1 概述82

3.7.2 基于CART模型的填补83

3.8 多层级数据84

3.8.1 概述84

3.8.2 线性多层级模型的两个公式85

3.8.3 计算86

3.8.4 结论87

3.9 不可忽略的缺失数据88

3.9.1 概述88

3.9.2 模型选取89

3.9.3 模式混合模型90

3.9.4 转换选择和模式混合模型90

3.9.4 灵敏度分析92

3.9.6 灵敏度分析的作用93

3.10 练习93

4 多变量缺失数据95

4.1 缺失数据类型95

4.1.1 概述95

4.1.2 概括统计96

4.1.3 流入与流出99

4.2 多元填补中的问题101

4.3 单调数据填补102

4.3.1 概述102

4.3.2 算法103

4.4 联合建模105

4.4.1 概述105

4.4.2 连续数据105

4.4.3 分类数据107

4.5 充分条件详述108

4.5.1 概述108

4.5.2 MICE算法109

4.5.3 性能111

4.5.4 兼容性111

4.5.5 循环数量112

4.5.6 慢速收敛案例113

4.6 FCS与JM116

4.6.1 FCS和JM的联系116

4.6.2 比较117

4.6.3 演示117

4.7 结论121

4.8 练习121

5 数据填补实践123

5.1 模型选取概述123

5.2 可否忽略的判别125

5.3 模型形式和预测126

5.3.1 模型形式126

5.3.2 预测127

5.4 衍生变量129

5.4.1 变量比率129

5.4.2 总分数132

5.4.3 交互期133

5.4.4 条件填补133

5.4.5 成分数据136

5.4.6 二次关联139

5.5 算法选择140

5.5.1 访问序列140

5.5.2 收敛性142

5.6 诊断学146

5.6.1 模型适宜性与分布差异146

5.6.2 诊断图146

5.7 结论151

5.8 练习152

6 填补数据分析153

6.1 如何处理填补数据153

6.1.1 均值与求和153

6.1.2 重复性分析154

6.2 参数共用155

6.2.1 正态量的数值推断155

6.2.2 非正太量的数值推断155

6.3 多元数据填补的正态检验156

6.3.1 Wald检验157

6.3.2 似然比检验157

6.3.3 χ2一检验159

6.3.4 模型参数的习惯假设检验159

6.3.5 计算160

6.4 逐步回归模型的选取162

6.4.1 变量选取技巧162

6.4.2 计算163

6.4.3 模型优化164

6.5 结论166

6.6 练习166

第Ⅱ部分 案例分析169

7 测量171

7.1 太多列问题171

7.1.1 科学问题172

7.1.2 莱顿85+军队172

7.1.3 数据探查173

7.1.4 外流通量175

7.1.5 已记录事件176

7.1.6 大批量数据的快速预测选取177

7.1.7 生成填补179

7.1.8 进一步改进:作为预测变量而存在180

7.1.9 一些建议181

7.2 灵敏度分析182

7.2.1 缺失数据的成因及后果182

7.2.2 情景184

7.2.3 δ-修正下的数据填补生成185

7.2.4 完整数据分析186

7.2.5 结论187

7.3 自报数据的普遍正确估计188

7.3.1 问题描述188

7.3.2 基于预测计数的不适宜性189

7.3.3 主要观点190

7.3.4 数据191

7.3.5 应用192

7.3.6 结论193

7.4 提升可比性194

7.4.1 问题描述194

7.4.2 完全相关:简单等同195

7.4.3 独立:无桥接的填补196

7.4.4 完全独立或相关的判别198

7.4.5 基于桥接的填补199

7.4.6 说明202

7.4.7 结论203

7.5 练习204

8 选择205

8.1 所选数据缺失点的修正205

8.1.1 连续19年的POPS研究205

8.1.2 数据缺失点的特征化206

8.1.3 填补模型207

8.1.4 退化选择208

8.1.5 更佳选择210

8.1.6 结果211

8.1.7 结论211

8.2 无感应修正212

8.2.1 第五次荷兰人口增长研究212

8.2.2 无响应213

8.2.3 与已知人口总体数值的比较213

8.2.4 样本扩充214

8.2.5 填补模型215

8.2.6 无响应对最终高度的影响217

8.2.7 讨论218

8.3 练习219

9 纵向数据221

9.1 长宽格式221

9.2 SE烟花造成灾难的研究223

9.2.1 处理意义224

9.2.2 填补模型225

9.2.3 检验性填补227

9.2.4 完整数据分析228

9.2.5 完整数据分析结果229

9.3 时间栅格填补230

9.3.1 改变分数231

9.3.2 科学问题:关键阶段232

9.3.3 碎棒模型234

9.3.4 Temeuzen出生群236

9.3.5 收缩与分数改变237

9.3.6 填补238

9.3.7 完整数据分析240

9.4 结论242

9.5 练习244

第Ⅲ部分 延伸247

10 结论249

10.1 风险、可以做的和不能做的249

10.1.1 风险249

10.1.2 可以做的250

10.1.3 不能做的251

10.2 报告编写251

10.2.1 报告提纲252

10.2.2 样板254

10.3 其他应用255

10.3.1 以数据保护为目的的人工数据集255

10.3.2 潜在产出的填补255

10.3.3 粗糙数据分析256

10.3.4 多元数据集的文件匹配256

10.3.5 为高效设计所计划的缺失数据256

10.3.6 验证偏差的调整257

10.3.7 测量误差的修正257

10.4 展望257

10.4.1 衍生变量257

10.4.2 MICE算法的收敛问题257

10.4.3 批和块的算法258

10.4.4 并行算法258

10.4.5 嵌套填补258

10.4.6 填补的机器算法259

10.4.7 吸收专家经验259

10.4.8 自由分布的汇集规则259

10.4.9 提升的诊断技术260

10.4.10 模块统计学的块建设260

10.5 练习260

附录A 软件263

A.1 R263

A.2 S-Plus265

A.3 Stata265

A.4 SAS266

A.5 SPSS266

A.6 其他软件266

参考文件269

作者索引299

主题索引307

热门推荐