7 复习

学习笔记
作者: MingXiao

7.1 总论

例:以下说法全错

均值95% 置信区间包含大约95%的观测值

总体均值落入95%置信区间的概率是95% 正确的是有95%的信心,即对这个方法,不是对单个区间

t检验的p<0.05,说明零假设成立的概率小于5% 仅仅一次不能说概率

t检验的p<0.001,说明对照组和实验组来自的均值差异较大 统计显著性不是实际显著性

Pearson 相关分析,得到r=0.8,p<0.05,说明两个变量存在强相关性

Pearson 相关分析,得到r=0.05,p>0.5,说明两个变量关联性很弱,或者不存在关联性 没有线性关系

简单线性模型y=1+1.5x,说明如果自变量x增加1个单位,因变量y增加1.5

简单线性模型y=1+1.5x,说明如果自变量x增加1个单位,因变量y均值增加1.5 增加都是指同一个观测对象

如果对照组和实验组在干预前不具有显著差异(p>0.05),在干预后具有显著性差异(p<0.01),可以推断干预有效 要比差异的差异,见6.3.1

血压研究实验,把50只动物随机分配到对照组和实验组,每组25只动物,实验完成后想知道对照组(n=25)动物血压是否高于实验组动物(n=25)的血压均值,可以用单边t-检验 这是检验总体是否高于的方法,如果是对照组和实验组,则是样本,直接算就行

实验分成三组(对照组,低剂量组,高剂量组),统计检验发现对照组和低剂量组差异不具有统计显著性(p=0.50),对照组与高剂量组差异具有统计显著性(p=0.01),可以推断高剂量组比低剂量组干预有效 直接比较p不可取

t-test, ANOVA都可以用线性模型来完成

7.2 第六章

如果一个线性模型得到的R Squared 值为0.95, 说明该模型的正确的可能性很大
错误,单单R2无法说明问题,要综合R2和t检验和其他参数

简单线性回归模型的置信区间带(CIB)比预测区间带(PIB)要窄,并且这两个带在自变量均值处都最窄
正确

多元线性回归模型,某自变量的系数如果不显著(比如p=0.4), 说明该系数可以从模型中去掉
错误,要综合考虑



Comments