7 复习

学习笔记

作者: MingXiao

例：以下说法全错

均值95% 置信区间包含大约95%的观测值

总体均值落入95%置信区间的概率是95% 正确的是有95%的信心，即对这个方法，不是对单个区间

t检验的p<0.05,说明零假设成立的概率小于5% 仅仅一次不能说概率

t检验的p<0.001,说明对照组和实验组来自的均值差异较大统计显著性不是实际显著性

Pearson 相关分析，得到r=0.8,p<0.05,说明两个变量存在强相关性

Pearson 相关分析，得到r=0.05,p>0.5,说明两个变量关联性很弱，或者不存在关联性没有线性关系

简单线性模型y=1+1.5x,说明如果自变量x增加1个单位，因变量y增加1.5

简单线性模型y=1+1.5x,说明如果自变量x增加1个单位，因变量y均值增加1.5 增加都是指同一个观测对象

如果对照组和实验组在干预前不具有显著差异(p>0.05)，在干预后具有显著性差异(p<0.01)，可以推断干预有效要比差异的差异，见6.3.1

血压研究实验，把50只动物随机分配到对照组和实验组，每组25只动物，实验完成后想知道对照组(n=25)动物血压是否高于实验组动物(n=25)的血压均值，可以用单边t-检验这是检验总体是否高于的方法，如果是对照组和实验组，则是样本，直接算就行

实验分成三组(对照组，低剂量组，高剂量组)，统计检验发现对照组和低剂量组差异不具有统计显著性(p=0.50),对照组与高剂量组差异具有统计显著性(p=0.01),可以推断高剂量组比低剂量组干预有效直接比较p不可取

t-test, ANOVA都可以用线性模型来完成

如果一个线性模型得到的R Squared 值为0.95，说明该模型的正确的可能性很大
错误，单单R2无法说明问题，要综合R2和t检验和其他参数

简单线性回归模型的置信区间带（CIB）比预测区间带（PIB）要窄，并且这两个带在自变量均值处都最窄
正确

多元线性回归模型，某自变量的系数如果不显著（比如p=0.4), 说明该系数可以从模型中去掉
错误，要综合考虑

Comments