7 复习
7.1 总论
例:以下说法全错
均值95% 置信区间包含大约95%的观测值
总体均值落入95%置信区间的概率是95% 正确的是有95%的信心,即对这个方法,不是对单个区间
t检验的p<0.05,说明零假设成立的概率小于5% 仅仅一次不能说概率
t检验的p<0.001,说明对照组和实验组来自的均值差异较大 统计显著性不是实际显著性
Pearson 相关分析,得到r=0.8,p<0.05,说明两个变量存在强相关性
Pearson 相关分析,得到r=0.05,p>0.5,说明两个变量关联性很弱,或者不存在关联性 没有线性关系
简单线性模型y=1+1.5x,说明如果自变量x增加1个单位,因变量y增加1.5
简单线性模型y=1+1.5x,说明如果自变量x增加1个单位,因变量y均值增加1.5 增加都是指同一个观测对象
如果对照组和实验组在干预前不具有显著差异(p>0.05),在干预后具有显著性差异(p<0.01),可以推断干预有效 要比差异的差异,见6.3.1
血压研究实验,把50只动物随机分配到对照组和实验组,每组25只动物,实验完成后想知道对照组(n=25)动物血压是否高于实验组动物(n=25)的血压均值,可以用单边t-检验 这是检验总体是否高于的方法,如果是对照组和实验组,则是样本,直接算就行
实验分成三组(对照组,低剂量组,高剂量组),统计检验发现对照组和低剂量组差异不具有统计显著性(p=0.50),对照组与高剂量组差异具有统计显著性(p=0.01),可以推断高剂量组比低剂量组干预有效 直接比较p不可取
t-test, ANOVA都可以用线性模型来完成
7.2 第六章
如果一个线性模型得到的R Squared 值为0.95, 说明该模型的正确的可能性很大
错误,单单R2无法说明问题,要综合R2和t检验和其他参数
简单线性回归模型的置信区间带(CIB)比预测区间带(PIB)要窄,并且这两个带在自变量均值处都最窄
正确
多元线性回归模型,某自变量的系数如果不显著(比如p=0.4), 说明该系数可以从模型中去掉
错误,要综合考虑