萍萍家园's Archiver

bbslover 发表于 2010-3-8 09:30

统计学中的一句话如何使用数学表达式表示出来?

这个话题的背景是,有一个因变量和大量的自变量,现在想对自变量降维,有很多方法,如PCA等等,还有就是在建立模型前对自变量处理,如去除那些方差为0的和方差很小的自变量等,然后用少量的与因变量有关系的自变量建模。

问题出在这了,
最近看文献说, Independent variables whose correlation with the response variable was not significant at 5% level were removed,
这句话 1、如何使用数学表达式来表示呢?
            2、如何体现出自变量和因变量的显著性,用什么指标呢?
            3、Y  X1 X2 X3  .....Xn,是不是分别求出 X1.....Xn 与Y的表示显著相关的值(significant correlation),用哪个值表示呢?大于或者小于多少是显著相关呢?

谢谢,希望大家帮忙!

sxlion 发表于 2010-3-11 18:49

楼上好像对统计学的知识了解很少。
如果这样的话,就很难解释清楚了。

文献的那句话挺常见的,大意是“去掉显著性小于5%的自变量”。

所以你的第一个问题,涉及到数学表达式要根据具体的问题来谈,不同的问题有不同的公式,
如果说用一个通用的公式,那就是最终会归结到一个假设的概率问题,也就是你的第二个问题,一般用p来表示。
3,不一定是相关性,多元统计里面有很多方法设计到显著性的问题,都是基于一个假设的。

以上都是浅看个人看法,建议楼主去补充相关的统计知识。

map1999 发表于 2010-6-22 09:56

楼主你是不是试验设计的数据分析?对回归方程进行优化文章是根据回归系数的显著性检验来进行的,也就是你给的那句话。

saiyasaibing 发表于 2010-9-1 00:46

楼主问的问题好像可以用principal components 来做啊。

ikonos 发表于 2010-11-17 13:55

太复杂了,我不太懂

map1999 发表于 2010-11-25 19:39

楼主这句话的意思是在5%的显著水平下提出不显著因素。你的问题就是回归方程的显著性检验,用方差分析就可以解决,软件都是直接给出来的,你是不是看的响应面文章

suibian8113 发表于 2011-1-18 19:54

懂不起啊

dudupi 发表于 2011-5-6 00:56

2楼的解释是对的

cocooo 发表于 2011-5-11 00:24

看了半天不太明白lz要问什么,不过2楼貌似看懂了并给了解答

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.