统计学中的一句话如何使用数学表达式表示出来?
这个话题的背景是,有一个因变量和大量的自变量,现在想对自变量降维,有很多方法,如PCA等等,还有就是在建立模型前对自变量处理,如去除那些方差为0的和方差很小的自变量等,然后用少量的与因变量有关系的自变量建模。问题出在这了,
最近看文献说, Independent variables whose correlation with the response variable was not significant at 5% level were removed,
这句话 1、如何使用数学表达式来表示呢?
2、如何体现出自变量和因变量的显著性,用什么指标呢?
3、Y X1 X2 X3 .....Xn,是不是分别求出 X1.....Xn 与Y的表示显著相关的值(significant correlation),用哪个值表示呢?大于或者小于多少是显著相关呢?
谢谢,希望大家帮忙! 楼上好像对统计学的知识了解很少。
如果这样的话,就很难解释清楚了。
文献的那句话挺常见的,大意是“去掉显著性小于5%的自变量”。
所以你的第一个问题,涉及到数学表达式要根据具体的问题来谈,不同的问题有不同的公式,
如果说用一个通用的公式,那就是最终会归结到一个假设的概率问题,也就是你的第二个问题,一般用p来表示。
3,不一定是相关性,多元统计里面有很多方法设计到显著性的问题,都是基于一个假设的。
以上都是浅看个人看法,建议楼主去补充相关的统计知识。 楼主你是不是试验设计的数据分析?对回归方程进行优化文章是根据回归系数的显著性检验来进行的,也就是你给的那句话。 楼主问的问题好像可以用principal components 来做啊。 太复杂了,我不太懂 楼主这句话的意思是在5%的显著水平下提出不显著因素。你的问题就是回归方程的显著性检验,用方差分析就可以解决,软件都是直接给出来的,你是不是看的响应面文章 懂不起啊 2楼的解释是对的 看了半天不太明白lz要问什么,不过2楼貌似看懂了并给了解答
页:
[1]