数据挖掘与数据化运营实战

《数据挖掘与数据化运营实战:思路、方法、技巧与应用》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例 …… [ 展开全部 ]
  • 作者:"卢辉"
  • 出版社:机械工业出版社
  • 定价:59.00元
  • ISBN:7111426509
8.7.1 如何发现共线性
  • 淦秋士
    2018-04-08 15:52:19 摘录
    常见的识别共线性的方法如下:
    口相关系数的方法。最常见的就是皮尔逊相关系数( Pearson Correlation)
    口通过模型结论的观察。比如,在回归模型中,如果回归系数的标准差过大,就可能意味着变量之间存在着共线性问题。
    口主成分分析方法。比如,第一主成分中,某几个原始变量的主成分载荷系数较大,且数值相近,就有可能在其中隐藏着共线性问题。
    口根据业务经验判断的原本应该没有预测作用的变量突然变得有很强的统计性,那其中就有可能隐藏着共线性问题。
    口对变量进行聚类。通过对区间型变量进行聚类,同一类中的变量之间具有较强的相似性,也就可能隐藏着共线性问题。
    这条书摘已被收藏0