Page 111 - 李路论文集
P. 111

25. 数据挖掘技术在市场风险投资的应用



                 如果卡方值越大,则关于卡方值的概率 P 越小。
                 类别变量:类别变量是具有离散值的变量。一种判断变量是否具有预测能力
             的简单的方法就是应用卡方测试;经验告诉我们每个单元至少要提供 25 个观测

             样本。卡方统计才能显示出很高的显著性。计算卡方概率也很简单,卡方概率等于:
                     P=exp(β0+β1K+β2K…+βnK)/(1+exp(β0+β1K+…+βnKn))
                 其中 β0……βn 为加权系数,K1……Kn 为卡方预期值。计算离散率和卡

             方率的计算机源程序为:
                 计算离散率的源程序:
                 string     a,b
                 double   c,d,e,f
                 a=sle  l.text
                 _
                 b=sle  2.text
                 c=double(a)
                 d=double(b)
                 e=(c)-(d)
                 f=e/d
                 sle  3.text=string(f)
                 sle  4.text=string(f*100)



                 计算卡方率的源程序:
                 string     a,b

                 double    c,d,e,f,g
                 a=sle  1.text
                 b=sle  2.text
                 c=double(a)
                 d=double(b)
                 e=(c  )-(d)
                 f=e^2
                 g=f/c
                 sle  3.text=string(g)
                 sle  4.text=string(g*100)



                                                                                     99
   106   107   108   109   110   111   112   113   114   115   116