Page 110 - 李路论文集
P. 110

李路论文集
            Collected Papers by Li Lu


            数据、外部数据,建模的数据包括:潜在的客户数据、客户建模数据、风险建模
            数据。
                建立好数据模型后,进一步的工作就是要寻找一些变量,这些变量可能具有

            强大的市场预测能力。寻找这些变量可以由这些变量的归约来实现。为了选择最
            终的归约变量,可以利用综合的划分、转换和相互作用检测来实现。例如:要预
            测净现值,它应当包括如下四部分:激活概率、风险指数、产品收益率、营销费
            用。其每一部分的函数作用如下:

                (1)激活概率:由模型计算出的一个概率。它是个体必须响应的、通过风
            险验证、支付首次保险金的概率。
                (2)风险指数:由实际分析组成成分矩阵得出的一个系数。这个值也可以
            由预测模型得到。

                (3)产品收益率:特定产品的现值,由该产品的经理人得到的三年的产品
            利润。
                (4)营销费用:包装、邮寄、处理(验证、完成)的费用。
                最终的模型预测的净现值为这四部分的组合:

                       NPV=P( 激活概率 )× 风险指数 × 产品收益率 - 营销费用
                计算激活率有两种方法:一种是直接由预测模型得到预测激活率;另一种是
            建立两个模型。一个用于预测响应,
                一个用于预测给定的响应激活率。由归约变量得出。

                风险指数是由前客户的组成成分的矩阵系数得出。例如:对于人寿保险来说;
            年轻的已婚女子的风险系数比单身老年男性的风险系数要低;因为年轻的已婚女
            子对利润有强烈的正相互作用;相反,单身老年男性对利润有负相互作用。
                产品收益率是由产品经理人根据产品的平均收益率,折换成现价得出的。

                营销费用:包括处理这个产品所需要的所有费用。
                有很多机会通过合并和变换现有的变量来创建新的变量,一旦取样、格式化、
            创建了所有合适的变量后,就该缩小范围,选出最佳变量。其中包括连续变量与
            类别变量。

                为了选择最佳变量;经验值是保留卡方概率小于 0.5 的所有变量;卡方统计
            是度量预期值与实际值之间的差异:
                                卡方值 (X2)=( 预期值 - 实际值 )2/ 预期值



            98
   105   106   107   108   109   110   111   112   113   114   115