Page 110 - 李路论文集
P. 110
李路论文集
Collected Papers by Li Lu
数据、外部数据,建模的数据包括:潜在的客户数据、客户建模数据、风险建模
数据。
建立好数据模型后,进一步的工作就是要寻找一些变量,这些变量可能具有
强大的市场预测能力。寻找这些变量可以由这些变量的归约来实现。为了选择最
终的归约变量,可以利用综合的划分、转换和相互作用检测来实现。例如:要预
测净现值,它应当包括如下四部分:激活概率、风险指数、产品收益率、营销费
用。其每一部分的函数作用如下:
(1)激活概率:由模型计算出的一个概率。它是个体必须响应的、通过风
险验证、支付首次保险金的概率。
(2)风险指数:由实际分析组成成分矩阵得出的一个系数。这个值也可以
由预测模型得到。
(3)产品收益率:特定产品的现值,由该产品的经理人得到的三年的产品
利润。
(4)营销费用:包装、邮寄、处理(验证、完成)的费用。
最终的模型预测的净现值为这四部分的组合:
NPV=P( 激活概率 )× 风险指数 × 产品收益率 - 营销费用
计算激活率有两种方法:一种是直接由预测模型得到预测激活率;另一种是
建立两个模型。一个用于预测响应,
一个用于预测给定的响应激活率。由归约变量得出。
风险指数是由前客户的组成成分的矩阵系数得出。例如:对于人寿保险来说;
年轻的已婚女子的风险系数比单身老年男性的风险系数要低;因为年轻的已婚女
子对利润有强烈的正相互作用;相反,单身老年男性对利润有负相互作用。
产品收益率是由产品经理人根据产品的平均收益率,折换成现价得出的。
营销费用:包括处理这个产品所需要的所有费用。
有很多机会通过合并和变换现有的变量来创建新的变量,一旦取样、格式化、
创建了所有合适的变量后,就该缩小范围,选出最佳变量。其中包括连续变量与
类别变量。
为了选择最佳变量;经验值是保留卡方概率小于 0.5 的所有变量;卡方统计
是度量预期值与实际值之间的差异:
卡方值 (X2)=( 预期值 - 实际值 )2/ 预期值
98