background image
集中的数据源拥有宝贵的数据信息。
◆大规模并行计算机的出现:
IBM\HP\SUN\NCR 等公司的主流机型都能支持多达几
Gbyte 数据的并发 I/O 处理/小时。这些保证数据挖掘处理能每天进行更新数据源,对市场
能快速反应
,真正做到”time-to-marketing” 。
◆多种多样的数据挖掘算法:
SAS/IBM/SPSS 等公司都有成熟的商业数据挖掘软件包
供利用。
3.2 客户流失分析过程
客户流失分析过程指客户流失逻辑模型的建立过程
,包括数据采样、数据分析、模型评估和
应用等方面
,以下就这些方面进行简单的描述。
⑴ 数据采样
数据采样就是从所有已经流失的移动客户中,抽取部分客户的信息,进行预处理
,如对错误
格式的记录数据进行过滤、转换
, 对部分字段进行必要的拆分或汇总。注意,有些字段在业务
系统中并不直接存在
,需要转换得到。
例如
: 某种离网模型数据输入如表 1 所示:
1 某离网模型数据表
基本资料组
客户性别
,客户职业, 地区, 年龄, 付费方式,客户等级,入网时间,客户所在 VPMN 客户群
通话方式
最近连续半年平均消费水平
最近连续 3 月平均消费水平
前第 3 个月呼叫转移次数
前第 2 个月呼叫转移次数
本月呼叫转移次数
网间通话占网内通话的比率