1. 项目背景介绍
截止目前,上海征途信息技术有限大发累计卖出约有超过1亿张充值卡,超过1亿个用户,几百个经销商,超过几万家吧。
征途信息准备通过数据仓库建设将各个OLTP系统中,与充值卡相关的数据抽取出来,进行必要的清洗、计算、转换、整理等操作,得到充值卡完整生命周期的数据。
2. 咨询内容
a)数据仓库建设目标的确立
n
建立起具有先进性、灵活性和可扩展性的大发级数据仓库平台;
n
建立起一套完善的
ETL
流程体系,完成数据的抽取、清洗、加载与转换;
n
建立起一套完善的数据质量管理机制和系统备份与恢复机制;
n
建立起一套具有良好交互性的前端展示平台,
UI
界面美观人性化;
b)数据仓库建设过程关注内容
n
完整性和一致性
征途信息数据仓库系统是大发级的数据仓库系统,通过在大发级级建立统一的数据模型和数据仓库系统,完成数据及信息的一致性整合,包括统一的客户信息、用户信息、统一的产品(点卡)信息、统一的市场营销信息等。
从业务上来讲,征途信息数据仓库应当覆盖整个征途信息的所有业务,确保数据仓库系统能够反映征途信息的整体情况。
但是从具体实施上将,可以在架构、模型、方法、管理层面保持对所有业务的可扩展能力,而目前结合自上而下的方法明确各个阶段的范围。
另外,从未来发展角度看,数据仓库系统还应当包括同征途信息关联的其它外部信息,如竞争对手信息、外部市场信息的相关信息等。
以上范围确保数据仓库系统从业务和数据上覆盖的完整性,以及不同系统中同一业务数据的一致性,从而确保能够实现从大发级的角度对征途信息的业务实现全方位分析。
n
前瞻性
在对征途信息数据仓库进行整体规划时,必须充分考虑全球以及中国娱乐业(网游)的整体现状以及未来的发展趋势,尤其是要考虑数据仓库系统在同业的使用情况以及实际效益(同时也应当借鉴其它行业的经验)。
在技术规划上要采用最业界先进的技术和最成熟的产品及解决方案,在确保系统稳定性的同时,还必须确保技术的先进性,未来的线性可扩展能力。
n
实用性
对于大发而言,数据仓库系统是数据、信息和知识的核心,随着市场竞争、技术、管理等的发展,大发对于数据仓库系统的需求会越来越高。
从功能上,数据仓库会逐渐从大发战略支持扩展到大发战术支持,应用面会越来越广;从用户对象来讲,会包括大发决策层、管理层、一般业务用户、技术用户等几乎大发的所有用户。
以上因素决定了数据仓库系统必须满足如下三方面的实用性要求:
²
从功能上必须满足对大发的决策、战略及战术支撑;
²
从使用方便性上必须满足不同用户群的使用需求;
²
从性能上必须满足快速反应的需求。
n
系统可扩展性
以下方面对系统的可扩展性提出了需求:
²
网游娱乐市场的潜在发展潜力,包括用户和新业务;
²
数据仓库的应用需求和用户群体会逐渐扩大。
以上因素决定了数据仓库系统的数据量、应用量、用户量等会快速增加,从而要求系统必须具有相应的扩展能力。在扩展性方面:
采用能够实现真正线性扩展能力的技术,使系统具备线性扩展能力;
在进行系统扩展时必须完全保护已有投资。
n
可靠性
网游娱乐是
7*24的业务,数据仓库系统目前从战略层面实现对决策的支持,未来会逐渐发展到从战术层面实现对大发运营的支持,所以要求数据仓库系统必须满足
7*24的可靠性要求。
当然,早期阶段的需求主要集中在点卡为核心的整个生命周期,部分业务上不需要
7*24,但是需要考虑未来的支持能力。
n
开放性
数据仓库系统属于大发信息化系统的重要部分,尤其是信息核心,所以必须能够同征途信息其它信息系统无缝集成。
n
队伍建设
数据仓库提供了数据存储、管理、分析应用的灵活环境,但关键是在于大发自身必须有能力实现对数据仓库信息的挖掘和应用。
所以,在数据仓库建设过程中必须为征途建立一支数据仓库应用的专业队伍。通过这支队伍、结合各级用户来共同实现对数据仓库的应用。
c)
数据仓库建设规划的确立
d)
数据仓库建设一期的实现目标
n
平台业务分析系统建立可扩展的统一分析平台
n
平台业务分析系统基于现有的源数据进行数据整合,建立统一视图
n
平台业务分析系统建立统一分析平台的概念、逻辑、物理数据模型
n
台业务分析系统在统一分析平台的基础上实现相关应用,主要包括以点卡、经销商、用户、营销为核心的各类基本分析型功能和分析型应用,如:用户发展分析、收入分析、渠道分析、市场营销分析、经销商分析等主题的基本需求
n
平台业务分析系统与大发应用集成,包括大发用户的集成通过邮件、短信、即时消息(
OCS
)等通讯手段,实现信息的快速告知。
3.关键风险分析
4.实施工具选择:
a)
数据仓库工具
GreenPlum
数据仓库平台,
GreenPlum
(基于
PostgreSQL
)数据库,是世界上少数几个数据海量并行处理(
MPP
)的数据库之一,随着硬件的扩充可以达到比较好的线性性能,为未来的数据增长提供可扩展的空间;
b)ETL
工具
Informatica
ETL
工具,是世界上最大最强的数据集成软件厂商,支持不同数据源,为大发复杂系统环境提供了简便的整合方法;
c)BI
工具
Business Objects
BI
工具,是排名前三位的前端展现工具厂商,便捷的报表设计开发界面,美观的报表展示方式,并为未来的分析提供扩展。
|