网站运营数据分析(企业网站数据分析方法)

网站运营数据分析(企业网站数据分析方法)

企业互联网数据分析可分为两部分,由数仓建设作为基础,基于数仓构建大数据分析平台。在数仓建设过程中往往需要注意以下几个部分,首先是数据的整合,包含数据的口径及数仓维度,其次是指标的管理,最后主要针对于数据的更新策略及历史数据的留存问题。

1.数据整合:

数据的整合往往是为了解决各个业务系统之间的异构问题,对于一些体量较大的企业来讲往往会投入大量的资源解决“数据孤岛”问题。当企业发展过快,随着部分、子公司以及信息化系统的不断增多,信息系统很难再使用统一的系统,每个分公司可能会有各自的系统,各个系统中数据结构定义往往是差异,由于这种差异的存在,两个系统不能识别对方的数据,这就我们常说的 “数据孤岛”问题。企业内部信息无法互通互联,每个子公司自成体系,数据无法在企业业务系统之间流转。
针对数据孤岛问题建议采用ESB/ETL将业务系统数据根据时间戳以增量的形式将业务系统数据的拉取到同一类型的数据库内例如是SQL SERVER,可以使数据是相同类型得,数仓需要把从各个系统中的数据转换成相同的数据格式。

2.统一口径:

口径统一是数仓进行主题划分,根据业务得切入点不同可能会造成一些争论、重构等的现象。按照业务或业务过程划分,比如地产行业可根据整体得运营分为投拓主题、成本主题、项目主题、财务主题、销售主题等。也可以根据各个部分得考核进行划分例如销售域、技术域、财务域、策划域等等。
再根据主题对这些数据进行处理,对数据进行划分成不同得主数据以及参考数据,使拉入数仓的数据是准确的、统一的来保证数据统一口径,做数据分析平台、大数据平台,主数据是基础,大数据关注于数据的量和数据的类型,而主数据是更关注于数据的质量。

3.数仓维度:

维表是根据业务系统进行划分的,举例来讲每个公司都离不开钱,而钱一定是和财务挂钩的,在财务出纳时一定会关联财务科目,而企业总部和每个分公司的这个财务科目又不一致就导致了数据混乱的现象,所以我们根据业务需求定义了财务科目这个维度表,使其公有一个黄金编码,维度表一般是有主键的。代表该类物质的一个单一个体。

4.指标管理:

对数仓的更新策略共有两类的更新,一类众所周知是对数据的更新,还有一类是我们在数仓构建基础事实表、汇总事实表时的表结构以及元数据的级联更新。数据的更新在此不做过多赘述,千人千面,各有特点,这里我们重点阐述元数据的更新策略,在保证元数据能顺利更新的过程中还要保证在更新时正在运行的数据分析平台不受更新影响。首先需要对元数据和中间库表进行对比先对最为基础的元数据的基础事实表进行更新,由于汇总事实表是由基础事实表构建所以要对相对应的汇总事实表进行关联更新。

5.历史留存:

数仓不同于数据中台,数仓是保留历史数据的,而随着企业生产系统的不断生成,数仓的数据量无疑是巨大的,应该如何存贮海量数据呢,针对这种情况我们采用GreenPlum进行数据的存储,是面向数据仓库应用的关系型数据库,基于PostgreSQL开发,它支持海量数据存储和处理,查询速度快、数据装载速度快、批量DML的快速处理、性能可以随着硬件的添加呈线性增加、拥有非常良好的可扩展性。
以上为数仓建设方面,而选择一个对应匹配的数据分析平台是至关重要的,我认为一个数据分析平台应该对数仓元数据进行统一的管理,基于元数据关联关系就可以轻松的构建我们的数据分析平台,由数仓提供数据基础,构建集团企业数据大屏及各个看板,帮助企业运营分析、风险掌控等。另外企业数据也是企业的核心资产,需要数据分析平台对数据资产构建一个分析导航,从业务型数据、数据资产型数据进行分析,提升企业核心竞争力。

原创文章,作者:站长号,如若转载,请注明出处:https://www.zhanzhanghao.com/417.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注