大数据应用 基于数据仓库的销售决策分析系统设计
沉沙 2018-10-23 来源 : 阅读 1164 评论 0

摘要:本篇教程介绍了大数据应用 基于数据仓库的销售决策分析系统设计,希望阅读本篇文章以后大家有所收获,帮助大家对大数据云计算大数据应用的理解更加深入。

本篇教程介绍了大数据应用 基于数据仓库的销售决策分析系统设计,希望阅读本篇文章以后大家有所收获,帮助大家对大数据云计算大数据应用的理解更加深入。

<


    决策支持系统(Decision Support System,DSS)是在管理信息系统的基础上发展起来的一门新兴的信息技术。它是以管理科学、运筹学、控制论和行为科学为基础,以计算机技术、仿真技术和信息技术为手段,针对半结构的决策问题,支持决策活动的、具有智能作用的人机系统,能够为企业提供各种决策信息支持以及许多商业问题的解决方案。

    传统的决策支持系统主要是以模型库系统为主体,通过定量分析进行辅助决策。DSS对数据的使用是非结构化的,它的一次查询操作要涉及上百张表的上千行数据,复杂的表连接会严重影响系统的性能,而且用户仅仅在分析的时候才查找有关数据,查找条件是随机的,因此基于事物处理的传统数据库环境不适宜DSS的应用。

    随着计算机信息系统的广泛应用与网络技术的迅速普及,以数据仓库和联机分析处理相结合的辅助决策系统成为决策支持系统的新形式。数据仓库把分布在网络中不同站点的数据集中到一起,通过联机分析处理(Online Analytical Processing,OLAP)把数据的组织由二维平面结构扩充到多维空间结构,并提供了多维分析方法,然后从多个数据库发现数据信息,从而进行决策分析,这是决策支持系统发展的一种途径。目前这类工具还比较缺乏。

    在数据仓库的支持下,采用OLAP等分析工具,开发面向最终用户的决策支持系统,使用户能够利用该系统对存储在数据仓库中的各种信息进行跨时间、地点等多维数据进行在线分析、挖掘和提炼,从而为决策者提供完整、准确和及时的决策信息。

    近年来企业部门业务处理以及信息管理系统的广泛使用,既为销售决策支持系统的建立提供了基础,也为它的应用产生了强大的推动力。与此同时,计算机在理论与技术上的新进展也使销售决策支持系统的研究与应用水平不断提高,使它从早期的批处理方式演变成今天的联机分析处理方式,也带动了数据仓库、多维数据库、数据挖掘等新技术的研究。

    1 销售决策分析系统的设计

    研制销售决策分析系统是为处在竞争日趋激烈的环境中的企业提供一种分析销售因素关系及其变化规律的方法。根据数据仓库设计的步骤,我们可以通过分析系统结构、概念设计、逻辑设计和物理设计这四个阶段来开发销售决策分析的数据仓库系统,且以基于数据仓库的销售决策系统设计与开发为任务。具体分为系统结构分析、概念设计、逻辑设计和物理设计这四个阶段。

    1.1 系统结构

    通过对销售决策分析的处理过程,我们可以把系统分为三个部分,如图1所示。
 
    
    图1 销售决策系统结构图
    (1)业务处理子系统。主要是用来完成日常销售业务的数据处理,包括操作性的数据库系统和外部各种数据。它是数据仓库系统的基础,是整个系统的数据源泉。

    (2)管理数据子系统。负责对整个系统的数据进行管理,是整个数据仓库系统的核心。在确定数据仓库信息需求后,首先进行数据建模;然后确定从源数据到数据仓库的数据抽取、清理和转换过程,并有效集成,按照主题进行重新组织;最后确定数据仓库的物理存储结构,同时组织存储数据仓库元数据(具体包括数据仓库的数据字典、记录系统定义、数据转换规则、数据加载频率和控制信息等)。

    (3)决策分析子系统。利用联机分析处理OLAP和其他工具对数据仓库中的数据进行统计与分析,实现分析和预测功能。

    1.2 数据仓库的概念模型和逻辑模型设计

    根据对系统的需求分析和决策的需要,我们采用信息包图的方法进行多维数据建模。如图2所示。
 
    
    图2 销售分析的信息包图

    销售分析的信息包图建立过程如下:

    (1)确定维度。维度是相同类型数据的集合,是人们观察数据的特定角度,不同的维度组合构成了访问数据仓库的约束条件。本系统中确定的维度主要包括时间维、产品维、销售地区维、销售部门维和客户维等。

    (2)确定粒度。粒度是数据仓库中数据单元的详细程序和级别,也就是维度划分的单位。对所确定的纬度进行粒度划分,如按时间、产品、销售地区、销售部门和客户等进行划分。

    (3)确定度量指标。度量指标是指在维度空间内数据所表达的含义,这些度量指标包含导出信息,本系统的度量指标包括单价、成本、销量、利润等。

    (4)确定维度的层次。维度的层次是指在一个层次内为表达不同细节程序的信息按顺序划分的多个阶层,比如时间维可以划分为年、季、月、旬、日等不同的层次。

    根据以上分析的信息包图,我们采用星型模型为系统建立多维数据模型。星型模式是多维数据模型中的一种典型结构,它组织实体的方式是把一个事实表放在中间,周围有各个维表与这个事实表相连,是一种由一点向外辐射的形式,如图3所示。数据库中包括一张事实表,用于存放事实数据,其中的信息有多个维度,对于每一维都有一张维表,用来记录相应维度的描述信息。事实表中的每条元组都包含指向各个维表的外键和一些相应的测量数据。
 
    
    图3 销售分析的星形模式图
    1.3 数据仓库的设计

    为了能够实现信息和数据网络共享,我们通过Web技术来开发系统。在这里,系统的前台使用HTML语言和ASP技术进行Web编程,以Microsoft SQL Server 2000作为中间数据库,采用Microsoft SQL Server 2000 Analysis Services提供的数据仓库,采用OLAP作为分析工具对相关数据进行分析,帮助决策者做出可靠的决策。

    数据仓库物理模型的设计主要是为了确定数据的存储结构,确定数据存放位置,以及确定存储分配。

    为支持数据仓库加载数据,需要对准备的数据进行抽取、清理和转换操作,需要创建表和其他数据库对象。因此,数据仓库的物理实现首先是要创建一个独立的数据库作为数据准备区,用户从数据源抽取出所需要的数据后,经过数据转换,最终按照预先定义好的数据仓库模型将数据加载到数据仓库中创建数据。

    数据抽取过程是将数据从联机事务处理系统、外部数据源以及其他存储介质导入到数据仓库中。数据从数据源中被抽取后,需要进行擦除、格式化以及保持一致性的处理,然后才能转换为数据仓库结构。可以采用Microsoft SQL Server 2000中的数据库与表创建工具来实现,其中可以通过SQL Server 2000中的Transact-SQL、数据转换服务DTS、分布式查询以及命令行应用程序等工具来实现数据的提取、清理、转换和加载过程。

    2 销售决策分析系统的实现

    数据仓库把来自多个系统的数据集成起来,形成一个可靠的、一致的、不断更新的信息集合。在大多数情况下,它们直接采取大规模关系型数据库以及传统的关系型报表和查询工具的形式。但是,它不直接支持更加完整的和多维的视图,而这正是灵活的决策制定所需要的。

    在实际决策过程中,决策者需要的数据往往不是某一指标单一的值,他们希望能从多个角度观察某指标或多个指标的值,并且找出这些指标之间的关系。比如,决策者可能想知道“北京和上海两个地区今年上半年和去年上半年在销量总额上的对比的情况,以及销量额按照50万~100万、100万~500万,以及500万以上分组”。这些决策数据是多维的,多维的数据分析是决策分析的主要内容。但是,传统的关系数据库系统及其查询工具对于管理和应用这样复杂的数据就显得力不从心了。

    本系统的决策分析过程采用OLAP来实现。OLAP技术通过对数据仓库进行综合、统计和分析,以专业报表和查询结果的形式提供给管理人员。OLAP的功能结构由数据存储服务、OLAP应用服务、用户描述服务组成的三层客户/服务器结构,复杂的应用逻辑集中存放在应用服务器上,由服务器提供高效的数据存储,根据前端的客户要求,通过对数据仓库细节数据的统计和分析,安排后台处理及报表的预处理,最终得到所需要的结论。

    对于本系统,我们可以采用Microsoft SQL Server 2000 Analysis Services提供的OLAP和Microsoft English Query等工具对数据仓库中的数据进行查询。Analysis Services系统包括一个用于管理分析数据的多维数据集和提供客户端对多维数据集信息的快速访问的服务器。Analysis Services借助预先计算的聚合数据将来自数据仓库的数据组织成为多维数据集,通过在多维结构中对数据仓库中的数据进行获取、摘要、组织和存储,从而为复杂的分析查询提供快速应答。在该系统中,开发的客户端分析模块可以用表格、平面图、立方图和圆饼状图等形式来显示分析结果,主要有以下功能:

    (1)销售分析。根据建立的销售模型,可以对不同种类的产品以及不同的销售部门,从年、月、旬、日产品的销售情况来进行分析和预测。同时,从产品的销售情况的分析结果可以再进一步分析相应的销售员工的业绩。这样,可以帮助决策者了解公司的发展业绩,以及公司员工的能力,为公司的下一步发展制定出相对准确的计划。

    (2)客户分析。根据产品的销售区域以及具体的客户分布,一方面可以进行客户所属地区的分析,从而可以得到产品销售的方向;另一方面,可以对客户价值进行分析,了解产品的消费群。这些可以帮助决策者确定各种类型客户的消费模式,以便采取灵活而主动的经营方式,从而获取最大的利润。

    (3)供应商分析。这主要是建立在销售分析的基础上,对来源于不同的供应商的同一种产品的销售业绩进行分析,了解消费者的购买喜好和对不同厂家的产品的适应能力,帮助决策者制定合理的采购计划。

    (4)财务分析。根据划定的时间周期来进行实际费用和花费的比较,审查过去资金流动的趋势,可以预测未来的资金需求量,整合各部门的财务数据形成正确的财务报表。图4是一张部分业务分析的示例图。
 
    
    图4 部分业务分析示例图

    3 结束语

    本文所介绍的基于数据仓库和OLAP的销售决策分析系统可以大大改善原有的基于事务处理系统的数据处理和分析能力。数据仓库是在数据库的基础上发展起来的,其面向主题的数据组织方式可方便用于决策分析,联机分析处理把数据的组织由二维平面结构扩充到多维空间结构,实现了多维数据分析。在数据仓库的基础上进行联机分析处理的辅助决策技术越来越成为现代决策支持系统发展的新趋势。
          

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标大数据云计算大数据应用频道!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程