谈数据整合技术在水利设计中的重要性

数据整合资源库的数据都是一些统计和分析数据,怎样浅谈数据整合技术在水利设计中的重要性?

谈数据整合技术在水利设计中的重要性

论文关键词集成信息系统 数据整合 信息孤岛

论文摘要数据整合已经成为未来水利设计单位进一步发展的必经之路,水利设计单位需要进一步的发展和提高,就需要进行数据整合。文章采用数据整合技术,充分整合综合办公管理、计划经营管理、项目设计流程管理、图档管理数据资源,并建设成统一的数据集成平台。利用这一数据集成平台将四大数据资源,经过抽取、规则转换、清洗、加载,形成整合资源库,为经营和战略决策提供数据支持。

决策分析需要的数据通常都是统计数据,但在现有信息系统下进行会比较复杂。原因有:①做出一个决策分析往往需要查询多个基于各种异构数据源的信息系统和外部系统,并进行大量数据分析,工作量大,数据利用率不高,且容易出现人为差错。②现有信息系统平台及开发工具互不兼容,直接提取这些数据比较麻烦。③各个信息系统没有统一的数据接口,也没有通用的数据标准和规范,各个数据库无法直接集成。④统计分析需要大量的历史数据,但是历史数据并不完整。

因此,为了适应决策信息系统建设的需要,我们采用数据整合技术,充分整合综合办公管理、计划经营管理、项目设计流程管理、图档管理数据资源,并建设成统一的数据集成平台。

1数据资源分析

数据整合资源库的数据都是一些统计和分析数据,如项目进度跟踪管理统计、产值管理统计等,它们来源于生产数据,所以在数据整合之前,需对现有生产数据资源进行归类。现阶段生产数据资源主要分为综合办公管钾数据集、计划经营管理数据集、项目设计流程管理数据集和图档管理数据集等。

1)综合办公管理数据集是实现人员基础信息统一管理的基础数据集。主要包括:①个人基本信息:包括个人信息库等。②单位基本信息:包括单位基本信息库、单位所属分支机构信息库等。③参数信息库:包括代码库、图表分析生成库等。

2)计划经营管理数据集主要包括:①市场信息:包括顾客信息资源库、市场动态信息库、竞争对手信息库等。②招投标管理信息:包括招标信息库、投标信息库、专家信息库等。③合同信息:包括合同信息库、收付款项信息库、产品交付管理库等。④资质管理信息:包括资质信息库、资质审核库、资质借用管理库等。

3)项目设计流程管理数据集主要包括:①项目信息:包括项目立项信息库、任务下达信息库、项目组人员任命库等。②项目任务分解:包括项目任务分解资源信息库、关键路径控制等。③网络虚拟办公室:包括项目动态信息库、中间成果管理库、动态分析库等。④产品管理信息:包括产品校审信息库、成果交付信息库等。

4)图档管理数据集主要包括:①归档管理信息:包括资料预归档管理库、资料归档管理库等。②整编信息:包括档案整编信息库等。③借阅信息:包括人员信息库、档案借阅信息库等。④电子档案信息:包括电子档案授权库、电子档案借阅管理库等。⑤销档信息:包括销毁档案信息库、销毁人员信息库等。

2数据整合的实现方式

水利设计单位集成信息系统数据库大多为sqlserver数据库,数据整合实现方式通常可以采用数据库开发技术和etl技术实现,以下分别介绍这两种实现方式。

1)数据库开发技术。利用数据库开发技术的数据整合主要指利用数据库本身的功能,如触发器、pl/sql存储过程、dblink等功能完成,完成对各个信息系统所需要数据的抽取、查询和关联等。

这种数据整合技术有如下优势:①适合于同种数据库之间的数据集成。②投资少,基本都是靠开发人员手工编程为主,只需要一些开发费用。但是该数据整合实现技术也存在一些局限性。③扩展性较差。由于都是开发人员手工编程,后期的维护成本较高,特别是在决策需求发生变化时,需要开发人员修改程序源代码。④数据整合效率问题。由于数据库都靠开发商编写,在系统日趋庞大的情况下,在面对复杂的`数据整合问题上,效率难以得到保证。