浅谈网络信息资源的整合问题研究

浅谈网络信息资源的整合问题研究

  论文关键词: 信息资源;网络传递;整合

  论文摘要:信息资源在数字化的条件下,由于网络传递的便利性,使得信息资源整合问题显得更为重要。本文从数据整合、应用系统整合以及业务过程整合等三个层次对网络信息资源整合问题进行了分析和研究。
  
  
  1引言
  
  当今,科学和技术向高度综合化发展。这种高度综合的趋势,使读者的信息需求呈现综合化的特点。特别是对于网络信息资源,现有的网络检索工具的搜索范围覆盖面广,专指性差,人们在检索学术信息时,往往从专门学科入手,而网络检索工具却不以专业划分,在查询某一特定学科网络信息时,一方面没有专门的网络检索工具,另一方面又是任何一个网络检索工具都可以用,致使检索的完整性可靠性都较差,难以实现对网络资源的有效过滤和筛选。为此,我们进行整合的目的就是要使信息用户快速获取知识。
  对于整合有不同的层次,首先要考虑的是数据和信息的整合,其次要考虑的是各种应用系统的整合,这包括构件系统是要考虑所构建的系统同现有系统的整合,以及以后新开发的系统同所构建的系统的结合。更为复杂的是面向过程的整合,它又可以分为在利用系统资源的过程中系统资源的组织过程的整合。
  
  2 数据整合
  
  数据整合主要用来实现不同系统的数据交流与共享,发生在应用领域内的数据库和数据级别。通过从一个数据源将数据移植到另一个数据原来完成数据整合。数据整合是现有整合解决方案中最普遍的一种形式,然而数据整合的一个最大的问题是业务常常只存在于主系统中,无法在数据库层次去响应业务流程的处理,因此这限制了实时处理的能力
  数据整合是进行下一步整合的基础。数据整合对数据进行标识并编成目录,确定元数据模型。只有建立统一的模型后,数据才能在数据库系统中分布和共享。数据整合采用的主要数据处理技术有数据复制、数据聚合和接口整合。
  数据复制。数据复制方式的目的是为了保持数据在不同数据库间的一致性,而数据可以是同一厂商也可以是不同厂商的,甚至可以是采用了不同模型和模式的数据库。对于数据复制的基本要求是数据必须能够提供一种数据转化和传输的基本结构,以屏蔽不同数据库间数据模型的差异。数据复制服务的基本原理是这样的:在两个或多个数据库之间设置个软件中间件,在一边,数据从源数据库中被抽取,而在另一边,数据被导入目标数据库。有的是以实时方式工作的,也有的是以批处理方式工作的。
  数据聚合。数据聚合是将多个数据库和数据库模型整合成为一种统一的数据库试图方法,也可以认为,数据聚合体是一种虚拟的业务数据库,它包括多个实体的数据库。数据聚合方法在分布的数据库和应用之间放置一个中间件层,该层与每一个后台的数据库用其自带的接口相连,并将分布的数据库映射为统一的数据库模型,而这种虚拟模型只在中间件中存在,应用程序就可以使用该虚拟数据库去访问需要的信息。同时该数据聚合软件也可以通过将相关的数据库映射导入实体数据库,进行数据库更新。数据聚合方法的优点是其将多种数据类型表示为统一的数据模型,支持信息交换,它能通过一个良好的定义接口访问相关业务中任何相连的数据库,也提供了一种利用统一接口解决面向数据的应用整合问题的良好方法。
  接口整合。接口整合方法利用良好定义的应用接口实现对应用包和客户化应用的整合。可以说,它是目前得到的最广泛应用的整合方法。在面向接口的整合中,整合代理是一个时髦的概念,它通过提供用以连接应用软件包和应用适配器的方法来实现整合,适配器通过其开放或私有接口将信息从应用中提取出来。另外一些类型的适配器可以通过面向消息的中间件(MOM)、数据库管理系统、文件系统或其他系统和应用间接整合。有些解决方案通过接口抽象以屏蔽适配器的自然属性,来促进信息交互,从而实现和应用的交互,甚至也可以屏蔽同应用间的信息传输。这种通过接口抽象的方法提供了整合不同类型应用的高效率,也是面向接口整合方法的主要优势来源。