(2)建立网络资源数据库:数据库是将所获得的信息资源按照固定的记录格式存储组织,
它最小存贮单位是字段,数据库方式是对大量规范化数据进行组织管理的技术,它具有以
下优点:第一、对大量的结构化数据处理效率很高。大大提高了信息的管理效率。第二、可根
据用户需求灵活地改变查询结果集的大小,从而大大降低了网络数据传输的负载。
(
3)超媒体组织的方式。这种信息组织方式是将超文本与多媒体技术结合起来组织网
络信息资源的一种主要方式。超文本方式打破了顺序线性存取的限制,将文本信息组织成立
体网状结构,使用户可以从任一节点开始,根据网页中信息之间的联系,从不同角度浏览
与查询信息。超媒体方式是将文本、表格、声音、图像等多媒体信息以超文本格式组织起来,
通过节点与链接结构在数据库中寻找所需的媒体信息。采用超媒体方式组织信息资源的优势
主要有:
第一,以非线性的方式组织信息,符合人们思维联想与跳跃习惯。 第二、节点中的
内容可多可少,结构可以任意伸缩,具有良好的包容性和可扩充性。
第三。方便描述和建立
各种媒体之间的语义联系,完全超越媒体类型对信息组织与检索的限制。
二、网络信息资源的组织技术
(
1)WEB 数据库的基础技术。所谓 WEB 数据库,其实质是在传统的关系数据库技术
之上,融最新的网络技术、数据库技术、存储技术和检索技术为一体,完全基于
Internet 应用
的数据库结构和数据库模型的新型数据库。典型的
WEB 数据库系统有一个 WEB 游览器作
为用户界面,一个数据库服务用作信息存储和一个连接两者的
WBB 服务器。用户使用
WEB 浏览器访问 WEB 页,通过 WEB 页上显示的表格与数据库进行交互操作。
(
2)数据仓库技术。数据仓库(Date Warehouse)数据仓库是支持管理决策过程的,
面向主题的、集成的、随时间而变的、持久的数据集合;而斯坦福大学数据仓库研究小组则认
为"数据仓库是集成信息的存储中心,这些信息可用于查询或分析"。目前己成为企业决策
者进行管理分析和决策的一种有利工具。而
Internet 也使得任意时间任意地点对信息的访问
变得更容易,代价更低。这两项技术结合起来可以使得重要信息的处理和传输更有效、更经
济,因此它导致了基于网络的数据仓库技术的产生。
(
3)基于 WEB 数据挖掘技术。Web 挖掘是利用数据挖掘技术从 Web 文档及 Web 服务
中自动发现并提取人们感兴趣的信息。它是一项综合技术,涉及到
Internet 技术、人工智能、
计算机语言学、信息学、统计学等多个领域。通常
Web 挖掘过程可以分为以下几个处理阶段:
资源发现、数据抽取及数据预处理阶段、数据汇总及模式识别阶段、分析验证阶段。
Web 挖掘
可分为三类:内容挖掘、结构挖掘、用户访问模式挖掘,而
Web 内容挖掘和用户访问模式挖
掘是
Web 挖掘的两个主要方面。
(
4)搜索引擎技术。搜索引擎,,一般是指通过超文本(超媒体)技术和在 Internet 网上
建立的一种向网络用户提供网上信息资源检索和导航服务的专门站点或服务器。它通过搜集
网上的信息,如网站、网页、
URL、以及非 WWW 形态的 BBS、Telnet、FTP、Newsgroup 等,进
行整理、组织、加工、处理,建立管理和存储这些信息的索引数据库,并提供基于该索引数据
库的检索。搜索引擎的最终目的是能够根据用户需求查找到相关信息。
(
5)指引库技术。所谓指引库是指所建立的数据库中,从物理上讲并不存储实际的信
息资源,但对其进行访问却可以检索到有关数据库的实际资源,即指引用户到特定的地址
获取所需信息,这样就可以把因特网上与某一或某些主题相关的节点进行集中,按照方便
用户检索的原则,用熟悉的语言组织起来,向用户提供这些资源的分布情况,指引用户查
找。信息资源指引库包括三部分:一批反映该专业国外信息源的
URL;一批原始信息,包
括访问频度高的原始信息资源的镜像,自建的信息资源等;一套方便信息组织与用户查询
的支持技术。