对于IT产业而言,这个产业之所以被冠之以“信息”技术产业,就是因为几乎其所有的应用都是围绕信息展开的。信息之于信息产业就好像材料之于传统工业一样,是整个产业的根基。
下面我们来简单分析一下信息的含义内容在计算机应用的三个阶段中的作用和影响。
在计算机的数值计算时代,计算机所处理的数据只具有非常单一的语义性质。
在应用中,数据的含义内容不会带来处理上的困难,只需提供合适的具体数据算法,计算机就能解决问题。所以,在这类应用中不必对被处理的数据所具有的含义内容加以特别的关注。
在计算机面向结构化数据应用的时代,计算机处理的是在有限维度语义空间中定义的数据。
与数值计算中的数据相比,这样的数据语义虽然趋向复杂,但是其语义的含义依然十分明确清晰。利用有限维度语义空间,可以对数据进行完善的管理操作。而关系型数据库正是可以实现有限维度语义空间并对其进行管理和操作的有效工具和手段。
当然,放入关系型数据库的不都是结构化数据,结构化数据也不是都必然要放入关系型数据库。结构化数据的语义内容,在这里既是被管理的对象,也成为了对数据进行有效管理的基本手段,因而也构成了数据应用的基础。
进入非结构化信息及信息分享时代,由于信息的含义内容多变复杂,使得我们无法用有限维度语义空间来对其进行完整严格的描述。
如果一定要建立一个语义空间,来比较完整地描述一般性非结构化信息的话,必然遇到语义的不确定性与开放性所带来的不可克服的困难。而问题的不确定性和开放性都是计算机在本质上所无法有效面对的。所以,仅仅从语义的角度,试图对非结构化信息做有效的管理与操作是不现实的,这是目前很多相关研究陷入的误区。
这些研究试图用语义空间或其他的仅仅基于语义的方法,来解决非结构化信息管理和应用中的一切,至少是核心问题。要对非结构化信息做有效的管理和操作,我们不仅需要超越语义内容的视角,而且要超越信息含义内容的视角。
事实上,信息本身是对某个对象的描述。在大量非结构化信息出现以前,在计算机的数值计算与基于结构化数据应用中,信息(结构化数据)的生成是为了实现特定的具体应用,信息都是被当作对某个对象的描述来使用的。
信息是手段和材料,被用来加工以达到其他目的。在整个应用中,信息处于从属地位。这个时候的信息的内涵相对简单,基本是数值与相对简单的结构化数据,而且信息不是应用的目的。
但是当我们进入非结构化信息大量涌现的时代后,信息不再仅仅是为某个特定具体应用而生成和存在,它的内涵也变得复杂,而且具有多种不确定、可能的或潜在的应用。比如一张照片,在不同的时间和场合,会有不同的可能用途。非结构化信息的这些特点,使得信息的管理本身在计算机应用的第三个阶段成为了一个十分重要的主题。在非结构化信息管理中,信息本身不再仅仅是其描述对象的附属,而成为了计算机信息管理的对象和主体。信息本身成为了应用的目的之一。
当我们关注的焦点,由信息支撑的特定具体应用,转移到信息本身的时候,当我们将信息本身不是作为手段,而是作为目的和对象来审视与管理的时候,特别是当信息的含义变得更加复杂的时候,便产生了对一个信息全面理解与描述的需求。因此我们引入了“主信息”、“附属信息”、“形式化表达”、“含义内容”与“全信息”等概念。
全信息试图不仅对信息本身,而且对信息的产生与使用全生命过程,不同信息之间的关系以及信息存在的环境等相关方面做“全信息”性描述。或者说,“全信息”的引入,正是将复杂的信息自身作为主体对象来全面审视的必然结果。我们也正是试图基于对信息的全面理解,来寻找复杂的非结构化信息的有效管理方式,以及建立在此基础上的信息有效的应用方式。
谢耘
……
关注读览天下微信,
100万篇深度好文,
等你来看……