多媒体

  初识多媒体
  怎样与多媒体打交道
  缤纷世界的背后
  来来往往多媒体
  多媒体时代的通行证
  如何把精彩留给自己
  新的世纪从多媒体开始

移动通信

计算机网络

智能网

光通信

微波通信

卫星通信

交换网

接入网

电信管理网

 

    
  电信博物馆 > 多媒体 > 缤纷世界的背后 > 数据库技术的挑战

 


多媒体数据库的新问题

  在传统的数据库中引入多媒体数据和操作,是一个极大的挑战。这不只是把多媒体数据加入到数据库中就可以完成的问题。传统的字符数值型的数据虽然可以对很多的信息进行管理,但由于这一类数据的抽象特性,应用范围毕竟十分有限。为了构造出符合应用需要的多媒体数据库,我们必须解决从体系结构到用户接口等一系列的问题,多媒体对数据库设计的影响主要表现在以下几个方面:

  1、数据库的组织和存储。媒体数据的数据量大,而且媒体之间的差异也极大,从而影响数据库的组织和存储方法。如动态视频压缩后每秒仍达上百K的数据量,而字符数值等数据可能仅有几个字节。只有组织好多媒体数据库中的数据,选择设计好合适的物理结构和逻辑结构,才能保证磁盘的充分利用和应用的快速存取。数据量的巨大还反映在支持信息系统的范围的扩大,显然我们不能指望在一个站点上就存储上万兆的数据,而必须通过网络加以分布,这对数据库在这种环境下进行存取也是一种挑战。

  2、媒体种类的增加增加了数据处理的困难。每一种多媒体数据类型都要有自己的一组最基本的操作和功能、适当的数据结构以及存取方式、高性能的实现。但除此之外也要有一些标准的操作,包括各种多媒体数据通用的操作及多种新类型数据的集成。虽然主要的多媒体类型只有那么几种,但事实上,在具体实现时往往根据系统定义、标准转换等演变成几种媒体格式。不同媒体类型对应不同数据处理方法,这就要求多媒体数据库管理系统能够不断扩充新的媒体类型及其相应的操作方法。新增加的媒体类型对用户应该是透明的。

  3、数据库的多解查询问题。传统的数据库查询只处理精确的概念和查询。但在多媒体数据库中非精确匹配和相似性查询将占相当大的比重。因为即使是同一个对象若用不同的媒体进行表示,对计算机来说也肯定是不同的;若用同一种媒体表示,如果有误差,在计算机看来也是不同的。与之相类似的还有诸如颜色和形状等本身就不容易精确描述的概念,如果在对图像、视频进行查询时用到它们,很显然是一种模糊的非精确的匹配方式。对其它媒体来说也是一样。媒体的复合、分散及其形象化的特点,注定要使数据库不再是只通过字符进行查询,而应该是通过媒体的语义进行查询。然而,我们却很难了解并且正确处理许多媒体的语义信息。这些基于内容的语义在有些媒体中是易于确定的(如字符、数值等),但对另一些媒体却不容易确定,甚至会因为应用的不同和观察者的不同而产生不同。

  4、用户接口的支持。多媒体数据库的用户接口肯定不能用一个表格来描述,对于媒体的公共性质和每一种媒体的特殊性质,都要在用户的接口上、在查询的过程中加以体现。例如对媒体内容的描述、对空间的描述、以及对时间的描述。多媒体要求开发浏览、查找和表现多媒体数据库内容的新方法,使得用户很方便地描述他的查询需求,并得到相应的数据。在很多情况下,面对多媒体的数据,用户有时甚至不知道自己要查找什么,不知道如何描述自己的查询。所以,多媒体数据库对用户的接口要求不仅仅是接收用户的描述,而是要协助用户描述出他的想法,找到他所要的内容,并在接口上表现出来。多媒体数据库的查询结果将不仅仅是传统的表格,而将是丰富的多媒体信息的表现,甚至是由计算机组合出来的结果。

  5、多媒体信息的分布对多媒体数据库体系所带来的巨大影响。这里所说的分布,主要是指以www(万维网)全球网络为基础的分布。Internet网的迅速发展,网上的资源日益丰富,传统的那种固定模式的数据库形式已经显得力不从心。多媒体数据库系统将来肯定要考虑如何从万维网的信息空间中寻找信息,查询所要的数据。

  6、处理长事务增多。传统的事务一般是短小精悍的,在多媒体数据库管理系统中也应该尽可能采取短事务。但有些场合,短事务不能满足需要,如从动态视频库中提取并播放一部数字化影片,往往需要长达几个小时的时间,作为良好的数据库管理系统,应该保证播放过程中不会发生中断,因此不得不增加处理长事务的能力。

  7、多媒体数据库对服务质量的要求。许多应用对多媒体数据库的传输、表现和存储的质量要求是不一样的。系统能够提供的资源也要根据系统运行的情况进行控制。我们对每一类多媒体数据都必须考虑这些问题,如何按所要求的形式及时地、逼真地表现数据;当系统不能满足全部的服务要求时,如何合理地降低服务质量;能否插入和预测一些数据;能否拒绝新的服务请求或撤销旧的请求,等等。

  8、多媒体数据管理还要考虑版本控制的问题。在具体应用中,往往涉及对某个处理对象的不同版本的记录和处理。版本包括两种概念。一是历史版本,同一个处理对象在不同的时间有不同的内容,如CAD设计图纸,有草图和正式图之分;二是选择版本,同一处理对象有不同的表述或处理,一份合同文献就可以包含英文和中文两种版本。我们需要解决多版本的标识、存储、更新和查询,尽可能减少各版本所占存储空间,而且控制版本访问权限。但现有的数据库管理系统一般都没有提供这种功能,而由应用程序编制版本控制程序,这显然是不合理的。

[上一页] [下一页]