有口皆碑的MPEG-4
MPEG-4于1998年11月公布,预计投入使用的国际标准MPEG-4是针对一定比特率下的视频、音频编码,更加注重的是多媒体系统的交互性和灵活性。为此,MPEG-4引入了AV对象(Audio/Visual Objects),使得更多的交互操作成为可能:
“AV对象”可以是一个孤立的人,也可以是这个人的语音或一段背景音乐等。它具有高效编码、高效存储与传播及可交互操作的特性。
MPEG-4对AV对象的操作主要有:采用AV对象来表示听觉、视觉或者视听组合内容;组合已有的AV对象来生成复合的AV对象,并由此生成AV场景;对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据;允许接收端的用户在AV场景中对AV对象进行交互操作等。
MPEG-4标准则由6个主要部分构成:
1、DMIF(The Deliveries Multimedia Integration Framework,多媒体传送整体框架)。主要用于解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过传输多路合成信息来建立客户端和服务器端的连接与传输。
2、数据平面。
3、缓冲区管理和实时识别。MPEG-4定义了一个系统解码模式,该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理,可以更好地利用有限的缓冲区空间。
4、音频编码。MPEG-4不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。
5、视频编码。与音频编码类似,MPEG-4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括二维、三维动画和人面部表情动画等。
6、场景描述。MPEG-4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息组成场景描述,用于描述各AV对象在一具体AV场景坐标下,如何组织与同步等问题。
[上一页] [下一页]
|