第三章 MPEG-7
标准介绍
MPEG-7[18]的正式名称为“
多媒体内容描述接口”(Multimedia Content
Description Interface)。其制定目标就是通过制定一组
标准的
描述符
(Descriptor) 及其
描述方案(Description Scheme)来为不同类型的
多媒体信息
提供一套
描述多媒体内容数据的
标准化
工具集, 使得
内容描述与媒体
内容结合,
构造一个统一的、
标准的
多媒体检索平台来支持基于
内容的快速、高效的检索,
满足实时、非实时以及推拉应用的需求。
本章介绍了 MPEG-7 目标和对象、体系结构、
描述工具、
描述定义语言及系
统
工具。
3.1 MPEG-7 目标和对象
MPEG-7
标准的目的是要制定一种针对各类
多媒体信息的
描述标准。该
描述
与
内容有关,并能够达到快速高效地搜索用户感兴趣的素材。
无论
描述的形式如何,
描述都可以附在任何一种
多媒体素材之后。具有此种
附加信息的存储素材就可以被方便地索引和搜索了。尽管 MPEG-7
描述与被
描述
内容的表达方式无关,但在一定程度上还是依赖于 MPEG-7
标准,在该
标准中提
供了一种将声音图像
内容作为在时间(同步)和空间(屏幕)上有一定联系的对
象来编码的方法。
MPEG-7 定义的“
多媒体”含义十分广泛,包括:
1. 客观类:图像、图表、文本、三维模型、音频、语音、视频等。
2. 主观类:对对象/事件的概括、人的感性色彩等。
3. 合成类:各种元素之间的有机结合以构成一个真正意义上的
多媒体演
示。如人的面部表情、性格特征、以至一段电影的主题都是 MPEG-7 中
的数据类型之一。
为此,MPEG-7 定义了“
标准描述子集合(Standard Set of Descriptors)”用
于
描述各种类型的
多媒体数据,与之相应的“
描述方案(Description Schemes)”
用于规范
多媒体描述子的生成和不同
描述子之间的有机联系。这些
描述子与所指
定的
多媒体对象的
内容紧密联系,采用提取对象特征的方法为实现基于
内容的语
义的准确检索提供了接口。在此基础上,MPEG-7 定义了一种新的语言——
“
描述定义语言(Description Definition Language)”用于指定和生成
描述方案。
和 VHDL 语言在超大规模集成电路应用中所扮演的角色一样,DDL 语言是
MPEG-7 的核心。
要充分地利用
多媒体信息
描述,特征(
描述符)的自动提取是十分有用的。
但是根据 MPEG 一贯坚持的“制定最少的、最有用的”原则,MPEG-7 主要集
中在对便于
多媒体信息分类的表达方法进行
标准化。而特征提取算法、声音图像
内容识别
工具不属于 MPEG-7
标准的界定范围。同样,搜索机制和音频或视频
回放技术也不包括在 MPEG-7
标准中,而只确定
描述与搜索机制之间的接口。
开发声音图像
内容识别
工具、特征抽取
工具、搜索和音频视频回放
工具是工业界
的任务,他们会生产销售符合 MPEG-7 的产品。
符合 MPEG-7
标准的
描述可以是手工输入的,也可以是自动提取的,
标准
中对此并不作规定。但某些特征最好自动提取(如色彩、纹理),但另一些特征
则很难甚至不可能自动提取,所以要根据
描述的
内容和层次来决定。
MPEG-7 可以独立于其它 MPEG
标准使用,例如符合 MPEG-7
标准的
描述
甚至可以附在非数字模拟影片之后。但是 MPEG-7
标准也利用了 MPEG-4
标准
提供的用对象来
描述声音图像数据的方法,这一表达方法是
多媒体信息分类过程
的基础。同时,MPEG-7
描述又可以帮助改进以往 MPEG
标准编码的性能。所
以各 MPEG
标准是相互独立又相互联系的。
MPEG-7 所主要讨论的应用可分为 3 大类:①索引和检索类应用(也称“PULL”
应用),例如视频数据库的存储检索、商标的注册和检索、向专业生产者提过图
像和视频、商用音乐、音响效果库等;②选择和过滤类应用(也称“PUSH”应用),
例如个人化电视服务(IPTV 等)、智能化
多媒体表达;③与传统的面向媒体的应
用不同,是与 MPEG-7 中要定义的“元(meta)”
内容表达有关的专业化的应用,
例如远程购物、教学教育、保安监视等。
3.2 MPEG-7 体系结构
MPEG-7
标准主要单元包括:
1.
描述工具:定义了各个特征的语法与语义的
描述符(D),详细说明了各
部分(包括
描述符和
描述规范)之间联系的结构和语义的
描述规范(DS)。
2.
描述语言(DDL):定义 MPEG-7
描述工具的语法,允许建立新的
描述规
范和
描述符。必要时,也允许扩展和更改己经存在的
描述规范。
3. 系统
工具:支持有效存储、传送的二进制码的表示法,支持播放机制
(文本或二进制形式)、多路技术支持、
描述内容同步,管理和保护在 MPEG-7 中
描述的知识产权等。保护在 MPEG-7 中
描述的知识产权等。
MPEG-7
描述工具不依赖于己经被编码或为存储所做的
描述,是满足各种需
要的
描述音视频信息的
标准。MPEG-7
标准是建立在其它
标准描述法如 MPEG-1,
MPEG-2,MPEG-4 等的基础上。MPEG-7
标准的泛函性在于它提供了合适的接触这
些
标准的某一部分的方法。MPEG-7 允许在它的
描述中采用不同的梯度,提供尽
可能多的不同水平的分辨率。尽管 MPEG-7 采用几种不同观点
描述内容,但建立
在这些观点上的这一套
描述工具现在作为一个整体的几个部分。它们在很多方面
是相互联系的,是可以相互结合的。
使用 MPEG-7
描述工具进行
内容描述时,与
描述内容自身有关,允许快速和
有效的进行查询。按照使用者的意愿进行过滤。MPEG-7 在不同的环境有不同的
应用,意味着它必须提供灵活的和可扩展的结构来
描述视听数据。而且,MPEG-7
没有提供单一模式的
内容描述系统,而是提供了一套根据不同的观点
描述视听内
容的方法和
工具。根据这些要求,MPEG-7 被设计成考虑或包含其他
标准的所有
观点的一种
标准。同时 MPEG-7 已经尽可能往通用的方面发展。MPEG-7 没有把目
标定在任何特殊的应用,相反,MPEG-7
标准尽可能的支持最大范围的应用。