《ITU-T 推荐标准 G.722.1》是一种先进的国际标准宽频带音频压缩算法,在四年的遴选过程中经过了广泛的测试后于 1999 年 9 月 30 日获批。它基于 Polycom 的第三代 Siren™ 压缩技术,衍生自 Polycom 经过现场检验的 PT716plus 算法。这种为了满足多媒体界苛刻的音频需要而开发的技术,音质高、码率低、延迟小、复杂度极低,适用于语音、音乐、歌唱等所有音频信号类型。
16 kbps Siren™ 是 G.722.1 标准的扩展,工作于 16 kbps。
G.722.1 电子版可直接从国际电联网上书店购买,网址为:http://www.itu.int/rec/T-REC-G.722.1/en.
而在使用 ITU-T 推荐标准 G.722.1 前,需要与 Polycom 签署使用许可协议。
首先从 ITU 购买一份《ITU-T 推荐标准 G.722.1》,其中包括算法实现需要的全部信息。G.722.1 在任何硬件实现上的输出信号,与参考 C 代码在处理同样的输入信号时的输出信号必须完全相符。标准中提供的测试向量用以对实现的准确性进行测试。
其中具有输入和输出向量,用以对编码器和解码器的实现进行测试。测试向量经过专门设计,能够尽可能多地进行算法检查。因此,任何成功地再现了输出测试向量的实现,均会被视为准确地再现了参考 C 代码的性能。
SirenZip 是一个在 Microsoft Windows 95 或更高版本上运行的程序。该程序执行 G.722.1,可选的码率共有三种(16,000 kbps 扩展、24,000 kbps 或者 32 kbps)。请下载 SirenZip 免费体验版(文件大小 208 KB)。
SirenZip 的使用方法
TU-T 标准将 G.722.1 规定为定点算法。浮点版本今后会由 ITU-T 予以标准化,并且该版本与定点标准之间将具备互操作能力(Polycom 有具备互操作能力的浮点算法)。下面针对三种不同 DSP 类型上未经优化的实现,举例列出了 MIPS 复杂度数字。注意其中显示的两种 DSP 采用的是浮点。
G.722.1 常规参数
参数 |
值 |
|---|---|
音频采样率 |
16 kHz |
码率(该速率可能在任何帧分界上变化) |
16、24、32 kbps(16 kbps 是 Polycom 对标准的扩展)。 |
音频带宽 |
50 Hz - 7 kHz. |
音频帧大小 |
20 毫秒 |
算法时延(见注 1) |
40 毫秒 |
RAM(定点) |
< 7.5 k bytes |
ROM 表空间(定点) |
~ 20 k bytes |
编码器和解码器之间的 MIPS 比率 |
约 1:1 |
不同处理器的 MIPS 数字示例
处理器 |
MIPS(编码 + 解码) |
|---|---|
TI TMS320C50 |
13.9(= 6.95 + 6.95)(定点 G.722.1 的非最优代码) |
TriMedia TM 1300 |
4(= 2+2)(浮点实现) |
TI TMS320C31 |
9.25(= 4.51+4.51)(浮点实现) |
传统电话被称为“窄带”,因为它只能在 300-3500 Hz 的范围内传输音频信号,带宽只有 3.2 kHz。与高保真系统中丰富的宽频带声音相比,这种较窄的带宽会使电话呼叫产生特有的“尖声尖气”感。G.722.1 提供 7 kHz 的音频带宽(50-7000 Hz)。这是一个很大的改进,音质更接近于调频广播而非普通电话。与窄带音质相比,所有人都更愿意享受宽带音频。
比如说,打电话时人们可能会把“see”和“fee”混为一谈--在高频再现不足时“f”和“s”会丧失清晰度,非常容易听混。但在宽频带编码中,由于语音所需的全部频率均能得到全面表现,因此不会发生这种混淆。
使用宽频带时的全音频体验要自然、悦耳得多。
G.722.1 还能以前所未有的低码率实现出色的音乐再现。它的声音比调幅广播要好得多。
G.722.1 与16 kbps Siren™ 的应用举例:
IP 电话、视频会议和音频会议的音频需要非常类似:音质高、时延短、复杂度低。此外还必须具备改变码率的能力以适应通道要求。在任何 20 毫秒的帧边界上,G.722.1都允许在 24 kbps、32 kbps 以及 Siren™ 扩展 16 kbps 之间改变码率。
在流应用中,客户端绝对需要满足低复杂度和低成本要求。而 G.722.1 正满足了这一要求,同时还不会影响质量。由于码率为 16 kbps、24 kbps 和 32 kbps,因此客户端甚至在 V.90(56 kbps)调制解调器连接上也能体验到高质量的音频。
消息传递是一种存储转发应用。低复杂度意味着低成本的硬件实现。而高质量的音频压缩则确保了发送方的语音与音乐可以得到出色的再现。
请下载这些 .WAV 文件,亲耳体验 G.722.1 的出色质量。
(注意:这些示例文件均属于未压缩的 .WAV 文件,可在任何计算机上播放。播放时无需 G.722.1 编解码器,但由于未经压缩,所以下载起来会需要一些时间。)
语音文件 |
下载 |
|---|---|
3.5 kHz 音频带宽,POTS 长话级质量 |
|
7 kHz 音频带宽,使用 Siren™ 以 16 kbps 编码 |
|
7 kHz 音频带宽,使用 Siren™ 以 24 kbps 编码 |
|
7 kHz 音频带宽,使用 Siren™ 以 32 kbps 编码 |
|
音乐文件 |
下载 |
|---|---|
3.5 kHz 音频带宽,POTS 长话级质量 |
|
7 kHz 音频带宽,使用 Siren™ 以 16 kbps 编码 |
|
7 kHz 音频带宽,使用 Siren™ 以 24 kbps 编码 |
|
7 kHz 音频带宽,使用 Siren™ 以 32 kbps 编码 |
|
即使用户的因特网访问速度较低,Siren™ 也能够以较低的码率实现非常出色的效果(比如说采用 28.8 到 56 kbps 拨号调制解调器访问因特网时)。请试听以下文件,做一下比较:
22 kbps 下 14 kHz 音频带宽时 Siren™ 与 Windows Media Player(仅支持 22 kbps 下 44 kHz 采样率)*。
码率 |
下载 |
下载 |
|---|---|---|
22 kbps |
*Windows Media Player 的带宽由码率决定,在 44 kHz 高采样率情况下,音频带宽只能为 20 kHz。
24 kbps 下 14 kHz 音频带宽时 Siren™ 与 MP3(码率为 24 kbps 时,最大音频带宽为 11 kHz)之比较
码率 |
下载 |
下载 |
|---|---|---|
24 kbps |
为使不同厂商的设备在使用 G.722.1 时能够做到互操作,有必要针对 G.722.1,对能力交换及模式选择实现标准化。对于 H.320、H.323 和 H.324 系统来说,这些技术问题已经在 ITU-T 第 16 研究组中定义完毕。
被许可方将得到按照 ITU-T 标准协商使用 G.722.1 所必需的所有信息,以及厂商间对 Polycom 16 kbps 标准扩展的互操作使用所需的能力交换和协商程序。
ITU 就是国际电信联盟,简称国际电联,总部设于瑞士的日内瓦。国际电联成立于 1865 年,是世界上历史最悠久的国际条约组织,目前为联合国的下设机构,负责包括电话、无线电和数据通讯在内的国际电信技术的标准化。更多信息参见国际电联网站: http://www.itu.int.
如需了解更多的技术信息,请致函: SirenInfo@polycom.com