Jump to content

Polycom® Siren/G 722.1 常见问题解答

联系宝利通

什么是 G.722.1?

《ITU-T 推荐标准 G.722.1》是一种先进的国际标准宽频带音频压缩算法,在四年的遴选过程中经过了广泛的测试后于 1999 年 9 月 30 日获批。它基于 Polycom 的第三代 Siren™ 压缩技术,衍生自 Polycom 经过现场检验的 PT716plus 算法。这种为了满足多媒体界苛刻的音频需要而开发的技术,音质高、码率低、延迟小、复杂度极低,适用于语音、音乐、歌唱等所有音频信号类型。

返回顶端

什么是 16 kbps Siren™?

16 kbps Siren™ 是 G.722.1 标准的扩展,工作于 16 kbps。

返回顶端

如何得到 ITU-T 推荐标准 G.722.1?

G.722.1 电子版可直接从国际电联网上书店购买,网址为:http://www.itu.int/rec/T-REC-G.722.1/en.

而在使用 ITU-T 推荐标准 G.722.1 前,需要与 Polycom 签署使用许可协议。

返回顶端

ITU-T 推荐标准 G.722.1的确切内容有哪些?

ITU-T 推荐标准 G.722.1包括以下项目:

  • 宽频带编码算法的描述。
  • 编码器与解码器的参考 C 代码。
  • 测试向量(信号),一种协助实施方核对实现是否准确的工具。

返回顶端

如何实现 G.722.1?

首先从 ITU 购买一份《ITU-T 推荐标准 G.722.1》,其中包括算法实现需要的全部信息。G.722.1 在任何硬件实现上的输出信号,与参考 C 代码在处理同样的输入信号时的输出信号必须完全相符。标准中提供的测试向量用以对实现的准确性进行测试。

其中具有输入和输出向量,用以对编码器和解码器的实现进行测试。测试向量经过专门设计,能够尽可能多地进行算法检查。因此,任何成功地再现了输出测试向量的实现,均会被视为准确地再现了参考 C 代码的性能。

返回顶端

下载 G.722.1 演示程序

SirenZip 是一个在 Microsoft Windows 95 或更高版本上运行的程序。该程序执行 G.722.1,可选的码率共有三种(16,000 kbps 扩展、24,000 kbps 或者 32 kbps)。请下载 SirenZip 免费体验版(文件大小 208 KB)。

SirenZip 的使用方法

  • SirenZip 下载后可立即使用。
  • 双击 SirenZip.exe。单击 Siren™ Encode(Siren™ 编码)后输入正确的音频源和输出码率文件名。选择正确的码率,然后单击Play Wav Input(播放波形输入)收听输入文件,或者单击Encode Wave Input(编码波形输入),采用 G.722.1 压缩文件。
  • 需要解码时,请单击 Siren™ Decode(Siren™ 解码),然后输入正确的码率源文件和音频输入文件名。然后或者单击 Play Wav Output(播放波形输出) ,收听 G.722.1 解码后的输出文件,或者单击(解码码率) ,采用G.722.1 对音频输出进行合成处理。<
  • 使用 SirenZip 时需要注意以下几点:
    • 编码器接受单声道波形格式的音频输入文件。
    • 解码器输出单声道波形格式的音频文件。
    • 码率可在编码器中设置,解码器将自动了解正确的工作码率。
    • 长度大于 60 秒的音频输入文件将被自动截短为 60 秒。
    • 音频输出可以采用 16,000 Hz or 22,050 Hz 两种码率之一。输入采用 22,050 Hz 采样时,SirenZip 会把码率降到正确的码率,也就是 16 kHz;这可能会导致音频保真度发生某种变化。建议尽量使用 16 kHz 采样率。

返回顶端

技术规格

TU-T 标准将 G.722.1 规定为定点算法。浮点版本今后会由 ITU-T 予以标准化,并且该版本与定点标准之间将具备互操作能力(Polycom 有具备互操作能力的浮点算法)。下面针对三种不同 DSP 类型上未经优化的实现,举例列出了 MIPS 复杂度数字。注意其中显示的两种 DSP 采用的是浮点。

G.722.1 常规参数

参数

音频采样率

16 kHz

码率(该速率可能在任何帧分界上变化)

16、24、32 kbps(16 kbps 是 Polycom 对标准的扩展)。

音频带宽

 

50 Hz - 7 kHz.

音频帧大小

 

20 毫秒

算法时延(见注 1)

 

40 毫秒 

RAM(定点)

 

< 7.5 k bytes

ROM 表空间(定点)

 

~ 20 k bytes

 

编码器和解码器之间的 MIPS 比率

 

约 1:1

 

不同处理器的 MIPS 数字示例

 

处理器

MIPS(编码 + 解码)

TI TMS320C50

 

13.9(= 6.95 + 6.95)(定点 G.722.1 的非最优代码)

 

TriMedia TM 1300

 

4(= 2+2)(浮点实现)

 

TI TMS320C31

9.25(= 4.51+4.51)(浮点实现)

 

返回顶端

为什么要使用宽频带?

传统电话被称为“窄带”,因为它只能在 300-3500 Hz 的范围内传输音频信号,带宽只有 3.2 kHz。与高保真系统中丰富的宽频带声音相比,这种较窄的带宽会使电话呼叫产生特有的“尖声尖气”感。G.722.1 提供 7 kHz 的音频带宽(50-7000 Hz)。这是一个很大的改进,音质更接近于调频广播而非普通电话。与窄带音质相比,所有人都更愿意享受宽带音频。

比如说,打电话时人们可能会把“see”和“fee”混为一谈--在高频再现不足时“f”和“s”会丧失清晰度,非常容易听混。但在宽频带编码中,由于语音所需的全部频率均能得到全面表现,因此不会发生这种混淆。

使用宽频带时的全音频体验要自然、悦耳得多。

G.722.1 还能以前所未有的低码率实现出色的音乐再现。它的声音比调幅广播要好得多。

返回顶端

应用

G.722.1 与16 kbps Siren™ 的应用举例:

  • 宽频带 IP 电话
  • 因特网音频流(包括音乐!)
  • 视频会议
  • 音频会议
  • 录音回放(录音机等等)
  • 存储转发消息(语音邮件)
  • 在网站上添加音频功能

IP 电话、视频会议和音频会议的音频需要非常类似:音质高、时延短、复杂度低。此外还必须具备改变码率的能力以适应通道要求。在任何 20 毫秒的帧边界上,G.722.1都允许在 24 kbps、32 kbps 以及 Siren™ 扩展 16 kbps 之间改变码率。

在流应用中,客户端绝对需要满足低复杂度和低成本要求。而 G.722.1 正满足了这一要求,同时还不会影响质量。由于码率为 16 kbps、24 kbps 和 32 kbps,因此客户端甚至在 V.90(56 kbps)调制解调器连接上也能体验到高质量的音频。

消息传递是一种存储转发应用。低复杂度意味着低成本的硬件实现。而高质量的音频压缩则确保了发送方的语音与音乐可以得到出色的再现。

返回顶端

亲耳体验 G.722.1 和 16 kbps Siren™

请下载这些 .WAV 文件,亲耳体验 G.722.1 的出色质量。

(注意:这些示例文件均属于未压缩的 .WAV 文件,可在任何计算机上播放。播放时无需 G.722.1 编解码器,但由于未经压缩,所以下载起来会需要一些时间。)

语音文件

下载

3.5 kHz 音频带宽,POTS 长话级质量

  speech_3p5kHz_mulaw.wav (下载大小为 114 KB)

7 kHz 音频带宽,使用 Siren™ 以 16 kbps 编码

 speech_16kbps_siren.wav (下载大小为 452 KB)

7 kHz 音频带宽,使用 Siren™ 以 24 kbps 编码

 speech_24kbps_g722p1.wav (下载大小为 452 KB)

7 kHz 音频带宽,使用 Siren™ 以 32 kbps 编码

 speech_32kbps_g722p1.wav (下载大小为 452 KB)

音乐文件

下载

3.5 kHz 音频带宽,POTS 长话级质量

 music_3p5kHz_mulaw.wav (下载大小为 72 KB)

7 kHz 音频带宽,使用 Siren™ 以 16 kbps 编码

 music_16kbps_siren.wav (下载大小为 286 KB)

7 kHz 音频带宽,使用 Siren™ 以 24 kbps 编码

 music_24kbps_g722p1.wav (下载大小为 286 KB)

7 kHz 音频带宽,使用 Siren™ 以 32 kbps 编码

 music_32kbps_g722p1.wav (下载大小为 286 KB)

返回顶端

Siren™ 与 Windows Media Player 和 MP3 之比较

即使用户的因特网访问速度较低,Siren™ 也能够以较低的码率实现非常出色的效果(比如说采用 28.8 到 56 kbps 拨号调制解调器访问因特网时)。请试听以下文件,做一下比较:

22 kbps 下 14 kHz 音频带宽时 Siren™ 与 Windows Media Player(仅支持 22 kbps 下 44 kHz 采样率)*。

码率

下载

下载

22 kbps

 siren_22kbps.wav

 wmplayer_22kbps.asf

*Windows Media Player 的带宽由码率决定,在 44 kHz 高采样率情况下,音频带宽只能为 20 kHz。

24 kbps 下 14 kHz 音频带宽时 Siren™ 与 MP3(码率为 24 kbps 时,最大音频带宽为 11 kHz)之比较

码率

下载

下载

24 kbps

 siren_24kbps.wav

 mp3_24kbps.asf

返回顶端

H.320、H.324 和 H.323 系统的能力交换

为使不同厂商的设备在使用 G.722.1 时能够做到互操作,有必要针对 G.722.1,对能力交换及模式选择实现标准化。对于 H.320、H.323 和 H.324 系统来说,这些技术问题已经在 ITU-T 第 16 研究组中定义完毕。

被许可方将得到按照 ITU-T 标准协商使用 G.722.1 所必需的所有信息,以及厂商间对 Polycom 16 kbps 标准扩展的互操作使用所需的能力交换和协商程序。

返回顶端

ITU 是什么样的机构?

ITU 就是国际电信联盟,简称国际电联,总部设于瑞士的日内瓦。国际电联成立于 1865 年,是世界上历史最悠久的国际条约组织,目前为联合国的下设机构,负责包括电话、无线电和数据通讯在内的国际电信技术的标准化。更多信息参见国际电联网站: http://www.itu.int.

返回顶端

技术联系方式

如需了解更多的技术信息,请致函: SirenInfo@polycom.com

www.polycom.com.cn是宝利通中国官方网站,为远程呈现及视音频会议客户提供权威的产品信息。

Polycom通讯系统(北京)有限公司, 北京东三环北路5号北京发展大厦6层, 邮编:100004, 其他办事处

电话:+86 10 85884800, 传真:+86 10 65908368

© Polycom, Inc. 保留所有权利。荷兰宝利通隶属美国宝利通(因商务注册规定)