>
首页 » 业界动态 » 数字音频接口和数字音频格式

数字音频接口和数字音频格式

作者:  时间:2008-08-28 09:52  来源:eaw

目前在数字音频应用领域中,数字音频接口数据格式标准有很多,以下是一些主要标准的简单介绍。
    AES/EBU是美国和欧洲录音师协会制定的一种高级的专业数字音频数据格式,插口硬件主要为卡侬口,目前用于一些高级专业器材,如专业DAT、顶级采样器、大型数字调音台、专业音频工作站等。
    S/PDIF是Sony和飞利浦公司制定的一种音频数据格式,主要用于民用和普通专业领域,插口硬件使用的是光缆口或同轴口,现在的DAT、CD机和MD机和计算机声卡音频数字输入输出口都普遍使用S/PDIF格式。
    ADAT(又称Alesis多信道光学数字接口)是美国Alesis公司开发的一种数字音频信号格式,因为最早用于该公司的ADAT八轨机,所以就称为ADAT格式,该格式使用一条光缆传送八个声道的数字音频信号,由于连接方便、稳定可靠,现在已经成为了一种事实上的多声道数字音频信号格式,越来越广泛地使用在各种数字音频设备上,目前许多公司的多声道数字音频接口,像Frontier公司的一系列产品,使用的都是ADAT口。
    TDIF是***Tascam公司开发的一种多声道数字音频格式,使用25针类似于计算机串行线的线缆来传送八个声道的数字信号。TDIF的命运与ADAT正好相反,在推出以后TDIF没有获得其它厂家的支持,目前已经越来越少地被各种数字设备所采用。
    R-BUS是Roland公司新推出的一种八声道数字音频格式,也被称为RMDB II。它的插口和线缆都与TASCAM公司的TDIF相同,传送的也是八声道的数字音频信号,但它有两个新增的功能。第一,R-BUS端口也可供电,这样当你将一些小型器材连接在其上使用时,这些器材可以不用插电。第二,除数字音频信号外,R-BUS还可以同时传送运行控制和同步信号。这样,当两件设备以R-BUS口连接时,在一台设备上就可以控制另一台设备。比如你将Roland公司最新的VSR-880多轨机通过R-BUS连在Roland的VM系列调音台上时,你就可以在VM调音台上直接控制多轨机的运行。

AES/EBU标准
    AES/EBU的全称是Audio Engineering Society/European Broadcast Union(音频工程师协会/欧洲广播联盟),现已成为专业数字音频较为流行的标准。大量民用产品和专业音频数字设备如CD机、DAT、MD机、数字调音台、数字音频工作站等都支持AES/EBU。
    AES/EBU是一种通过基于单根绞合线对来传输数字音频数据的串行位传输协议。它无须均衡即可在长达100m的距离上传输数据,如果均衡,可以传输更远距离。它提供两个信道的音频数据(最高24比特量化),信道是自动计时和自同步的。它也提供了传输控制的方法和状态信息的表示(channel status bit)和一些误码的检测能力。它的时钟信息是由传输端控制,来自AES/EBU的位流。它的三个标准采样率是32kHz、44.1kHz、48kHz,当然许多接口能够工作在其它不同的采样率上。
    AES/EBU提供“专业”和“消费”两种模式。它们两者最大的不同在于信道状态位格式的提供上。专业模式的状态位格式里包括数字信道的源和目的地址、日期时间码、采样点数、字节长度和其它信息。消费模式包括的东西就比较少,但包含了拷贝保护信息。另外,AES/EBU标准提供“用户数据”,在它的位流里包含用户说明(例如厂商说明等)。图1是AES/EBU专业格式24字节信道状态数据块的一部分。

字节 比特
0 1 2 3 4 5 6 7
0 PRO=1 音频? 加重 锁定 取样频率
1 声道模式 用户比特管理
2 辅助比特的使用 音频取样长度 保留
3 专供说明多声道录音之用
4 音频基准 保留
5 保留


    AES/EBU的普通物理连接媒质有:(1)平衡或差分连接,使用XLR(卡侬)连接器的三芯话筒屏蔽电缆,参数为阻抗110Ω,电平范围0.2V~5Vpp,抖动为±20ns。(2)单端非平衡连接,使用RCA插头的音频同轴电缆。(3)光学连接,使用光纤连接器。
   S/PDIF标准
    S/PDIF的全称是Sony/Philips Digital Interface Format,由于被广泛采用,它成为事实上的民用数字音频格式标准,大量的消费类音频数字产品如民用CD机、DAT、MD机、计算机声卡数字口等都支持S/PDIF,在不少专业设备上也有该标准的接口。
    S/PDIF格式和AES/EBU有略微不同的结构。音频信息在数据流中占有相同位置,使得两种格式在原理上是兼容的。在某些情况下AES/EBU的专业设备和S/PDIF的用户设备可以直接连接,但是并不推荐这种做法,因为在电气技术规范和信道状态位中存在非常重要的差别,当混用协议时可能产生无法预知的后果。
    图3是S/PDIF的24字节信道状态数据块的一部分。

字节 比特
0 1 2 3 4 5 6 7
0 PRO=0 音频? 拷贝 加重 模式
1 类别代号 一般标准
2 信号源数 声道数
3 取样频率 钟频精度 保留


    S/PDIF的普通物理连接媒质主要是采用捆紧式/光学波导连接设备,如采用BNC连接器的75Ω同轴电缆,电平范围0.2V~5Vpp,距离在10m内;还可选用光学Toslink接头和塑料光缆,距离小于1.5m;如果大于1km的距离,可使用玻璃光缆和使用编解码器。

随着计算机多媒体和网络技术的发展,数字音频设备逐渐进入千家万户。在听MP3、欣赏Flash动画,在享用着CD、MD、手机或者录音笔等数字音频设备的时候,我们一定会很奇怪:这些声音到底是以什么形式存在着?
首先,我们来明确一下数字音频的概念,它是指一个用来表示声音强弱的数据序列,由模拟声音经抽样、量化和编码后得到的。简单地说,数字音频的编码方式就是数字音频格式,我们所使用的不同的数字音频设备一般都对应着不同的音频文件格式。常见的数字音频格式有:
    1. WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。
    2. MIDI是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。MIDI文件就是MIDI格式的文件,在MIDI文件中存储的是一些指令。把这些指令发送给声卡,由声卡按照指令将声音合成出来。
    3. 大家都很熟悉CD这种音乐格式了,扩展名CDA,其取样频率为44.1kHz,16位量化位数。CD存储采用了音轨的形式,又叫“红皮书”格式,记录的是波形流,是一种近似无损的格式。
    4. MP3全称是MPEG-1 Audio Layer 3,它在1992年合并至MPEG规范中。MP3能够以高音质、低采样率对数字音频文件进行压缩。换句话说,音频文件(主要是大型文件,比如WAV文件)能够在音质丢失很小的情况下(人耳根本无法察觉这种音质损失)把文件压缩到更小的程度。
    5. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding科技公司所特有的解码技术,二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。
    6. WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。此外,WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。
    7. MP4采用的是美国电话电报公司(AT&T)所研发的以“知觉编码”为关键技术的a2b音乐压缩技术,由美国网络技术公司(GMO)及RIAA联合公布的一种新的音乐格式。MP4在文件中采用了保护版权的编码技术,只有特定的用户才可以播放,有效地保证了音乐版权的合法性。另外MP4的压缩比达到了1:15,体积较MP3更小,但音质却没有下降。不过因为只有特定的用户才能播放这种文件,因此其流传与MP3相比差距甚远。
    8. SACD(SA=SuperAudio)是由Sony公司正式发布的。它的采样率为CD格式的64倍,即2.8224MHz。SACD重放频率带宽达100kHz,为CD格式的5倍,24位量化位数,远远超过CD,声音的细节表现更为丰富、清晰。
    9. QuickTime是苹果公司于1991年推出的一种数字流媒体,它面向视频编辑、Web网站创建和媒体技术平台,QuickTime支持几乎所有主流的个人计算平台,可以通过互联网提供实时的数字化信息流、工作流与文件回放功能。现有版本为QuickTime 1.0、2.0、3.0、4.0和5.0,在5.0版本中还融合了支持最高A/V播放质量的播放器等多项新技术。
    10. VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。但VQF未公开技术标准,至今未能流行开来。
    11. DVD Audio 是新一代的数字音频格式,与DVD Video尺寸以及容量相同,为音乐格式的DVD光碟,取样频率为“48kHz/96kHz/192kHz”和“44.1kHz/88.2kHz/176.4kHz”可选择,量化位数可以为16、20或24比特,它们之间可自由地进行组合。低采样率的192kHz、176.4kHz虽然是2声道重播专用,但它最多可收录到6声道。而以2声道192kHz/24b或6声道96kHz/24b收录声音,可容纳74分钟以上的录音,动态范围达144dB,整体效果出类拔萃。
    12. Sony公司的MD(MiniDisc)大家都很熟悉了。MD之所以能在一张小小的盘中存储60~80分钟采用44.1khz采样的立体声音乐,就是因为使用了ATRAC算法(自适应声学转换编码)压缩音源。这是一套基于心理声学原理的音响译码系统,它可以把CD唱片的音频压缩到原来数据量的大约1/5而声音质量没有明显的损失。ATRAC利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性)以及人耳对信号幅度、频率、时间的有限分辨能力,编码时将人耳感觉不到的成分不编码,不传送,这样就可以相应减少某些数据量的存储,从而既保证音质又达到缩小体积的目的。
    13. RealAudio是由Real Networks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio主要适用于网络上的在线播放。现在的RealAudio文件格式主要有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured)等三种,这些文件的共同性在于随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽敞的听众获得较好的音质。
    14. Liquid Audio是一家提供付费音乐下载的网站。它通过在音乐中采用自己独有的音频编码格式来提供对音乐的版权保护。Liquid Audio的音频格式就是所谓的LQT。如果想在PC中播放这种格式的音乐,你就必须使用Liquid Player和Real Jukebox其中的一种播放器。这些文件也不能够转换成MP3和WAV格式,因此这使得采用这种格式的音频文件无法被共享和刻录到CD中。如果非要把Liquid Audio文件刻录到CD中的话,就必须使用支持这种格式的刻录软件和CD刻录机。
    15. Audible拥有四种不同的格式:Audible1、2、3、4。Audible.com网站主要是在互联网上贩卖有声书籍,并对它们所销售商品、文件通过四种Audible.com 专用音频格式中的一种提供保护。每一种格式主要考虑音频源以及所使用的收听的设备。格式1、2和 3采用不同级别的语音压缩,而格式4采用更低的采样率和MP3相同的解码方式,所得到语音吐辞更清楚,而且可以更有效地从网上进行下载。Audible 所采用的是他们自己的桌面播放工具,这就是Audible Manager,使用这种播放器就可以播放存放在PC或者是传输到便携式播放器上的Audible格式文件。
    16.VOC文件,在DOS程序和游戏中常会遇到这种文件,它是随声霸卡一起产生的数字声音文件,与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。
    17.AU文件,在Internet上的多媒体声音主要使用该种文件。AU文件是UNIX操作系统下的数字声音文件,由于早期Internet上的Web服务器主要是基于UNIX的,所以这种文件成为WWW上唯一使用的标准声音文件。
    18.AIFF(.AIF) 是苹果公司开发的声音文件格式,被Macintosh平台和应用程序所支持。
    19. Amiga声音(.SVX):Commodore所开发的声音文件格式,被Amiga平台和应用程序所支持,不支持压缩。
    20.MAC声音(.snd) :Apple计算机公司所开发的声音文件格式,被Macintosh平台和多种Macintosh应用程序所支持,支持某些压缩。
    21.S48(stereo、48kHz)采用MPEG-1 layer 1、MPEG-1 layer 2(简称Mp1,Mp2)声音压缩格式,由于其易于编辑、剪切,所以在广播电台应用较广。
    22.AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。
    数字音频给我们的生活带来了前所未有的变化。它以音质优秀、传播无损耗、可进行多种编辑和转换而成为主流,并且应用于各个方面。例如我们常使用到的音响设备、IP电话、卫星电话、数字卫星电视以及专业录音、制作等。展望未来,数字音频将会应用于更多的领域,而且会拥有更清晰、更真实的音质、更小巧的体积和更方便的传输和转换功能。

相关推荐

Bus/总线布线时如何做到等长

Bus  总线  等长  2010-06-09

研华在e-Bus智能公交系统的移动数据终端解决方案

研华  e-Bus  Intel  车载终端  2010-06-03

爱特梅尔推出汽车混合密匙应用方案

Supermicro树立服务器每瓦性能比及高性价比新标准

PM-Bus  Supermicro  服务器  2009-04-01

恩智浦SmartMX IC

恩智浦  EMV  AES  2008-12-03

用汇编实现I2C总线协议

汇编  I2C  BUS  I/O  2008-11-26
在线研讨会
焦点