数字音频信号接口技术

更新时间:2024-03-17 作者:用户投稿原创标记本站原创 点赞:3282 浏览:9651

摘 要 :在演播室中各种数字音频设备之间需要相互连接,这些设备包括数字录音机,数字录像机的音频系统,调音台等,由于数字音频的基带信号的带宽已接近视频信号,用简单的连接是不行的,两端的阻抗必须匹配,否则会造成接收端数字波形有效大失真.本文主要对现在广泛使用的AES/EBU数字音频接口标准进行介绍.

关 键 词 :数字音频 接口 AES/EBU

中图分类号:TN74 文献标识码:A 文章编号:1007-9416(2013)04-0050-02

在演播室中各种数字音频设备之间需要相互连接,这些设备包括数字录音机,数字录像机的音频系统,调音台等,由于数字音频的基带信号的带宽已接近视频信号,用简单的连接是不行的,两端的阻抗必须匹配,否则会造成接收端数字波形有效大失真.

在采用电缆连接不同的电视设备传输数字音频信号时,有两种接口类型.第一种双绞线的平衡方式传输信号,电缆连接头是XLR型,由AES/EBU(Audio Engineering Society即美国音频工程协会和European Broadcast Union即欧洲广播联盟)规定;第二种是使用同轴电缆的非平衡方式传输信号,电缆连接头是BNC型,由PTE 276M建议规定.

我国行业标准GY/T 158-2000《演播室数字音频信号接口》(Digital audio signal interface for broadcasting studios)是参照AES/EBU标准制定的.

1.数字音频接口

1.1 AES/EBU数字音频接口

如图所示为一个AES/EBU编码器对数据样值进行编码的简单框图(图1).

AES/EBU数字音频接口标准时传输和接收数字音频信号的数字设备接口协议.标准中规定,音频数据必须以2的补码编码,传输介质是电缆,在串行传输16bit-20bit的并行字节时先传输最低有效位,必须加入字节时钟标志以表明每个样值的开始,最后的数据流为双相标志码编码等.

1.2 接口信号格式

接口可以对取样频率为48Khz,44Khz和32Khz,量化比特数位24,20,16的数字音频信号进行实时传输,并能提供辅助信息,这些辅助信息可以向接收端提供所传输数据的各种重要参数,如误码检测和同步信息等.

2.数字音频数据的结构

2.1 数字音频数据的帧结构

一个音频帧包括两个32比特的子帧(子帧1和子帧2),一个子帧只包括一个音频声道的一个样值数据:20比特同步数据和4个附加比特.如(图2)所示.

4个附加比特:

有效比特(V):样值数据是音频且可进行D/A转换,则此比特置0.否则样值有问题,接收设备将输出静音.

用户比特(U):送至一个28×8bit的存储器.一个音频块中每个声道有192个子帧,因而该存储器中有192个用户比特.

通道比特(C):送到一个28×8bit的通道状态存储器.此比特对于音频数据内容的标识非常重要.

通道状态存储器描述了在AES/EBU数据流通道中比特分配及其含义.例如的字节0的比特0表示是家用级还是专业级,如果通道用于消费,字节0中比特0置0;用于专业时置1.

奇偶校验比特(P):通常为偶校验.偶校验确保在一个子帧的64个双相标志码元中1的数目是偶数.奇偶校验比特可以检测在传输中发生的奇数个错误.一些设备忽略此比特或者没有正确地处理这种标识.

2.2 数字音频的块结构(Block Structure)

每192个音频帧构成一个块.在数据流中用标志符Z标识每个块的开始.在一个48kHz抽样的系统中每个音频帧的时间是20.83s.一个AES/EBU块的时间为20.83s×192等于4000s.

三种4比特的同步数据的意义:Z:表示每个音频块第一帧的开始.X:表示一个块内其余每帧的开始.Y:表示每个帧的子帧2开始.

这些同步数据长度均为4比特,与子帧中其它数据结构不同,不用双相标志码编码.

3.AES/EBU数据特性

抽样频率为48Khz时总数据率为32×2×48000等于3.072Mbps.在双相标志码编码后,数据传输率提高到两倍为6.144Mbps.双相标志码的频谱能量在6.144MHz的倍频处为0.

同步字包括三个低单元和随之而来的三个连续的高单元.在AES/EBU信号频谱中占据一个低的基频,3.072/3等于1.024MHz.

每个音频帧包括64bit,每20.83s发出一帧.帧中的一个数据比特持续时间为325.5ns,一个双相标志码比特单元时间为163ns.由一些数据流比特叠加产生的眼图眼宽时间为163ns


3.1 通道编码

为了减少传输线上的直流分量,利于数据流中恢复时钟,并使接口不易受连接极性的影响,每个子帧32个bit的后28个bit(4~31)采用双标志编码.双标志编码的编码特点是在码元“0”或“1”的边沿都有电平跳变,而对于码元“1”,在每个比特周期的又有一次跳变,这种码的数据信号内没有直流分量,因而可用变压器耦合,而且不怕相位反转,有容易从输入数据流中根据跳变提取时钟.

3.2 前置码

前置码是个特定的格式,用于子帧、帧和块的同步和识别.

为了能够在一个取样周期内实现同步,并使这种处理完全可靠,前置码采用与双相位标志码不同的规则,从而避免出现与前置码相似的数据状态.

有三种前置码,前置码分配在每个子帧的前4个比特传输,并用8个连续的状态表示.前置码的第一个状态总是不同与前一个比特(奇偶校验比特)的第二个状态.根据这个状态限定方法,前置码如(表1). 4 平衡传输接口电特性

连接电缆应采用屏蔽层的平衡电缆,在0.1MHZ~6.0MHZ频率上电缆标称特性阻抗为110欧姆.从结构上看,接插件使用了常见的XLR型接插件.平衡信号由平衡的双绞线和带屏蔽层的传声器型电缆传送.输入和输出都规定为变压器耦合,而且不接地.双绞线特性阻抗为110欧姆,发收两端必须有110欧姆匹配电阻.这种连接的电缆长度可达到100米,不致对信号造成过分的劣化.

AES/EBU专业格式接口特性如(表5):

5.数字音频嵌入数字视频频数据流

数字音频数据可以嵌入数字音频SDI流得每一行的HBI(行逆程)中的辅助数据空间中传送.对于如何将音频和视频在同一条信号中传输,ITU-R BT.1305号建议书对此作出了规定.我国的行业标准GY/T 161—2000《数字电视附属数据空间内数字音频和辅助数据的传输规范》等效采用了ITU-R BT.1305号建议书.

按HBI计算,一行中可容纳的辅助数据为:144-8-6等于130B或1040bit(按8bit计算)

公式中的8B为E和S占用,6B为紧随E之后固定的定时基准码占用.由此可以计算出数字视频HBI期间可以传送的辅助数据码率为:1040×625×25等于16.25Mbit/s

由于一路立体声的码率为:48000×20×2等于1.92Mbit/s

由此可以计算出在数字视频SDI流最多可以嵌入8路无压缩的数字立体声音频信号.

标准规定,除了第7,320,5,318行外,音频数据可以出现在大多数行的HBI期间,并应在整个帧内平均分布.当一路48khz取样的音频信号嵌入一帧内时,相当于HBI内传送该路声音的48000/15625等于3.072个样值,具体是在多数行内传3个样值,在少数行内传4个样值.

6.其他接口协议格式

除了占极大优势地位的AES/EBU协议外,其他3种接口格式也被广泛使用,他们是MADI(多通道音频数字互联)、SDIF2(SONY数字接口格式)和SPDIF(SONY Philips 数字接口).

6.1 MADI格式

MADI格式在标准文件《AES 10-1991》中规定.它可以容纳直到56个符合AES3-1992标准的32位信号.最初开发的MADI是作为点对点操作系统,用以将多道录音机到数字音频控制台或处理.其他的应用包括数字路径选择系统和演播室之间的互联.

MADI信号可以容易地转换为AES/EBU子帧,因为只有开始的前4位不同.56个子帧被串行化以组成MADI帧,然后4/5方案编码,该方案在串行数据流中采用4位的组并通过检查表将其转换为5位字,这样可以减少编码数据的直流含量.于是每个编码的子帧的长度为32+8等于40位.使用±12.5%的可能变化支持32~48KHz的抽样频率,这样可以允许对录音机进行变换操作.数据传输率则被固定为125Mbit/s,用以为编码数据流提供足够的带宽(56通道×40位48KHz×1.125等于121Mbit/s).

传输介质可以使宽带宽的同轴电缆(长达50m)或光纤链路(超过50m).

6.2 SDIF2格式

这种格式是由Sony开发的,用于专业和半专业的原版片制作和记录.它用于互连44.1KHzK和48KHz的单通道链路,并且由32比特长的音频字组成.开始的20bit专留作音频样本值.紧接的9bit用于创建控制字,剩余的3bit将同步信息添加到32bit字.控制字提供有关预加重、正常音频或非音频数据、禁止复制、SDIF音频块同步信息(每256音频字)和用户数据信息的音频通道信息.

传输介质为75欧姆同轴电缆,在晶体管-晶体管逻辑(TTL)电平上工作且数据传输速率为1.54Mbit/s.它是点对点操作互连系统.需要3条同轴电缆分别用于传送左通道数据、右通道数据和字时钟信号.

6.3 SPDIF格式

这种格式是一家厂商的专利商品名,用于AES/EBU格式协议的消费者模式.开发这种格式用于在半专业和消费者设备间进行数字音频数据的串行传输.在AES3专业模式和AES3消耗模式设备之间需要有格式转换器(用于数据和电平转换).