在多媒体应用中,音频功能起着关键的作用。一般情况下,音频需要的处理能力比视频要小的多,但是应该对这两种应用给予同样的重视。
      接下来将会讨论一下声音和音频信号的问题,然后简单介绍一下音频数据的存储和处理格式。
      此外,讨论一些关于嵌入式音频处理系统的软件构造快。对于音频处理来说,高效的数据传输时必须的。所以可以关注一下音频算法的数据存储。语音和音频压缩的一些知识也会有所涉及。
1232796-20170927085843450-656194172.png
      声音是什么:声音是一种通过空气或者其他介质传播的纵向波。声音具有两种属性:振幅和频率。声波的振幅是指对压强变化的度量。以分贝(dB)为测量单位。人类能够听到的最小的声波振幅称为“听觉阈值”,用0dBSPL来表示,这里的SPL是Sound Pressure Level的缩写,指声波压强级别。在这个SPL尺度上,参考压强定义为20微帕斯卡(uPa)。假定压强的变化为x,则 dBSPL的一般表达式为:dBSPL=20*log(xuPa/20uPa)
1232796-20170927090135372-1391220120.jpg
       从上表可以看出,人类可以忍受并能够听到的声音范围是120dB。因此所有工程设计上的音频系统都可以使用120dB作为动态范围的上限。
      声音的另一个重要特征是频率,单位是赫兹(Hz)。或者说是每秒钟的周期数 。人类可听到的声音,频率范围是20Hz-20000Hz。
      实际上,人类最敏感的频率范围是2-4KHz。在有损音频压缩算法中利用了两种有用的现象,这就是时间屏蔽和频率屏蔽。
      在实践屏蔽中,高的音调可以淹没几乎同时发生的低音调。当某一频率的高音调渲染一些无法听到的附近频率的声音时会发生频率屏蔽。
音频信号:
      为了产生一个表示声波的模拟信号,必须使用转换器将机械的压强能量转换为电能量。即,麦克风。由于麦克风可以将声音转换为电压,所以需要使用一种新的分贝刻度来描述声波的振幅。这个刻度称为dBV。以1V作为基准参考点。描述电压x和dBV之间的关系等式如下:dBV=20*log(xVOLTS/1.0VOLTS),另一种模拟分贝刻度以0.775V作为参考电压,单位符号是dBu。
模拟与数字音频信号之间转换:
      将模拟信号数字化,可以通过模数转换器(ADC)来实现。将数字信号模拟话可以通过数模转化器(DAC)来实现。许多音频系统实际上是一种全双工媒体处理流程,所以在一个包中既有ADC和DAC,这个包称为“音频解码器”(audio codec)。所有的A/D和D/A转换都应遵循香浓-奈奎斯特(Shannon-Nyquist)采样定律。简单的说。这个定律规定,对模拟信号的采样频率必须大于信号中最高频率成分的两倍,只有这样才能在后面的D/A转换中对信号进行恢复。
1232796-20170927090248434-100756489.jpg
(a) 用40KHz的频率去采样20KHz的信号可以正确捕捉到原始信号。
(b) 用30KHz的频率去采样20KHz的信号会出现混淆信   
     一般重建音乐信号时采用的最低采样频率为44.1KHz。在许多高品质的系统中,采用的48KHz的采样频率。
      音频应用中常用的数字表示方法为脉冲编码调制(Pulse-Code-Modulated,PCM)信号。在这种表示方法中,每个采样周期用一个数字电平对模拟信号的幅度进行编码。得到的数字波形是一组采样自输入模拟波形的近似值。由于所有A/D转换器的分辨率都是有限的,所以在数字音频系统中,A/D转换器带来的量化噪声是不可避免的。
1232796-20170927090425450-568151331.jpg