接下来将会讨论一下声音和音频信号的问题,然后简单介绍一下音频数据的存储和处理格式。
此外,讨论一些关于嵌入式音频处理系统的软件构造快。对于音频处理来说,高效的数据传输时必须的。所以可以关注一下音频算法的数据存储。语音和音频压缩的一些知识也会有所涉及。
声音的另一个重要特征是频率,单位是赫兹(Hz)。或者说是每秒钟的周期数 。人类可听到的声音,频率范围是20Hz-20000Hz。
实际上,人类最敏感的频率范围是2-4KHz。在有损音频压缩算法中利用了两种有用的现象,这就是时间屏蔽和频率屏蔽。
在实践屏蔽中,高的音调可以淹没几乎同时发生的低音调。当某一频率的高音调渲染一些无法听到的附近频率的声音时会发生频率屏蔽。
音频信号:
为了产生一个表示声波的模拟信号,必须使用转换器将机械的压强能量转换为电能量。即,麦克风。由于麦克风可以将声音转换为电压,所以需要使用一种新的分贝刻度来描述声波的振幅。这个刻度称为dBV。以1V作为基准参考点。描述电压x和dBV之间的关系等式如下:dBV=20*log(xVOLTS/1.0VOLTS),另一种模拟分贝刻度以0.775V作为参考电压,单位符号是dBu。
模拟与数字音频信号之间转换:
将模拟信号数字化,可以通过模数转换器(ADC)来实现。将数字信号模拟话可以通过数模转化器(DAC)来实现。许多音频系统实际上是一种全双工媒体处理流程,所以在一个包中既有ADC和DAC,这个包称为“音频解码器”(audio codec)。所有的A/D和D/A转换都应遵循香浓-奈奎斯特(Shannon-Nyquist)采样定律。简单的说。这个定律规定,对模拟信号的采样频率必须大于信号中最高频率成分的两倍,只有这样才能在后面的D/A转换中对信号进行恢复。
(b) 用30KHz的频率去采样20KHz的信号会出现混淆信
一般重建音乐信号时采用的最低采样频率为44.1KHz。在许多高品质的系统中,采用的48KHz的采样频率。
音频应用中常用的数字表示方法为脉冲编码调制(Pulse-Code-Modulated,PCM)信号。在这种表示方法中,每个采样周期用一个数字电平对模拟信号的幅度进行编码。得到的数字波形是一组采样自输入模拟波形的近似值。由于所有A/D转换器的分辨率都是有限的,所以在数字音频系统中,A/D转换器带来的量化噪声是不可避免的。