PCM音频压缩A-Law算法，uLaw-开源代码-UP93论坛

PCM音频压缩A-Law算法，uLaw C/C++

admin 2020-10-23 2323

参考相关：“关于pcm音频头与a-law音频头的互换代码” http://blog.csdn.net/fjhyy/article/details/6593049

https://baike.baidu.com/item/A%E5%BE%8B/5923040

http://www.sohu.com/a/147745747_464086

背景：正在做的一个项目，需要网络传输音频，音频格式为wav，16位采样率，PCM编码。为了降低传输带宽，需要对音频数据进行压缩。

把16bit的音频数据转为8bit。

最简单的方式是均匀量化， >>8 （右移8位），但这样做会使得声音的噪音变大。

最好的做法是使用非均匀量化（如A-Law），其原理是对于小音量的声音，其蕴含的信息量更大，人耳对小音量

更敏感；而大音量部分则影响没那么大。因此使用非均匀量化的方式，对于小音量部分保留更多的数据，大音量部分

则保留更少的数据。具体实现如下：

这里选择A-Law（A律）算法，也可以用uLaw（μ律），两种算法可相互转化。

令量化器过载电压为1,相当于把输入信号进行归一化，那么A律对数压缩定义为：

当0 <= x <= 1/A时，f(x)=(Ax)/(1+lnA)

当1/A <= x <= 1时，f(x)=(1+lnAx)/(1+lnA)

在现行的国际标准中A=87.6，此时信号很小时(即小信号时)，从上式可以看到信号被放大了16倍，

这相当于A压缩率与无压缩特性比较，对于小信号的情况，量化间隔比均匀量化时减小了16倍，

因此，量化误差大大降低；而对于大信号的情况例如x=1，量化间隔比均匀量化时增大了5.47倍，

量化误差增大了。这样实际上就实现了“压大补小”的效果。

图形曲线如下（只画出正数部分，对于负数也是同样的道理）（这里用了归一化）：

但是要在程序中实现该曲线，比较复杂。因此这里使用8段折线来近似表示。

把x轴划分为不均匀的8份，第一点取1/2处，第二点取1/4处，第三点取1/8处……第七点取1/128.

把y轴划分为均匀的8分段。

代码实现如下：

A-Law算法实现PCM压缩.c

#include "stdio.h"
 
#define SIGN_BIT    (0x80)      /* Sign bit for a A-law byte. */  
#define QUANT_MASK  (0xf)       /* Quantization field mask.   */  
#define NSEGS       (8)         /* Number of A-law segments.  */  
#define SEG_SHIFT   (4)         /* Left shift for segment number. */  
#define SEG_MASK    (0x70)      /* Segment field mask. */  
  
static short seg_end[8] = {0xFF, 0x1FF, 0x3FF, 0x7FF,  
                           0xFFF, 0x1FFF, 0x3FFF, 0x7FFF};  //分成不均匀的8个分段，算上负数，总共是16个分段
  
/* copy from CCITT G.711 specifications */  
unsigned char _u2a[128] = { /* u- to A-law conversions */  
    1,  1,  2,  2,  3,  3,  4,  4,  
    5,  5,  6,  6,  7,  7,  8,  8,  
    9,  10, 11, 12, 13, 14, 15, 16,  
    17, 18, 19, 20, 21, 22, 23, 24,  
    25, 27, 29, 31, 33, 34, 35, 36,  
    37, 38, 39, 40, 41, 42, 43, 44,  
    46, 48, 49, 50, 51, 52, 53, 54,  
    55, 56, 57, 58, 59, 60, 61, 62,  
    64, 65, 66, 67, 68, 69, 70, 71,  
    72, 73, 74, 75, 76, 77, 78, 79,  
    81, 82, 83, 84, 85, 86, 87, 88,  
    89, 90, 91, 92, 93, 94, 95, 96,  
    97, 98, 99, 100,101,102,103,104,  
    105,106,107,108,109,110,111,112,  
    113,114,115,116,117,118,119,120,  
    121,122,123,124,125,126,127,128  
};  
  
unsigned char _a2u[128] = { /* A- to u-law conversions */  
    1,  3,  5,  7,  9,  11, 13, 15,  
    16, 17, 18, 19, 20, 21, 22, 23,  
    24, 25, 26, 27, 28, 29, 30, 31,  
    32, 32, 33, 33, 34, 34, 35, 35,  
    36, 37, 38, 39, 40, 41, 42, 43,  
    44, 45, 46, 47, 48, 48, 49, 49,  
    50, 51, 52, 53, 54, 55, 56, 57,  
    58, 59, 60, 61, 62, 63, 64, 64,  
    65, 66, 67, 68, 69, 70, 71, 72,  
    73, 74, 75, 76, 77, 78, 79, 79,  
    80, 81, 82, 83, 84, 85, 86, 87,  
    88, 89, 90, 91, 92, 93, 94, 95,  
    96, 97, 98, 99, 100,101,102,103,  
    104,105,106,107,108,109,110,111,  
    112,113,114,115,116,117,118,119,  
    120,121,122,123,124,125,126,127  
};  
  
static int search(int val,short *table,int size)  
{  
    int     i;  
    for (i = 0; i < size; i++) {  
        if (val <= *table++)  
            return (i);  
    }  
    return (size);  
}  
  
/********************************************************************* 
 * 输入参数范围 ：-32768~32767
 * 返回8位无符号整数
 * linear2alaw() - Convert a 16-bit linear PCM value to 8-bit A-law 
 *   
 * linear2alaw() accepts an 16-bit integer and encodes it as A-law data. 
 * 
 *  Linear Input Code       Compressed Code 
 *  -----------------       ------------------ 
 *  0000000wxyza            000wxyz 
 *  0000001wxyza            001wxyz 
 *  000001wxyzab            010wxyz 
 *  00001wxyzabc            011wxyz 
 *  0001wxyzabcd            100wxyz 
 *  001wxyzabcde            101wxyz 
 *  01wxyzabcdef            110wxyz 
 *  1wxyzabcdefg            111wxyz 
 * 
 * For further information see John C. Bellamy's Digital Telephony, 1982, 
 * John Wiley & Sons, pps 98-111 and 472-476. 
 *********************************************************************/  
unsigned char linear2alaw(int pcm_val)  /* 2's complement (16-bit range) */  
{  
    int             mask;  
    int             seg;  
    unsigned char   aval;  
  
    if (pcm_val >= 0) {  
        mask = 0xD5;        /* sign (7th) bit = 1 */  
    } else {  
        mask = 0x55;        /* sign bit = 0 */  
        //pcm_val = -pcm_val - 8;  
        pcm_val = -pcm_val - 1;  
    }  
  
    /* Convert the scaled magnitude to segment number. */  
    seg = search(pcm_val, seg_end, 8);  //返回pcm_val属于哪个分段
  
    /* Combine the sign, segment, and quantization bits. */  
  
    if (seg >= 8)        /* out of range, return maximum value. */  
        return (0x7F ^ mask);  
    else {  
        aval = seg << SEG_SHIFT;  //aval为每一段的偏移，分段量化后的数据需要加上该偏移（aval）
        //分段量化
        //量化方法： (pcm_val-分段值)，然后取有效的高4位   （0分段例外）
        //比如 pcm_val = 0x7000 ，那么seg=7 ，第7段的范围是0x4000~0x7FFF ，段偏移aval=7<<4=0x7F
        //0x7000-0x4000=0x3000 ，然后取有效的高4位，即右移10(seg+3)，0x3000>>10=0xC
        //上一步等效为：(0x7000>>10)&0xF=0xC 。也就是： (pcm_val >> (seg + 3)) & QUANT_MASK
        //然后加上段偏移 0x7F(aval) ，加法等效于或运算，即 |aval 
        
        if (seg < 2)  
            aval |= (pcm_val >> 4) & QUANT_MASK;  //0、1段折线的斜率一样
        else  
            aval |= (pcm_val >> (seg + 3)) & QUANT_MASK; 
        return (aval ^ mask);    //异或0x55，目的是尽量避免出现连续的0，或连续的1，提高传输过程的可靠性
    }  
}  
  
/********************************************************************* 
 *    alaw2linear() - Convert an A-law value to 16-bit linear PCM 
 *********************************************************************/  
int alaw2linear(unsigned char a_val)  
{  
    int     t;  
    int     seg;  
  
    a_val ^= 0x55;  
  
    t = (a_val & QUANT_MASK) << 4;  
    seg = ((unsigned)a_val & SEG_MASK) >> SEG_SHIFT;  
    switch (seg) {  
    case 0:  
        t += 8;  
        break;  
    case 1:  
        t += 0x108;  
        break;  
    default:  
        t += 0x108;  
        t <<= seg - 1;  
    }  
    return ((a_val & SIGN_BIT) ? t : -t);  
}  
  
 
int main(int argc, char* argv[])
{
 
	int cmp;
	int dcmp;
	int d;
 
	while(1)
	{
		scanf("%d",&d);		//输入16位的整数
		printf("input:%d \n",d);
		cmp=linear2alaw(d);		//压缩成8位整数
		dcmp=alaw2linear(cmp);	//解压缩为16位整数
 
		printf("cmp:%d , dcmp:%d \n",cmp,dcmp);
	}
 
	return 0;
}

运行结果：

对1753压缩后得到238，然后把238解压还原得到1760. 可以看出，还原后的数据，和原始数据还是相当接近的。输入

比较小的时候，还原误差小；输入大时，误差大。

最新回复 [0]

发新帖

admin

主题数
699

帖子数
122

精华数
1

注册排名
1

PCM音频压缩A-Law算法，uLaw C/C++

admin

作者最近主题：