图像处理与视觉感知复习–图像压缩
文章目录
- 图像压缩系统的组成
- 三种基本的数据冗余
- 计算哈夫曼编码
- 计算算术编码
- 离散傅里叶变换和离散余弦变换的异同点
图像压缩系统的组成
三种基本的数据冗余
- 编码冗余
如果一个图像的灰度级编码,使用了多余实际需要的编码符号,就称该图像包含编码冗余。 - 像素间冗余
- 反应图像像素之间的相互关系
- 因为任意给定像素的值可以根据与这个像素相邻的像素进行预测,所以单个像素携带的信息相对较少
- 对于一幅图像,多个单个像素对视觉的贡献是冗余的。它的值可以通过与它相邻的像素值为基础进行预测
- 心理视觉冗余
- 人眼感觉到的图像区域亮度不仅取决于该区域的反射光,还有如马赫带效应,在灰度值为常数的区域也能感觉到灰度值的变化
- 这是由于眼睛对所有视觉信息感受的敏感度不同。在正常视觉处理过程中各种信息的相对重要程度不同
- 有些信息在通常的视觉过程中与另外一些信息相比并不那么重要,这些信息被认为是心理冗余的,去除这些信息并不会明显降低图像质量
计算哈夫曼编码
平均码字长度
L
ˉ
\bar{L}
Lˉ
令L
ˉ
\bar{L}
Lˉ 为数字图像第
i
i
i 个灰度级
d
i
d_i
di 的编码长度
L
ˉ
=
∑
i
=
1
m
L
i
p
(
d
i
)
\bar{L} = \sum^m_{i = 1} L_i p(d_i)
Lˉ=i=1∑mLip(di)
压缩比(r)
r
=
n
L
ˉ
=
压缩前每像素所占平均比特数目
压缩后每像素所占平均比特数目
r = \frac{n}{\bar{L}} = \frac{压缩前每像素所占平均比特数目}{压缩后每像素所占平均比特数目}
r=Lˉn=压缩后每像素所占平均比特数目压缩前每像素所占平均比特数目
一般情况下压缩比r
≥
1
r \geq 1
r≥1,
r
r
r 越大则压缩程度越高
图像熵 (H)
令p
(
d
i
)
p(d_i)
p(di) 为数字图像第
i
i
i 个灰度级
d
i
d_i
di 相应出现概率
H
=
−
∑
i
=
1
m
p
(
d
i
)
l
o
g
2
p
(
d
i
)
H = – \sum^m_{i = 1} p(d_i) log_2 p(d_i)
H=−i=1∑mp(di)log2p(di)
编码效率
η
\eta
η
η
=
H
L
ˉ
×
100
%
\eta = \frac{H}{\bar{L}} imes 100\%
η=LˉH×100%
如果L
ˉ
\bar{L}
Lˉ 接近
H
H
H, 则编码效果为佳
冗余度
v
=
1
−
η
v = 1 – \eta
v=1−η
经过统计0,1…7对应出现次数为 2,4,7,7,5,11,3,25
计算算术编码
up主讲解
无损预测编码
离散傅里叶变换和离散余弦变换的异同点
离散余弦(DCT) 离散傅里叶变换(DFT)
相同:都是图像的离散变换,对信息进行集中
异同:离散傅里叶变换涉及复数运算,而离散余弦变换涉及实数运算,离散余弦变换是离散傅里叶变换的一种特殊形式
- 离散余弦变换的信息压缩能力比离散傅里叶变换的能力要强
- 离散余弦变换在信息压缩能力和计算复杂性之间提供了很好的平衡,因此,许多变换编码系统都是以离散余弦变换为基础的
- 离散余弦变换具有使用单一的集成电路就可以实现,可以将最多的信息包装在最少得系数之中