什么是数字图像处理
数字图像是由有限数量的元素组成的,每个元素都有一个特定的位置和幅值,这些元素称为像素。
可以定义为二维函数f(X,y),其中,x,y是空间坐标,f(x,y)是点(x,y)的幅值.
- 灰度图像是一个二维灰度(或亮度)函数f(x,y)
- 彩色图像(如RGB,HSV)由三个二维灰度(或亮度)函数f(X,y)组成
本书将数字图像处理界定为其输入和输出都是图像的处理,另外,包含从图像中提取特征的处理,直至包括各个目标的识别
数字图像处理的基本步骤
- 1.图像获取(第2章) —— 预处理
- 2.图像滤波和增强(第3章和第4章)
- 3.图像复原(第5章) ——改进图像外观的一个处理领域。与图像增强不同,图像增强是主观的,而图像复原是客观的
- 4.彩色图像处理(第6章)
- 5.小波和分辨率处理(第7章)——小波是以不同分辨率来描述图像的基础
- 6.压缩(第8章)——压缩指减少图像存储量或降低传输图像带宽的处理
- 7.形态学处理(第9章)
- 8.分割(第10章)——分割过程将一幅图像划分为它的组成部分或目标
- 9.表示和描述(第11章)
- 10.目标识别(第12章)
数字图像基础
图像处理系统的基本组成结构
主要由三大部分组成:
- 图像数字化设备,包括数码相机、数码摄像机或手机等
- 图像处理设备,包括计算机和存储系统
- 图像输出设备,包括打印机,也可以输出到Internet上的其他设备
数字图像处理基础
图像的采样和量化
- 大多数传感器的输出是连续电压波形
- 为了产生一副数字图像,需要把连续的感知数据转化为数字形式
- 这包括两种处理:取样和量化
- 取样:图像空间坐标的数字化[可以理解为坐标点的选取]
- 量化:图像函数值(灰度值)的数字化[可以理解为幅值的数字化]
图像采样的举例:
图像的量化举例:
上述函数取值的数字化被称为图像的量化,如量化到256个灰度级。图像的采样与数字图像的质量
图像的量化与数字图像的质量
非统一的图像的采样
在灰度级变化尖锐的区域,用细腻的采样
在灰度级比较平滑的区域,用粗糙的采样非统一的图像的量化
- 在边界附近使用较少的灰度级。剩余的灰度级可用于灰度级变化比较平滑的区域
- 避免或减少由于量化的太粗糙,在灰度级变化比较平滑的区域出现假轮廓现象
图像的质量
- 1.层次:表示图像实际拥有的灰度级的数量,如具有32种不同取值的图像可称该图像具有32个层次。图像数据的实际层次越高,视觉效果越好。
- 2.对比度:是指一幅图像中灰度反差的大小$对比度=最大亮度/最小亮度$
- 3.清晰度: 与清晰度相关的主要因素:亮度、对比度、尺寸大小、细微层次、颜色饱和度
空间和灰度分辨率
空间分辨率是图像中可分辨的最小细节的度量。
灰度分辨率是指在灰度级可分辨的最小变化。灰度分辨率指的则是用于量化灰度的比特数,比如通常一幅图是256级的图像有8比特灰度分辨率图像内插
内插是在注入放大、收缩、旋转和几何校正等任务钟广泛应用的工具。
从根本上看,内插是用已知数据来估计未知位置的数值的处理。例如一幅大小为500×500的图像要放大1.5倍到750×750像素。一种简单的放大方法是创建一个假想的750×750的网格。它与原始图像有相同的间隔,然后将其收缩,使其准确地与原图像匹配。显然,收缩后地750×750网格地像素间隔要小于原图像地像素间隔。为了对覆盖地每一个点赋予灰度值,我们可以用最紧邻内插法(将原图像中最近邻的灰度赋给每个新位置)
另外一种内插方法叫双线性内插,该方法中,我们用4个最近邻去估计给定位置的灰度。我们可以用下面公式来赋值:
其中,4个系数可由4个用(x,y)点最近邻点写出的未知方程确定。双线性内插给出了比最近邻内插好得多得结果,但随之而来的是计算量的增加
双三次内插:
它包括16个最近邻。赋予点(x,y)的灰度值是使用下式得到的:
在内插中,有可能采用更多的邻点和更复杂的技术,如采用样条和小波
像素间的一些基本关系
相邻像素——4邻域
4邻域:像素p(x,y)的4邻域是:(x+1,y);(x-1,y);(x,y+1);(x,y-1)
一般我们用$N_4(p)$表示像素p的4邻域
相邻像素——D领域
D邻域定义:像素p(x,y)的D邻域是:对角上的点(x+1,y+1);(x+1,y-1);(x-1,y+1);(x-1,y-1)
用$N_D(p)表示像素p的D邻域$
相邻像素——8邻域
8邻域定义:像素p(x,y)的8邻域是:4邻域的点+D邻域的点
用$N_8(p)$表示像素p的8邻域
像素的连通性——4连通
对于具有值V的像素p和q,如果q在集合$N_4(p)$中,则称这两个像素是4则称这两个像素是4连通的
同理有8连通
像素的连通性——m连通
对于具有值V的像素p和q,如果:
- 1.q在集合$N_4(p)$中,或
- 2.q在集合$N_D(p)$中,并且$N_4(p)$与$N_4(q)$的交集为空(没有值V的像素)
则称这两个像素是m连通的,即4连通和D连通的混合连通像素的连通性——通路
通路的定义:一条从具有坐标(x,y)的像素p,到具有坐标(s,t)的像素q的通路,是具有坐标$(x_0,y_0),(x_1,y_1),…,(x_n,y_n)$的不同像素的序列。其中,$(x_0,y_0)=(x,y),(x_n,y_n)=(s,t)$,$(x_i,y_i)$和$(x_{i-1},y_{i-1})$是邻接的,1≤i≤n,n是路径的长度。如果$(x_0,y_0)=(x_n,y_n)$,则该通路是闭合通路。像素的连通性——距离
距离或测度必须满足三个条件:
1.D(p,q)≥0(D(p,q)=0,当且仅当p=q)
2.D(p,q)=D(q,p)
3.D(p,z)≤D(p,q)+D(q,z)
则称D是距离函数或度量$D_4$(城市距离)
像素p(x,y)和q(s,t)之间的$D_4$距离定义为:$D_4距离的举例$$D_8$(棋盘距离)
像素p(x,y)和q(s,t)之间的$D_8$距离定义为:$D_8$距离的举例数字图像处理中所用数学工具的介绍
空间操作
我们把空间操作分为三大类:(1)单像素操作(2)邻域操作(3)几何空间操作 - 1.单像素操作:s=T(z)其中z是原图像中像素的灰度,s是处理后的图像中相应像素的(映射)灰度。
- 2.邻域操作
- 3.几何空间变换:有尺度变换,旋转变换,平移变换
图像变换
先前我们提到的变换操作都是在空间域上进行处理的。但在有些情况下,需要先将图像转换到变化域之后执行指定的任务,然后用反变换返回到空间域效果会更好。
通用的变换形式是:该过程能将图像从空间域转换到变换域
反变换形式:概率方法
概率以很多方式用于图像处理工作中。最简单的方式是当我们以随机量处理灰度值时。例如,令$z_i$,i=0,1,2,…L-1表示一幅M×N大小数字图像中所有可能的灰度值,则在给定图像中灰度级$z_k$出现的概率$p(z_k)$可估计为其中,$n_k$是灰度$z_k$在图像中出现的次数,MN是像素总数。显然,一旦我们知道了$p(z_k)$,就可以得出许多重要的图像特性。例如,平均灰度由下式给出:类似地,灰度的方差是n阶矩均值和方差对于图像地视觉特性有明显地直接关系,高阶矩更敏感。
图像灰度对比度度量时标准差值的比较。
对比度由低到高像素灰度的标准差也由低到高。