opencv图像处理算法：OpenCV机器视觉傅里叶变换

小君 2023-01-23 22:42:25 709

opencv图像处理算法：OpenCV机器视觉傅里叶变换cv2.dft(img flags)(1) 傅里叶变化函数：傅里叶变换的详细可看一下知乎大佬的解释：安全验证 - 知乎傅里叶分析之掐死教程（完整版）更新于2014.06.06 - 知乎在图像中，高频是指变化剧烈的灰度分量，如图像的边缘轮廓区域。低频是指图像中变化缓慢的灰度分量，如图像中轮廓内的填充，非边缘区域。傅里叶变换可进行高通滤波和低通滤波。低通滤波器：只保留低频信息。如消除图像边界，使图像变得模糊。高通滤波器：只保留高频信息，消除低频信息。如增强图像细节，描绘图像轮廓信息。

图像处理一般分为空间域处理和频率域处理。

空间域处理是直接对图像内的像素进行处理。主要划分为灰度变换核空间滤波两种形式，灰度变换对图像内的单个像素进行处理，滤波处理涉及对图像质量的改变。

频率域处理是先将图像变换到频率域，然后在频率域对图像进行处理，最后通过反变换将图像变为空间域。

傅里叶变换可以将图像变换为频率域，傅立叶反变换将频率域变换为空间域。

傅里叶变换的详细可看一下知乎大佬的解释：安全验证 - 知乎傅里叶分析之掐死教程（完整版）更新于2014.06.06 - 知乎

opencv图像处理算法：OpenCV机器视觉傅里叶变换(1)

在图像中，高频是指变化剧烈的灰度分量，如图像的边缘轮廓区域。低频是指图像中变化缓慢的灰度分量，如图像中轮廓内的填充，非边缘区域。

傅里叶变换可进行高通滤波和低通滤波。低通滤波器：只保留低频信息。如消除图像边界，使图像变得模糊。高通滤波器：只保留高频信息，消除低频信息。如增强图像细节，描绘图像轮廓信息。

(1) 傅里叶变化函数：

cv2.dft(img flags)

img：代表输入图像，opencv中输入图像必须转换成np.float32类型

flags：转换标识，通常为cv2.DFT_COMPLEX_OUTPUT，其他值如下：

opencv图像处理算法：OpenCV机器视觉傅里叶变换(2)

(2) 图像频谱中的零频率分量会被移到频域图像的中心位置

np.FFT.fftshift(x axis)

x：数组，代表输入的频谱图数据

axis：可选，指定需要移动的轴。默认移动所有的轴

返回位移之后的数组。

使用傅里叶变换后，在得到的频谱图中，频率为0的部分会在左上角，为了计算方便，我们通常将频率为0的部分转换到频谱图中心位置。

(3) 计算二维矢量的幅值

cv2.magnitude(x y)

x：数组类型，表示浮点型的x轴坐标，也就是实部

y：数组类型，表示浮点型的y轴坐标，也就是虚部

返回值为：x和y的平方和开根，

opencv图像处理算法：OpenCV机器视觉傅里叶变换(3)

由于cv2.dft()返回的结果是双通道的(实部和虚部)，通常需要转换成图像格式[0 255]，才能正常显示频谱图。公式为：

20*np.log(cv2.magnitude(x y))

(4) 构造滤波器

傅里叶变换之后，构造一个和原图像相同size的掩模。注意：构造的掩模是三维度的，因为傅里叶变换后的结果第三维度是实部和虚部，有2个通道。掩模的shape应该和它一致。

低通滤波器：构造一个像素值全为0的掩模底板，获取频率为0的部分的中心坐标，以它为中点，设置掩模大小，掩模内的像素值都为255。把掩模覆盖到频谱图上，只保留掩模值为255的部分，其他全部删除。即在频谱图像上，只保留频率为0附近的点，其他高频点全部删除。因为掩模白色部分框住的就是所有的低频点。

高通滤波器：构造一个像素值全为255的掩模底板，获取频率为0的部分的中心坐标，以它为中点，设置掩模大小，都掩模内的像素值为0。把掩模覆盖到频谱图上，只保留掩模值为255的部分，其他全部删除。即在频谱图像上，只删除频率为0附近的点，其他高频点全部保留。因为掩模黑色部分覆盖住的就是所有的低频点。

我们在下面代码段的图中进一步理解

(5) 傅里叶逆变换函数

cv2.idft(img)

img：代表输入处理后的频谱图像

在使用cv2.dft()获得频谱图时，将低频点从边缘移动到图像中间，现在要逆变换，得把低频点还原到原始位置，使用函数： np.fft.ifftshift(处理后的频谱图) ，之后才能将频谱图转变回空间图像。

注意，逆变换后的结果是包含实部和虚部的，仍需要使用cv2.magnitude函数进行处理

1. 正向变换

import cv2 import numpy as np import matplotlib.pyplot as plt filepath = 'C:\\...\\opencv\\img' # 获取图片所在文件夹 #（1）正向变换 # 导入图像，变成灰度图 img = cv2.imread(filepath '\\mh1.jpg' 0) # 转变成np.float32类型 img_float = np.float32(img) # 傅里叶变换 dft = cv2.dft(img_float flags=cv2.DFT_COMPLEX_OUTPUT) # 获得频谱图，将低频值转换到中间 dft_shift = np.fft.fftshift(dft) # 得到灰度图能表示的形式，将对实部虚部计算后的结果，映射到0-255之间 magnitude = 20*np.log(cv2.magnitude(dft_shift[: : 0] dft_shift[: : 1])) # 绘图 plt.subplot(121) plt.imshow(img cmap='gray') plt.title('input image') plt.xticks([]) plt.yticks([]) #不显示坐标轴 plt.subplot(122) plt.imshow(magnitude cmap='gray') plt.title('magnitude Spectrum') plt.xticks([]) plt.yticks([]) plt.show()

下图左侧是原图，右侧是FFT变换后的频谱图。右侧图中间的亮点代表的频率为0的部分，离中心点越近，频率越低，越往外发散，频率越高。

因此我们只需要把中间一小块的点抹除掉就能消除所有频率在0附近的部分，消除低频信息，实现高通滤波。或者只保留中心点附近的部分，就能消除所有的高频信息，实现高通滤波。至于怎么消除呢，我们之前提讲解过的掩模就可以用在这里。

opencv图像处理算法：OpenCV机器视觉傅里叶变换(4)

2. 低通滤波

#（1）傅里叶正向变换 img = cv2.imread(filepath '\\mh1.jpg' 0) 导入图像，变成灰度图 # 转变成np.float32类型 img_float = np.float32(img) # 傅里叶变换 dft = cv2.dft(img_float flags=cv2.DFT_COMPLEX_OUTPUT) # 获得频谱图，将低频值转换到中间 dft_shift = np.fft.fftshift(dft) #（2）构造滤波器 # 获取频率为0部分中心点位置 rows cols = img.shape # (471 498) 分别保存图像的高和宽 crow col = int(rows/2) int(cols/2) # 计算中心点坐标 # 构造低通滤波器，相当于构造一个掩模 mask = np.zeros((rows cols 2) np.uint8) # 构造的size和原图相同，2通道，傅里叶变换后有实部和虚部 mask[crow-30:crow 30 col-30:col 30] = 255 # 构造一个以频率为0点中心对称，长30 30，宽30 30的一个区域，只保留区域内部的频率 #（3）滤波 # 频谱图上，低频的信息都在中间，滤波器和频谱图相乘，遮挡四周，保留中间，中间是低频 fshift = dft_shift*mask # 在获得频谱图时，将低频点从边缘点移动到图像中间，现在要逆变换，得还回去 f_ishift = np.fft.ifftshift(fshift) #（4）傅里叶逆变换idft img_back = cv2.idft(f_ishift) # 还原后的还是有实部和虚部，需要进一步处理 img_back = cv2.magnitude(img_back[: : 0] img_back[: : 1]) #（5）绘图 # 结果展示，低通使图像模糊 plt.subplot(121) plt.imshow(img cmap='gray') plt.title('input img') plt.xticks([]) plt.yticks([]) #不显示坐标轴 plt.subplot(122) plt.imshow(img_back cmap='gray') plt.title('fft img') plt.xticks([]) plt.yticks([]) plt.show()

构造的滤波器是以频率等于0为中心的矩形，宽30 30，高30 30，如图1。只保留白色部分，消除黑色部分。白色部分框住的是低频信息，滤波器设置的越大，保留的低频信息也就越多，过大会保留高频信息。

图2原图，图3是低通滤波后的图，明显变模糊了，消除了图像的边界。

opencv图像处理算法：OpenCV机器视觉傅里叶变换(5)

opencv图像处理算法：OpenCV机器视觉傅里叶变换(6)

3. 高通滤波

#（1）正向傅里叶变换 img = cv2.imread(filepath '\\mh1.jpg' 0) # 导入图像，变成灰度图 # 转变成np.float32类型 img_float = np.float32(img) # 傅里叶变换 dft = cv2.dft(img_float flags=cv2.DFT_COMPLEX_OUTPUT) # 获得频谱图，将低频值转换到中间 dft_shift = np.fft.fftshift(dft) #（2）构造滤波器，获取频率为0的坐标 rows cols = img.shape #(471 498) 分别保存图像的高和宽 crow col = int(rows/2) int(cols/2) # 计算中心点坐标 # 构造高通滤波器，相当于构造一个掩模，设置的越大，低频信息删除的越多 mask = np.ones((rows cols 2) np.uint8) # 构造的size和原图相同，2通道，傅里叶变换后有实部和虚部 mask[crow-10:crow 10 col-10:col 10] = 0 # 以频率为0处坐标为中心，宽10 10，高10 10的部分抹除 #（3）傅里叶逆变换 # 删除中间的信息，保留其他部分的信息，低频都集中在中央位置，统一删除 fshift = dft_shift*mask # 在获得频谱图时，将低频点从边缘点移动到图像中间，现在要逆变换，得还回去 f_ishift = np.fft.ifftshift(fshift) # 傅里叶逆变换idft img_back = cv2.idft(f_ishift) # 还原后的还是有实部和虚部，需要进一步处理 img_back = cv2.magnitude(img_back[: : 0] img_back[: : 1]) #（4）绘图 # 结果展示，只有边界信息 plt.subplot(121) plt.imshow(img cmap='gray') plt.title('input img') plt.xticks([]) plt.yticks([]) #不显示坐标轴 plt.subplot(122) plt.imshow(img_back cmap='gray') plt.title('fft img') plt.xticks([]) plt.yticks([]) plt.show()

高通滤波器，构造一个以频率等于0为中心的矩形，宽10 10，高10 10，如图1。只保留白色部分，消除黑色部分。白色部分(像素255)框住的是高频信息，黑色部分(像素为0)设置的越大，消除的低频信息也就越多，过大会一定程度抹除一些高频信息。

图2原图，图3是高通滤波后的图，只保留了图像的边界，抹除了图像的内在信息。

opencv图像处理算法：OpenCV机器视觉傅里叶变换(7)

opencv图像处理算法：OpenCV机器视觉傅里叶变换(8)

网站首页

返回栏目

opencv图像处理算法：OpenCV机器视觉傅里叶变换

猜您喜欢：

相关文章