运用Python寻找图像最常见的颜色_图像_色彩

2024-12-14 18:11:25 智能写作

与往常一样，我们可以利用Python和大略但功能强大的库（如Numpy、Matplotlib和OpenCV）来办理这个问题。
我将演示如何利用这些软件包在图像中找到最常见的颜色的几种方法。

步骤1-加载包

运用Python寻找图像最常见的颜色_图像_色彩智能写作

import cv2 as cvimport numpy as npimport matplotlib.pyplot as pltimport PIL%matplotlib inline

在这里加载基本包，后续会连续加载更多的包。
其余，由于我们是用Jupyter编程的，以是不要忘了包含%matplotlib内联命令。

步骤2-加载并显示示例图像

在本教程中，我们将展示两个并排的图像。
以是，让我们用一个helper函数来实现。

def show_img_compar(img_1, img_2 ): f, ax = plt.subplots(1, 2, figsize=(10,10)) ax[0].imshow(img_1) ax[1].imshow(img_2) ax[0].axis('off') # 隐蔽轴 ax[1].axis('off') f.tight_layout() plt.show()

接下来，我们将加载一些在本教程中利用的示例图像，并利用上面的函数演示它们。

img = cv.imread("img/img_1.jpg")img = cv.cvtColor(img, cv.COLOR_BGR2RGB)img_2 = cv.imread("img/img_2.jpg")img_2 = cv.cvtColor(img_2, cv.COLOR_BGR2RGB)dim = (500, 300)# 图像大小自定义img = cv.resize(img, dim, interpolation = cv.INTER_AREA)img_2 = cv.resize(img_2, dim, interpolation = cv.INTER_AREA)show_img_compar(img, img_2)

现在我们准备好了。
接下来要找出这些图像中最常见的颜色了。

方法1-均匀值

第一种方法是最大略的（但无效的），找到均匀像素值。

img_temp = img.copy()img_temp[:,:,0], img_temp[:,:,1], img_temp[:,:,2] = np.average(img, axis=(0,1))img_temp_2 = img_2.copy()img_temp_2[:,:,0], img_temp_2[:,:,1], img_temp_2[:,:,2] = np.average(img_2, axis=(0,1))show_img_compar(img, img_temp)show_img_compar(img_2, img_temp_2)

利用numpy的average函数，我们可以很随意马虎地得到行和宽度轴的均匀像素值axis=(0,1)。

我们可以看出，均匀法可以给出误导或不准确的结果，由于它给出的最常见的颜色与实际偏离，这是由于均匀值结合了所有像素值。
当我们有高比拟度的图像（在一个图像中“光”和“暗”），如在第二幅图中，这个问题更明显。

它给了我们一种在图像中不明显的新颜色。

方法2-最高像素频率

第二种方法要比第一种方法精确一些，我们只需打算每个像素值中涌现的次数。

幸运的是，numpy给了我们另一个函数，这个函数给出了精确的结果。
但首先，我们必须重塑图像数据构造，使其仅给出3个值的列表（每个R、G和B通道强度各一个）。

可以大略地利用numpy的reshape函数来得到像素值的列表。

现在我们有了精确构造的数据，我们可以开始打算像素值的频率。
只需利用numpy的unique函数，参数return_counts=True。

完成了，接下来在图像上运行。

img_temp = img.copy()unique, counts = np.unique(img_temp.reshape(-1, 3), axis=0, return_counts=True)img_temp[:,:,0], img_temp[:,:,1], img_temp[:,:,2] = unique[np.argmax(counts)]img_temp_2 = img_2.copy()unique, counts = np.unique(img_temp_2.reshape(-1, 3), axis=0, return_counts=True)img_temp_2[:,:,0], img_temp_2[:,:,1], img_temp_2[:,:,2] = unique[np.argmax(counts)]show_img_compar(img, img_temp)show_img_compar(img_2, img_temp_2)

这比第一个更故意义，对吧？最常见的颜色是玄色区域。
但我们可以更进一步，如果不但取一种最常见的颜色，而是多取一种呢？用同样的方法，我们可以选择前N种最常见的颜色。
但是如果你看第一张图片，频率最高的许多颜色很可能是相邻的颜色，可能只有几个像素的差别。

换言之，我们要取最常见的，不同颜色的簇。

方法3-利用K均值聚类

我们利用Scikit-Learn来实现。
我们可以利用K-Means聚类将颜色组聚拢在一起。

现在，我们只须要一个函数来显示上面的颜色簇并立即显示出来。

def palette(clusters): width=300 palette = np.zeros((50, width, 3), np.uint8) steps = width/clusters.cluster_centers_.shape[0] for idx, centers in enumerate(clusters.cluster_centers_): palette[:, int(idxsteps):(int((idx+1)steps)), :] = centers return paletteclt_1 = clt.fit(img.reshape(-1, 3))show_img_compar(img, palette(clt_1))clt_2 = clt.fit(img_2.reshape(-1, 3))show_img_compar(img_2, palette(clt_2))

我们只需创建一个高度为50、宽度为300像素的图像来显示颜色组/调色板。
对付每个颜色簇，将其指定给调色板。

K-Means聚类在检测图像中最常见的颜色方面给出了很好的结果。
在第二张图中，我们可以看到调色板中有太多的棕色阴影。
这很可能是由于我们选择了太多的簇。
让我们看看是否可以通过选择较小的k值来修复它。

def palette(clusters): width=300 palette = np.zeros((50, width, 3), np.uint8) steps = width/clusters.cluster_centers_.shape[0] for idx, centers in enumerate(clusters.cluster_centers_): palette[:, int(idxsteps):(int((idx+1)steps)), :] = centers return paletteclt_3 = KMeans(n_clusters=3)clt_3.fit(img_2.reshape(-1, 3))show_img_compar(img_2, palette(clt_3))

是的，办理了。

由于我们利用K-Means聚类，仍旧须要自己确定适当的k。
3彷佛是个不错的选择。

但我们仍旧可以在这些结果的根本上改进。
我们也展示一下这些簇在全体图像中所占的比例如何？

方法3.1-K均值+比例显示

我们须要做的便是修正调色板函数。
我们不该用固定的步长，而是将每个簇的宽度变动为与该簇中的像素数成比例。

from collections import Counterdef palette_perc(k_cluster): width = 300 palette = np.zeros((50, width, 3), np.uint8) n_pixels = len(k_cluster.labels_) counter = Counter(k_cluster.labels_) # 打算每个簇有多少像素 perc = {} for i in counter: perc[i] = np.round(counter[i]/n_pixels, 2) perc = dict(sorted(perc.items())) # 用于日志记录 print(perc) print(k_cluster.cluster_centers_) step = 0 for idx, centers in enumerate(k_cluster.cluster_centers_): palette[:, step:int(step + perc[idx]width+1), :] = centers step += int(perc[idx]width+1) return paletteclt_1 = clt.fit(img.reshape(-1, 3))show_img_compar(img, palette_perc(clt_1))clt_2 = clt.fit(img_2.reshape(-1, 3))show_img_compar(img_2, palette_perc(clt_2))

这样好多了，它不仅给了我们图像中最常见的颜色。
它还供应了每个像素涌现的比例。

它也有助于见告我们该当利用多少个簇。
在上面的图像中，两到四个簇彷佛是合理的。
在第二张图像中，我们至少须要两个簇。
不该用一个簇（k=4）的缘故原由是可能会碰着与均匀方法相同的问题。

结论

我们先容了利用Python和一些著名的库来获取图像中最常见颜色的几种技能。
其余，我们也看到了这些技能的优缺陷。
到目前为止，利用K>1的K-Means找到最常见的颜色是在图像中找到最常见颜色的最佳办理方案之一（至少与我们已经利用的其他方法比较）。

Github仓库代码：https://github.com/mrakelinggar/data-stuffs/tree/master/frequent_color。