开始使用计算机视觉

数字图像处理和计算机视觉是一个有趣的领域,因为它位于数学和计算机科学之间。因此,理解基础知识并使用编程来理解该主题非常有用。

数字图像是 2 维或 3 维信号的离散化。换句话说,数字图像是连续域的像素或体素的采样组。

                                        f : R² ⊃ Ω → R

其中 f 是Ω上的数字图像:矩形图像域

为简单起见,我们只讨论二维数字图像,就像 StackOverflow 头像中的图像一样。

关于像素:在我们开始讨论图像类型之前,关于像素值的快速说明。根据经验,像素以值 0 开始,其表示无光(黑色),达到 1,最大强度(例如白色),并且它们以整数表示。

二进制图像: 仅黑白图像。每个像素为 0 或 1,每个像素可以用一个比特表示。它们并不是非常普遍地知道,因为它们通常用于科学应用或用于其他图像处理操作,例如掩模。

StackOverflow 文档

二进制图像示例。 (警告此文件的图像像素值不一定是二进制,这是用于演示,这也是 Lena,图像处理世界的明星)

灰度图像: 借助在线过滤器,每个人都能很好地了解这些图像。这些图像通常是每像素一个字节,0 为黑色,255 为白色,两者之间的所有内容都是不同的灰色,因为人类只能区分 40 种灰度,这个范围对于许多应用来说已经足够了(注意这些值)这里的像素映射从 0 到 1 到字节值 0 - 255)

StackOverflow 文档

彩色图像: 最后,最常见的数字图像类型,彩色图像。我们在这里必须提到渠道的概念。数字图像也具有通道,实际上,上述二进制和灰度图像也具有通道。最常见的描述是 RGB(红 - 绿 - 蓝)模型,在这种情况下,图像有 3 个通道(不要将它与尺寸混淆,这些仍然是 2D 图像)来描述图像的红色,蓝色和绿色。在这种情况下,每个像素是一个三元组,值介于 0 - 255(无红色至大多数红色),0 - 255(无绿色至大多数绿色),0 - 255(无蓝色至最蓝色)之间。对于此模型,像素{0,0,0}为黑色,{255,255,255}为白色,{255,0,0}为红色,{255,255,0}为黄色。但是,颜色是一个非常广泛的主题,你可以查看参考资料以获取更多信息。

StackOverflow 文档

超光谱图像:

在我们讨论了频道之后,谈论高光谱图像更容易。这些图像可以有数百个通道,通常用于显微镜,卫星成像等。

阅读

  1. 信号采样: https//en.wikipedia.org/wiki/Sampling_(signal_processing)

  2. 数字图像处理圣经:RC Gonzalez,RE Woods:数字图像处理。第三版,Pearson Prentice Hall,Upper Saddle River,2008。

  3. 计算机视觉评论(直到深度学习):R。Szeliski:计算机视觉:算法和应用。施普林格,纽约,2010 年。

  4. 要了解二进制,灰度,彩色图像: https//en.wikipedia.org/wiki/Grayscale