 

深度学习算法：利用卷积神经网络为黑白历史照片着色

2019-10-31 16:56 4409 87

但令人欣慰的是，独特或视觉上不同的作品会愚弄算法-这证明并非所有颜色都是预先确定的，而且人类艺术家具有令人惊讶的能力。

彩色图像着色

有没有看过手工着色的历史照片？它们是艺术品，熟练的技术人员会为黑白照片的每个部分精心上色，并添加肤色，背景等等。自摄影之初起，它们就一直很受欢迎，直到今天仍在制作-唯一的区别是，今天的艺术家使用Photoshop而不是画笔。

像彩色辛辛那提（Cincinnati ca）1840年代的石版画一样，手工着色的图像也是艺术品。

手工上色的照片很漂亮，但是制作它们很慢。你必须决定要添加的颜色，要具有将它们放入原始照片中的绘画技巧，等等。即使使用现代工具，聘请艺术家为单张历史照片着色也要花费昂贵。

本文探讨深度学习算法关于成分、样式以及机器学习与艺术之间的关系的说法。

深度学习方法

输入卷积神经网络。在许多情况下，图像中的颜色是唯一的-拍摄黑白照片后，人的衣服的确切颜色，树木的完美绿色阴影等永远消失了。但是，在其他情况下，颜色是可以预测的：天空通常是蓝色的，草地是绿色，水是蓝色的，衣服通常是花哨的或疯狂的颜色，等等。

由于颜色比你想像的要容易预测，因此使用机器学习比最初想像的要容易处理得多。这意味着实际上可以使用卷积神经网络为历史黑白照片着色。

是一种使用CNN来分析一组彩色图像及其黑白版本的颜色的算法。在这里很容易获得训练数据：可以将任何彩色图像更改为灰度，然后将其与彩色版本进行配对，以构成一对简单的训练示例。该算法使用多次前馈传递最终获得灰度图像，用算法创建者的话说，预测一组合理的颜色以填充图像。

彩色图像着色算法可以为黑白照片添加合理的颜色。

对彩色图像着色进行了超过一百万张图像的训练。它的创造者报告说，当通过"着色图灵测试"将结果显示给人类时，人们相信32％的时间里颜色都是真实的。听起来似乎不多，但是请记住，这项任务比仅仅为历史图像着色似乎还要困难。图灵测试中的人们不仅相信他们所看到的图像是一种执行良好的手工着色，而是他们相信该图像确实是彩色图像。这样做是从灰度原件开始的，甚至是32％的时间，这都是很有成就的。

算法结果中出现了一些非常明显的属性。例如，给定带有可口可乐徽标的灰度历史图像，它可以正确地将可口可乐徽标涂成红色，这大概是从数千个带有红色可口可乐徽标的训练图像中看到的。重要的是，该算法从未被教导过可口可乐徽标是什么：通过CNN的魔力，它通过查看大量训练数据来弄清楚了这一点。

该算法正确地在此图像可口可乐中为饮料车上了红色，大概是因为在其训练数据中看到了许多红色的可口可乐徽标。

那么颜色重要吗？

作为专业摄影师，色彩非常重要，专业摄影师的工作很大一部分就是使图像中的色彩完全正确，并根据其鲜艳的色彩选择拍摄对象，等等。色彩如此之多是预先确定的，这样一台机器就可以猜测场景中的颜色并使其大致正确，令人兴奋尽管略有不安。

颜色是构成中有趣的元素，是否是后来幻觉化的计算机程序可以在事后补充的东西？

这种观点当然有很多历史先例。著名的纪录片摄影师亨利·卡蒂埃·布列森（Henri Cartier-Bresson）以他的甘地照片和世界各地的亲密街拍肖像而闻名，对当代威廉·艾格斯顿（William Eggleston）说的："威廉，色彩就是胡说八道。"还有安塞尔·亚当斯（Ansel Adams），也许是20世纪最著名的美国摄影师。

那么所有颜色都是预定的吗？我们是否可以发布一种出色的新压缩算法，使相机以灰度级拍摄照片，然后像"彩色图像着色"这样的CNN可以在后面填充颜色？我们是否应该扔掉亚当斯的玻璃板，并用机器创造的色彩鲜艳的风景照代替它们？

令人惊讶的算法

没那么快。像许多基于卷积神经网络的系统一样，"彩色图像着色"产生了一些显著的结果，但是在边缘情况下却遇到了困难。值得庆幸的是，视觉艺术界到处都是边缘案例。

"彩色图像着色"最擅长的图像是那些具有可预测构图的图像：上方的蓝天，中庭的某些风景，也许是一棵漂亮的明显树（可以很好地测量）以及前景中的一些水可以使其变为蓝色。从某种意义上说，它在"平均"图像上表现最佳，因为那些图像的成分和颜色与训练过的100万张图像的平均成分和平均颜色相差不大。

该算法在构图可预测的图像上效果最佳

但是，对于具有不同成分，图像对象新厅和非常规颜色的图像，该算法很难解决。车水马龙的城市、色彩缤纷的壁画、五花八门的市场，带有大量复杂的图像-在这些图像上，色彩鲜艳的图像色彩趋于平坦。

该算法对通过窗户射出的花朵的这种非常规的组合产生了怪异的结果，在图像的中心飞溅了一些随机的蓝色，并完全丢失了外面的砖墙。

从某种意义上讲，该算法实际上是图像唯一性的很好指示。如果通过算法将图像着色后，你的图像看起来还不错，那么就成分和颜色而言，它可能是相当"平均"的图像，与训练系统的数百万张图像相差不大。这并不一定意味着图像质量差，大量成分平均的图像是商业性金矿或描绘了重要人物或场所。有时候，一幅普通的图像是好的，尤其是当您希望您的构图和颜色选择不受干扰并且不干扰图像的文档内容时。

但是，如果你创建的图像"使"彩色图像着色令人吃惊"（产生奇怪或不准确的结果），请向后轻拍。您已经创建了一些偏离平均值的东西，足以使算法蒙蔽。简而言之，你已经创建了一些艺术上独特的作品。

对我来说，这赎回了围绕色彩的艺术过程。如果你希望图像遵循视觉规范，则最好通过"彩色图像着色"来运行它，并确保即使是计算机也可以猜测其颜色。

但令人欣慰的是，独特或视觉上不同的作品会愚弄算法-这证明并非所有颜色都是预先确定的，而且人类艺术家具有令人惊讶的能力。

实践中的算法

因此，除了整洁的机器学习聚会技巧或验证您的艺术选择的工具之外，"彩色图像着色"是否有价值？

绝对。在某些历史照片（特别是肖像）上，该算法可得出令人难以置信的结果，并为图像带来深度和震撼力，否则这些图像将变得更平淡，更不活跃。对于这些肖像中的许多肖像，摄影师可能会使用彩色胶卷（如果有），因此对图像进行彩色处理实际上等于填入了他们可能包含的细节。

在某些情况下，算法的幻觉本身就是艺术。运行经典的图像，例如《走进死亡的下巴》（该图像显示美国士兵在诺曼底的D日入侵期间登上了炮火墙），产生了令人难以忘怀的梦境，色彩依托并增强了原始构图。

在经典图像《死亡的下颌》中运行彩色图像着色会产生具有艺术意义的结果。原始图片由Signal Corps提供，Gado的彩色化与"彩色图像彩色化"。

尽管功能强大，但是彩色图像着色确实有盲点。尽管幻觉出的颜色是合理的，但它们在历史上并不总是准确的-例如，本文顶部图像中的Pan Am徽标看起来很像红色，但实际上是蓝色。

而且，可能是由于接受过许多棕褐色而不是真彩色的历史照片的培训，所以它倾向于以柔和的黄色和棕褐色渲染历史照片。一个有趣的实验将是在一组实际上是彩色拍摄的历史图像上（例如，大量的Kodachrome幻灯片）对算法进行训练，然后查看该新版本如何对历史图像进行着色。可以填充类似于Kodachrome的颜色的CNN对于处理历史图像将是极好的选择，并且可以在今天拍摄的图像上产生一些非常吸引人的结果。

机器学习与艺术

最终，彩色图像着色是当机器学习和艺术这两个截然不同的领域融合在一起时可能发生的有趣协同作用的一个令人信服的示例。

你不会期望用于猜测颜色的神经网络会引发关于构图，主题选择和摄影作品的独特性等现存的问题。

你也不会以为它会重新点燃人们半个世纪以上的艺术史观点，例如卡地亚-布雷森和亚当斯的对话。

但是，看看"彩色图像着色"的结果，就会出现这些问题。

随着机器学习对更多行业的影响，我希望视觉艺术家以及所有艺术家真正开始参与这些技术提出的有关社会和艺术过程本身的问题。如果机器学习要继续发展，它需要来自整个社会的艺术家，创意者和其他思想家的观点。但是与此同时，机器学习可以回馈一些东西，展示出观看艺术作品的新方法，甚至是创造艺术作品的新方法。诸如彩色图像着色的系统表明，在机器学习和艺术方面，对话是双向的。

 87

上一篇：音响三极管放大电路图-共集电极放大电路实例
下一篇：三极管三种工作状态电路图:放大、截止、饱和