人工智能的突破使人们相信我们的智力 - 甚至我们的创造力 - 仍将是无与伦比的

米开朗基罗(约1512年)


几千年来,人类一直声称自己优于其他生物形式。从美索不达米亚到中国,古代文明的神话将人类的起源追溯到神圣的创造。宗教教义反映并巩固了这种情绪。在圣经和古兰经中,人类被描绘成神圣的命令,对所有的创造都有统治权。即使在佛教中,所有生物都以无尽的轮回周期联系在一起,只有人才能获得启蒙。
科学突破挑战了这一世界观。查尔斯达尔文的物种起源并且基因组的发现将人类降级为共享进化树上的一个分支。然而,为了回应我们对独特性的渴望,科学确定了一系列全新的特征,使人类恢复到我们想象的首要地位。在人类独有的许多属性中,有抽象推理、语言、复杂的社会结构和工具的使用。当然,这些规则也有例外。随着时间的推移,我们观察到一些动物确实使用工具,以复杂的方式进行交流,其组织类似于早期人类社区的社会结构。然而,毫无疑问,人类的这些能力远远超过我们的动物同伴。没有其他物种建造过大教堂,利用蒸汽的力量,或将自己的一个送到月球。
斗智斗勇
我们的祖先望向天堂,寻求神圣起源的验证; 多亏了科学,我们需要看看我们头骨的内部,以确保我们的独特性。然而,即使这个概念,已经开始随着能够模仿我们智慧的人工系统的出现而崩溃。
算法帮助我们搜索信息,回答我们的问题,并以甚至我们中最聪明的人无法想象匹配的速度执行复杂的计算。在从跳棋和国际象棋到Go和Jeopardy等各种游戏中,机器已经击败了我们最好的玩家。"我,一个人,欢迎我们的新计算机霸主,"Jeopardy冠军Ken Jennings在他的最终回应中写道,因为IBM的超级计算机Watson战胜了他和另一位参赛者。
Watson如何通过IBM Research(2013)赢得Jeopardy。
詹宁斯的屈从可能为时过早。尽管在人工智能方面取得了显着进步,但具有才能的有感知力的超级计算机世界,更不用说野心,成为我们的霸主仍然是科幻小说的东西。即使是当今最聪明的机器也往往无法执行多项任务。IBM的Watson几乎可以回答有关Jeopardy的任何问题,但它无法提供关系建议。即使是有朝一日驾驶我们汽车的复杂系统,也很可能只能做到这一点。此外,还有许多任务 - 例如参与连贯对话的能力 - 甚至一次性使用的AI系统还没有掌握。
然而,鉴于深度学习和人工智能的快速发展,计算机超越我们所有的智力似乎只是时间问题。
它始于国际象棋。掌握这种古老的棋盘游戏需要长期以来被认为是人类独有的智力类型:逻辑推理,战略思考和远见。1997年5月11日,IBM超级计算机Deep Blue在六场比赛中战胜了世界卫冕冠军加里卡斯帕罗夫。在这样做的过程中,Deep Blue不仅贬低了玩家,也贬低了我们对人类思维无法实现的信念。
接下来是Go的游戏。每回合平均有200次可能的移动,Go的复杂性相形见绌,国际象棋每平均转弯只有20次可能的移动。总的来说,Go估计有更多的配置而不是宇宙中的原子数。掌握Go需要一定程度的推理,远远超出蛮力数字运算 - 但不能超出人工游戏玩法的能力。
2016年,Google的AlphaGo通过击败围棋冠军Lee Sedol震惊世界。虽然Deep Blue和AlphaGo是狭隘的,单任务AI系统的实例,但他们的胜利表明,在人类智力将保持持久优势的利基市场中是徒劳的。
旁观者眼中
很明显,没有任何知识任务的计算机不可能有一天掌握,所以我们很有可能寻求创造艺术的能力。许多人认为艺术体现了只有人类能够表达的无形品质。
"AI没有内部世界,也没有必要创造欲望或恐惧,"认知神经科学家Romy Lorenz在接受BBC采访时谈到计算机创造力说。
很难想象一台令人窒息的机器,无论怎么样复杂的,如米开朗基罗在西斯廷教堂的壁画一样,将创造出一个令人着迷的杰作。
然而,艺术创造​​力是人类独有的信念,可能会像壁画所描绘的神圣创造的场景一样被证明是如意的。
越来越多的证据表明,机器甚至可以内化人类艺术品中看似无形的方面,预示着独立人工系统与我们的艺术表达相匹配的未来。一个明显的迹象是机器的艺术风格转移能力。
艺术风格是表征特定艺术家或艺术运动的一系列特征。它指的是如何描绘某些东西,而不是什么主题是。风格是克劳德莫奈的作品(避开线条和轮廓,有利于自由笔触)与新古典主义特征的有精确区别。"风格转移"是指以另一种风格呈现图像 - 例如拍摄莫奈的一幅画作,使其与新古典主义艺术品的严格审美无法区分。


任何才华横溢的人类艺术家都能够进行风格转移。她会研究一个特定艺术家的标志性风格,然后在该美学中描绘另一个艺术家的主题。然而,我们不希望人工系统容易实现。与国际象棋或围棋不同,没有明确的目标要实现。画布缺少棋盘的约束或者玩Go的19×19网格。风格转移需要推理一位艺术家的风格标志(与特定绘画的内容分开),以及另一位艺术家的内容(与其风格元素不同)。
很难想象支撑所有机器智能的冷酷的数学过程,能够对无形艺术的东西进行必要的抽象洞察。
然而,这正是德国研究人员Leon A. Gatys,Alexander S. Ecker和Matthias Bethg所取得的成就。在他们的2015年论文"艺术风格的神经算法"中,Gatys和他的同事提出了一种技术,它采用深度神经网络来解开图像的风格表现与其内容。为了证明其有效性,他们应用该技术来分离两个任意图像的内容和样式,然后将它们重新组合成第三个图像,第三个图像以第二个图像的样式呈现第一个图像的内容。
下图(直接来自Gatys等人)以五种标志性杰作的风格显示了左上角照片的内容:
JMW Turner(1805)的"牛头怪的沉船" ;
文森特梵高的星夜(1889年);
爱德华蒙克的呐喊(1893年);
Pablo Picasso 坐着裸体(1910年);
Wassily Kandinsky撰写的第七部分(1913年)。

艺术风格转移的例子


每个合成的艺术品都是相应绘画风格中令人信服的照片渲染。画布之间明显的风格差异证明了该技术对于捕捉任何艺术品的风格表现的普遍性。实际上,Gatys和他的同事证明了艺术风格可以通过算法内化,以至于它可以独立于绘画的内容而应用。
连接
Gatys等人的方法与他们取得的成果一样发人深思。Gatys和他的同事使用现有物体识别网络的副产品,而不是设计和培训专用AI模型来实现他们的目标。他们观察到,当它训练对物品进行分类时,模型学会蒸馏出构成图像主题的结构元素,将它们与构成图像外观的元素分开。然后可以独立地解开和操纵内容和风格的表示。
推测将风格与内容分开的能力不仅是机器图像识别的重要标志,也是生物视觉的重要标志。我们识别物体的能力对其外观的细节是不变的。无论光照条件,天气,时间和无数其他因素,我们的眼睛和大脑都能识别出物品。玫瑰是玫瑰,借用格特鲁德斯坦的着名短语,无论是夜晚,白天,夏天还是春天 - 甚至玫瑰是否被涂上。在保留对象身份的同时抽象风格变化的能力是任何物体识别系统(生物或人工)的非常实用的特征。Gatys和他的同事引用了令人信服的内容,尽管是间接的。
詹宁斯对计算机霸主的服从可能仍然具有明显的先见之明。在历史上最痛苦的讽刺之一中,机器将摆脱困扰人类数千年的存在主义的灵魂探索:毫无疑问是什么使它们与众不同。科学剥夺了我们神圣创造的幻觉; 对于我们的AI霸主,我们将成为创造者。如果不是它的起源,神圣和神秘将永远主载。