一、数据驱动、知识引导和行为探索相互结合的智能计算
演讲者是来自浙江大学的吴教授,吴老师的研究方向是主要研究领域为人工智能、跨媒体计算、多媒体分析与检索和统计学习理论,这次的报告题目为《数据驱动、知识引导和行为探索相互结合的智能计算》,报告讲的津津有味,十分有趣,我这个非专业户都有所很大收获,听得不亦乐乎。
“人工智能”这一提议,最早就起源于1955年,由四位国际知名学者提议和研究,分别是:
John McCarthy,时任Dartmouth数学系助理教授,1971年度图灵奖获得者Marvin Lee Minsky,时任哈佛大学数学系和神经学系Junior Fellow,1969年度图灵奖获得者Claude Shannon 来自Bell Lab ,信息理论之父Nathaniel Rochester ,是第一代通用计算机701的主设计师而最初提出的愿景也是让机器能像人一样认知、思考和学习,即用计算机模拟人的智能。一般以为,人工智能是以机器为载体所展示的人类智能,因为人工智能有时候也可以称呼为机器智能。
在著名的达特茅斯会议中,参与会者提出了人工智能AI值得关注的七个主要问题:Automatic Computers 自动计算机How can a computer be programmed to use a language 计算机编程语言Neuron Nets 神经元网络Theory of the size of calculation 计算规模理论Self-improvement 自我学习与提高Abstractions 归纳与演绎Randomness and Creativity 随机性与创造性随着对人工智能的研究深入,后面三个问题逐渐的受到更广泛和更普遍的重视,从最开始的“Learning by data and rules”到现在主流的“Learning to learn”,也就是从数据和规则中学习到学会自我学习。
我对此的理解是,数据和规则即使在怎么海量,如果不会自我提升和学习,其实现的功能永远是特定的,无法灵活地适应外界环境刺激和变化,遇到新的数据和规则就无法理解和学习,这样是不行的。由此也推出了学会自我学习和自我推演,就像婴儿成长到成年人,最后拥有了独立面对外界环境,做出决策的能力。
讲座时吴老师也借用了荀子《劝学》的语录:“登高而招,臂非加长也,而见者远;顺风而呼,声非加疾也,而闻者彰。假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河。君子生非异也,善假于物也。”
而这也是混合增强人工智能提倡的:多种智能体的混合形式。就像外骨骼机器人,达芬奇外科手术机器人,智慧城市系统等等,多种智能体的混合智能,联动控制和学习。以上是简略的人工智能技术发展和应用,在讲座中,还有一个应用让我十分的钦佩和赞同:智能审批系统-“小智”。
“小智”从一开始研发到最后应用,学习了7000万篇裁判文书,其中精准标注有10万+,400多万个法条,10万个证据样本,在浙江省法院系统的应用中表现十分出彩,这也是人工智能融入法院审判的探索。我相信在未来,随着这一类系统的不断学习和自我提升,越来越能提供更多的服务,甚至可以直接完成判案,全方位给出案件分析结果。
同时吴老师也说道过阿尔法狗的故事,相信大家对这个并不陌生,这里不再过多讨论,大佬们对这个也有很多的分析,可以直接百度查看。
古诗文上流传着三大境界,第一层“昨夜西风凋碧树,独上高楼,望尽天涯路”,第二层“衣带渐宽终不悔,为伊消得人憔悴”,第三层“众里寻他千百度,蓦然回首,那人却在,灯火阑珊处。”,来自王国维《三种境界》。
在人工智能领域,对应地,第一层即为数据驱动下的归纳,更进一步则在知识指导中演绎,第三层在行为中探索顿悟。这对我启发很大,剖开自身浅薄的编程能力来说,我是很愿意深入研究这些理论关系和发展方向的。吴老师也谈到,目前他的研究方向在分布式多智能体机器学习,也巧妙地引用了《三国志 吴志 孙权传》中的“能用众力,则无敌于天下矣;能用众智,则无畏于圣人矣。”
对于分布式多智能体机器学习,首先要知道这个“分布式”指的是什么分布?多智能体又包括哪些智能体,是整体的内衬系统还是某些外在机器表现?对此,我产生的很多的疑惑,毕竟是第一次接触这个领域的知识。
有人的地方,就有江湖,有人的地方,就充满了数据,这些都是宝贵的财富,每一次数据的背后都蕴藏着人性的秘密。通过同学提问和弹幕交流,我获得了比较想要的答案,分布式即与集中式相对,集中式可以简单理解为一个统一的差异较小的数据端口或者采集端,是一种集中式机器学习引擎。而分布式即将这样集中的引擎分散,换成一种联邦式学习,从安全性、聚合能力和用户激励等多方面实现分布式的机器学习,从而变得可信、灵活和赋能。在这方面吴老师也有了一定的探索:群智协同驱动机器学习、知识引导助力机器学习和打造人工智能生态(AI Ecosytem)。
群智交互行为,简单来说譬如常见的在线教育Q-A社区和互联网经济中群体认知行为等,在这些行为的计算中即可通过分析文本实体和逻辑关系,找到其知识图谱。
还有一个很有意思的点,“消除歧义”。你比如说,诸葛明月,这个名字经常在小说中出现,我们都知道这个“明月”是一个名字,而不是真的填上的明月,但是如果不进行精准的机器他不知道这是个名字还是具体的风景意像,而这时可引入人为的精准标注,标注之后系统会进行识别和判断,综合所有用户建议和补充,从而得到较为精确的结果,而这样之后,系统也会牢牢记住这样的行为和思维模式,从而当它遇到下一个次,公孙青叶,它的第一判断就是这个“青叶”就是人名,而不是什么叶子或者火车站。转自:https://baijiahao.baidu.com/s?id=1675962763023143247&wfr=spider&for=pc