热度 28
2015-3-12 10:20
1099 次阅读|
1 个评论
还有人记得当年很火小黄鸡吗?本产品汪,哦,不对,暂时还是半只产品汪,就是从小黄鸡开始关注人工智能的。今天,本汪就准备从产品的角度,大概叙述下我所了解的国内人工智能的人机交互的产品发展历程。 曾经怀着一颗被科幻电影激荡的心,为了了解人工智能,作为一个代码盲,我甚至去研究过正则表达式,然后我发现小黄鸡这货也就是娱乐产品,连智能的边都搭不上;另外,我在产品方面特意研究过各种语音助手,包括Siri、Cortana、灵犀语音助手、虫洞语音助手、智能360、搜狗语音助手、哦啦语音助手、还有就是最近才出来的智乐Aimusic。也正是智乐Aimusic的出现激发了我写这篇文章的兴趣。 在国内最初的智能机器人应该算是小i机器人,但是一开始知道人并不多,应该是当年作为MSN聊天机器人火过一段时间。后来Siri的诞生,引发了国内众多手机智能助手的热潮。这算是国内人机交互智能的第二阶段。这个阶段的智能助手产品最主要有三个功能: 第一,问问附近有什么,帮忙查下票,但这些功能对我这样的用户来说需求不大。导航、查地图我可以打开百度地图,更便捷;查火车飞机票,我可以打开去哪APP,输入几个字的是事情,何况去哪APP也有语音查询功能,我为什么一定要打开助手的程序,再点击按钮,然后说一句话,再让你把百度地图或者去哪的页面调给我看呢? 第二,打电话发短信,这个功能确实有时候方便。懒得翻通讯录找人、懒得打字的时候,可以一句话呼叫发短信;或者开车的时候是最方便的,起码不用眼睛盯着屏幕看,可以更安全的驾车。 第三,问个闲扯的问题,或者无聊的时候,闲聊几句,让它讲个笑话。前段时间,有人吹捧微软小冰,其实这玩意也就是把人闲聊的内容匹配给用户,有时候牛头不对马嘴,看在你那么勤奋更新功能的份上,我就不多吐槽了。现在看起来,智能助手的对话内容要要么从某些“地方”积累的人与人闲聊的对话数据,要么就是到百度知道匹配一个答案。用专家们的话说,他们沾了大数据的光,其实挺无聊。 所以智能助手软件在第二阶段时期慢慢成为了一个非大众化的鸡肋产品。这些产品慢慢在智能中迷失了,只记住了自己是“助手”,忘记了自己应该是“智能”的。不过也可以理解,智能交互的技术毕竟门槛高,发展不能一蹴而就,有时候技术得不到突破,就只能在智能的门外徘徊。不到到现今为止,还有人想着用“不够智能”的技术来做一些智能产品来控制空调、电视机的开关。我们真该从这种“科幻思维”的怪圈里走出来,我们真的需要在回家的路上对着手机话筒说,“打开家里的空调”这种命令吗?把高大上的人工智能技术变成声控遥控器,你们很开心吗? 话题转回来,继续说智能产品的发展。如果再细化分的话,人工智能的产品,可以划出第三个阶段。在这些助手发展过程中,个人认为其中第三个阶段的标志有两个: 第一,Google now在主动探知用户生活习惯上的尝试。譬如说它可以探知人什么时候离开家,什么时候到达办公室。 第二,对应Google now的尝试,国内智能助手的在上下文技术上的应用是一个亮点。这个以哦啦语音助手为典型,他比较早打着上下文技术来宣传的。当初让我觉得最惊艳的是:当询问今天的天气之后,可以继续询问“明天呢”。这样的智能助手才开始称得上智能了,因为这样的对话具备人的思维了,他可以通过上下文来知道用户想表达的意思。可惜的是感觉哦啦有些江郎才尽,没有太多进步了。后来上下文技术慢慢成了智能助手的标配,但是有的做的好,有的则做的一般。 同时,在第三阶段,IBM还是怀抱着他的智能计算机Watson不撒手,还参加了智力竞赛,不过你一直抱着技术不落地实际应用,让用户颇有一种“我裤子都脱了你就给我看这些”的失落感。同时,谷歌和百度都陆续在开始发展自己的人工智能技术,纷纷搭建团队开发自己的人工大脑。不过都是应用于搜索领域。 这个时候,本汪发现了智乐Aimusic。(不知道他们的产品经理为啥给APP带个英文名字,鬼麻烦),这款产品目前上下文做的是很好的,可以说超过哦啦语音助手;作为一个音乐APP,它确实做到其他助手类或者音乐类APP做不到的一些功能,例如说“播放王菲唱的佛教音乐”,还有点播英文歌的时候,它可以提示让用户用英语对它说出点播的歌曲名称,这些都很细致贴心。最重要的是,这个APP的智能程度,让我感到震动,记录下三个对话过程: 对话1 人问:春眠不觉晓 机器答:处处闻啼鸟 人问:夜来风雨声 机器答:花落知多少 人问:这是谁写的 机器答:孟浩然 人问:出自哪首诗 机器答:春晓 (注:本汪心理活动,上下文技术不错,会对诗?哥直接读最后一句,看你对啥!) 人问:花落知多少 机器答:念的真好!这出自孟浩然的《春晓》。 (尼玛,这个有点出乎意料了,不过我记得《春晓》是王维写的) 人问:春晓是王维写的吗 机器答:不是,作者有:【陆龟蒙】、【李中】、【孟浩然】、【元稹】。 (简直惊到我了,有这些人写过春晓?) 人问:背诵元稹的春晓 机器答:半欲天明半未明,醉闻花气睡闻莺。狋儿撼起钟声动,二十年前晓寺情。 (还真有这首诗!) 对话2 人问:香蕉真好吃 机器回答:香蕉味甜,无种子,香味特浓。我挺喜欢的。 人问:我还喜欢吃火龙果 机器答:我讨厌吃火龙果,但是我喜欢吃硬毛扁担杆。 人问:我还喜欢吃粽子 机器答:我可以教你怎么做饺子哟,只要你说“饺子怎么做”,我就能告诉你怎么做啦 人问:,对了,我刚才看到发生车祸了 机器答:是在哪里? 问:在航天桥 答:结果怎么样了 问:貌似没有人伤亡,就是车撞坏了 答:酒驾害人害己呀 (这个对话我想知道是怎么做到的,很多地方重复问,回答还会不一样 ) 人问:最近有啥好看的电影 机器答:1.饥饿游戏3 2.有一个地方只有我们知道 3.神探驾到 4...... 人问:奔跑吧兄弟好看吗 机器答:我都没看过奔跑吧兄弟这部电影,有机会找来看下。 (他竟然知道奔跑吧兄弟是电影) 人问:智取威虎山好看吗 机器答:智取威虎山这部电影不错,剧情是:《智取威虎山3D》……(省略几十字)的故事。 目前这样流程的对话,其他任何一款智能助手APP都没有做到!小小激动下!看来人工智能的智能交互又要有一个进步了。也许国内的人工智能人机交互又要有第四阶段了。 不过,虽然技术上取得了突破,但是在智能功能应用的方面,目前看来灵聚还没进一步展现,只是尝试性的悄悄发布了智乐Aimusic,经常使用的话还会发现一些对话也在不断改进,看样子应该是在小心试水,或许在憋大招吧。本汪一直很期待灵聚科技所谓的AI即UI能达到什么程度,未来产品的交互设计是不是都需要考虑AI了呢?希望这次在功能实际应用方面,国内公司也能突破一下,改变前几个阶段都是国外公司引领开端的局面。