“搜狗的使命是让人人都能够有一个助理,甚至成为你的分身。”
“速记员的取代比播音员更容易些,因为还没有机器技术能取代人的创造力。”
“以前搜狗做输入法和搜索,录音笔的发布则代表搜狗在智能硬件领域也扎根进去。”
“搜狗明年会有重大爆发,原有的工具将升级为有温度的服务。”
近日,在2019搜狐科技AI峰会上,搜狗AI主持人“雅妮”再度引发热议,机器人主持人并不罕见,但像雅妮逼近真人的形象,让机器与人的边界更加模糊。峰会当日,搜狗CEO王小川发表演讲,他提到了语言AI的重大意义,并展示了搜狗最新发布的录音笔。
“搜狗目前的使命是让人人都能够有一个助理,甚至成为你的分身。”原来,搜狗早已离开了搜索引擎和输入法的舒适圈,在人工智能领域用语音AI开辟疆域。
搜狗为何会有这样的转变,未来又将走向何方?搜狐科技对王小川进行了专访。
搜狗AI主持人“雅妮”背后的故事
在语音AI方面,搜狗目前有两大产品,一是AI主持人,二是录音笔。有意思的是,这两个产品一个是语音的收集,一个是语音的输出,他们的诞生都来源于搜狗的语音识别项目。
为何搜狗AI机器人不走大众化的“卖萌机器人形象”,而是选择无限地向真人靠近?这背后有着什么样的故事呢?
“原来搜狗在做语音识别项目的时候发现,为什么不是从语音里面提取信息,而是从嘴形、表情里面获取讲的内容。所以我们当时立项更多从自然交互里面用视觉的方式去尝试理解人的表达,这个项目做得蛮成功的。”
王小川对搜狐科技表示,AI主持人的诞生离不开前期的技术积累,通过前期的技术积累,倒过来思考,如何让带有视觉效果的机器人去表达,用最自然的方式让人去接受。
“当时我们的技术能够实现在90%的垂直场景中,不用听声音只看嘴形就知道讲话内容,在一些通用场景10个字也能对6个字。这样的技术积累后,倒过来,我们开始在自然交互里面,从机器听人,变成让机器表达,用最自然的方式让人去接受,从现在的AI主持人成果来看,我们达到了立项目标。”
AI主持人的第一个应用场景是新华社,王小川提起,目前在新华社已有大约3000条播报从人转向机器,AI主播解放了新华社主播:“新华社主播以前每周一三五下午需要去录视频,现在已经被彻底解放了,成为一个采访记者,可以去做更高级的访问活动。”
那么,AI主播有没有可能取代人类主播?录音笔有没有可能取代速记员呢?王小川觉得,速记员的取代比播音更容易。
“速记员的取代比播音更容易一些,因为录音并不调动人性部分,它没有表演成分,只需要忠实地记录,这是机器可以做到的。如果是主播或者网红,会有更多的表演成分,需要人的创造力,现在还没有这样的机器技术。”
搜狗要从工具升级为服务
2019已接近尾声,被问及今年以来对搜狗印象最深的时刻,王小川提到了录音笔的发布:“今年搜狗做得更多是技术的积累,现在已经快到爆发的点了,以前搜狗做输入法和搜索,今年录音笔的发布代表搜狗在智能硬件领域也扎根进去。有了这样的成绩,我更看重明年的重大爆发。”
从2017年上市之后,外界一直在猜测,搜狗对人工智能领域,特别是语言处理的关注,是不是代表它将会朝着人工智能企业进行转型,而今年搜狗录音笔C1的发布,似乎印证了外界的猜测。但王小川否认了这一说法。在王小川看来,搜狗并非要进行转型,而是要升级。
“不叫转型,而叫升级,就是原有的工具,比如打字的工具会变成辅助的写作助理,从冷冰冰的工具,变成一个有温度的,会替你思考的服务。”
除了智能硬件领域可能带来的新惊喜,在搜狗最强势的搜索领域,明年也将引入更多的AI技术,王小川表示:“搜狗明年会有个发布,AI融入后将使搜索引擎准确度得到很大提升,不仅如此,像beta的算法或者其他的深度学习,包括对于用户问题的理解,对知识的抽取等都会提高,搜狗将会打造新的人机交互方式。”
三年前,王小川因在质疑声中预言AlphGo(围棋机器人)能够打败所有人类棋手而成为AI圈红人,现在,他正尝试用智能录音笔取代传统的速记方式,那么,在他眼中,三年后的人工智能会有什么新的突破?
王小川觉得,让技术与人类感知相结合,才能实现应用的大爆发:“三年后,我们在图像和语音上获取上已取得足够多的成绩,要开始思考在垂直场景当中,如何让深度学习图像语音技术,和人在垂直场景中的认知,包括法律、医疗等的知识,得到更好的结合,这样行业应用才能有大的爆发。”
二维码