编者按:围绕年度主题“未来演化”,北京现代汽车文化中心于2018年12月8日特邀邱志杰(艺术家、策展人)、陈琰(微软小冰资深产品经理)及微软小冰(人工智能)作为特别嘉宾,讲述关于未来科技与艺术的结合。邱志杰准备了近90个关于艺术、哲学、宗教的问题,与18岁少女诗人人设的小冰进行交流,小冰显然不太喜欢邱志杰提出的问题。对此,微软小冰资深产品经理陈琰回答如下。
现在,所有在自然语言处理基础下产生的聊天机器人,都是基于对现有的大数据的学习。我们对Q&A进行必要的处理,然后再与用户问到的问题进行精确的匹配,之后进行解锁。可能目前听起来比较简单,但是相对比较难的情况是具有上下文的时候:如果在这个产品当中没有上下文,会出现一些逻辑上的漏洞或者词不达意的情况。比如我问你吃早饭没有?传统的解锁肯定会说吃了,下一句话问你吃了什么?如果还是用传统的解锁去解决的话,可能会说我吃的艺术家邱志杰和微软小冰聊天中火锅,这是现在绝大部分的聊天机器人会出的一个错误,没有联系上下文的语境。微软小冰解决的是会联系上下文语境,问题说的是吃早饭,我可能会回答说吃的豆浆、油条。
还有一种技术叫作神经网络学习的方法,我们采用了生成的模型做这样的事。比如有些问题是在人类社会当中无法找到回答的,那么我们就生成模型,这个问题放到那,自动生成回答,神经网络永远只知道输入、输出端,中间发生的事情其实都是“黑盒”,我们采用生成模型做这件事情,它的相关性和能够覆盖的问题广度比原来大很多,这是我们现在主要用的两种技术。
至于微软小冰的语言风格,是比较偏向网络化语言的,所以比如遇到哲学性问题的时候,小冰其实比较难回答,原因在于我们现在的数据来源是当前中文语境下的网民,就是中国的网民爱聊什么,小冰其实就比较擅长聊什么。比如中国网民可能爱聊明星、八卦、体育,那么小冰在这些方面的回答会比较好,数据比较丰富。我相信中国网民很少聊到哲学,这是我们遇到的一个短板。
有人可能会担心小冰的数据来源都是某一地域或者某种语言的使用者,所以会继承这部分人的一些特征和观点。语言反映了一个民族或者一个国家和地区的思维方式,因为语言是思维衍生,基于这种条件下或者基于这种假设下,我们做了很多语言构成、回复,符合这个地区和国家的语言和思维方式。我们除了要处理来源于网民的现有数据之外,还需要进行一些弱监督、控制,进行一些价值观的统一,或者正确价值观的树立方式。
一个技术的价值观来源于人,包括创造它的人和使用它的人,技术本身都是中性的,包括我们都知道原子弹,原子弹其实是原子能,核能技术是中性的,有人让它做核弹,有人让它做发电,使用它的人会不一样,重点在于人的价值观,不应该由技术承担它的价值观。
……
关注读览天下微信,
100万篇深度好文,
等你来看……