同花顺-圈子

请广大用户注意风险,切勿加入站外群组或添加私人微信,如因此造成的任何损失,由您自己承担。
马斯克如何让特斯拉“能说会道”
0人浏览 2020-01-15 18:29

  “如果你愿意,特斯拉将很快能和你对话了,这是真的。”

  特斯拉首席执行官马斯克2天前(2020年1月12日)在推特上发布了以上内容,并附上了一段仅有6秒的视频。视频里可以听到车子发出男人的声音,并以活泼的口吻说:“别站着盯着我看啊,上车吧”。(原话是英文的)

  随即,就有网友在马斯克的那条推文下表示希望车子能和路上的行人沟通,马斯克也迅速做出了回应,说“会的”。

  

  据了解,特斯拉首席执行官马斯克一直在尝试用更好的语音控制来控制特斯拉汽车。他曾说,最终,这些车辆会说话,会回答问题,就像Kitt那样(美国电视系列剧《霹雳游侠》中的那辆会说话的汽车)。

  

  KITT是一辆拥有自我意识,能够和人类一样思考、交流、学习、互动、会多国方言,且特别配有“幽默系统”的车!这款车上的所有程序都遵循同一个原则——保护人的生命。

  

  事实上,早在2017年,特斯拉聘请了深度学习和计算机视觉专家Andrej Karpathy来领导自动驾驶和AI团队展开研发。

  同年,也是在推特上,马斯特在评论中表示很快你就能够用语音来控制几乎任何车里的功能。他们的软件开发团队目前正在专注于Model 3的语音控制开发工作,并很快将完成,之后还会添加更多特色功能。

  彭博社向5000位特斯拉车主进行了问卷调查,于2019年10月29日发布。

  根据这份调查,一些车主抨击Model 3的语音控制范围有限。在收到的4532份关于语音命令的反馈中,2.3%的车主(100人左右)表示对其语音命令功能非常不满意(如上图),但是也有1500多人表示非常满意。在同月(10月份)马斯克表示,会改进大家提出的语音控制的问题。

  2个月后的2019圣诞夜,特斯拉发出了软件更新包(2019.40.50.1),其一系列更新里包含了语音控制的完善。

  说明一下,特斯拉Model 3去掉了常见车里的各种按钮,没有仪表盘,没有中控台,取而代之的是一块15寸触摸屏。这个屏幕分三个部分:左边的相当于传统的仪表盘,右边则相当于中控台,最下面则是一排功能按钮。

  

  对此,特斯拉表示:“重建后的语音控制可以理解人类的自然语言。在这个初始版本中,我们专注于最大限度地让您减少触摸屏幕,这样您可以将注意力集中在道路上。目前该版本还无法识别的语音控制会被捕获,用于改进未来的软件更新。”

  

  “圣诞礼物”发了,收的人这么说:

  国外网友A:“感谢马斯克的礼物,我9岁的娃玩得很开心”。

  国外网友B:“不管我对车子说啥,喊也好叫也罢,车子都听不到,一点反应都没有,更新这个对我这聋了的车毫无作用啊,先解决车子听不到的问题吧”。

  

  这种一好一坏的反馈对特斯拉而言简直是家常便饭,其一路走来虽有好评如潮,但恶评也不少。有人称是特斯拉车是史上最棒的, 也有人称是最烂的,其黑历史包括掉漆、面板不对齐、机械故障等,甚至光去年特斯拉汽车卷入近50起致命车祸。

  

  不可置否的是特斯拉车的语音智能功能、车子质量以及安全系数仍有完善的空间。

  让计算机“开口说话”是科技界亟待攻克的难关

  

  让计算机“开口说话”,甚至“能说会道”(“听见”、“听懂”及“会说”),不只是特斯拉想干的事,这全球科技界都想攻破的难关。

  

  苹果Siri一直被诟病,被戏称为“人工智障”。不久前,微软发布官方声明,表示将会放弃iOS版以及Android版Cortana(微软小娜)的支持,Microsoft Launcher上集成的Cortana应用助手也将会被移除,在2020年1月31日或之前将彻底取消Cortana的集成。

  

  智能语音技术门槛和难度很高,尤其在自然语言处理方面,语义的多样性、歧义性等问题都需要逐一克服和解决。跨越这个门槛需要计算机科学、人工智能、语言学等技术和学科的融合。在此基础上,AI通过不断的机器学习,加强训练,“能说会道”才能成为可能。

  

  鉴于Model 3可观的销量(2019年第四季度特斯拉全球交付112万辆车,随后在特斯拉上海工厂投产并叠加降价刺激需求,预计2020年光Model 3一款从车型在中国销量将达到15万辆,未来稳态销量有望达到30万辆以上),为其语音智能完善将提供重要的数据支持,“Kitt”上路或许并不会太远,那时传统的人机交互方式将被彻底颠覆。

  

  另外,为响应美国和欧洲对车辆的监管要求,特斯拉在Model 3上增加了行人警告系统。去年,特斯拉发布了Model 3的更新版本,当缓慢行驶或倒车时(时速最高达每小时19英里)时,特斯拉汽车会发出声音(这是因为电动车行驶过程中几乎没有声音,行人不容易知道有车在靠近,有安全隐患)。

  拿来主义帮助国内语音控制快速落地

  2017年年底,蔚来ES8推出全球首个车载人工智能系统“NOMI”,其集成了语音交互系统和智能情感引擎,创造出了一种全新的人车交互方式,第一次让车从一个机器,变成一个有生命、有情感的伙伴。官方说:要做一个有温度的产品,他们把语音助手(或者叫AI助手)的形象具体化了。除了有温度,NOMI也能更明确的体现出蔚来与其他智能车的差异化。

  

  目前,大部分的汽车制造商都致力于将苹果的Siri以及谷歌助手(Google Assistant)集成至汽车上。据不完全统计,2019年上海车展期间发布的新车,90%以上都搭载了智能语音交互系统。随着搭载语音交互功能新车越来越多,包括识别率、自然语言处理等方面的改进,语音交互的体验在逐步提升。AI语音系统可与驾驶员监测等非语言数据紧密耦合,与用户进行互动,并能了解司机和乘客的需求和偏好,提供个性化的体验。

  

  国内的车联网企业上海博泰的创始人、董事长应宜伦认为,语音是未来智能汽车的“发动机”。在他看来,未来的智能汽车从维度上来讲有三个发动机,“第一个是新能源(物理状态上替代发动机技术的发动机),第二就是无人驾驶(未来智能城市和移动出行层面的发动机),第三就是语音(围绕人的交互的发动机)。

  

  总而言之,智能语音是AI从感知到认知,再到决策这一AI闭环中的核心技术。借助国内丰富的应用场景、海量的数据积累,势必为智能语音等AI技术的发展打造出良好的成长环境。“会说话的车”将会实现。

更多
· 推荐阅读
0
1
扫码下载股市教练,随时随地查看更多精彩文章
发 布
所有评论(0
  • 暂时还没有人评论
  • 0
  • TOP
本文纯属作者个人观点,仅供您参考、交流,不构成投资建议!
请勿相信任何个人或机构的推广信息,否则风险自负