同花顺-圈子

请广大用户注意风险,切勿加入站外群组或添加私人微信,如因此造成的任何损失,由您自己承担。
中富金石:神经网络技术加快机器人迭代 多家上市公司已积极布局
0人浏览 2024-03-20 14:10

事件刺激:

神经网络是人工智能(AI)领域的一个重要分支,它模拟人脑的工作方式,通过大量数据训练和学习,使机器能够执行各种任务,如图像识别、语音识别、自然语言处理等。Figure公司公布原型机仅五个月,其人形机器人即迅速迭代,神经网络技术在应用在其中扮演的角色功不可没。当前,谷歌、微软等多公司加快布局该领域,产业链在机器人迭代中不断被催化。

最新消息:

日前,人形机器人初创公司Figure发布了自己第一个ChatGPT加持的机器人demo,Figure 01可以与人类全面对话。Figure将基于OpenAI的GPT模型,专门训练Figure收集的机器人动作数据,以便其可与人交谈,看到东西并执行复杂任务。据分析,Figure进步迅速主要原因为“端到端”神经网络。公司创始人BrettAdcock认为,Figure01主要通过“端到端”神经网络来与人类进行对话。

此外,特斯拉日前在北美地区全面推送FSD(全自动驾驶)V12.3版本,此次升级的最大亮点是引入了特斯拉CEO马斯克引以为傲的“端到端神经网络”技术。这一变革被誉为“改变游戏规则的技术”。

关注逻辑:

在AI大模型与神经网络加持下,人形机器人正加速迭代

日前,人形机器人初创公司Figure发布了自己第一个ChatGPT加持的机器人demo,Figure01可以与人类全面对话。Figure将基于OpenAI的GPT模型,专门训练Figure收集的机器人动作数据,以便其可与人交谈,看到东西并执行复杂任务,并通过逻辑推理完成日常任务。Figure01的操作和回答是根据人类的开放性问题和要求,基于逻辑思考而得出的,说明已经可以理解人类语言指令和意图,并进行动作和进行回答。

相比传统机器人执行,VLA端到端模式展现以下优点。

1)增加互联网学习能力,利于扩展:将基于互联网规模数据训练的视觉语言模型直接纳入端到端机器人控制中。这利于解释机器人训练数据中不存在的命令的能力,以及响应用户命令执行基本推理的能力。    2)VLA增加有效率的“泛化“能力:为了将自然语言响应和机器人动作都适应相同的格式,将动作表示为文本标记,并以与自然语言标记相同的方式将其直接合并到模型的训练集中。    3)强调了动作微调:为了使视觉语言模型能够控制机器人,必须训练它们输出动作。RT-2将动作表示为模型输出中的标记(类似语言标记)。动作空间主要包括机器人末端执行器的六自由度(6DoF)位置和旋转位移。

据分析,Figure进步迅速主要原因为“端到端”神经网络。公司创始人BrettAdcock认为,Figure01主要通过“端到端”神经网络来与人类进行对话。

大致流程为:OpenAI的LLM提供“大脑”——视觉推理和语言理解;Figure神经网络提供“小脑”——做出一系列快速、低级、灵巧的机器人动作。

FigureAI团队负责人CoreyLynch解释:“这些神经网络以每秒10帧的速率接收机器人内置图像,并能生成每秒200次的24自由度动作(包括腕部姿势和手指关节角度)”类似的增加人类自然语言交互的VLA(Vision、Language、Action)端到端模式,可能是人形机器人未来形态。

神经网络模拟人脑工作方式,该领域呈现出快速多元化的态势

神经网络是人工智能(AI)领域的一个重要分支,它模拟人脑的工作方式,通过大量数据训练和学习,使机器能够执行各种任务,如图像识别、语音识别、自然语言处理等。神经网络的研究和发展始于20世纪50年代,当时科学家们首次提出模拟人脑工作方式的理论。然而,由于计算能力的限制,直到20世纪80年代,神经网络才开始得到广泛的应用。近年来,随着计算能力的提升和大数据的出现,神经网络得到了飞速的发展,并在很多领域取得了显著的成果。

作为深度学习技术的核心,神经网络在近年来得到了快速的发展和优化,从最初的感知机、多层前馈神经网络,到后来的卷积神经网络(CNN)、循环神经网络(RNN)等,其结构和功能都在不断完善和丰富。特别是卷积神经网络,在图像识别、视频分析等领域取得了显著的应用成果,使得AI在这些领域的性能得到了极大的提升。

据悉,Figure机器人迭代极为迅速,2023年10月原型机Figure01公布,展示具备行走能力;2024年1月学会做咖啡,引入端到端神经网络,机器人学会自己纠正错误,训练时长10小时。2024年2月已学会搬箱子,并运送到传送带上,速度目前只有人类16.7%。2024年3月初,Figure官宣与OpenAI合作,OpenAI将为其打造人形机器人AI多模态大模型,短短两周后,Figure01已经能识别周围场景、与人类对话、分析对话内容识别和完成指令、评价自己的行为。

视频中Figure01能够1)辨别自己所在场景;2)能够区分物品功能;3)能与人对话获取命令并执行;4)能理解并且评价自己行为;5)计划下一步行动;6)灵巧手足够灵活能抓取餐盘、苹果等物品。本次Figure01的升级核心是加入了OpenAI的大模型,现在Figure01已经拥有OpenAI大模型提供的视觉推理和语言理解能力,以及Figure的神经网络提供的快速、低水平、灵巧的机器人动作。这其中,神经网络扮演着极为关键的角色。

目前全球范围内,谷歌、微软、Facebook、IBM、亚马逊等大型科技公司都在这个领域有着重要的布局。此外,还有一些初创公司也在这个领域崭露头角,如OpenAI、DeepMind等。这些企业不仅拥有强大的技术实力,还具备丰富的应用场景和庞大的用户数据,使得他们在神经网络领域具有显著的优势。

在中国,神经网络领域的发展也呈现出蓬勃的态势。随着国家对人工智能产业的重视和支持,越来越多的企业开始投身于神经网络领域的研发和应用。其中,百度、阿里、腾讯等巨头企业在神经网络领域的应用和布局尤为引人瞩目。这些企业不仅在技术层面取得了显著的突破,还在实际应用中取得了良好的效果,推动了神经网络领域的发展和应用。

在产业链方面,神经网络领域的主要相关企业涵盖了从基础层、技术层到应用层的全产业链。基础层企业主要提供硬件设备和数据资源,技术层企业则专注于神经网络算法和模型的研发和优化,而应用层企业则将这些技术和模型应用于具体的场景中,如图像识别、语音识别、自然语言处理等。

更多
· 推荐阅读
0
1
扫码下载股市教练,随时随地查看更多精彩文章
发 布
所有评论(0
  • 暂时还没有人评论
  • 0
  • TOP
本文纯属作者个人观点,仅供您参考、交流,不构成投资建议!
请勿相信任何个人或机构的推广信息,否则风险自负