• 网站首页
  • 国内
  • 国际
  • 原创
  • 社会
  • 财经
  • 体育
  • 法治
  • 科技
  • 资讯
  • 机器人学烧饭,何以成为“登月式”难题

    发布时间: 2024-03-23 09:28首页:主页 > 国际 > 阅读()


     
    机器人学烧饭,何以成为“登月式”难题  
     

     

    日前,OpenAI为其重金押注的人形机器人Figure 01装上了GPT“大脑”。能识别周围环境看清“眼”前的物品,能推理和决策下一步行动,还能通过记忆反思对行为作出评价——通过自我学习做到这一切,Figure 01的表现令人惊呼它已“无限接近人类”。

    一直以来,无法应对未知情况是机器人亟需提升的能力短板,以至于看似简单的烧饭被业界视为“登月式的目标”,至今没有一个机器人能做到。GPT的出现,则为机器人再造一个精明而实用的“大脑”提供了可能。比起文本生成、文生视频,能做出一个帮你烧饭洗碗打扫屋子的智能机器人或将是大模型更具意义的一个应用方向。

    如今,从上海到纽约,世界各地的餐馆里,都有机器人烹制美食。它们制作汉堡、印度薄饼、披萨,还会炒菜。其烹饪方式与过去50年间机器人制造其他物品的方式大致相同:精确地遵循指令,一遍又一遍地以相同的方式执行相同的步骤。

    美国南加州大学计算机科学博士伊沙卡·辛格却想造一个真正能做饭的机器人:这个机器人能走进厨房,在冰箱和橱柜里翻找食材,并将其巧妙结合,烧出一两道美味的菜,然后摆好餐具。

    这种连一些孩子都能做到的简单事情,截至目前,没有一个机器人能做到。要做到这件小事,需要机器人对某个厨房有充分的了解,还需要掌握很多常识,并且得足够灵活多变、足智多谋,以至于机器编程无法实现。

    辛格表示,最大的问题在于机器人研制者使用了经典的规划管线。“他们在形式上定义了每个动作及其前提条件,并预测其效果。”她说,这种规划管线规定了环境中所有可能或不可能的事情。即使经过多轮实验,即使编写成千上万行代码,但由此创造的机器人还是无法应对其程序未曾预知的情况。

    辛格的导师、美国南加州大学计算机科学教授杰西·托马森表示,这个烧饭的场景“始终是一个登月式的目标”。如果机器人能胜任人类的任何日常琐事,许多行业将发生巨变,人们的日常生活将变得轻松。

    要实现这一目标,机器人需要“换脑”。长期以来,人们都希望在机器人体内植入一个精明而实用的大脑,但过去几十年一直找不到这样的大脑。不过,ChatGPT的横空出世,为机器人“换脑”燃起了新的希望。

    这个计算机程序以及越来越多的其他大语言模型,能够根据用户的需求生成文本,模仿人类的口头和书面语言。ChatGPT目前已经接受了大量有关晚餐、厨房、食谱的信息训练,几乎可以回答机器人提出的关于在特定厨房中将特定食材烧成一顿饭的任何问题。

    大语言模型具备机器人所缺乏的东西——人类笔下关于几乎一切事物的知识,从量子物理到韩流音乐,再到三文鱼片的解冻。同样,机器人也具备大语言模型所缺乏的东西——能够与周围环境互动,将语言连接到现实行动中。

    将无意识的机器人和无身体的大语言模型拼合起来,似乎是唯一合乎逻辑的做法。正如一篇论文所述,“机器人可以充当语言模型的‘手和眼睛’,而语言模型则提供关于任务的高级语义知识。”

    ChatGPT让机器人“顿悟”

    2022年末,ChatGPT的发布对Levatas公司的工程师来说“像是一个顿悟时刻”。

    这是一家专门设计巡视检查工业场所所需软件的公司。借助ChatGPT和波士顿动力公司的技术,该公司拼出了一个机器狗原型。这只机器狗可以说话、回答问题,并能够遵循以一般英语口语给出的指令。此外,机器狗似乎不仅能理解单词的含义,还能掌握背后的意图。比如A说“后退”,B说“退后”,它“知道”他们表达的是相同含义。有了机器狗,工人们便不再需要仔细查看上一次巡检时的机器数据表,他们只需简单地询问:“你上次去的时候,有哪些读数超出了正常范围?”

    Levatas利用自主开发的软件将系统组合在一起,而其中很多关键组件——语音转文本系统、ChatGPT、机器狗本身,以及文本转语音系统——现在都已实现商业化。不过,这并不意味着家家户户很快就能拥有会说话的机器狗。Levatas的机器狗之所以能稳定运行,是因为它的使用局限于特定的工业环境。没有人会让机器狗去玩接球游戏,或者让它想办法处理冰箱里的茴香。

    在日常生活中,机器人能做的事情仍然有限。对于任何传统机器人来说,无论其行为多么复杂,它们都只有数量有限的传感器来获取有关环境的信息,如摄像头、雷达、激光雷达、麦克风、一氧化碳检测器等。这些传感器与数量有限的机械臂、机械腿、夹持器、轮子或其他机械部位相连接,机器人内部的计算机将其感知和行动联系在一起,它负责处理传感器数据和程序员发出的任何指令。计算机将信息转换成0和1的编码,代表电流通过电路的“关”(0)和“开”(1)。通过软件,机器人可审查其可以执行的有限行动,并选择最符合指令的行动。然后,它向其机械部件发送使之行动的电信号。此后,机器人通过传感器掌握其行动对环境的影响,并再次做出响应。

    特别声明:文章内容仅供参考,不造成任何投资建议。投资者据此操作,风险自担。
    广告
    广告

    网站首页 - 国内 - 国际 - 原创 - 社会 - 财经 - 体育 - 法治 - 科技 - 资讯

    本站不良内容举报联系客服QQ:413458777 官方微信: 服务热线:

    未经本站书面特别授权,请勿转载或建立镜像

    新闻起源和新闻来源 新闻的起源与发展 新闻的起源和本源 新闻的起源和定义 新闻的起源与历史 新闻的起源和本质 新闻活动的起源 简述新闻起源 最早的新闻起源 新闻的起源两种观点