马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

北京时间4月13日上午,X平台的xAI官方账号发布了“Grok-1.5 Vison”版本的预告,并同时宣告,公司正在湾区招募设计师、工程师、产品、数据、架构和标注师等职位。马斯克也呼吁:“请加入xAI公司!”

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

xAI的招聘页面:构建人工智能,推动人类进步 [1]

从预告页面的介绍和秀肌肉的七个例子能看出来,Grok-1.5V版本主打多模态视觉信息处理,对标GPT-4,强调“理解物理世界的能力”。

以下为xAI官方的介绍,瓦砾粗译。[2]

一 官方介绍

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

介绍Grok-1.5V,我们的第一代多模态模型。除了强大的文本功能外,Grok现在还能处理各种视觉信息,包括文档、框图、图表和照片。Grok-1.5V即将向我们的早期测试者和现有的Grok用户推出。

能力

从多学科推理到理解文档、科学框图、图表、截图和照片,Grok-1.5V在多个领域都能与现有的前沿多模态模型相媲美。Grok在理解物理世界方面的能力尤其令我们兴奋。在我们新推出的RealWorldQA基准测试中,Grok的表现优于同类产品。对于下面所有的数据集,我们都是在没有思维链提示的情况下,对Grok进行了评估。

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

例子1 从框图生成代码

用户:你能把这个转化为Python代码吗?

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

Grok:当然!你提供的流程图描述了一个简单的猜谜游戏:计算机生成一个随机数,用户必须猜出它。下面是表示流程图中逻辑的Python代码:

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

这段代码将运行流程图中描述的猜谜游戏。用户将被提示输入他们的猜测,直到他们猜出正确的数字为止。

例子2 计算卡路里

用户:5片这个东西含有多少卡路里? 

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

Grok:如果一份是3片,含有60卡路里,那么5片大约含有100卡路里。计算方法是首先确定每片的热量:60卡路里 / 3片=每片20卡路里。然后,将每片的卡路里乘以片数:每片20卡路里 * 5片 = 100卡路里。

例子3 从手绘到睡前故事

用户:这是我儿子画的,你能根据他的画讲一个睡前小故事吗?

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

Grok:很久很久以前,在一个充满冒险和奇迹的国度里,有一个勇敢的小男孩,名叫提米。提米和家人住在舒适的小房子里,他最喜欢的事情就是探索周围的世界。

在一个阳光明媚的日子里,提米决定去附近的森林探险。他带上了自己最喜欢的零食、指南针和他最信任的笔记本,准备把看到的所有令人兴奋的事物都画下来。

当提米走进森林深处时,他发现了一条在阳光下闪闪发光的神奇河流。这条河是如此迷人,以至于提米决定做一艘小纸船,顺流而下,作为给森林精灵的特别讯息。

提米小心翼翼地折好纸船,在上面画了一个笑脸,希望能给森林精灵带来欢乐。然后,他把小船放在河面上,看着小船载着他的友谊和对大自然的爱漂走了。

夕阳西下,提米知道是时候回家了。他为自己在森林里度过这神奇的一天感到庆幸,他知道自己将永远铭记这次探险。

回到家后,提米和家人分享了他的故事,家人听到他在森林里度过的神奇一天都非常高兴。他们一致认为,提米勇敢、善良的精神是一种真正的激励,他们知道,提米今后还会有更多精彩的冒险经历。

就这样,带着满心的爱和满脑子的梦想,提米渐渐进入了梦乡,他渴望发现,在他的想象世界里还有什么新的冒险在等着他。

例子4 解释梗图(meme)

用户:我不理解,请解释一下。

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

Grok:这幅图幽默地将初创公司和大公司作了对比。在标有“初创公司”的左侧,有一群人在一起挖洞。他们都在积极参与,洞已经挖得很深了。

在标有“大公司”的右侧,有一群人围着一个洞站着。然而,与初创公司不同的是,只有一个人在真正挖洞,其他人都在围观或干别的事。

这幅图的幽默感来自于对初创公司和大公司之间差异的夸大。在初创公司,人们往往有一种紧迫感,希望每个人都能直接为手头的任务做出贡献。相比之下,大公司往往被描绘为官僚主义更严重,所有团队成员对每个项目的直接参与更少。

例子5 把一个表格转为CSV文件

用户:请把这个表格转成csv文件

 Grok:图片中的表格可转换为CSV格式,如下所示:

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”
马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

请注意,CSV格式不支持样式或格式化,因此信息以纯文本格式显示。

例子6 帮助处理露台上的朽木

用户:我露台上的螺丝周围出现了这些洞。是腐烂了吗?我应该更换木板吗?

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

Grok:看来你的露台上的木材已经开始腐烂。这表现在螺丝周围出现孔洞,这是木材腐烂的常见迹象。

为了确保露台的安全和使用寿命,建议更换受影响的木板。这将有助于防止露台受到进一步损坏,并保持其结构的完整性。

如果你不确定如何更换木板,咨询专业的露台建造商或承包商可能会有所帮助。他们将能够评估损坏的程度,并就露台的最佳行动方案向你提供专家建议。

例子7 解决编程问题

用户:你能编写Python代码解决这个问题吗?

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

Grok:

马斯克Grok1.5V版本秀肌肉,展示“理解物理世界的能力”

真实世界理解能力

为了开发有用的真实世界的人工智能助手,提高模型对物理世界的理解能力至关重要。为此,我们推出了一个新的基准——RealWorldQA。该基准旨在评估多模态模型基本的真实世界空间理解能力。虽然当前基准中的许多示例对人类来说相对容易,但它们往往对前沿模型构成挑战。

初版发布的RealWorldQA包含700多张图片,每张图片都有一个问题和易于验证的答案。除其他真实世界的图像外,该数据集还包括从车辆上拍摄经匿名化处理后的图像。我们很高兴能向社区发布RealWorldQA,并打算随着多模态模型的改进而不断扩展。RealWorldQA根据CC BY-ND 4.0协议发布。单击此处可下载677MB的数据集。[3]

展望未来

推进我们的多模态理解和生成能力,是构建能够理解宇宙的有益通用人工智能(AGI)的重要步骤。在接下来的几个月中,我们预计将在图像、音频和视频等各种模式上显著提高这两种能力。

内容链接:https://www.hpaper.cn/17953.html

(0)
上一篇 2024-04-15 上午9:17
下一篇 2024-04-15 上午9:22

相关推荐

  • 极狐自燃,厂家来了盖车衣、撬车标,还反穿衣服,其他车企咋处理的?

    车头条消息,据津云报道,7月24日,浙江杭州一女子称公司新买2个月的极狐车,载客时发生自燃,厂家第一时间的处理方式是撬标、拆内部件,并表示大不了赔点钱。当事人称,对方态度很差,希望极狐道歉并解释。 从网传视频来看,厂家工作人员到达现场后,反穿着衣服,给车辆罩上黑布,并且使用锤子、螺丝刀等工具撬车标。 今日晚间,极狐官微发文回应称,2024年7月24日,杭州发…

    1天前
    17.4K
  • 武汉萝卜快跑涨价,基本与网约车持平?我们测了一下

    车头条消息,据腾讯新闻深网报道,武汉萝卜快跑价格涨至与网约车持平,几毛钱一公里的价格早已成为历史。 报道称,深网于7月14日和7月15日在武汉多个辖区,一共呼叫了24次萝卜快跑,成功打到6次。 这6单中,每公里实收价格最低1块6毛钱,最高1块9毛8。若除去所有优惠补贴,按原价来算,萝卜快跑每公里价格最低4块6毛钱,最高6块7毛钱。 有在武汉洪山区拉活的网约车…

    2天前
    466
  • 马斯克:特斯拉Robotaxi计划10月发布,FSD有望年底前入华

    特斯拉第二季度营收高于预期,但净利润不及预期。在随后的财报电话会上,特斯拉方面对产品路线较为模糊的展望再度影响投资者情绪,美股盘后股价下跌超8%。 7月24日,特斯拉发布的财报显示,公司第二财季营收255亿美元,同比增长2%,高于分析师预期的245.4亿美元;净利润为14.78亿美元,同比下降45%,低于分析师预期的18.06亿美元;调整后每股收益0.52美…

    3天前
    2.1K
  • 马斯克又跳票了,特斯拉推迟交付擎天柱机器人

    7月23日消息,特斯拉到底什么时候才能交付一直在宣传的擎天柱(Optimus)机器人?根据公司首席执行官埃隆·马斯克(Elon Musk)的最新说法,这将比最初的预期要延后一些时间。 马斯克在当地时间周一早上发推文说:“特斯拉明年将在内部使用少量真正有用的人形机器人,有望在2026年为其他公司大批量生产。” 这比马斯克之前承诺的时间有所推迟。马斯克曾在今年4…

    4天前
    9.4K
  • “萝卜快跑”遇行人急刹 车上安全员会介入调整速度

    一辆“萝卜快跑”无人驾驶汽车行驶在粤海街道路上。 “萝卜快跑”无人驾驶汽车上配有一名安全员。 近期,无人驾驶网约车“萝卜快跑”因在武汉市的订单量迎来爆发式增长,单日单车峰值超20单等话题,多次冲上热搜,引发了外界对无人驾驶网约车的诸多讨论。 7月16日,南都湾财社记者在位于深圳南山的试运营区域,实地体验了萝卜快跑、小马智行、如祺出行的无人驾驶网约车服务。总体…

    5天前
    2.6K
  • “俄版谷歌”创始人带走400名顶尖工程师,到欧洲创办AI公司

    当地时间2022年6月11日,俄罗斯莫斯科,Yandex大楼。IC 图 俄罗斯科技巨头Yandex的母公司完成退俄协议后,其联合创始人宣布正在欧洲创办一家人工智能企业,公司大部分员工主要是Yandex的前雇员。 据《金融时报》(FT)7月17日报道,“俄版谷歌”Yandex的联合创始人阿尔卡季·沃洛日(Arkady Volozh)正在欧洲启动一家人工智能公司…

    2024-07-19
    9.9K
  • 退出价格战!大众丰田本田沃尔沃等跟进BBA,7月起降低优惠力度

    红星资本局7月17日消息,日前,宝马中国退出价格战,将从7月起,通过减少销售量来稳定价格,缓解门店的经营压力。不仅是宝马,红星资本局今日采访了解到,大众、丰田、本田、沃尔沃等多个品牌均决定,从7月起调整终端政策,降低终端优惠力度,或不再进一步降价。 值得一提的是,包括日产、奔驰和奥迪在内,一些经销商表示未收到品牌方调价的正式通知,但会根据市场情况动态调整,对…

    2024-07-18
    833
  • GPT-4o 现货变期货,是什么在拖 OpenAI 的后腿

    Her,正从电影,走向现实。 今年 5 月,OpenAI 发布最新 AI 多模态大模型 GPT-4o。相比此前的 GPT-4 Turbo,GPT-4o 速度快了两倍,成本低了一半,实时的 AI 语音互动的平均时延,相比此前版本的 2.8 秒 (GPT-3.5) 到 5.4 秒 (GPT-4),更是达到了 320 毫秒——与人类日常对话响应速度几乎一致。 不仅…

    2024-07-17
    594
  • 硬件缺乏创新的苹果,比以往更需要人工智能

    缺乏创新,是苹果在过去几年里面临的最常见的批评。 事实也的确如此,在硬件层面,自从2017年iPhone X取消沿用10年的Home键后,苹果唯一看得见的创新差不多就是2022年的灵动岛了。最近的两年里,除了贵得惊人、不太可能成为大众消费设备的Vision Pro,苹果几乎没有交出任何让人耳目一新的工业设计成果。 随着每年更新的iPhone越来越缺乏新意,消…

    2024-07-02
    1.3K
  • 美股半年收官:上半年涨14%,其中60%来自五大科技股,英伟达一家贡献超三成

    过去半年日渐黯淡的降息预期,丝毫没有影响美股的强势表现。 截至2024年6月28日收盘,标普500指数上半年累计上涨14%,略低于2023年上半年的表现,但仍然创下自千禧年互联网泡沫以来最强劲的半年度表现之一。 支撑美股涨势的关键支柱,就在于AI热潮。上半年,美股近60%的涨幅由仅五家科技巨头贡献——英伟达、微软、亚马逊、Meta和苹果,其中仅英伟达一家的涨…

    2024-06-29
    976
  • OpenAI AI模型销量超越微软!年化收入达10亿美元

    在2019年与微软建立合作伙伴关系后,AI初创公司OpenAI显示出了惊人的销售能力,根据最新两家公司内部数据,截至3月,OpenAI通过出售对其AI模型的访问权限,产生了约10亿美元的年化收入。相比之下,微软的同类产品Azure OpenAI Service,直到最近才达到了10亿美元的年化收入(ARR)。(这里的“年化收入”是指取前一个月的收入数字,然后…

    2024-06-28
    985
  • 赛道Hyper | 荣耀平板即将发布:探索护眼新玩法

    6月26日,在2024上海世界移动通信大会(以下简称“2024 MWC 上海”)上,荣耀CEO赵明在发表《AI共生时代,智能终端终将以人为中心赋能》的主题演讲中,首次向外界展示了两大突破性端侧AI创新:AI离焦视力舒缓技术和AI换脸检测技术,对智能终端厂商如何用AI赋能个人展示了新思路。 赵明将荣耀平板、笔电和手机相提并论,并向华尔街见闻透露:荣耀Magic…

    2024-06-27
    3.8K
  • 十年前的AI?大摩:为何VC圈一半会议都聊到量子计算

    近期,量子计算技术频繁出现在投资者的讨论中,成为继人工智能之后备受关注的前沿科技领域。摩根士丹利分析师Edward Stanley、Matias Ovrum在最新发布的研究报告深入分析了量子计算的发展现状及其对金融市场的潜在影响,为投资者提供了宝贵的洞察。 他们认为,量子计算目前仍然处于非常早期的阶段,在技术和政策上都不够成熟,企业、投资者、社会公众对量子计…

    2024-06-26
    1.8K
  • 突发!OpenAI停止不支持国家API,7月9日开始执行

    6月25日凌晨,有部分开发者收到了OpenAI的信,“根据数据显示,你的组织有来自OpenAl目前不支持的地区的API流量。从7月9日起,将采取额外措施,停止来自不在OpenAI支持的国家、地区名单上的API使用。” 但这位网友表示,他只在美国和乌克兰的第聂伯罗两个地方使用,都是在白名单上的,还是被无理由禁止。 并且当他试图去联系OpenAI的真人客服时,得…

    2024-06-25
    627
  • 还不到6个月,GPTs黄了

    上周,不少人发现微软官网忽然更新了一条“GPT Builder 即将停用”的通知。宣布将从7月10日起终止对Copilot GPT的支持,并会在四天内把平台上所有已创建的GPT连同相关数据全部删除。 如此猝不及防,因为就在仅仅3个月前, GPT Builder 才被微软打包进Copilot Pro服务正式推出。每月付费20美元的订阅用户可以根据特定需求,创建…

    2024-06-24
    1.7K
  • GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

    6月20日周四,OpenAI竞争对手Anthropic发布了公司迄今为止性能最强大的AI模型Claude 3.5 Sonnet。 在覆盖阅读、编程、数学和视觉等领域的多项性能测试中,Claude 3.5 Sonnet的性能略胜一筹,吊打GPT-4o等一众竞争对手的AI模型,且优于自家旗舰模型Claude 3 Opus。当然,也有些测试不能完全反映AI在现实运…

    2024-06-21
    1.5K
  • “科八条”为资本市场带来哪些变化?

    值此五周年之际,科创板改革再出发 6月19日,陆家嘴论坛正式开幕,证监会主席吴清阐述了当前资本市场建设的三个着力点:一是积极主动拥抱新质生产力发展,二是大力推动上市公司提升投资价值,三是保护投资者。我们认为论坛延续了新“国九条”及资本市场“1+N”系列政策文件的表述,增量举措或在于新质生产力:继5年的“科创”耕耘后,科创板改革再出发,证监会于今日发布《关于深…

    2024-06-20
    1.5K
  • 英伟达高管和董事上半年卖股套现超7亿美元,黄仁勋本人也在其列

    市场对芯片的狂热需求令英伟达股价迭创新高,数据显示,该公司内部人士今年迄今已经卖股套现逾7亿美元,首席执行官黄仁勋也在套现之列。自从5月22日英伟达第一财季业绩公布以来,今年已有超过三分之一的内部人士减持股票。 根据Washington Service汇编的数据,剔除6月10日10股拆1股的影响,英伟达高管和董事迄今已卖掉约77万股英伟达股票,创2023年上…

    2024-06-19
    1.4K
  • 疑加密货币挖矿收入误导投资者遭起诉,英伟达上诉,美国最高法院受理

    美国最高法院周一同意受理英伟达的一项诉讼,该公司申请法庭撤销一项此前针对其的证券欺诈诉讼。此前,在营收中有多少来自波动较大的加密货币行业这个问题上,英伟达被指误导投资者。 此前,由瑞典斯德哥尔摩的投资管理公司E. Ohman J:or Fonder AB领衔一众英伟达股东,对英伟达和该公司首席执行官黄仁勋提起集体诉讼,指英伟达及其公司高层违反了1934年的《…

    2024-06-18
    966
  • 大模型下一步在哪里?王小川、杨植麟等给出回答

    AI大模型是正在进行的新一轮技术革命,它最终能否通向AGI,在技术研发和商业落地之间该如何权衡,这是当下需要厘清的核心议题。 6月14日,在2024北京智源大会上,百川智能CEO王小川、智谱AI CEO张鹏、月之暗面CEO杨植麟、面壁智能CEO李大海等给出了最新的思考和判断。从理论研究层面来看,业内的共识是大模型可以通向AGI。 杨植麟认为,大模型是第一性原…

    2024-06-17
    949