GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

6月20日周四,OpenAI竞争对手Anthropic发布了公司迄今为止性能最强大的AI模型Claude 3.5 Sonnet。

在覆盖阅读、编程、数学和视觉等领域的多项性能测试中,Claude 3.5 Sonnet的性能略胜一筹,吊打GPT-4o等一众竞争对手的AI模型,且优于自家旗舰模型Claude 3 Opus。当然,也有些测试不能完全反映AI在现实运用的情况,偏小众和个例。

GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

Anthropic的产品负责人Michael Gerstenhaber自信表示道:“对企业来说,重要的是AI是否能帮助他们满足业务需求,而不是AI在性能测试中是否具有竞争力,从这个角度来看,我相信Claude 3.5 Sonnet将领先于我们现有的任何其他产品,也领先于行业中的任何其他产品。”

定价方面,新模型定价与前代3 Sonnet模型相同,即每输入百万token为3美元,每生成百万token为15美元,并具有20万个token的上下文窗口,约合15万个单词。Token是数据的细分单元,例如单词“fantastic”中的“fan”、“tas”和“tic”。

现在,用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型,而订阅了Claude Pro和Claude Team的用户将享受5倍的速率限制。此外,新模型也在Anthropic的API以及亚马逊Bedrock和谷歌云的Vertex AI等托管平台上上线。

今年晚些时候,公司还将推出更大更好的模型,如Claude 3.5 Haiku和Claude 3.5 Opus。后者配备有网络搜索和偏好记忆等功能。

最强视觉模型、速度提升两倍、幽默感增加、内容迭代功能

和前一代模型Claude 3 Opus相比,新模型在多个方面实现了性能上的提升。Anthropic在一篇博客中写道:“它在把握细微差别、幽默和复杂指示方面有显著进步,在以自然、合理的语气撰写高质量内容方面也十分出色。此外,它还可以编写、编辑和执行代码。”

例如,与3 Opus相比,Claude 3.5 Sonnet在理解复杂指令和细微差别方面更为出色,甚至能够更好地把握幽默概念,尽管AI在幽默感方面通常表现不佳。

对于需要快速响应的应用程序,如客户服务聊天机器人,3.5 Sonnet的处理速度是Claude 3 Opus的两倍,成本只有其五分之一。

视觉分析方面,3.5 Sonnet能够更准确地解读图表和图形,并能从存在失真和视觉伪影的“不完美”图像中转录文本。

除了新模型的推出,Anthropic还推出了新功能“Artifacts预览版”,这是一个工作空间,允许用户能够编辑和迭代AI模型生成的内容。

想象一下,你在使用一个AI助手来帮你写代码。当你向AI提出你的要求后,AI会生成一段代码。在Artifacts功能中,这段代码不仅仅是显示给你,而是会以一种可以操作和修改的形式出现在你的界面上,就像是一个“工件”或是一个“草稿”。

接下来,你可以对这段代码进行迭代——也就是说,你可以修改它,增加新的功能,或者和 AI 助手“Claude”交流,告诉它你的修改意见或新的需求。AI 会根据你的反馈再次生成代码,你则可以继续这个过程,直到代码达到你的期望,可以被实际运行。

这个过程就像是你和AI一起合作,不断地打磨和完善最终的产品。Artifacts提供了一个平台,让你能够更容易地与AI模型互动,并且对生成的内容进行有效的管理和优化。

目前Artifacts处于预览阶段,Anthropic计划在未来为其增加新功能,比如支持与大型团队协作和知识库存储。

此外,媒体称,Claude 3.5 Sonnet虽然是一个先进的AI模型,但它并不完美,仍然可能会犯错。尽管如此,它的能力可能足以吸引开发者和企业转向Anthropic的平台。毕竟,这才是对Anthropic最重要的。

模型改进部分归功于训练数据,但来源不明

Anthropic的产品负责人Michael Gerstenhaber表示,这些改进归功于模型架构的调整和新的训练数据(包括AI生成的数据)至于具体是哪些数据带来了这些增强?Gerstenhaber没有透露详细信息。

出于保护商业机密和避免法律挑战的考虑,训练数据的具体细节尚未公开,但Claude 3.5 Sonnet和公司以往AI模型一样,经过了大量文本和图像的训练,并通过人类测试人员的反馈,试图让模型与用户的意图“保持一致”,希望以此防止模型生成有害或有问题的文本。

GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

目前法院尚未做出裁决,即Anthropic等供应商及其竞争对手(如 OpenAI、谷歌、亚马逊等)是否有权使用公共数据(包括受版权保护的数据)进行训练,而无需向这些数据的创作者提供补偿。

网友怎么看?

网友们社交媒体X上发帖表示:

“Claude 3.5 Sonnet是最新推出的最佳LLM模型!刚刚为ChatGPT Plus支付了20美元,现在我必须为Claude支付20美元,我的聊天记录怎么办?这些LLM战争才刚刚开始。”

GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

“来自Anthropic的竞争很激烈,但我希望ChatGPT能够与之匹敌甚至更好,因为迁移到新服务需要成本。”

GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

“Anthropic刚刚发布了Claude 3.5 Sonnet,据介绍性能可以说相当于Anthropic最高级型号大模型Claude 3 Opus,而API收费价格与Claude 3 Sonnet相同,作为默认的免费体验AI已经替换了Claude 3 Sonnet。也就是,现在就可以免费用上这个最好性能的AI了。”

GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

新模型对Anthropic和AI生态系统有何意义?

今年3月,Anthropic推出了Claude 3系列模型。随后,OpenAI在5月份推出了GPT-4o。6月20日Anthropic又推出了Claude 3.5家族的第一款模型“Claude 3.5 Sonnet”。

媒体指出,在AI技术的不断演进中,Anthropic公司的Claude 3.5 Sonnet模型虽未带来翻天覆地的变化,却代表了AI模型发展的现阶段现实:在期待重大科研突破的同时,实现逐步的性能提升,即在等待重大研究突破的同时,持续进行小步快跑。

近几个月,包括谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o在内的旗舰产品,仅在基准测试和性能上实现了小幅提升。由于现有模型架构的局限性和训练所需的巨大计算资源,业界尚未再次见证类似从GPT-3到GPT-4的巨大飞跃。

随着生成性AI供应商将重点转向数据整理和许可,投资者对于生成性AI投资回报的预期变得更加审慎。Anthropic得益于亚马逊(以及谷歌的较小程度支持)的有利位置,相对免受这种压力的影响。然而,Anthropic预计到2024年底的营收仅略低于10亿美元,与OpenAI相比仍有较大差距。

Anthropic拥有包括Bridgewater、Brave、Slack和DuckDuckGo等知名品牌在内的不断增长的客户群,但在企业信誉方面仍有提升空间。值得注意的是,普华永道最近选择与OpenAI合作,而非Anthropic,以向企业转售生成性AI产品。

Anthropic意识到,随着模型之间能力差距的缩小,建立一个围绕模型构建生态系统(而不是孤立的模型)是留住客户的关键。

一方面,为了留住客户,Anthropic在加强工具开发。比如允许开发人员深入控制AI模型的内部功能,以及让AI模型能够在应用程序中执行特定的操作。这些工具包括前面提到的Artifacts。

另一方面,公司在扩展团队和市场。Anthropic聘请了Instagram的联合创始人作为产品负责人,这表明公司在产品开发方面的重视。此外,公司在伦敦和都柏林设立了办公室,这有助于扩大其产品的市场覆盖。

当然,成本也很重要。Anthropic产品负责人Michael Gerstenhaber表示:“当你在构建应用程序时,最终用户不需要关心背后使用的模型或优化细节,而工程师则可以利用工具来优化体验,其中成本是一个重要因素。”

内容链接:https://www.hpaper.cn/19215.html

(0)
上一篇 2024-06-21 上午10:03
下一篇 2024-06-21 上午10:05

相关推荐

  • 马斯克又跳票了,特斯拉推迟交付擎天柱机器人

    7月23日消息,特斯拉到底什么时候才能交付一直在宣传的擎天柱(Optimus)机器人?根据公司首席执行官埃隆·马斯克(Elon Musk)的最新说法,这将比最初的预期要延后一些时间。 马斯克在当地时间周一早上发推文说:“特斯拉明年将在内部使用少量真正有用的人形机器人,有望在2026年为其他公司大批量生产。” 这比马斯克之前承诺的时间有所推迟。马斯克曾在今年4…

    6小时前
    7
  • “萝卜快跑”遇行人急刹 车上安全员会介入调整速度

    一辆“萝卜快跑”无人驾驶汽车行驶在粤海街道路上。 “萝卜快跑”无人驾驶汽车上配有一名安全员。 近期,无人驾驶网约车“萝卜快跑”因在武汉市的订单量迎来爆发式增长,单日单车峰值超20单等话题,多次冲上热搜,引发了外界对无人驾驶网约车的诸多讨论。 7月16日,南都湾财社记者在位于深圳南山的试运营区域,实地体验了萝卜快跑、小马智行、如祺出行的无人驾驶网约车服务。总体…

    1天前
    2.6K
  • “俄版谷歌”创始人带走400名顶尖工程师,到欧洲创办AI公司

    当地时间2022年6月11日,俄罗斯莫斯科,Yandex大楼。IC 图 俄罗斯科技巨头Yandex的母公司完成退俄协议后,其联合创始人宣布正在欧洲创办一家人工智能企业,公司大部分员工主要是Yandex的前雇员。 据《金融时报》(FT)7月17日报道,“俄版谷歌”Yandex的联合创始人阿尔卡季·沃洛日(Arkady Volozh)正在欧洲启动一家人工智能公司…

    4天前
    9.9K
  • 退出价格战!大众丰田本田沃尔沃等跟进BBA,7月起降低优惠力度

    红星资本局7月17日消息,日前,宝马中国退出价格战,将从7月起,通过减少销售量来稳定价格,缓解门店的经营压力。不仅是宝马,红星资本局今日采访了解到,大众、丰田、本田、沃尔沃等多个品牌均决定,从7月起调整终端政策,降低终端优惠力度,或不再进一步降价。 值得一提的是,包括日产、奔驰和奥迪在内,一些经销商表示未收到品牌方调价的正式通知,但会根据市场情况动态调整,对…

    5天前
    829
  • GPT-4o 现货变期货,是什么在拖 OpenAI 的后腿

    Her,正从电影,走向现实。 今年 5 月,OpenAI 发布最新 AI 多模态大模型 GPT-4o。相比此前的 GPT-4 Turbo,GPT-4o 速度快了两倍,成本低了一半,实时的 AI 语音互动的平均时延,相比此前版本的 2.8 秒 (GPT-3.5) 到 5.4 秒 (GPT-4),更是达到了 320 毫秒——与人类日常对话响应速度几乎一致。 不仅…

    5天前
    589
  • 硬件缺乏创新的苹果,比以往更需要人工智能

    缺乏创新,是苹果在过去几年里面临的最常见的批评。 事实也的确如此,在硬件层面,自从2017年iPhone X取消沿用10年的Home键后,苹果唯一看得见的创新差不多就是2022年的灵动岛了。最近的两年里,除了贵得惊人、不太可能成为大众消费设备的Vision Pro,苹果几乎没有交出任何让人耳目一新的工业设计成果。 随着每年更新的iPhone越来越缺乏新意,消…

    2024-07-02
    1.3K
  • 美股半年收官:上半年涨14%,其中60%来自五大科技股,英伟达一家贡献超三成

    过去半年日渐黯淡的降息预期,丝毫没有影响美股的强势表现。 截至2024年6月28日收盘,标普500指数上半年累计上涨14%,略低于2023年上半年的表现,但仍然创下自千禧年互联网泡沫以来最强劲的半年度表现之一。 支撑美股涨势的关键支柱,就在于AI热潮。上半年,美股近60%的涨幅由仅五家科技巨头贡献——英伟达、微软、亚马逊、Meta和苹果,其中仅英伟达一家的涨…

    2024-06-29
    974
  • OpenAI AI模型销量超越微软!年化收入达10亿美元

    在2019年与微软建立合作伙伴关系后,AI初创公司OpenAI显示出了惊人的销售能力,根据最新两家公司内部数据,截至3月,OpenAI通过出售对其AI模型的访问权限,产生了约10亿美元的年化收入。相比之下,微软的同类产品Azure OpenAI Service,直到最近才达到了10亿美元的年化收入(ARR)。(这里的“年化收入”是指取前一个月的收入数字,然后…

    2024-06-28
    983
  • 赛道Hyper | 荣耀平板即将发布:探索护眼新玩法

    6月26日,在2024上海世界移动通信大会(以下简称“2024 MWC 上海”)上,荣耀CEO赵明在发表《AI共生时代,智能终端终将以人为中心赋能》的主题演讲中,首次向外界展示了两大突破性端侧AI创新:AI离焦视力舒缓技术和AI换脸检测技术,对智能终端厂商如何用AI赋能个人展示了新思路。 赵明将荣耀平板、笔电和手机相提并论,并向华尔街见闻透露:荣耀Magic…

    2024-06-27
    3.8K
  • 十年前的AI?大摩:为何VC圈一半会议都聊到量子计算

    近期,量子计算技术频繁出现在投资者的讨论中,成为继人工智能之后备受关注的前沿科技领域。摩根士丹利分析师Edward Stanley、Matias Ovrum在最新发布的研究报告深入分析了量子计算的发展现状及其对金融市场的潜在影响,为投资者提供了宝贵的洞察。 他们认为,量子计算目前仍然处于非常早期的阶段,在技术和政策上都不够成熟,企业、投资者、社会公众对量子计…

    2024-06-26
    1.8K
  • 突发!OpenAI停止不支持国家API,7月9日开始执行

    6月25日凌晨,有部分开发者收到了OpenAI的信,“根据数据显示,你的组织有来自OpenAl目前不支持的地区的API流量。从7月9日起,将采取额外措施,停止来自不在OpenAI支持的国家、地区名单上的API使用。” 但这位网友表示,他只在美国和乌克兰的第聂伯罗两个地方使用,都是在白名单上的,还是被无理由禁止。 并且当他试图去联系OpenAI的真人客服时,得…

    2024-06-25
    626
  • 还不到6个月,GPTs黄了

    上周,不少人发现微软官网忽然更新了一条“GPT Builder 即将停用”的通知。宣布将从7月10日起终止对Copilot GPT的支持,并会在四天内把平台上所有已创建的GPT连同相关数据全部删除。 如此猝不及防,因为就在仅仅3个月前, GPT Builder 才被微软打包进Copilot Pro服务正式推出。每月付费20美元的订阅用户可以根据特定需求,创建…

    2024-06-24
    1.7K
  • “科八条”为资本市场带来哪些变化?

    值此五周年之际,科创板改革再出发 6月19日,陆家嘴论坛正式开幕,证监会主席吴清阐述了当前资本市场建设的三个着力点:一是积极主动拥抱新质生产力发展,二是大力推动上市公司提升投资价值,三是保护投资者。我们认为论坛延续了新“国九条”及资本市场“1+N”系列政策文件的表述,增量举措或在于新质生产力:继5年的“科创”耕耘后,科创板改革再出发,证监会于今日发布《关于深…

    2024-06-20
    1.5K
  • 英伟达高管和董事上半年卖股套现超7亿美元,黄仁勋本人也在其列

    市场对芯片的狂热需求令英伟达股价迭创新高,数据显示,该公司内部人士今年迄今已经卖股套现逾7亿美元,首席执行官黄仁勋也在套现之列。自从5月22日英伟达第一财季业绩公布以来,今年已有超过三分之一的内部人士减持股票。 根据Washington Service汇编的数据,剔除6月10日10股拆1股的影响,英伟达高管和董事迄今已卖掉约77万股英伟达股票,创2023年上…

    2024-06-19
    1.4K
  • 疑加密货币挖矿收入误导投资者遭起诉,英伟达上诉,美国最高法院受理

    美国最高法院周一同意受理英伟达的一项诉讼,该公司申请法庭撤销一项此前针对其的证券欺诈诉讼。此前,在营收中有多少来自波动较大的加密货币行业这个问题上,英伟达被指误导投资者。 此前,由瑞典斯德哥尔摩的投资管理公司E. Ohman J:or Fonder AB领衔一众英伟达股东,对英伟达和该公司首席执行官黄仁勋提起集体诉讼,指英伟达及其公司高层违反了1934年的《…

    2024-06-18
    965
  • 大模型下一步在哪里?王小川、杨植麟等给出回答

    AI大模型是正在进行的新一轮技术革命,它最终能否通向AGI,在技术研发和商业落地之间该如何权衡,这是当下需要厘清的核心议题。 6月14日,在2024北京智源大会上,百川智能CEO王小川、智谱AI CEO张鹏、月之暗面CEO杨植麟、面壁智能CEO李大海等给出了最新的思考和判断。从理论研究层面来看,业内的共识是大模型可以通向AGI。 杨植麟认为,大模型是第一性原…

    2024-06-17
    947
  • 马斯克在2024年特斯拉股东大会上的年度发言

    北京时间6月14日凌晨,特斯拉公司在得州超级工厂召开了2024年股东大会。本次股东大会因为两项意义重大的股东投票——重新批准埃隆的2018薪酬计划,及将特斯拉注册地迁往得州——而备受关注。 大会首先宣布了所有公司及股东提案的投票结果,正如埃隆在前一晚剧透的,这两项重要提案顺利通过。紧接着,埃隆上台致辞。今天的埃隆明显心情既激动又放松,为了表示对股东的感激之情…

    2024-06-15
    966
  • 宁德时代、比亚迪竞赛超充,动力电池将进入6C时代

    电动汽车的充电速度正在卷向一个新的高度——6C倍率。 据36氪了解,宁德时代计划在下半年推出充电倍率达到6C的动力电池,为麒麟电池的二代产品。理想、极氪汽车等公司都已经与宁德时代就麒麟二代产品进行了技术交流,但尚未决定是否今年推出搭载相应技术的产品。 与此同时,三年未发布电池新品的比亚迪也在酝酿推出快充电池产品。有接近比亚迪的人士告诉36氪,比亚迪二代刀片电…

    2024-06-14
    2.9K
  • 财报超预期、宣布拆股,“AI热门股”博通盘后大涨13% | 财报见闻

    博通周四美股盘后发布第二财季业绩显示,得益于AI产品强劲需求的推动,该公司当季业绩超出分析师预期并上调全财年业绩指引,同时宣布10-1拆股计划,股价盘后涨超13%。 根据财报,博通第二财季调整后净营收124.9亿美元,高于分析师预期的120.6亿美元。其中半导体解决方案营收72亿美元,高于预期的71.2亿美元。AI产品营收达到31亿美元。 博通第二财季净利润…

    2024-06-13
    957
  • “苹果智能”:专注小模型

    在周二凌晨的 WWDC 大会上,苹果以 Apple Intelligence 取代 Artificial Intelligence 作为 AI 的代名词,大有重新定义 AI 的意思。原本吵得最凶最受关注的和 OpenAI 的合作,其实也只不过是提供一个 ChatGPT 接口而已,用不用都随用户。 从某种程度上来说,苹果的确称得上重新定义了 AI——与业内其他…

    2024-06-12
    979