10M上下文,仅靠提示就掌握一门语言,Google Gemini 1.5被OpenAI抢头条是真冤

这两天,几乎整个AI圈的目光都被OpenAI发布Sora模型的新闻吸引了去。其实还有件事也值得关注,那就是Google继上周官宣Gemini 1.0 Ultra 后,火速推出下一代人工智能模型Gemini 1.5。

公司首席执行官 Sundar Pichai携首席科学家Jeff Dean等众高管在推特同时宣布了这一重大更新。

其中最亮眼的当属它在跨模态超长文本理解能力上的大幅突破。Gemini 1.5能够稳定处理的信息量高达100万个tokens。更直观去感受,这相当于1小时的视频、11小时的音频、超过3万行代码或70万个单词。

在此之前,世界上公开可用的LLM中,最大的上下文窗口来自Claude 2.1的20万tokens。同时GPT-4是12.8万tokens, Gemini 1.0 Pro是3.2万tokens——此次Gemini 1.5已在窗口长度上成功碾压所有大模型。

图片

Google还表示,他们在研究中已成功测试了高达1000万tokens,相当于一次将整个《指环王》三部曲放进去。

Sundar Pichai认为更大的查询窗口对企业来说会非常有用, “电影制作人可能会上传他们的整部电影,询问Gemini评论家是什么意见,公司还能使用Gemini审查大量的财务记录。这是我们实现的重大突破之一。”

更高效的MoE架构

作为目前Google公开的最先进LLM,Gemini 1.5采用时下流行的混合专家(MoE)架构来提高效率,响应更快、质量更高。

与传统Transformer 作为一个大型神经网络运行不同, MoE 模型被划分为较小的专家模块。执行任务时会根据信息类型,选择性地激活最相关的专家路径,从而大大提升模型的效率和准确性。不仅更适应处理大规模数据集的复杂任务,还有更强的可扩展性和灵活性。

我们熟知的Mistral 8x7B、MiniMax abab6都是使用了Moe架构,更有爆料称GPT-4也是由8个或16个专家模型构成。

根据Google 数据,此次供早期测试的Gemini 1.5 Pro在使用更少计算资源的同时,对数学、科学、推理、多语言和视频等任务的执行水平已逼近1.0 Ultra。

图片

在官方演示和58页的技术论文中, Google还针对新模型的强大性能给出了以下几个用例:

大量信息的复杂推理和多模态分析

Gemini 1.5 Pro 可以无缝分析、分类和总结给定的长篇复杂文档。例如,上传阿波罗 11 号登月任务的 402 页pdf记录,让它根据要求列出3个有意思的瞬间,并引用原始对话细节。

图片

给出维克多·雨果的五卷本小说《悲惨世界》(1382页,73.2万tokens),粗略勾勒一个场景,并提问“看看这幅画中的事件是在哪一页上?”模型准确给出了页码,并标识出关键情节。

图片

在超长视频理解上同样出色,能够快速准确地分析各种事件和情节点。比如给定一部相当于68.4万tokens、时长为44分钟的无声电影Sherlock Jr.,要求一句话总结电影情节:

图片

继续询问一个“纸张从口袋取出的关键信息和时间”。Gemini 1.5 Pro用时57秒给出详细答案。

图片

另外,Gemini 1.5 Pro超大的上下文窗口还能够深入分析整个代码库。当发出一个81.6万tokens、超过10万行代码的提示时,它可以根据提问快速找到特定demo的代码,还能提出有用的修改建议并进行解释。

一本语法书,自学翻译新语言

另一项让人耳目一新的是Gemini 1.5 Pro的“上下文学习(in-context learning)”技能,意味着它能从一个长提示中给出的信息里学习新技能,而无需额外微调。

为此,Google使用“对一本书进行机器翻译 (MTOB)”进行测试,并选用新几内亚西部不到200名使用者的Kalamang语。由于该语言几乎没有任何网络信息,模型只能依赖于给定的上下文数据,而非训练权重中储存的知识来进行翻译。

在测试中, 工作人员向Gemini 1.5 Pro提供了500页参考语法、2000条双语词条和400个额外的平行句子——总计约25万tokens信息作为其输入上下文,要求从中学习并完成Kalamang语和英语的互译。

从测试结果可见,Gemini 1.5 Pro对整本书的翻译得分接近人类学习者,在半本书的表现中远超GPT-4 Turbo与Claude 2.1。

图片

对于一门在模型训练过程中几乎完全没接触过的语言来说,这一成就尤为突出。不仅支持濒危语言的保护和复兴,也为其它低资源教育领域开辟了新的可能性。

从今天开始,Google将通过AI Studio和Vertex AI向开发者和企业客户提供 Gemini 1.5 Pro的有限预览权限。最终在完成所有安全部署和测试后取代Gemini 1.0。免费使用的Gemini 1.5 Pro标准版将采用12.8万个tokens上下文窗口,普通用户需要额外支付费用获得100万tokens使用权。

被OpenAI“夹心”,但仍不可小觑

此次Gemini 1.5的发布时间再次“不凑巧”,前有OpenAI放话开发网络搜索产品和推出GPT记忆功能,后面紧跟着两小时后又横空杀出个Sora。奥特曼武器库丰富且擅长针锋相对,每当Google有新动作,刚要炸起水花就被摁下去。

网友们形容当天的场面就如同:

图片

但是,依然有不少声音站出来提醒大家切莫小看了Gemini 1.5 Pro,它对超长文本强大的分析推理能力是其它大模型做不到的。

图片

NVIDIA高级科学家Jim Fan更是发表评论盛赞。表示尽管Gemini-1.5 Pro被抢走了风头,被人们拿梗图来开玩笑,但这仍是LLM能力的巨大跃升。测试中达到的1000万tokens上下文、擅长检索、在零样本情况下对极长指令进行泛化、多模态工作能力都是惊人的。

“重要的不是声明中实现多少上下文长度的神话,而是模型实际上如何使用上下文来解决现实世界的问题。”他认为1.5 Pro不通过微调而自主实现对Kalamang语的学习和应用,就展现出了这种神经激活中的复杂技能,超越了现有的技术水平。

图片

如今OpenAI的急速扩张和Gemini逐步加快的升级速度,已经标志着生成式AI底层技术的狂热步伐。Google DeepMind 负责人Demis Hassabis表示,可以期待未来几个月会有更多的进步。

“这是一种新的节奏”,他说,“我正试图带来一种类似初创公司的心态。”

文章来源于硅星GenAI ,原文标题《10M上下文,仅靠提示就掌握一门语言,Google Gemini 1.5被OpenAI抢头条是真冤》作者张潇雪

内容链接:https://www.hpaper.cn/16446.html

(0)
上一篇 2024-02-18 上午11:15
下一篇 2024-02-18 上午11:19

相关推荐

  • “索罗斯战友”到底猛砍了多少英伟达?答案来了:至少70%!

    前索罗斯副手、亿万富翁Stanley Druckenmiller上周表示,人工智能热潮可能被过度炒作了,他削减了许多英伟达持仓,不过减持规模并没有透露。最新的13F文件给出了相关重要线索。 本周公布的13F文件显示,Druckenmiller的家族办公室在今年第一季度出售了超过44.1万股的英伟达股票,将其英伟达持仓减少至仅17.6万股,这意味着仅截至一季度…

    2天前
    789
  • 大摩看好AI服务器成吸金利器!戴尔大涨11%

    人工智能(AI)概念股又飚了,被投资者看好AI服务器强劲需求打动的戴尔就是其中佼佼者。 美东时间5月15日周三,戴尔(DELL)午盘涨至150.28美元,日内涨约12%,收涨11.2%,创盘中和收盘历史新高,今年内累计涨近95%。 虽然戴尔自身周三并未发布任何利好消息,但摩根士丹利的分析师Erik Woodring当天发布了看涨戴尔的报告,预计市场对AI服务…

    3天前
    422
  • 价格战开卷!字节发布豆包大模型,比行业便宜99.3%

    5月15日,在2024春季火山引擎Force原动力大会上,字节跳动正式发布豆包大模型。 据火山引擎总裁谭待介绍,目前,豆包日均处理1200亿Tokens文本,生成3000万张图片。经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一。 “大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的…

    4天前
    382
  • GPT 4o意味着什么?OpenAI加苹果,AI手机势不可挡!

    ChatGPT带飞Siri? 当地时间5月13日上午10点,OpenAI在春季发布会上发布了GPT-4的迭代版本——GPT-4o。据悉,GPT-4o的速度是上一代的两倍,并且对用户更友好:语音唤起、实时对话、无需注册、免费使用。 OpenAI表示,GPT-4o及其文本和图像能力即日起将开始向API和用户推出,语音和视频能力即将推出。 从定位来看,全新的旗舰版…

    5天前
    461
  • “微软-OpenAI”模式!中国“AI独角兽”投了个遍,阿里是中国AI最大金主

    “微软-OpenAI”模式作为AI行业最成功投资案例,近些年成为众多公司争相学习的模板。如今阿里便走在相似的道路上,通过云计算入股人工智能,成为了中国AI领域的投资翘楚,有望在全球AI发展浪潮中占据一席之地。 不同于传统的现金投资方式,阿里提供云计算额度,让这些初创企业能够使用训练AI模型所需的宝贵网络资源。 目前阿里已投资多家国内AI初创公司,包括月之暗面…

    6天前
    210
  • 更专注AI和半导体,甚至有意PK英伟达!软银出售部分“愿景基金”资产

    孙正义投资重心转为半导体和人工智能行业了? 5月10日,据媒体报道,软银集团旗下有一个叫做“愿景基金”的旗舰投资基金,它是全球最大的风险投资基金之一,这个基金曾经很喜欢投资初创公司,特别是那些有潜力的科技公司。此前,软银的创始人孙正义对风险投资交易情有独钟,但最近,孙正义改变了策略,他开始减少传统的风险投资,并转向对高科技行业如半导体和人工智能的战略性投资。…

    2024-05-11
    191
  • 报道:OpenAI计划下周一宣布人工智能搜索引擎

    周四,据报道,OpenAI计划于下周一5月13日宣布其基于AI的搜索产品,以期与谷歌搜索竞争。 上周就有多方位消息证实,OpenAI将发布备受瞩目的ChatGPT搜索引擎产品。OpenAI将会在当地时间5月9日上午10点公布该消息,大约是北京时间周五的凌晨2点。据悉,OpenAI将推出搜索网页,search.chatgpt.com域名和相关的SSL证书已经被…

    2024-05-10
    192
  • 谷歌AI药物研发模型AlphaFold重磅升级:预测所有生命分子的结构和相互作用

    谷歌在生物医学领域的人工智能(AI)模型重磅升级,将为加快药物研发做出更大贡献。 美东时间5月8日周三,谷歌宣布,旗下AI研究实验室谷歌DeepMind以及致力于以AI方式提升药物发现的谷歌姊妹公司Isomorphic Labs联合开发了新的AI模型——AlphaFold 3,称是一种“革命性的模型”,它可以预测蛋白质、DNA、RNA等生物分子的结构以及它们…

    2024-05-09
    1.5K
  • 抢跑苹果甩平价AI手机王炸!谷歌开卖499美元Pixel 8a,AI功能加持不加价

    苹果的人工智能(AI)手机功能还“犹抱琵琶半遮面”,谷歌就已经抢在苹果前面甩出了自己的平价AI手机王炸。 美东时间5月7日周二,谷歌发布新一代平价智能手机Pixel 8a,并当天开始接受预订。虽然它配置了最先进的谷歌处理器,拥有了一批新的AI功能,但并未上调价格,起售价和前代一样仍为499美元。同时,谷歌还发布了新版平板电脑Pxel,不配支架的平板售价399…

    2024-05-08
    1.4K
  • 微软准备推出新款自研AI模型 硬刚谷歌、Anthropic以及OpenAI

    媒体报道,微软公司目前正在开发自家的人工智能模型,与谷歌、Anthropic以及OpenAI竞争。 据了解,这是自从微软向OpenAI投资超过100亿美元以重新获得后者人工智能模型的使用权以来,微软首次开始训练一个规模足够大的内部AI模型。这个新模型在内部被称为MAI-1,由Mustafa Suleyman负责,他曾是谷歌AI的负责人,此前也担任AI初创公司…

    2024-05-07
    1.5K
  • 高盛:上周对冲基金科技股买入力度为一年多以来最大

    高盛的大宗经纪业务数据显示,从上周情况来看,被认为是“聪明钱”的对冲基金对科技股的风险偏好并没有丧失,这一群体以一年多以来最快的速度抢购科技股,对科技股的净买入创下2022年12月以来最大,主要是由于多头仓位增加和空头回补推动。这也是对冲基金连续第四周净买入科技股。 事实上,标普500信息科技指数在上周之前的时间里表现疲软,4月的大部分时间都在下跌,主要是由…

    2024-04-30
    1
  • 禾赛发起一场“科技平权”

    作者 | 郑巧 编辑 | 周智宇 北京国际汽车展览会上,比亚迪董事长王传福来到了小米汽车展台,小米董事长雷军指着自家SU7问王传福,“您没看过这么好看的激光雷达吧?”引得现场一片哄笑。 随后雷军解释,这是禾赛科技为小米SU7定做的激光雷达。在北京车展上,从百万级的路特斯EMEYA,到25-45万的理想L系列,在智驾上都离不开禾赛科技的激光雷达。甚至16万出头…

    2024-04-29
    3
  • 深蓝要和华为联手挑战特斯拉

    华为造车军团正以势不可挡之势,极速扩张。 4月25日,深蓝汽车在北京车展上宣布,将携手华为打造比特斯拉更好的智能电动汽车。这一宣言预示着深蓝汽车在智能电动出行领域的雄心壮志。此前一天,深蓝汽车 CEO 邓承浩还现身华为发布会。这意味着在阿维塔之外,长安汽车和华为的合作正更加深入。 邓承浩自信地表示,深蓝+华为,一定能超越特斯拉。 华尔街见闻了解到,双方的合作…

    2024-04-28
    1
  • “每季度100亿美元”成为AI大战入场券!三巨头电话会总结:“撒钱”极为坚决!

    世界上排名靠前的几个科技公司已斥资数十亿美金投入AI革命。现在,他们计划再投入数百亿资金。 在本周的季度财报电话会上,Meta、谷歌和微软都强调了他们对AI的投资规模。周三,Meta将其今年的资本支出预测上调了100亿美金,全年上升至350亿到400亿美金。周四,谷歌首席财务官Ruth Porat表示,该公司今年每个季度将在资本支出上花费约120亿美金或更多…

    2024-04-26
    5
  • OpenAI“尝鲜”:收到英伟达全球首部DGX H200 AI超算

    英伟达号称开创先河的人工智能(AI)超级计算机DGX H200正式交付,OpenAI喝到了“头啖汤”。 美东时间4月24日周三,OpenAI总裁兼联合创始人Greg Brockman在社交媒体X透露,英伟达向OpenAI移交全球第一部DGX H200,并附上在交付现场他和OpenAI CEO 奥特曼以及英伟达CEO黄仁勋的合照。Brockman称,这部黄仁勋…

    2024-04-25
    2
  • “最懂苹果分析师”:苹果下调2024和2025年Vision Pro发货量

    天风国际证券分析师郭明錤称,由于需求降幅“严重超出预期”,苹果已经削减了Vision Pro头显的发货量。 4月24日,郭明錤发文表示,苹果已下修2024年Vision Pro发货量至40至45万台,原本预期为70至80万台。 郭明錤认为,苹果在美国之外的市场推出Vision Pro之前就削减了订单,这表明美国的需求大幅下降。因此,预计当Vision Pro…

    2024-04-24
    0
  • 英伟达Jim Fan反击扎克伯格AI“寒冬”论:AI领域还有巨大潜力

    小扎前两天接受采访时,认为AGI短时间不会实现,接下来可能出现又一轮的AI寒冬,对此英伟达人工智能总监Jim Fan不同意。 Jim Fan的观点概括来说如下: 他不认为当前会出现”人工智能(AI)冬天”的现象,即AI发展遇到停滞。即便GPT-5等大型语言模型的发展可能会放缓,但AI的其他领域如机器人技术仍有巨大的发展空间; 他强调了…

    2024-04-23
    5
  • 第一批投大模型的VC,开始卖老股了?

    关于该不该投大模型,依然还在争论,该不该退却早早提上了VC的日程。 最近一位投资人透露,某个头部大模型公司的资方,已经决定在这一轮估值起来后,卖掉老股。听闻此言,我的第一个疑问是,融资进度按下加速键的大模型,这么快已经进入退出期了吗? 不过跟数位大模型投资人交流后我发现,“大模型卖老股退出”作为现象是存在的,但的确还远远称不上“现象级”,并不具备普遍性。 大…

    2024-04-22
    1
  • AI热潮熄火!“一年十倍股”超微暴跌20%,英伟达重挫10%,ARM也崩了

    4月19日周五,“一年十倍股”超微电脑(SMCI)暴跌超20%,股价收跌23%,创两个多月新低。 超微电脑在周五的一份简短新闻稿中表示,将于4月30日公布第三财季业绩。然而,该公司打破了此前提供初步业绩的惯例,这引发投资者担心,疯狂减持该股。 回顾今年1月份,超微电脑在宣布第二季度财报的11天前,上调了销售和盈利指引。亮眼的业绩预告令超微股价暴力拉升,也推动…

    2024-04-20
    1
  • 马云三次内部表态,阿里重组的真正结束

    过去一年,卸任董事局主席 5 年、淡出公众视野许久的马云三次内部表态。这三次,马云的表态一次比一次公开,身份也发生了变化。 2023 年 5 月下旬,马云在只有少数几个业务总裁参与的沟通会说淘天集团的未来是:回归淘宝、回归用户、回归互联网。 半年后,拼多多市值即将赶上阿里,马云在内网回帖 “阿里会变,阿里会改”,用 100 多字强调必须付出任何代价和牺牲来推…

    2024-04-19
    6