人工智能,如何妙笔“生”画

 核心阅读

  输入一段话,“绘”出一幅画——人工智能的绘画本领,吸引众多职业画师和零基础用户尝鲜。人工智能绘画的本质是计算,接受“语言描述”指令后根据自身的理解还原出图像。未来,人工智能技术应用于艺术创作等领域,还要注意防范潜在风险,让技术进步更好地造福社会。

  不用画笔、颜料,输入一段描述性文字,计算机就能自动解析,生成相应的画作。2022世界人工智能大会上,人工智能绘画的展示令观众惊叹。

  一些过去专属于人类创作的领域,比如绘画、书法、写作、作曲,如今人工智能也已开始涉足。人工智能是如何绘画的?当前沿技术与艺术相遇,将碰撞出怎样的火花?在内容、版权等方面又是否存在问题?

  从文本到图像,人工智能绘画本质是计算

  人工智能绘画是一个从文本到图像的生成过程,输入一段话,生成一幅画,本质是计算。简要地说,计算机通过大量学习,能识别特定图片元素和文本之间的关联。同理,人工智能程序在收到“语言描述”指令后,可以根据自身的算法还原出图像。

  设定计算机程序作画的想法由来已久。早在20世纪70年代,就有艺术家开发了操作机械臂的电脑程序,让机械臂按照指令在画纸上作画。近些年,人工智能技术日新月异,科研人员尝试设计自动作图的计算机程序。但过去很长一段时间,人工智能“画”出的作品普遍不够好,往往只是一些模糊的图像元素的组合,还称不上是完整的画。

  今年以来,人工智能画技迅速“进化”。谈及技术突破原因,百度文心一格总架构师肖欣延认为,这是预训练大模型的兴起、大数据的训练和扩散模型的出现3方面共同作用的结果。

  具体来说,预训练大模型增强了人工智能的通用性,成为人工智能技术及应用的新基座;大数据的训练中,通过在众多高性能GPU(图形处理器)算力资源中进行并行学习,计算机能够在短时间内完成大量的数据学习。近年来,几乎所有人工智能的技术发展都受益于这两方面的进展。而对人工智能绘画来说,扩散模型的出现至关重要。

  扩散模型的原理是,通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像。

  “这一过程与人类学习相似。通常,人们学画从临摹开始,机器也是如此。它最初生成的图像可能很模糊,但计算机会不断修正,从而输出越来越清楚、层次越来越丰富的图像。”肖欣延说。

  扩散模型让人工智能绘画技术实现跨越,不仅作画质量快速提升,生成时间也缩短到几秒钟。

  众多用户尝鲜,大量应用加速“画技”进化

  汤林杰是某互联网公司的运营人员。工作中,他需要借助一些图片来丰富文案,而网络上找到合适的配图并不容易。今年10月,了解人工智能绘画程序后,他尝试自己“画”图。现在,人工智能绘画工具已经是他工作的重要辅助。

  随着算法模型对公众开放以及训练数据成本的下降,人工智能绘画门槛越来越低,一些简易化操作平台在国内外兴起。如今,不仅一些职业插画师尝试用人工智能绘画程序辅助作画、激发灵感,许多没有绘画基础的用户也开始尝鲜,并“晒”在社交平台上。

  大量需求的涌现也加速了技术的更新迭代。“用人工智能绘画的人越多,算法就越能理解输入的描述文本,画作质量就越高。”肖欣延表示,当前人工智能绘画水平与今年初相比,已经有很大进步。

  不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节呈现能力还不够。比如,对空间、透视和光影的刻画就很不如意。不少人工智能渲染出的画作,初看上去惊艳,认真观察问题却不少。

  但肖欣延认为,人工智能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,“可以把视频生成看作是维度更高的绘画,从技术层面看,这是可以实现的。”

  防范潜在风险,守住法律和伦理底线

  人工智能进入绘画领域,计算机会取代人类画师吗?

  在肖欣延看来,好的绘画与构图、设计语言、视觉情绪息息相关,即使人人都可以用人工智能技术作画,但通常只有高水平的画师才能制作出优秀的人工智能绘画作品,“人工智能只是作画的辅助工具”。此外,虽然有的人工智能绘画语言娴熟,也包含细腻的情感,但并不意味着机器有意识、情感,它不过是学过类似的作品,又恰好呈现出来了。“优秀的艺术作品往往是人的思想的投射,目前机器并没有真正具备思考能力。”肖欣延说。

  不少业内人士认为,不妨以开放的心态拥抱人工智能绘画,接受新事物。可以预想,将来绘画中一些繁琐、重复性的工作可能由计算机完成,创作者能腾出更多时间去构思想法与创意,调整构图、色彩、光影氛围等。

  “人工智能可能会激发绘画创造的活力。”肖欣延表示,20世纪前后,照相技术让传统肖像画失去市场,促使一些画家向非写实方向创新。与人工智能技术融合,或许能激发画家创作出别开生面的作品。

  不过,由于人工智能绘画发展刚刚起步,技术发展也引发关于版权、内容把控等问题的争议。比如,有人认为,未经授权人工智能画作模仿原画的内容、构图和风格等,侵犯了原作者的版权,有违法嫌疑。也有人认为,“机器学习”过程是一种类人化的创作行为,同样体现了创造者的思想和劳动,应当获得版权保护。此外,还有人担忧,人工智能绘画技术若被滥用,可能滋生暴力等令人不适的图像。面对新技术发展,有必要前瞻潜在的风险,只有守住法律和伦理底线,技术进步才能更好地造福社会。

  不只是绘画,写作、作曲、生成短片,人工智能日益强大的深度学习能力,让它与不同艺术门类发生着奇妙的碰撞。展望未来,业界专家认为,人工智能与艺术融合,一方面会降低一些艺术门类的创造门槛,让更多人参与到当代的审美创造中来;另一方面新技术会带来新的审美风格,人们或许能从中扩展对自身和世界的认识。

  本报记者 喻思南

内容链接:https://www.hpaper.cn/6394.html

(0)
上一篇 2022-12-23 上午10:26
下一篇 2022-12-23 上午10:28

相关推荐

  • GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

    6月20日周四,OpenAI竞争对手Anthropic发布了公司迄今为止性能最强大的AI模型Claude 3.5 Sonnet。 在覆盖阅读、编程、数学和视觉等领域的多项性能测试中,Claude 3.5 Sonnet的性能略胜一筹,吊打GPT-4o等一众竞争对手的AI模型,且优于自家旗舰模型Claude 3 Opus。当然,也有些测试不能完全反映AI在现实运…

    11小时前
    7
  • “科八条”为资本市场带来哪些变化?

    值此五周年之际,科创板改革再出发 6月19日,陆家嘴论坛正式开幕,证监会主席吴清阐述了当前资本市场建设的三个着力点:一是积极主动拥抱新质生产力发展,二是大力推动上市公司提升投资价值,三是保护投资者。我们认为论坛延续了新“国九条”及资本市场“1+N”系列政策文件的表述,增量举措或在于新质生产力:继5年的“科创”耕耘后,科创板改革再出发,证监会于今日发布《关于深…

    1天前
    1.5K
  • 英伟达高管和董事上半年卖股套现超7亿美元,黄仁勋本人也在其列

    市场对芯片的狂热需求令英伟达股价迭创新高,数据显示,该公司内部人士今年迄今已经卖股套现逾7亿美元,首席执行官黄仁勋也在套现之列。自从5月22日英伟达第一财季业绩公布以来,今年已有超过三分之一的内部人士减持股票。 根据Washington Service汇编的数据,剔除6月10日10股拆1股的影响,英伟达高管和董事迄今已卖掉约77万股英伟达股票,创2023年上…

    2天前
    10
  • 疑加密货币挖矿收入误导投资者遭起诉,英伟达上诉,美国最高法院受理

    美国最高法院周一同意受理英伟达的一项诉讼,该公司申请法庭撤销一项此前针对其的证券欺诈诉讼。此前,在营收中有多少来自波动较大的加密货币行业这个问题上,英伟达被指误导投资者。 此前,由瑞典斯德哥尔摩的投资管理公司E. Ohman J:or Fonder AB领衔一众英伟达股东,对英伟达和该公司首席执行官黄仁勋提起集体诉讼,指英伟达及其公司高层违反了1934年的《…

    3天前
    936
  • 大模型下一步在哪里?王小川、杨植麟等给出回答

    AI大模型是正在进行的新一轮技术革命,它最终能否通向AGI,在技术研发和商业落地之间该如何权衡,这是当下需要厘清的核心议题。 6月14日,在2024北京智源大会上,百川智能CEO王小川、智谱AI CEO张鹏、月之暗面CEO杨植麟、面壁智能CEO李大海等给出了最新的思考和判断。从理论研究层面来看,业内的共识是大模型可以通向AGI。 杨植麟认为,大模型是第一性原…

    4天前
    938
  • 马斯克在2024年特斯拉股东大会上的年度发言

    北京时间6月14日凌晨,特斯拉公司在得州超级工厂召开了2024年股东大会。本次股东大会因为两项意义重大的股东投票——重新批准埃隆的2018薪酬计划,及将特斯拉注册地迁往得州——而备受关注。 大会首先宣布了所有公司及股东提案的投票结果,正如埃隆在前一晚剧透的,这两项重要提案顺利通过。紧接着,埃隆上台致辞。今天的埃隆明显心情既激动又放松,为了表示对股东的感激之情…

    6天前
    945
  • 宁德时代、比亚迪竞赛超充,动力电池将进入6C时代

    电动汽车的充电速度正在卷向一个新的高度——6C倍率。 据36氪了解,宁德时代计划在下半年推出充电倍率达到6C的动力电池,为麒麟电池的二代产品。理想、极氪汽车等公司都已经与宁德时代就麒麟二代产品进行了技术交流,但尚未决定是否今年推出搭载相应技术的产品。 与此同时,三年未发布电池新品的比亚迪也在酝酿推出快充电池产品。有接近比亚迪的人士告诉36氪,比亚迪二代刀片电…

    2024-06-14
    2.9K
  • 财报超预期、宣布拆股,“AI热门股”博通盘后大涨13% | 财报见闻

    博通周四美股盘后发布第二财季业绩显示,得益于AI产品强劲需求的推动,该公司当季业绩超出分析师预期并上调全财年业绩指引,同时宣布10-1拆股计划,股价盘后涨超13%。 根据财报,博通第二财季调整后净营收124.9亿美元,高于分析师预期的120.6亿美元。其中半导体解决方案营收72亿美元,高于预期的71.2亿美元。AI产品营收达到31亿美元。 博通第二财季净利润…

    2024-06-13
    942
  • “苹果智能”:专注小模型

    在周二凌晨的 WWDC 大会上,苹果以 Apple Intelligence 取代 Artificial Intelligence 作为 AI 的代名词,大有重新定义 AI 的意思。原本吵得最凶最受关注的和 OpenAI 的合作,其实也只不过是提供一个 ChatGPT 接口而已,用不用都随用户。 从某种程度上来说,苹果的确称得上重新定义了 AI——与业内其他…

    2024-06-12
    940
  • 点燃中国大模型价格战!“量化巨头”如何成为“AI界的拼多多”

    2元/百万输出Tokens,DeepSeek-V2大模型推出一周后,便引爆业内“价格大战”。 字节将价格降至0.6元/百万输出Tokens 0.6元人民币,阿里随后将部分大模型价格骤降97%,百度也免费开放了两款文心一言模型…… “大模型黑马”DeepSeek由知名私募巨头幻方量化创立,其推出的DeepSeek-V2不仅性能在众多开源…

    2024-06-11
    1.7K
  • 英伟达离“封神”只差一步

    每一轮技术革新的浪潮,都能创造一个个的造富神话,“皮衣教主”黄仁勋也接住了这泼天富贵。 美东时间6月5日,英伟达股价一路飙升,市值迈过三万亿美元关口。当天,它也超越苹果,成为全球市值第二高的公司。 次日英伟达股价略有下跌,不过这种波动阻碍不了它狂奔的步伐,此时距它市值迈过两万亿美元,不过66个交易日。 以6月6日收盘价来算,英伟达只需再涨6%,便能超越微软成…

    2024-06-07
    640
  • AI服务器需求强劲 慧与盘后大涨15%

    强劲的AI服务器业务催化下,慧与科技(Hewlett Packard Enterprise)上季度收入与业绩指引超预期,公司股价盘后大涨15%。 隔夜,慧与公布的财报显示,公司第二财季收入增长3.3%至72亿美元。而一致预期为同比下降2%至68.2亿美元。上季度的每股收益也达到了42美分,超出一致预期的39美分。 超预期的部分主要来自慧与的服务器业务,上季度…

    2024-06-05
    950
  • 摩根大通评Computex亮点:GPU一年更新一次,Blackwell已投产,下一个风口“物理AI”

    5月29日周一,英伟达创始人兼CEO黄仁勋以主题演讲拉开了COMPUTEX大会上的序幕。 6月3日,摩根大通发布研报,总结了黄仁勋主题演讲的几大亮点。 1.发布强大的AI芯片路线图,2027年前每年推出一款新芯片 英伟达概述了其强大的路线图,2027年前每年推出一款新的AI芯片(2024年推出Blackwell,2025年推出配备更多HBM 的Blackwe…

    2024-06-04
    675
  • AMD公布AI路线图:MI325X将比H200快1.3倍!还有全新AI PC芯片!

    6月3日,AMD董事长兼CEO苏姿丰在Computex 2024展会的开幕主题演讲中,公布了全新云端AI加速芯片路线图,今年将会推出全新Instinct MI325X。同时,AMD还发布了代号为“Strix Point”的第三代AI PC芯片“锐龙AI 300系列”,以及AMD Ryzen 9000系列桌面处理器(Granite Ridge)。 今…

    2024-06-03
    670
  • 马斯克要当特朗普顾问?据称问策加密货币、讨论电动车、太空军

    新近消息显示,摩拳擦掌竞选总统的特朗普可能“化敌为友”,找到新帮手——两年前还和他势同水火的特斯拉CEO马斯克。 本周稍早,有媒体援引知情者消息称,随着美国大选临近,近几个月马斯克和美国前总统特朗普的关系越来越融洽,每月都会通几次电话。两人讨论了移民、技术和科学等问题,包括美国太空军事部门太空军。他们的观点和利益变得更加一致,马斯克直接用手机给特朗普打电话。…

    2024-05-31
    1.1K
  • 打造手机最强性能!Arm发布面向下一代旗舰手机AI功能的CPU和GPU架构

    5月29日周三,日本软银集团旗下的英国芯片设计公司Arm控股发布了面向旗舰智能手机AI功能的下一代CPU和GPU设计,并将提供软件工具,让开发人员更容易在采用Arm架构的芯片上运行生成式AI聊天机器人和其他AI代码。预计搭载最新内核设计的手机将于2024年底上市。 不过,Arm股价周三跌超3%,失守六周高位。 具体来说,最新一代Arm CPU架构被称为Cor…

    2024-05-30
    1.8K
  • 英伟达“空中接力”,马斯克和奥特曼“火上浇油”

    在马斯克与奥特曼的携手助力下,“AI卖铲人”英伟达股价隔夜再涨7%创历史新高,目前2.8万亿美元总市值距离苹果仅一步之遥,658亿美元的差距创2009年1月以来最低水平。 据媒体 The Information 报道称,马斯克旗下人工智能初创公司xAI计划打造 AI 版的“超级算力工厂”,在最新一轮融资中筹集约60亿美元。xAI还表示,“超级算力工厂”规模或…

    2024-05-29
    777
  • 美国最火的教育APP,来自作业帮和字节

    AI技术的兴起,为中国出海企业创造了全新的机会——作业辅导。在多年积累的大量题库和大语言模型(LLM)的帮助下,中国企业正在攻城略地,和美国真人家教抢生意。 如今,美国学生在遇到难解的微积分题目时,可以在手机上打开Answer AI、Question AI、Gauth等拍下题目,几秒钟后,就能看到逐步解题的过程。 这些产品,无一例外均来自中国。 据媒体报道,…

    2024-05-28
    1.1K
  • 苹果“AI大招”流出: Project Greymatter!

    苹果正在AI领域奋起直追。 据媒体报道,苹果将在下个月召开的第35届全球开发者大会(WWDC24)上推出一套全新的AI工具方案,项目名为Project Greymatter,主要面向Safari、Photos和Notes等核心应用和部分操作系统功能。 据介绍,苹果将在iOS 18和macOS 15中应用Project Greymatter,新功能包括:语音转…

    2024-05-27
    601
  • 疯狂杀跌!B站又做错了什么?

    哔哩哔哩的一季报,单看 Q1 的业绩基本算符合预期,但近期股价的走高隐含了市场对接下来游戏、广告和集团的减亏更多期待。财报后的大跌,或许是因为电话会不够 “超预期”,部分资金选择止盈。 简单来说,B 站的中长期还是被质疑为主,一季报本身并未打破这个质疑。而财报前后的大涨大跌,和 Q1 业绩无关,我们更偏向是部分资金围绕短期估值做的交易行为,带来股价波动。质疑…

    2024-05-25
    1.4K