从数据到芯片,开发 AI 越来越昂贵,只有科技巨头能“玩得起”?

任老师命理 250 1

  更多的训练数据、更大的模型 、更多的芯片和数据中心 ,这些推动人工智能(AI)进步的“基础设施 ”,正推高科技公司的成本。

  5 月,OpenAI 与美国新闻集团(News Corp)签订了一项五年内金额超过 2.5 亿美元的内容授权协议 ,允许前者使用后者的新闻出版物内容来回答用户查询并训练 AI 。此前,图片提供商 Shutterstock 与苹果、Meta、谷歌 、亚马逊等大型科技公司签订了 2500 万至 5000 万美元的交易,提供其庞大的图片和视频库用于 AI 训练。

  全球经济分析公司 BCA Research 美国股票首席策略师唐克尔(Irene Tunkel)对之一财经记者表示 ,科技公司在 AI 领域开展了大量工作 ,但除非销售的是 AI 相关的“工具和设备”或云存储,否则科技公司更多仍做的是 AI 资本支出,而不是靠 AI 挣钱。

  然而 ,大量的资本开支需求无疑会将无力承担相应成本的公司甩在后面,有能力在这场游戏中竞争的玩家仍将是我们熟知的科技巨头 。

从数据到芯片,开发 AI 越来越昂贵	,只有科技巨头能“玩得起”?- 第 1 张图片 - 小家生活风水网

  “基础设施”很贵 ,资本支出很高

  唐克尔介绍,在生成式 AI 的生态系统中,提供芯片和计算机硬件、云平台和服务、数据库 、 *** 和分析等产品和服务的属于生成式 AI 的“基础设施公司” ,帮助模型的顺利开发和部署。例如,OpenAI 的研究员贝特克(James Betker)曾表示,训练模型的数据是越来越复杂 、强大的 AI 系统的关键。

  但数据该从哪来?据报道 ,生成式 AI 模型主要通过从公共网页中获取的图像、文本、音频 、视频和其他数据(其中一些是有版权的)进行训练 。例如 ,OpenAI 在未经某视频社交网站或创作者许可的情况下,转录了超过一百万小时的相关视频,以供其旗舰模型 GPT- 4 使用 。元公司(Meta)也一直在使用旗下公司照片墙(Instagram)上的图片和视频来训练其模型 ,并只允许欧盟公民退出这一机制。

  随着法律诉讼的增多,AI 公司开始选择付费。例如,线上社区 Reddit 称 ,该公司已通过向谷歌和 OpenAI 等组织许可数据赚取了数亿美元 。据报道,AI 训练数据市场预计将在十年内从现在的约 25 亿美元增长到接近 300 亿美元。

  模型训练也并不便宜。OpenAI 首席执行官奥尔特曼(Sam Altman)表示,训练 GPT- 4 的成本超过 1 亿美元 。AI 初创公司 Anthropic 首席执行官阿莫代(Dario Amodei)也称 ,目前市场上的人工智能模型的训练成本约为 1 亿美元。他说:“现在正在训练的模型,以及将在今年晚些时候或明年年初推出的模型,成本接近 10 亿美元。我认为在 2025 年和 2026 年 ,我们的成本将接近 50 亿美元或 100 亿美元 。 ”

  芯片支出更是一个大项目。据报道,英伟达的 H100 图形芯片售价约为 30000 美元。元公司首席执行官扎克伯格(Mark Zuckerberg)此前曾表示,公司计划在今年年底前购买 35 万块 H100 芯片 ,以支持其人工智能研究工作 。此外 ,亚马逊公司的云计算部门以每小时约 6 美元的价格向客户租用英特尔公司制造的大型主力处理器集群。

  在云服务中心方面,每一座数据中心的成本都以亿来计算。例如,微软公司与阿联酋 AI 公司 G42 宣布 ,双方将合作投资 10 亿美元在肯尼亚建设一个数据中心,投资 40 亿欧元在法国建设 AI 数据中心和云基础设施 。过去两年里,亚马逊也已承诺斥资 1480 亿美元在全球建设和运营数据中心 ,以应对 AI 应用和其他数字服务需求的激增 。

  总的来看,微软在 4 月表示,最近一个季度的资本支出为 140 亿美元 ,比去年同期增长了 79%,由于 AI 基础设施投资,这些成本“大幅增加 ”。谷歌母公司 Alphabet 也表示 ,上一季度支出为 120 亿美元,比去年同期增长 91%,并预计今年下半年的支出将“达到或超过”这一水平。与此同时 ,Meta 也上调了对今年投资的预期 ,目前认为资本支出将达到 350 亿至 400 亿美元,在这一区间的上限将增长 42% 。

  反垄断部门怎么看

  美国艾伦人工智能研究所(AI2)高级应用研究科学家凯尔·洛(Kyle Lo)认为,高额的训练成本将把小公司排除在“开发或研究 AI 模型”之外。

  凯尔·洛表示 ,对大规模、高质量训练数据集的日益重视,将把 AI 开发集中在少数拥有数十亿美元预算、能负担得起获取这些数据集的公司。合成数据或基础架构方面的重大创新可能会打破现状,但在近些年似乎都不会出现 。

  “总的来说 ,管理对 AI 开发潜在有用内容的实体有动力锁定他们的材料。 ”凯尔·洛说,“随着数据访问的关闭,我们基本上在为一些早期数据获取者开绿灯 ,并且撤掉梯子,其他人无法获得数据以赶上来。”

  目前,欧美英的反垄断机构也已经盯上了科技巨头在 AI 领域的地位 。

  例如 ,英国竞争与市场管理局(CMA)在今年 4 月发布的报告中称,AI 基础模型市场中主要参与者的合作关系可能通过其价值链加剧垄断。5 月,美国司法部(DOJ)也宣布加强对 AI 领域竞争情况的关注。近日 ,美国司法部反垄断部门主管坎特(Jonathan Kanter)表示 ,过去 40 年的反垄断政策未能有效保护公众利益,导致了少数公司对市场和信息流的控制 。他强调,内容创作者和开发者在当前市场环境中面临的高额费用 ,在大公司增加对内容创作和分发的控制时尤其如此。

  当涉及大科技公司收购 AI 初创公司时,富而德律师事务所中国反垄断业务部主管杜宁(Ninette Dodoo)对之一财经记者表示:“欧盟和美国的监管机构正越来越具有干预倾向,同时他们具备的执法工具也有能力对所有并购案件发起法律挑战。”

  金杜律师事务所合伙人吴涵律师告诉之一财经 ,中 、美、欧在 AI 数字治理领域的监管在一定程度上均具有共性,比如都重点关注 AI 系统的透明度披露、训练数据治理 、知识产权保护、内容安全与等 。

  (本文来自之一财经)

文章内容免责声明

加微信免费领取数字能量手机号旺运电子书

公众号

专家微信

1、本网站名称:好风水网 2 、本站永久网址:https://www.hfs666.com 3、本网站的文章部分内容可能来源于网络,仅供大家学习与参考 ,如有侵权,请联系站长进行删除处理 。 4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。 5 、本站一律禁止以任何方式发布或转载任何违法的相关信息 ,访客发现请向站长举报 6 、本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。

发布评论 1条评论)

评论列表

2024-07-18 15:00:04

内容丰富,引人深思。