Kimi 爆火后,大厂角逐长文本

任老师命理 343 3

  月之暗面不再“晦暗 ”。近期,由这家公司创作的大模型应用 Kimi ,吸引了大量目光 。Kimi 产生的效应已经从大模型圈外溢至资本市场 ,Kimi 概念股在本周应运而生 。用户激增,巨大流量突然涌入,甚至让 Kimi 服务器一度宕机。

Kimi 爆火后	,大厂角逐长文本 - 第 1 张图片 - 小家生活风水网

  Kimi 在这一轮大模型应用当中突围,核心优势在于长文本读取和解析能力。颇为巧合的是 ,就在 22 日晚间,阿里高调宣布通义千问开放 1000 万字长文本能力 。360 当晚紧随其后,宣布 360 智脑正式内测 500 万字长文本处理功能 ,即将入驻 360AI 浏览器。

  而据《科创板日报》了解,百度也将在下个月开放 200 万 -400 万的长文本能力。

  阿里巴巴 、百度等互联网巨头纷纷布局并升级自家的大模型产品,强化长文本处理能力 ,正让业界重新审视长文本处理在大模型领域的必要性和重要性 。而随着 Kimi 的崛起,这也让大模型的讨论焦点从大模型本身转移到了应用端,2024 年是否会成为 AI 大模型应用落地元年?

  长文本是必要的吗?

  相较于其他大模型应用 ,Kimi 的长处在于长文本分析联网搜索 、文档处理和等功能上 ,尤其在深度解析厚重书籍内容方面,其性能远超远超其他模型。3 月 18 日,月之暗面甚至一口气将无损上下文长度提升了十倍 ,直达 200 万字级别。

  据目前的用户体验来看,Kimi 也不是全能选手 。有用户反馈表示,对于一些较为困难的任务 ,包括结构化信息处理和图像中潦草文字的识别,对话连续性上,Kimi 仍显示出一些短板。在生成能力和语音能力上 ,目前 Kimi 还未加入这些模态。

  尽管如此,长文本能力的重要性不言而喻 。目前,市面上的大模型应用 ,GPT-4Turbo-128k 公布的文本范围约为 10 万汉字,Claude3200k 上下文约 16 万汉字。

  一家 AI 上市公司大模型架构业务人士告诉记者,由于模型训练结构的限制 ,以往大模型的文本范围都不算长 ,但复杂任务和行业知识通常是长篇巨制,这种情况下,只能拆分输入提问 ,但这可能会导致输出的结果上下不连贯逻辑不通顺。长文本可以全篇连贯的去理解上下文,满足理解和问答的需求,长文本能力在此时是具备优势的 。

  而国内大厂们 ,则正在长文本领域快速布局 。

  《科创板日报》记者从知情人士方面了解到,百度在下个月将对文心一言进行升级,届时也将开放长文本能力 ,文本范围在 200 万 -500 万。目前,文心一言的文本更高上限在 3.2 万。

  而阿里已经先行一步 。22 日晚间,阿里的通义千问官宣升级 ,向所有人免费开放 1000 万字的长文档处理功能。用户可通过通义千问网站和 APP 快速读研报、分析财报、读科研论文 、研判案情、读医疗报告、解读法律条文 、分析考试成绩、总结深度文章。

  360 紧随其后,其在当晚宣布,360 智脑正式内测 500 万字长文本处理功能 ,即将入驻 360AI 浏览器 。

  Kimi 成功在前 ,阿里、百度 、360 先后角逐长文本。长文本能力会是大模型未来差异化的竞争点吗?

  上述大模型架构人士表示,长文本能力目前在训练和效果上仍存在一些难点,比如如何避免遗漏细节。事实上 ,文本长度也可以通过 RoPE 等算法技术去拓展,但是此时会严重丢失细节,这就导致输出效果不准确 。因此 ,核心标准是看输出结果的精准性连贯性,并不是文本长度越长越好。

  另外一名大模型行业人士也告诉记者,长文本实际是大模型的基础能力 ,只要算力资源足够,理论上长文本可以追求无限长,“但是如果使用场景根本用不上长文本 ,那么此时的长文本就没有任何意义 ”。

  2024 年是大模型应用落地元年吗?

  Kimi 的火爆,一定程度上也反应了当下国内大模型的发展阶段,从打基建开始走向应用落地 。那么 ,2024 年是否会成为 AI 大模型应用落地元年?

  澜舟科技 CEO 周明认为 ,从长远来看,人工智能在近 AGI。而经过去一年的发展,大模型已经具备了落地的能力 ,企业侧也积攒了很多业务落地场景。加上国家政策的推动,2024 年将会是大模型落地元年 。

  零一万物联合创始人祁瑞峰也表达了类似的看法,但他是聚焦在 B 端场景 。目前 ,内容生成、理解、摘要和对话等应用仍占据主导,但随着新一代模型推理 、决策和执行能力的提升,有望更快地将 AI 技术植入企业业务系统 ,真正开启大模型赋能的腾飞。

  电商是 AI 应用更具代表性的领域之一。魔珐科技目前是阿里妈妈、 *** 直播生态官方指定的 3D 超写实虚拟直播服务商,旗下有一款 3D 虚拟人直播 AIGC 产品“有光” 。

  魔珐科技 CEO 柴金祥在接受《科创板日报》记者采访时表示,电商是公司 AI 产品应用的最主要一个行业。从已有的使用效果来看 ,多个知名头部美妆品牌在使用魔珐科技提供的 3D 虚拟人后,午夜 6 小时的直播时段内累计年 GMV 增量高达数千万。3D 虚拟直播午夜超级直播广告投放高于行业均值 2 倍以上,ROI 大于 5 倍 。

  尽管 2024 年被寄予厚望 ,但是各方仍然保持着审慎乐观的态度。

  祁瑞峰认为 ,在 C 端市场,目前成本还很高,商业模式还未完全跑通。即便是对于现在已经可以创收的 B 端市场 ,周明也认为,要想做好产品标准化和完整交付,训练和部署成本、行业适配能力 、幻象问题 、数据安全四方面的问题 ,还有待解决 。

  梦饷科技 CTO 曹均涛在接受《科创板日报》记者采访时表示,虽然 AI 在电商行业的应用,想象空间非常大 ,梦饷也在通过 GPT 大模型重构业务场景,包括解决模特图片生成、素材差异化、服装秀 、AI 创作助手、聊天室导购等问题。

  “但是现在的阶段,基础设施并不完善。”曹均涛告诉记者 ,梦饷在去年为创作者做了 AI 创作平台,虽然能生成模特图,但是成图率并不高 ,还是需要技术升级和内部做技术提示词、算法模型的调优 ,这个平台到现在还没有开放,“现在大家都在找应用场景,估计 2024 年开始能够看到更多 AI 、大模型带来的变化 ” 。

  在 42 章经创始人曲凯看来 ,2024 年仍会是技术上不断突破的一年,很难真的做到大规模的落地和有非常多的场景,不过 ,不管是在 B 端还是 C 端,今年有望看到更多应用开始跑出来。与此同时,应用端的项目今年也将更受投资人青睐。

  “去年大家投了非常多资金和精力在大模型本身 ,要想将这个故事持续下去,就需要有落地,因此会在应用端继续探索 ,找到 PMF(Product Market Fit,产品市场匹配) 。”曲凯说 。

文章内容免责声明

加微信免费领取数字能量手机号旺运电子书

公众号

专家微信

1、本网站名称:好风水网 2、本站永久网址:https://www.hfs666.com 3 、本网站的文章部分内容可能来源于网络,仅供大家学习与参考 ,如有侵权 ,请联系站长进行删除处理。 4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。 5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报 6 、本站资源大多存储在云盘 ,如发现链接失效,请联系我们我们会第一时间更新 。

发布评论 3条评论)

评论列表

2024-07-03 02:40:58

内容丰富,引人深思,值得一读再读。

2024-07-07 10:10:01

内容丰富,引人入胜。

2024-07-16 06:22:40

内容丰富,引人入胜。