月之暗面不再“晦暗 ”。近期,由这家公司创作的大模型应用 Kimi ,吸引了大量目光 。Kimi 产生的效应已经从大模型圈外溢至资本市场,Kimi 概念股在本周应运而生。用户激增,巨大流量突然涌入,甚至让 Kimi 服务器一度宕机。
Kimi 在这一轮大模型应用当中突围,核心优势在于长文本读取和解析能力。颇为巧合的是 ,就在 22 日晚间,阿里高调宣布通义千问开放 1000 万字长文本能力 。360 当晚紧随其后,宣布 360 智脑正式内测 500 万字长文本处理功能 ,即将入驻 360AI 浏览器。
而据《科创板日报》了解,百度也将在下个月开放 200 万 -400 万的长文本能力。
阿里巴巴 、百度等互联网巨头纷纷布局并升级自家的大模型产品,强化长文本处理能力 ,正让业界重新审视长文本处理在大模型领域的必要性和重要性 。而随着 Kimi 的崛起,这也让大模型的讨论焦点从大模型本身转移到了应用端,2024 年是否会成为 AI 大模型应用落地元年?
长文本是必要的吗?
相较于其他大模型应用 ,Kimi 的长处在于长文本分析联网搜索、文档处理和等功能上,尤其在深度解析厚重书籍内容方面,其性能远超远超其他模型。3 月 18 日,月之暗面甚至一口气将无损上下文长度提升了十倍 ,直达 200 万字级别。
据目前的用户体验来看,Kimi 也不是全能选手 。有用户反馈表示,对于一些较为困难的任务 ,包括结构化信息处理和图像中潦草文字的识别,对话连续性上,Kimi 仍显示出一些短板。在生成能力和语音能力上 ,目前 Kimi 还未加入这些模态。
尽管如此,长文本能力的重要性不言而喻 。目前,市面上的大模型应用 ,GPT-4Turbo-128k 公布的文本范围约为 10 万汉字,Claude3200k 上下文约 16 万汉字。
一家 AI 上市公司大模型架构业务人士告诉记者,由于模型训练结构的限制 ,以往大模型的文本范围都不算长,但复杂任务和行业知识通常是长篇巨制,这种情况下,只能拆分输入提问 ,但这可能会导致输出的结果上下不连贯逻辑不通顺。长文本可以全篇连贯的去理解上下文,满足理解和问答的需求,长文本能力在此时是具备优势的 。
而国内大厂们 ,则正在长文本领域快速布局。
《科创板日报》记者从知情人士方面了解到,百度在下个月将对文心一言进行升级,届时也将开放长文本能力 ,文本范围在 200 万 -500 万。目前,文心一言的文本更高上限在 3.2 万。
而阿里已经先行一步 。22 日晚间,阿里的通义千问官宣升级 ,向所有人免费开放 1000 万字的长文档处理功能。用户可通过通义千问网站和 APP 快速读研报、分析财报、读科研论文 、研判案情、读医疗报告、解读法律条文 、分析考试成绩、总结深度文章。
360 紧随其后,其在当晚宣布,360 智脑正式内测 500 万字长文本处理功能 ,即将入驻 360AI 浏览器 。
Kimi 成功在前,阿里、百度 、360 先后角逐长文本。长文本能力会是大模型未来差异化的竞争点吗?
上述大模型架构人士表示,长文本能力目前在训练和效果上仍存在一些难点,比如如何避免遗漏细节。事实上 ,文本长度也可以通过 RoPE 等算法技术去拓展,但是此时会严重丢失细节,这就导致输出效果不准确 。因此 ,核心标准是看输出结果的精准性连贯性,并不是文本长度越长越好。
另外一名大模型行业人士也告诉记者,长文本实际是大模型的基础能力 ,只要算力资源足够,理论上长文本可以追求无限长,“但是如果使用场景根本用不上长文本 ,那么此时的长文本就没有任何意义”。
2024 年是大模型应用落地元年吗?
Kimi 的火爆,一定程度上也反应了当下国内大模型的发展阶段,从打基建开始走向应用落地 。那么 ,2024 年是否会成为 AI 大模型应用落地元年?
澜舟科技 CEO 周明认为,从长远来看,人工智能在近 AGI。而经过去一年的发展,大模型已经具备了落地的能力 ,企业侧也积攒了很多业务落地场景。加上国家政策的推动,2024 年将会是大模型落地元年 。
零一万物联合创始人祁瑞峰也表达了类似的看法,但他是聚焦在 B 端场景。目前 ,内容生成、理解、摘要和对话等应用仍占据主导,但随着新一代模型推理 、决策和执行能力的提升,有望更快地将 AI 技术植入企业业务系统 ,真正开启大模型赋能的腾飞。
电商是 AI 应用更具代表性的领域之一。魔珐科技目前是阿里妈妈、 *** 直播生态官方指定的 3D 超写实虚拟直播服务商,旗下有一款 3D 虚拟人直播 AIGC 产品“有光” 。
魔珐科技 CEO 柴金祥在接受《科创板日报》记者采访时表示,电商是公司 AI 产品应用的最主要一个行业。从已有的使用效果来看 ,多个知名头部美妆品牌在使用魔珐科技提供的 3D 虚拟人后,午夜 6 小时的直播时段内累计年 GMV 增量高达数千万。3D 虚拟直播午夜超级直播广告投放高于行业均值 2 倍以上,ROI 大于 5 倍 。
尽管 2024 年被寄予厚望 ,但是各方仍然保持着审慎乐观的态度。
祁瑞峰认为,在 C 端市场,目前成本还很高,商业模式还未完全跑通。即便是对于现在已经可以创收的 B 端市场 ,周明也认为,要想做好产品标准化和完整交付,训练和部署成本、行业适配能力 、幻象问题、数据安全四方面的问题 ,还有待解决 。
梦饷科技 CTO 曹均涛在接受《科创板日报》记者采访时表示,虽然 AI 在电商行业的应用,想象空间非常大 ,梦饷也在通过 GPT 大模型重构业务场景,包括解决模特图片生成、素材差异化、服装秀 、AI 创作助手、聊天室导购等问题。
“但是现在的阶段,基础设施并不完善。”曹均涛告诉记者 ,梦饷在去年为创作者做了 AI 创作平台,虽然能生成模特图,但是成图率并不高 ,还是需要技术升级和内部做技术提示词、算法模型的调优,这个平台到现在还没有开放,“现在大家都在找应用场景,估计 2024 年开始能够看到更多 AI 、大模型带来的变化 ” 。
在 42 章经创始人曲凯看来 ,2024 年仍会是技术上不断突破的一年,很难真的做到大规模的落地和有非常多的场景,不过 ,不管是在 B 端还是 C 端,今年有望看到更多应用开始跑出来。与此同时,应用端的项目今年也将更受投资人青睐。
“去年大家投了非常多资金和精力在大模型本身 ,要想将这个故事持续下去,就需要有落地,因此会在应用端继续探索 ,找到 PMF(Product Market Fit,产品市场匹配) 。”曲凯说。
评论列表
内容丰富,引人深思,值得一读再读。
内容丰富,引人入胜。
内容丰富,引人入胜。