热搜：编程 Python Microsoft 编程语言 C++

首页> 网络资讯 > 科技新鲜事 > 正文

国内大模型创企“月之暗面”发布Kimi模型重磅升级：扩容200万字上下文窗口，新增「继续」延长回复按钮

发布时间：2024-03-19 21:05:49 来源：互联网

.

国内人工智能大模型创业公司“月之暗面”终于有了一次面向媒体的公开活动。虽然CEO杨植麟本人并未露面，但是发布了更长上下文窗口的版本：20

国内人工智能大模型创业公司“月之暗面”终于有了一次面向媒体的公开活动。虽然CEO杨植麟本人并未露面，但是发布了更长上下文窗口的版本：200万字上下文版本，即日起可在Kimi Chat上开启内测。

并且在与Kimi对话过程中，加入了（不打断模型思路的）「继续」功能按钮。

月之暗面工程副总裁许欣然将几摞打印出来的《中医中医内科学》《中医诊断学》、英伟达2023年年度财报、《甄嬛传》剧本版放在桌面上，一摞比一摞厚。

这是为了用来检验大模型的Tokens上下文窗口吞吐能力。

2023年10月，“月之暗面”团队的产品第一次公开亮相，发布了支持20万字上下文窗口的Kimi大模型。

五个月过去后，Kimi主要在3个方面有所提升：

遵循更复杂的指令
更强的信息检索能力
推出Chat机器人的网页版、Android客户端、iOS客户端、小程序

提出“Kimi 10分钟速成定律”

此次月之暗面最主要的动作，就是将自家模型的上下文窗口提升了一个数量级。即从发布之初的20万字，拓展到200万字。

同时据许欣然透露，5个月过去，相同成本、相同设备情况下，模型响应速度提升了3倍左右。

为了达到更好的长窗口无损压缩性能，月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发，不走“滑动窗口”、“降采样”等技术捷径，攻克了很多底层技术难点。

200万字上下文窗口，意味着Kimi模型能够吃下更长的文档内容，完成更长和更复杂的任务。

包括但不限于，让大模型快速整理N多的文件，例如从500份招聘简历中提取信息：

现场月之暗面还提出了“Kimi 10分钟速成定律”。

即无关领域大众小众，也无关资料或多或少，只要把资料一股脑丢给模型，10分钟内，Kimi都能快速入门一个新领域。

比如德州扑克、中医内科、驾驶飞机、大模型推理……

现场还演示了Kimi模型挖掘长篇故事情节中深层次信息的能力。

案例自然是被人类开发程度不足10%的《甄嬛传》。

值得注意的是，月之暗面在媒体沟通会现场提出了一个新说法，即大模型们最近的新竞速赛道，“大海捞针”功能，恐怕全绿也没什么太大意义了。

最初，大海捞针其实是一个非常好的评测标准，因为当时大家都没有针对这个case去优化过。

但现在它已经不是一个很好的评测指标了，当大家都去关注它的时候，就一定会想尽办法去优化它，慢慢就失去了原本的参考意义。

如果大海捞针不行了，有什么新的评测标准能够检测模型长文本能力吗?

“暂时还没有。”许欣然笑道。

他表示，模型窗口越来越长，评测的纬度变得非常非常多，不过团队已经在和学术界团队共同探讨这个开放性的问题。

期望打造“个人专家助理”

从20万字上下文窗口，迭代为今天开始内测的200万字上下文窗口，具体的模型应用场景又有什么新的亮眼之处？会不会只是从“处理50封简历”到“处理500封简历”的简单线性外扩？

一味拓展大模型上下文窗口的边界，会不会打造出一把普通人想象中的“皇帝的金锄头”？

“实际上，可能会不断地出现更多的现实场景，只有足够长的context才能完成。”

月之暗面表示，在200万字版本推出后，接下来Kimi模型会在以下几个方向发展：

第一、领域专家。

利用长文本能力吃掉一个领域里几乎所有的相关资料，使调研一个行业成为简单的事情。

第二、可完成复杂多步任务的Agent，月之暗面内部称之为“个人麦肯锡”。

希望模型未来不只是像能处理“帮我翻译一下这个PDF”这类非常具体的任务，也能自动完成抽象、复杂的任务。

第三、多模态能力。

Context长了之后，Kimi模型可以容纳更多高清的、时间更长的这种视频，从而让我们模型很方便地去拓展到更多的模态。

据月之暗面联合创始人周昕宇现场的答复，Sora出来以前，月之暗面就在根据自己的节奏推进多模态能力的研发，Sora的出现也并没有打乱原有的安排。

“预计今年会推出我们自己的多模态模型产品。”

One More Thing

最后，他们家的大模型还悄么声地改名了：

Kimi Chat➡️Kimi智能助手；Moonshot大模型➡️Kimi大模型

以下您可能有感兴趣的文章:

标签： 月之暗面 Kimi AI大模型

OpenAI发布ChatGPT Windows客户端丨微软Azure OpenAI接口终止向国服提供服务丨苹果AI整合ChatGPT将支持文本/图像生成

华军软件园发布9月AI产品榜丨零一万物发布新版大模型Yi-Lightning丨李开复：中美顶尖大模型性能差距只有五个月

苹果发布新一代iPad mini 7搭载「苹果AI」丨Adobe发布多款在线AI修图工具丨微软AI部门副总裁离职加盟OpenAI

重塑AI大模型智能终端新体验，TCL实业亮相中国移动全球合作伙伴大会

OpenAI o1推理能力极限测试丨大模型的推理能力究竟有多脆弱？

苹果10月28日发布iOS 18.1推送「苹果AI」丨Adobe发布AI视频创作工具丨荣耀手机本月底举行两场AI产品发布会

国产AI视频软件再迎重大升级丨可灵1.5版本解锁高质感视频生成，效果堪比大片!

华军AI产品榜【2024年9月】榜单发布丨AI视频赛道杀出黑马，二次元动画利器YoYo燃爆B站

特斯拉机器人发布会“擎天柱”背后有人远程操控丨李开复：零一万物没有放弃训练大模型丨快手推出开源文生视频模型

科技新鲜事热点排行

在线教程
开发软件

查看更多软件 

国内大模型创企“月之暗面”发布Kimi模型重磅升级：扩容200万字上下文窗口，新增「继续」延长回复按钮

提出“Kimi 10分钟速成定律”

期望打造“个人专家助理”

One More Thing

为您推荐

​谷歌发布时间感知框架MUSCATEL:图像识别准确率提升15%

OpenAI初步谈妥融资70亿美元：最大金主微软追加投资10亿，苹果退出

性能骤降92%！英特尔公布5nm制程「中国特供版」AI算力芯片，最快6月上市

2024谷歌I/O开发者大会回顾：疯狂2小时新品放送，从大模型到软件应用到算力TPU，正面硬刚GPT-4o与Sora

节日晒图必备！细数最火的AI修图4大玩法，掌握一个朋友圈都被赞爆

科技新鲜事最新文章

谷歌发布时间感知框架MUSCATEL:图像识别准确率提升15%