互联网2024年4月19日报道丨AI资讯早报
Meta发布Llama 3开源大模型:重夺最强开源大模型
当地时间4月18日,硅谷人工智能大厂 Meta 正式推出旗下新一代的开源大语言模型 Llama 3。包括两个版本:Llama 3 8B 与 Llama 3 70B。其中参数量更少的Llama 3 8B在某些测评基准的项目成绩上,甚至超越了参数量更大的 70B版本。
据介绍,Llama 3 使用的数据量是 Llama 2 的七倍,模型性能和准确性提高,推理、代码生成和遵循指令等方面的能力取得突破,使其更加灵活和易于使用。
Meta 声称,基准测试显示,Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试中击败 Google Gemma 7B 以及 Mistral 7B Instruct,而 Llama 3 70B 则略胜于 Gemini 1.5 Pro。
Meta 还透露,他们最大的模型参数超越 400B,接下来几个月将会推出具备多模态、多语言对话、更长上下文窗口等能力的新模型。
Meta发布Llama大模型在线网页版
当地时间4月18日,Meta 公司正式发布 Llama 3 大语言模型之外,并且宣布推出了在线聊天机器人的网页版。并将 Meta AI 服务扩展到美国之外的 13 个国家和地区,还宣布上线专门的聊天网站:meta.ai。
Meta 公司在新闻稿中表示开始在全球市场扩展 Meta AI,在澳大利亚、加拿大、南非和新加坡等国家和地区推出英语版本。目前 Meta AI 扩展的国家和地区包括:澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚、津巴布韦。
Meta AI 在网页端整合了最新发布的 Llama 3 大语言模型,执行人物的速度更快、智能性更高、功能更强,是执行各种 AI 自动化任务的理想选择。
月之暗面「Kimi智能助手」功能升级
4月18日,国内 AI 初创公司月之暗面宣布为旗下 AI 聊天机器人 Kimi 推出新功能。提升模型能力与基座稳定性,内置官方提示词支持常用语,增加语音输入输出和播报功能,优化翻译准确性与逻辑推理,改善用户体验。
具体来说,本次 Kimi 在四个方面迎来了更新:
- 模型能力提升,更稳的基座能力
- Kimi 常用语,更开箱即用的 Prompt
- 语音输入/播报,更丰富的交互
- 搜索支持引用溯源,更严谨的回答
据介绍,Kimi 在逻辑能力、交互方式上取得进步,给出的信息也更严谨。
MiniMax发布MoE大模型abab 6.5,能力接近GPT-4
4 月 17 日,国内知名的 AI 初创公司 MiniMax 稀宇科技今日正式推出 MoE 混合专家模型架构的 abab 6.5 系列模型。根据官方发布的测评基准报告,其核心能力开始接近 GPT-4、 Claude-3、 Gemini-1.5。
abab 6.5 系列包含两个模型:①abab 6.5:包含万亿参数,支持 200k tokens 的上下文长度;②abab 6.5s:与 abab 6.5 使用了同样的训练技术和数据,但是更高效,支持 200k tokens 的上下文长度,可以 1 秒内处理近 3 万字的文本。
自从今年 1 月发布国内首个基于 MoE 架构的 abab 6 模型后,MiniMax 通过改进模型架构,重构数据 pipeline,训练算法及并行训练策略优化等,在加速 Scaling Laws 过程上取得阶段性成果。
abab 6.5 系列模型的测试结果如下:
官方在 200k token 内进行了业界常用的“大海捞针”测试,即在很长的文本中放入一个和该文本无关的句子(针),然后通过自然语言提问模型,看模型是否准确将这个针回答出来。在 891 次测试中,abab 6.5 均能正确回答。
联想发布AI PC战略:AI落地需要设备、设施、方案服务三大支柱
4月18日,联想 Tech World 大会在北京举行。联想集团 CEO 杨元庆表示,人工智能的下半场,一定是从技术突破进入到落地应用的阶段,落地途径就是涵盖智能设备、智能基础设施、智能解决方案和服务的三大支柱。而联想正是基于三大支柱,打造全新的「AI新物种」人工智能电脑AI PC。
杨元庆在大会上,发布首个真正意义上的「硬件+端云结合AI」的AI PC产品。杨元庆强调在AI载体手机和电脑中,联想已经做了大量的技术和算力储备,而手机和PC未来在适应环境中会有巨大差别。在此次大会中,联想发布了联想小天人工智能体,作为AI PC的主要场景入口,可以实现纯端侧的生成式对话。杨元庆预计今年底,AI PC出货量将占全球市场10%,中国市场占比可达50%。
对于个人用户而言,智能设备就是获得智能体(AI Agent)体验的最便捷途径,而对于企业客户而言,AI 落地必须依赖服务器、网络和存储设备等基础设施,也需要更加的全面系统服务能力,去支撑混合型智能基础设施的升级、部署和管理。