字节豆包大模型升级,综合能力提升20.3%丨微软发布Phi-3.5系列迷你模型丨IDC发布中国大模型应用份额报告:百度居首

互联网2024年8月22日报道丨AI资讯早报 字节豆包大模型升级,综合能力提升20 3% 8 月 21 日,字节跳动旗下的大数据运营商火山引擎 AI 创新巡展在

互联网2024年8月22日报道丨AI资讯早报

字节豆包大模型升级,综合能力提升20.3%

8 月 21 日,字节跳动旗下的大数据运营商火山引擎 AI 创新巡展在上海举办。在此次会议上,火山引擎发布了豆包大模型的一系列产品升级。

5月15日正式对外发布以来,豆包大模型的日均 Tokens 使用量已经超过5,000亿,平均企业客户使用量增长了22倍。

图片

基于内外客户广泛、真实的业务需求,豆包大模型在关键能力上不断迭代优化。公开及内部测评集显示,最新版豆包大语言模型相比发布初期综合能力提升了20.3%。其中,角色扮演能力提升了38.3%,具备了更强的上下文感知,让对话情境更连贯、角色更拟人化。

语言理解能力提升了33.3%,让豆包大模型在信息分类、抽取、摘要、理解和问答等 NLP 方面都有了显著提升,能够在更多生产力场景中得到应用。此外,模型在长文任务、数学、专业知识、代码能力上也有不同程度的增强。

本次活动上,字节方面还公布了多个豆包大模型的垂类模型的最新升级情况,包括:

其中,豆包·文生图模型对长文本有更精准的图文匹配能力,多主体、多位置、手部结构等复杂场景的生图能力更强,更善于理解中国特色元素,创造更具美感的中国风图片。

豆包·语音识别模型基于大语言模型丰富的知识和推理能力,通过上下文感知,提升语音识别准确性,在多个公开测试集中,与国内公开发布的语音识别大模型相比,错误率最高降低40%;支持一个模型识别普通话和粤语、上海话、四川话、西安话、闽南语等方言。豆包·语音合成模型升级了流式语音合成能力,能够实时响应、精准断句,支持“边想边说”。

字节火山引擎联合多家零售商成立大模型商业化联盟

8 月 21 日,火山引擎 AI 创新巡展在上海举办。在此次会议上,火山引擎发布了豆包大模型的一系列产品升级,并携手多点 DMALL 成立零售大模型生态联盟,基于豆包大模型打造零售 AI 解决方案,提升消费者购物体验。

火山引擎总裁谭待认为,大模型应用落地不仅需要技术成熟度,还要有适配的商业组织和商业生态。为此,火山引擎与商超、餐饮、食品、服装等众多行业领军企业合作,共同成立零售大模型生态联盟。

火山引擎总裁谭待表示,豆包大模型获得众多行业客户青睐,本次大模型生态联盟的首批成员包括:物美集团、抖音电商、抖音生活服务、百胜、麦当劳、中国飞鹤、海底捞、居然之家等知名企业。

微软发布Phi-3.5系列迷你模型,首次引入混合专家模型

当地时间8月20日晚间,微软公司今天发布了三款小参数尺寸的 Phi-3.5 系列 AI 大模型,其中最值得关注的是推出了该系列首个混合专家模型(MoE)版本的 Phi-3.5-MoE。

Phi-3.5-vision 共有 42 亿个参数,使用 256 个 A100 GPU 在 500B 标记上进行训练,现在支持多帧图像理解和推理。

本次发布的 Phi-3.5 系列包括 Phi-3.5-MoE、Phi-3.5-vision 和 Phi-3.5-mini 三款轻量级针对端侧设备提供的 AI 大模型,基于合成数据和经过过滤的公开网站构建,上下文窗口为 128K,所有模型现在都可以在大模型在线体验社区 Hugging Face 上以 MIT 开源许可的方式获取。

Phi-3.5-MoE 是 Phi 系列中首个利用混合专家(MoE)技术的模型。该模型在 16 x 3.8B MoE 模型使用 2 个专家仅激活了 66 亿个参数,并使用 512 个 H100 在 4.9T 标记上进行了训练。

微软研究团队声称,这次 Pin-3.5 版本乃从零开始设计的新模型,以进一步提高其性能。在标准人工智能基准测试中,Phi-3.5-MoE 的性能超过了 Llama-3.1 8B、Gemma-2-9B 和 Gemini-1.5-Flash,并接近目前在小尺寸模型领域的领头羊 GPT-4o mini。

玩家自创AI人物,《逆水寒》手游上线“自捏江湖友人”玩法

8月20日,《逆水寒》手游官方发布通告称,在即将到来的 V2.1.3 版本里,名为「自捏江湖友人」玩法即将上线,《逆水寒》手游将是“业界首个可以自捏 AI 智能生命体”的游戏。

新版本上线后,玩家可以点开【呼吸-自捏江湖友人】界面,输入姓名,即可一键完成捏人工作。

图片

此外,玩家可以为江湖友人打造独一无二的外貌与声音。如果心中已有理想形象,可以选择扫码导入装扮站的现有外观;也可以在征得他人的同意后,通过扫码复制他人分享的门客的形象和人物特征为己所用。

IDC发布中国大模型应用份额报告:百度、商汤、智谱TOP3

8月21日,国际数据公司IDC首次对外发布了针对 2023 全年的《中国大模型平台市场份额,2023:大模型元年 —— 初局》市场调研报告。

数据显示,2023 年中国大模型平台及相关应用市场规模达 17.65 亿元人民币。在过去的一年中,行业对于大模型更多的是早期投入,甚至观望而不重投入,因此 2023 年整体市场规模并不显著;并且市场格局也主要还是由早期投入者,比如百度、商汤、智谱、百川智能等公司构成。

进入 2024 年,头部的互联网公司加大对大模型的投入且发起价格战,为早期的大模型初创企业带来一定的竞争压力。预计未来两到三年,市场格局将发生多轮巨变。

图片

2023 年中国大模型平台及应用市场份额如下:

  • 受益于多年来在 AI 领域的大力投入以及大模型的早期投入,百度智能云在 2023 年大模型市场规模达 3.5 亿元人民币,位居市场第一,市场份额达 19.9%
  • 商汤科技也受益于其对大模型的专注投入,以及其所建设的上海 AIDC 能够为客户提供一体化的大模型计算与应用解决方案,位居市场第二,市场份额达 16.0%
  • 智谱 AI 则是 2023 年初创企业中的胜出者,位居市场第三
  • 其次是百川智能、第四范式等

Meta部署新的网络爬虫,为大模型训练收集数据

据外媒报道,今日 Meta 悄悄地发布了一款新的网络爬虫,用于搜索互联网并收集大量数据,为其人工智能模型提供支持。

据三家追踪网络抓取器的公司称,Meta 新网络爬虫机器人 Meta External Agent 于上月推出,类似于 OpenAI 的 GPTBot,可以抓取网络上的人工智能训练数据,例如新闻文章中的文本或在线讨论组中的对话。

新爬虫的存在表明 Meta 庞大的数据库可能已经不够用了,因为该公司继续致力于更新 Llama 和扩展 Meta AI,通常需要新的和高质量的培训数据来不断改进功能。