ChatGPT将新增8种语音音色丨小米小爱音箱推送小爱大模型丨阿里通义Qwen2-VL视觉语言模型开源

互联网2024年9月3日报道丨AI资讯早报 ChatGPT将新增8种语音音色,甚至可以模仿狗叫等动物叫声 当地时间9月2日,科技博客 Testing Catal

互联网2024年9月3日报道丨AI资讯早报

ChatGPT将新增8种语音音色,甚至可以模仿狗叫等动物叫声

当地时间9月2日,科技博客 Testing Catalog 发文爆料称,他们通过 APP 逆向工程发掘 ChatGPT 的最新版本应用时发现,OpenAI 即将扩充添加语音,让朗读的声音更加自然和富有表现力。

有迹象表明,OpenAI 未来可能会额外推出 8 种新的语音,每种语音都有一个独特的代号,后续可能会逐步推出。

这些即将发布的新音色里边甚至包含了诸如动物叫声或其他非人类所能发出的音色。

小米小爱音箱推送小爱大模型:支持文本创作、实时搜索等

8月30日,小米官方发布博文表示,针对小爱音箱的大模型小爱全量升级已经发布,支持文本创作、实时搜索等能力,目前已在音箱上正式推送。

用户可以通过进入小爱音箱的App - 设置 - 权限管理,确认小爱大模型的开关是否已经开启。

以下为小米官方发布的小爱音箱升级计划:

已完成全量推送

  • Xiaomi Sound Pro
  • Xiaomi Sound Move
  • Xiaomi Sound
  • 小米小爱音箱 Art 电池版
  • 小米小爱音箱 Art
  • 小米小爱音箱 Pro
  • 小米小爱音箱
  • 小米 AI 音箱(第二代)

10月内陆续覆盖

  • Xiaomi 智能家庭屏 10
  • Xiaomi 智能家庭屏 Pro 8
  • Xiaomi 智能家庭屏 6
  • 小米小爱触屏音箱 Pro 8
  • Redmi 小爱触屏音箱 Pro 8
  • Redmi 小爱触屏音箱 8 英寸

阿里云通义Qwen2-VL视觉语言模型对外开源

9 月 2 日,阿里云公众号发布博文宣布,通义千问宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型。

图片

目前,通义千问第二代视觉语言模型 Qwen2-VL 的旗舰版本 Qwen2-VL-72B API 也已经上线阿里云百炼平台,所有用户可直接调用。

图片

图片

据阿里云官方介绍,相比上代第一代的视觉大模型,Qwen2-VL 的基础性能全面提升:

可以读懂不同分辨率和不同长宽比的图片,在 DocVQA、RealWorldQA、MTVQA 等基准测试创下全球领先的表现;

理解 20 分钟以上长视频,支持基于视频的问答、对话和内容创作等应用;

具备强大的视觉智能体能力,可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL 可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作;

理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等。

魅族将于9月举行AI硬件生态发布会

9月2日,吉利汽车旗下的星际魅族科技在官博发文宣布,将于 9 月举行 Al 生态发布会。此外,魅族官方还计划发布LOGO更新,将彻底放弃过去魅族手机时代的LOGO,完全纳入吉利的产品运营体系。

另外,星际魅族科技表示,已经与时空道宇达成战略合作,将合作发射「星纪魅族幸运星号」卫星,携手推进全球智能科技生态建设,带着全球用户的「星愿」共同探索星辰大海。

OpenAI将成为台积电A16工艺制程首批客户

当地时间9月2日,据台媒《经济日报》报道称,半导体生产大厂台积电定于 2026 下半年推出的量产型 A16 工艺制程已签约首批的客户:除已预定首批产能的长期合作伙伴苹果公司之外,目前正在积极寻求自研 AI 芯片产品的 OpenAI 也为自家芯片预订生产订单。

A16 工艺是台积电目前已公布的最先进节点,其采用下一代 Nanosheet 纳米片 GAA 晶体管技术,也是台积电首个应用 Super Power Rail 超级电轨背面供电解决方案的制程。

报道还援引此前的报道,OpenAI 在 AI 芯片领域的合作伙伴主要为博通、Marvell 两大定制 ASIC 设计企业,其中 OpenAI 有望跻身博通的 TOP4 客户。