互联网2024年3月26日报道丨AI资讯早报
苹果正在探索免唤醒词呼出Siri,以AI聆听取代
据《麻省理工科技评论》报道,当地时间3月22日上周五,苹果发表的的一篇论文显示,该公司的研究人员正在探索利用人工智能来检测用户何时在与iPhone等设备交谈的可能性,从而消除像「Hey, Siri」「Siri」这样的触发短语的技术需求。
在这项上传到 Arxiv 且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来自背景噪音的声学数据,训练了一个大型语言模型,以寻找“可能表明用户需要设备辅助”的模式。
论文中称,该模型部分基于 OpenAI 的 GPT-2 构建,因为它相对轻量级,可以在智能手机等设备上运行。论文还描述了用于训练模型的超过 129 小时的数据、额外的文本数据,但没有说明训练集的录音来源。论文最终得出的结论是“令人鼓舞”,声称该训练模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。
“月之暗面”Kimi Chat大火,大厂AI跟进长文本吞吐能力
国内AI初创企业“月之暗面”的聊天大模型Kimi近期人气大火,其最具特色的能力便是支持200万字的上下文窗口Tokens。一夜之间,国产的其他大模型忽然“觉醒”,打起了「长文本大战」。近日,各大厂的大模型排队官宣跟进长文本能力:
- 百度文心一言:下个月版本升级,开放200万~500万长度
- 360智脑:正在内测500万字,一完成就要入驻360 AI浏览器
- 阿里通义千问:则一出手就是1000万字,且不用等,当场就开始。
AI大模型的窗口吞吐量,内卷启动,大卷特卷。去年10月初,Kimi大模型首次亮相,参数上千亿,主力卖点长文本吞吐,最早的版本支持20万汉字输入处理,一本《三体》《马斯克传》轻松阅读全文,近期升级到200万字吞吐能力。
媒体曝Kimi一天烧20万,大厂围剿下盈利或成老大难
3月25日开始,近期大热的“月之暗面”Kimi概念股开始大幅下跌。此前,AI创业公司月之暗面旗下的Kimi智能助手在长上下文窗口技术上突破,无损上下文长度提升到200万字,其处理能力在AI领域一骑绝尘。
市场追捧下,Kimi概念股大涨,但大模型的算力消耗巨大,大模型公司的融资能力面临考验。根据消息人士透露,Kimi目前已经经历了5次服务器宕机,并且临时租用了大量的第三方数据中心服务,但增长曲线总会有回落周期,届时每天留存用户的算力消耗是不少的开支。20万元/天对于一家初创企业来说,是非常巨大的开支。
Transformer作者承认参与神秘的OpenAI「Q*」项目
据外媒报道,近日Transformer架构的六人联名作者中,唯一加入了OpenAI的一位成员公开承认,他参与了「Q*」项目。这项神秘项目可能是OpenAI当前最需要保守的秘密,据传「Q*」是一个数学大模型,可以解答许多人类未解之谜。
根据报道说法,当记者问及关于「Q*」的细节时,一旁的OpenAI公关人员几乎要跳起来捂他的嘴。
Transformer背后的开发内幕揭示,谷歌早在2012年就开始尝试开发生成式AI,看到自注意力机制可能性,但并未采取行动,反而被OpenAI抢先推出影响世界的AI产品。这篇奠定了大模型架构的论文《Attention is all you need》发表至今已被引超过11万次,成为AI领域的经典传奇。
结合奥特曼在上周的播客专访时,他毫不迟疑地拒绝了相关「Q*」的提问,奥特曼说:“我们还没准备好谈论这个话题。”
Windows 11 Copilot遭嫌弃,有用户要求微软移除
近日,微软正式向Windows 11用户推送了最新版本的更新。其中,微软将人工智能助理 Copilot 图标置于 Windows 任务栏中心引发用户强烈反对。众多用户在 Reddit 论坛上建议将其移到不显眼的系统托盘,批评其功能不成熟并干扰使用习惯。用户反感主要因强制添加功能和界面混乱,大多主张完全移除 Copilot。
在有关 Copilot 图标位置的 Reddit 帖子中,用户们更倾向于将 Copilot 放置在任务栏的最右侧,靠近时钟、通知和显示桌面按钮的位置。
微软工程师希望将 Copilot 的能力带入 Windows 体验核心部分的这一做法遭到了用户群体的普遍抵制。此前,微软曾表示 Copilot 未来盈利潜力巨大,即使目前尚在摸索阶段。
在 Reddit 论坛上,用户们纷纷表达了对 Copilot 的不满,其中充斥着诸如“让它从我的电脑里滚出去”和“扔进垃圾桶才是它的归宿”之类的评论。许多用户表示他们第一时间禁用了 Copilot,甚至将其隐藏或移除。