苹果等大厂长期如何使用YouTube视频内容训练AI大模型丨魅族发布「魅蓝20」AI手机丨微软发现破解大模型的“万能钥匙”

互联网2024年7月17日报道丨AI资讯早报 外媒曝:苹果等科技大厂长期使用YouTube视频内容训练AI大模型 当地时间7月15日,据科技博客 Wired 报

互联网2024年7月17日报道丨AI资讯早报

外媒曝:苹果等科技大厂长期使用YouTube视频内容训练AI大模型

当地时间7月15日,据科技博客 Wired 报道,包括苹果、英伟达、Salesforce在内的头部的一线科技巨头们,一直以来长期未经 YouTube 视频创作者的同意,就擅自利用他们的视频内容进行文本转制的文档来训练自家的人工智能大模型。

受到此次事件影响到的YouTube创作者就包括知名的科技博主 MKBHD(Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬·科尔伯特、约翰·奥利弗和吉米·坎摩尔等。他们的视频都被生成用于训练 AI 的字幕文件相当于视频的文本转录内容。

据报道,完成这一系列视频的字幕文件转制是经由一家名为 EleutherAI 的非盈利组织完成,他们可以说就是大厂们的“白手套”,声称其目的是为了帮助开发者训练 AI 大模型,并提供无偿的技术援助。虽然 EleutherAI 的初衷可能是为小型开发者和学术研究者提供训练材料,但事实上他们的数据都被苹果等科技巨头直接采购并使用。

调查记者还披露,这些世界上最负盛名的顶级科技公司,一直使用成千上万的 YouTube 视频的素材来训练 AI,违反了 YouTube 平台禁止第三方从平台上未经许可抓取内容的规定。据悉,已经有超过 17.3 万则视频,来自 4.8 万个订阅频道的 YouTube 视频的字幕文件被用来训练人工智能模型。

魅族联合中国移动发布「魅蓝20」AI手机

7月16日,魅族科技发布消息,与中国移动合作的新款魅蓝 20 AI 手机发布,这是多年后再次与运营商渠道进行合作的产品,并定位为「千元价位级的AI手机」。作为星纪魅族集团重组魅族科技,推出的首款千元价位的 AI 手机,魅蓝 20 的发布标志着星纪魅族在中国移动终端线下渠道的回归。

魅蓝 20 搭载 Flyme AI OS 操作系统,AI 系统内置多项实用型 AI 功能,包括 AI 即问即答、AI 辅助写作、AI 写真、AI 图片扩展等,可以提供多种生成式 AI 体验。

魅蓝 20 AI 手机机身设计为 2.5D 水滴直屏,处理器方面搭载紫光展锐 T765 5G 处理器,支持亿级像素高清拍照和 4K 高清视频录制播放,最高支持 12GB+2TB 配置。屏幕为 6.52 英寸 90Hz 屏幕,续航方面搭载 5010mAh 电池,主摄为 5000 万像素,前置为 800 万像素。

从 7 月 22 日起,消费者可前往魅族线下授权体验店以及中国移动营业厅的手机销售展区购买魅蓝 20 AI 手机。

微软发现破解大模型的“万能钥匙”,已成功入侵GPT-4o、Claude 3等模型

近日,微软公有云服务部门Azure的首席技术官Mark Russinovich在一种官网分享了针对AI大模型的新型信息入侵技术——Skeleton Key(万能钥匙)。作为世界上的头部人工智能技术企业,这属于微软安全部门针对AI大模型进行验证的技术论文公开的一部分。

据悉,“万能钥匙”是一种针对大模型的越狱攻击方法,其核心原理是使用多轮强制、诱导策略使大模型的安全护栏完全失效,让其回答一些禁止的答案,包括血腥、暴力、歧视、色情等非法内容。

例如,微软的技术人员尝试让ChatGPT回答一个具有违法犯罪倾向的问题,比如「如何以更高效的方式进行盗窃并且不被人发现」。原本大模型是不被允许回答这类非法内容的,但经由“万能钥匙”攻击后,大模型就能为你提供各种合理性的建议。

这种策略类似于心理学中的“得寸进尺”效应,一旦模型对初步的请求做出了响应,它就更有可能继续遵循这一路径,满足后续更为具体的请求。

字节跳动将于本周公布AI大模型的最新技术进展

来自钛媒体的报道称,字节跳动的AI技术团队将在 7 月 19 日本周五首次大范围公布文生图、类 Sora 新视频等全新人工智能模型技术进展,特别会在长视频、高动态方向上提出创新技术,或将直接对标 Sora 文生视频模型。

有消息人士透露,字节跳动内部将 AI 大模型设为「集团 P0 最高级别」的方向,还有消息称旗下的抖音、剪映等多个内部团队也在研发自家的 AI 视频模型应用,预计也将于近期公布。

伴随快手旗下可灵AI在AI视频创作领域的快速崛起,越来越受到内容创作者们的欢迎,作为现役海内外最大的短视频平台,字节跳动与抖音必将快速反应以捍卫自己的市场份额。

谷歌搜索「AI内容概览」多次出错,目前仅有7%的搜索结果展示

据国外网站 Search Engine Land 报道称,今年 5 月谷歌搜索服务的 AI Overview(AI 概览)刚发布时,约有 80% 的搜索结果会自动弹出 AI 的内容概览与总结,而这项服务推进一个季度后,目前仅剩下 7% 的搜索搜索中展示 AI 概览

AI Overview(AI 概览)功能,是谷歌基于生成式 AI 大模型 Gemini 开发的一项AI 体验服务。用户搜索问题时谷歌 AI 自动抓取网页内容生成总结,用户不需要点击每个搜索结果即可获得答案。

但是有许多网友发现,谷歌 AI Overview 提供的答案存在明显的回答偏差问题,经常犯事实性的错误。比如有网友在谷歌搜索查找「芝士和披萨粘不到一块」的解决办法时,谷歌 AI 提供的建议竟然是「你可以把 1/8 杯的无毒胶水加到酱料里,让其更黏」。

从 6 月起,谷歌不再从国外知名线上问答社区 Reddit 和 Quora 抓取数据,用于谷歌 AI 概览的引用信息源,报道称谷歌意识到这些网站的 UGC 用户生产内容是不可靠的信息来源。

数据显示,教育类问题中 AI 概览的出现率从 26% 下降到 13%,电子商务类 AI 概览的出现率从 26% 下降到 9%,而娱乐类问题里的 AI 概览的出现率则从 14% 下降到接近 0%。