中文多模态大模型SuperCLUE-V榜单发布丨Stability AI推出Stable Fast 3D模型丨Meta AI向好莱坞明星采买声音授权

互联网2024年8月5日报道丨AI资讯早报 中文多模态大模型SuperCLUE-V榜单发布 8月2日,国内最具影响力的权威中文大模型基准测评模态 SuperCL

互联网2024年8月5日报道丨AI资讯早报

中文多模态大模型SuperCLUE-V榜单发布

8月2日,国内最具影响力的权威中文大模型基准测评模态 SuperCLUE-V 基准 8 月榜单发布,腾讯混元大模型位居国内大模型首位(71.95 分),而排名第一依旧是雷打不动的 GPT-4o。

根据腾讯方面宣称,该模型准确识别图像元素并生成自然语言描述,全方位理解并洞察细节。此次测评覆盖了 12 个国内外高代表性的多模态理解大模型,腾讯混元模型在多模态基础能力和应用能力中获得 71.95 的分数。

8 月榜单中涵盖国内外最具代表性的 12 个多模态理解大模型。腾讯混元大模型在总榜上位居第二,仅次于 GPT-4o。GPT-4o 取得 74.36 分,领跑多模态基准,基础多模态认知能力和应用能力均有 70 + 分的表现,在技术和应用方面均有一定领先优势。

一张图0.5秒生成3D建模:Stability AI推出Stable Fast 3D模型

当地时间8月2日,Stability AI 推出了一款名为「Stable Fast 3D」的 AI 图形建模生成架构的新模型,该模型主打“图生 3D 模型”,号称只需 0.5 秒就能快速生成完整且自然的 3D 模型,目前该模型已在 Hugging Face 平台上架。

体验地址:https://huggingface.co/stabilityai/stable-fast-3d

Stable Fast 3D 只需要单张图片即可快速生成高质量的 3D 模型,相关模型自带材质及对应的参数,同时提供了精确的 UV 展开(UV Unwrapping)便于用户进行后期修改,如果用户需要,还可以选择四边形或三角形网格重建功能,相关工作只需多耗费 100 至 200 毫秒时间即可完成,能够允许用户更细致地控制模型网格拓扑结构。

Stability AI 将 Stable Fast 3D 模型与上半年发布的 SV3D 模型进行比较,强调了 Stable Fast 3D 图生模型的速度提升之大,号称在保证精度的情况下令单个模型推理时间从 10 分钟缩短至 0.5 秒,具有一定的实际效益。

官方同时提到,Stable Fast 3D 能够在利用图片生成模型时尽可能减少原图中主体受光照影响的痕迹,以便于生成的模型在不同的环境光照下都可以呈现出正确的颜色。

OpenAI将为AI安全部门分配至少20%的计算资源

当地时间8月1日,OpenAI CEO奥特曼在推特(X)平台发布推文称,已经确定了旗下的 AI 安全研究部门的应用资源与预算。宣布将为 AI 安全相关研究和开发工作,保障提供至少 20% 计算资源。

今年5月底,美国人工智能研究实验室与OpenAI联合组建了一支新的安全团队,由CEO 奥特曼亲自领导,以取代由前任首席科学家Ilya Sutskever领导的「超级对齐团队」,这支新成立的团队将由奥特曼信任的员工亲自督导。

奥特曼在推文中写道:正如我们在 7 月下旬所承诺的,我们公司将保障调配至少 20% 的计算资源,用于 AI 安全方面的工作。

奥特曼还提到,OpenAI已经与美国的人工智能安全研究所达成协议,让后者可以提前访问到 OpenAI 开发的下一代基础模型,共同推动人工智能评估的科学发展。

他承诺,将对于现任和前任员工能提出关于 AI 安全方面担忧提供“定心丸”。安全对于任何一家 AI 公司都至关重要,对于我们来说尤其如此,也是我们安全计划的重要组成部分。

奥特曼同时宣布,已经在今年 5 月取消了针对 OpenAI 所有的现任和离职员工签署的带有贬损性的保密条款,以及赋予 OpenAI 可以随意取消该名员工的既得股权权利。在社会与公众的舆论压力下,OpenAI不得不做出了以上妥协。

英伟达回应AI芯片短缺:产能爬坡中

近期,The Information 的一篇报道指出,有两名帮助英伟达生产芯片和服务器硬件的人士表示,因为存在设计缺陷, 英伟达即将推出的 AI 芯片将被推迟至少三个月。这可能会对 Meta、谷歌和微软等客户造成影响,这些客户总共订购了价值数百亿美元的芯片。

8 月 4 日,英伟达中国方面就此事回应咨询的第一财经记者,英伟达市场人员表示:「正如我们之前所说,Hopper 的需求非常强劲,Blackwell 的样品试用已经广泛开始,产量有望在下半年增加。除此之外,我们不对谣言发表评论」。

据英伟达官方介绍,Blackwell 是英伟达推出的一种全新的 GPU 架构,专为万亿参数规模的生成式 AI 模型设计。该架构 GPU 具有 2080 亿个晶体管,采用专门定制的台积电 4NP 工艺制造。

Meta计划向好莱坞明星采购AI声音使用许可

据彭博社报道,Meta 准备向好莱坞明星们提供数百万美元,以换取他们的录音和在人工智能项目中使用他们的声音的权利。知情人士表示,Meta 正在与朱迪·丹奇、奥卡菲娜和基根·迈克尔·基等人,就采买声音授权的事宜进行交涉。

报道指出,Meta 公司正在加紧达成交易,以便有时间开发一套人工智能工具,并在 9 月份的 Connect 2024 活动上亮相。

知情人士表示,虽然目前还不完全清楚 Meta 将如何使用这些声音,但已经讨论了一款可以充当数字助理或朋友的聊天机器人。例如,用户可以与拥有奥卡菲娜声音的聊天机器人交谈。