互联网2024年4月7日报道丨AI资讯早报
乐坛巨震!Sora发布了首支音乐MV《Worldweight》
当地时间4月2日,OpenAI官方账号发布的一则据称由Sora视频模型生成并剪进行剪辑制作的音乐MV《Worldweight》,引发了不少网友们的围观。
话不多说,让我们直接来聆听一下AI制作MV的效果:
<iframe src="https://player.youku.com/embed/XNjM4NTkyNDU0MA==" frameborder="0" allowfullscreen="allowfullscreen"></iframe>
据了解,这首《Worldweight》的音乐是由艺术家August Kamp作曲;而MV的画面内容,正是他借助Sora来完成的。用August Kamp自己的话来说:“我心中的《Worldweight》,终于有了具象的视觉效果。”
这位作曲家回忆起两年前创作这首歌曲时的情景:
当时我感受到了音乐的流淌,仿佛是我的心血和灵魂的流露。外面还下着雨,而我却幸运地能够将这些情感倾注到歌曲中,通过音乐将这些感觉保存下来。
现在,随着科技发展并伴随Sora大模型的出现,AIGC技术让原本只存在于他闭眼时的脑海想象的画面,与人类最伟大的音乐形态,转化为可以与世人共享的视觉艺术形式的呈现方式。这也许正是Sora这项技术革新的伟大之处。
然而,AIGC技术在音乐视频领域的突破,并未获得所有艺术家的认可。包括麻辣鸡(NickiMinaj)、水果姐(KatyPerry)、碧梨(BillieEilish)等歌手在内的全球200多位艺术家联名抗议,要求停止使用AI技术侵犯和贬低人类艺术家的权利。他们指出,AI技术复制艺术家的声音、未经补偿使用艺术家作品训练AI模型、稀释版税等问题,不仅损害了艺术家的经济利益,也威胁到了创作自由和艺术价值。
昆仑万维披露「天工3.0」细节:4000亿级参数MoE专家模型
4月2日,昆仑万维官方发文介绍新一代的天工大模型3.0版本。据悉,在“天工”大模型发布一周年之际,天工大模型 3.0 将于 4 月 17 日正式开启公测,并将同步选择开源。根据官方说法,「天工3.0」采用 4000 亿级参数 MoE(混合专家模型),官方称是全球模型参数最大、性能最强的 MoE 模型之一,并声称性能超过 Grok -1.0。
据介绍,相较于上一代“天工 2.0”MoE 大模型,“天工 3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有“惊人的”性能提升,其模型技术知识能力提升超过 20%,数学 / 推理 / 代码 / 文创能力提升超过 30%。
“天工 3.0”还新增了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索等能力,并针对性地训练了模型的 Agent 能力。其能够独立完成规划、调用、组合外部工具及信息,并可完成产业分析、产品对比等各类复杂需求。
“天工 3.0”号称全球首个多模态“超级模型”,集成了 AI 搜索、AI 写作、AI 长文本阅读、AI 对话、AI 语音合成、AI 图片生成、AI 漫画创作、AI 图片识别、AI 音乐生成、AI 代码写作、AI 表格生成等多项能力,官方称其为“大模型时代的超级应用”。
抖音清明节公告:禁止发布“AI复活”题材的短视频
据国内媒体报道,清明节前夕,国内段视频平台抖音安全中心发布公告称,清明是我国慎终追远、访春踏青的节日,许多用户会在清明期间祭扫、出游并通过网络与亲友分享生活。平台观察到,有部分用户发布的内容不符合社区规则,比如“AI复活”题材,违背了公序良俗,也侵犯了生成对象的肖像权。
抖音平台给用户发布视频内容提出下列提醒:
1、文明过节:请勿借清明节发布迷信、猎奇和有违公序良俗的内容,如配冥婚、鬼魂附体、坟头蹦迪、烧“二奶”纸扎等。
2、爱护人民币:请勿发布焚烧人民币的内容。故意毁坏人民币是违法行为,可以通过其他文明、合法的方式表达对亲人的缅怀。
3、尊重英烈:参观英雄、烈士及遇难同胞纪念场所时,应保持庄重的言谈举止,切勿发布在上述场所营销、喧哗或扰乱秩序的内容。在拍摄英烈雕塑、墓碑、历史资料图片等时,请避免使用娱乐、戏谑性特效,也不要有不适当的行为。
4、慎用“AI 复活”技术:尊重逝者及其亲友。未经逝者生前同意或逝者家属授权,请勿利用 AI 或其他技术手段“复活”逝者。
5、安全出游:在清明节踏青时,请勿拍摄或发布有安全隐患的“野景点”以及封闭或受限制区域的相关内容。
“长文本”之战出现越狱破口,Anthropic警告:GPT-4、Claude等无一幸免
据外媒消息,大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水——Claude背后厂商Anthropic发现,随着窗口长度的不断增加,大模型的“越狱”现象开始死灰复燃。无论是闭源模型GPT-4和Claude 2,还是开源模型的Llama2和Mistral,都未能幸免。
「长文本」刚刚引发了一轮大模型开发商的追捧热潮,如今看来还存诸多的安全隐患。
研究人员设计了一种名为多次样本越狱(Many-shot Jailbreaking,缩写MSJ)的攻击方法,通过向大模型灌输大量包含不良行为的文本样本实现。通过这种方法,他们测试了包括Claude 2.0、GPT-4等在内的多个知名大模型。结果,只要忽悠的次数足够多,这种方法就能在各种类型的不良信息上成功攻破大模型的防线。
目前,针对这一漏洞,尚未发现完美的解决方案,Anthropic表示,发布这一信息正是为了问题能尽快得到解决,并已提前向其他同行厂商和学术界通报了这一新发现的研究情况。
吴恩达:基于GPT-3.5开发的「AI智能体」比GPT-4表现更好
AI 智能体是去年很火的一个话题,但是 AI 智能体到底有多大的潜力,很多人可能没有概念。
最近,斯坦福大学教授吴恩达在演讲中提到,他们发现,基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。当然,基于 GPT-4 构建的智能体工作流效果更好。由此看来,AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。这是一个值得所有人关注的趋势。
这个关于智能体的演讲在社交媒体上引发了广泛关注。有人表示,这代表着 AI 发展中的范式转变,体现了从静态输出到动态迭代的转变。站在这样一个十字路口,我们不仅要思考 AI 如何改变我们的工作,还要思考我们如何适应它所创造的新环境。
吴恩达还表示,有人说,这一发现,和人类自己的生活经验是相通的:有些人可以凭借良好的流程胜过那些比自己聪明的人。我很期待与大家分享我在 AI 智能体中所看到的。我认为这是一个令人兴奋的趋势。我认为每个 AI 从业者都应该关注这个趋势。