热搜：编程 Python Microsoft 编程语言 C++

首页> 网络资讯 > 科技新鲜事 > 正文

字节跳动发布两款豆包系列视频模型丨ChatGPT「高级语音模式」功能全量上线丨「Apple智能」对存储空间要求进一步提高

发布时间：2024-09-25 12:00:00 来源：网络

.

互联网2024年9月25日报道丨AI资讯早报字节跳动发布两款豆包系列视频模型：生成效果超可灵AI 9月24日，字节跳动旗下火山引擎在深圳举办AI创新巡展，一举

互联网2024年9月25日报道丨AI资讯早报

字节跳动发布两款豆包系列视频模型：生成效果超可灵AI

9月24日，字节跳动旗下火山引擎在深圳举办AI创新巡展，一举发布了两款AI视频生成大模型，分别为豆包视频生成-PixelDance、豆包视频生成-Seaweed，面向企业市场开启邀测。

根据火山引擎方面介绍，此前国内外大部分的视频生成模型大多只能完成简单的指令，而豆包新出的两款视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。

据火山引擎介绍，豆包视频生成模型基于 DiT 架构，通过高效的DiT融合计算单元，让视频在大动态与运镜中自由切换，拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题。

有国内创作者在抢鲜体验新款的豆包视频生成模型时发现，其生成的视频不仅能够遵循复杂指令，让不同人物完成多个动作指令的互动，人物样貌、服装细节甚至头饰在不同运镜下也保持一致，更加接近于摄像机的实拍效果。

其中，视频生成模型能遵从复杂 prompt，解锁时序性多拍动作指令与多个主体间的交互能力；可以让视频在主体的大动态与镜头中炫酷切换，拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力；在一个 prompt 内实现多个镜头切换，同时保持主体、风格、氛围的一致性。

此外，豆包大模型家族还推出了AI音乐生成模型和同声传译大模型。

目前，新款豆包视频生成模型正在字节跳动旗下的“即梦AI”进行小范围测试，未来将逐步开放给所有用户。

ChatGPT重磅新功能「高级语音模式」全量上线

当地时间9月23日晚间，OpenAI 官方发布通告，人工智能对话机器人 ChatGPT 新版「高级语音模式」将在本周内向所有 Plus 和 Team 用户全量推送。

需要注意的是，新版高级语音模式每天的使用时间也是有限制，并且这个限制也会有所变化，当用户的使用时间剩余 15 分钟时，系统就会发出提醒。这意味着，想要将其作为 24 小时无话不谈的「AI 密友」目前还不太可能。

目前判断你是否已经获得新功能推送的资格有两种简单的方法：

① 第一种，如果获得资格推送，当你首次访问语音模式时，App 中将显示以下通知：

② 第二种方法则是通过检查 ChatGPT 内置的智能合成语音风格的数量来判断。

此前，ChatGPT 支持五种预设语音风格，但后续由于「Sky」语音风格与斯嘉丽·约翰逊的法律纠纷而遭到下架。

「Apple智能」对手机存储空间要求进一步提高

此前，有科技媒体报道称，苹果即将上线的人工智能服务 Apple Intelligence「Apple智能」只支持 iPhone 15 Pro 以上机型及 iPhone 16 系列新品，主要原因是手机的运行内存 RAM 需要至少 8GB，但对于存储空间 ROM 的描述则没有披露。

近日 iOS 18.1 Beta 版本开放测试，在其官方发布的指导手册「iPhone 使用手册」中指出，「iPhone 装置需要 4GB 存储空间」，而在文档最下方还标注「随着更多功能的推出，装置上 Apple 智能的储存要求将进一步提高」。

这意味着，此前使用 128G 容量的 IPhone 可能不太足够，如果想要使用新功能「Apple智能」，或许需要置换存储空间更大的 iPhone 版本。否则，用户在安装 APP 的时候就需要尽可能降低需求了。

腾讯发布起居家用机器人「5号」：可协助老人起床

腾讯旗下的人工智能研究所「腾讯 Robotics X 实验室」在其官方账号发布文章称，该实验室最新研发成果人居环境机器人「5 号」（The Five）正式对外亮相，并且发布了一则宣传片。

官方表示，小五作为腾讯 Robotics X 实验室最新一代机器人，集合了此前多代机器人研发的核心能力，融合了四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项自研技术。

通过该宣传视频，我们可以看到小五可以取拿物品、协助老人起床翻身、为老人推轮椅等等老龄化的康复疗养服务，未来有望进入医院、养老院、福利机构以及个人家庭等应用场景。目前该机器人还处于内测阶段，也没有发布定价策略方面的信息。

东半球最强法务部出手：任天堂利用AI识别马里奥图像

据外媒 The Verge 最新报道，近日，一款经由人工智能技术驱动的版权图像识别 AI 工具，成功让包含 AI 生成的任天堂游戏马里奥的图像帖子得到删除。该 AI 工具属于一家名为 Tracer 的公司，该公司利用人工智能识别技术出了版权图像，并代表任天堂方面，向这些帖子的发布者下达了警告通知。

根据 The Verge 收到的电子邮件爆料，人工智能识别工具 Tracer 向一名推特（X）平台发布帖子的作者寄出了一份包含美国《数字千年版权法》（DMCA）的通知。Tracer 主要服务企业客户，提供人工智能识别服务，据称能够识别在线的商标和版权侵权行为。

Tracer 寄送的下线诉求信息包括——将识别为侵犯任天堂马里奥形象的帖子删除。

The Verge 在报道中表示，因为帖子已经被删除，无法看到该作者发布的马里奥图像长什么样子，以及具体使用了哪种 AI 生成手段创作马里奥的图像。

以下您可能有感兴趣的文章:

标签： 豆包 AI视频字节跳动 chatgpt 苹果 AI机器人 AI版权

OpenAI发布ChatGPT Windows客户端丨微软Azure OpenAI接口终止向国服提供服务丨苹果AI整合ChatGPT将支持文本/图像生成

华军软件园发布9月AI产品榜丨零一万物发布新版大模型Yi-Lightning丨李开复：中美顶尖大模型性能差距只有五个月

苹果发布新一代iPad mini 7搭载「苹果AI」丨Adobe发布多款在线AI修图工具丨微软AI部门副总裁离职加盟OpenAI

重塑AI大模型智能终端新体验，TCL实业亮相中国移动全球合作伙伴大会

OpenAI o1推理能力极限测试丨大模型的推理能力究竟有多脆弱？

苹果10月28日发布iOS 18.1推送「苹果AI」丨Adobe发布AI视频创作工具丨荣耀手机本月底举行两场AI产品发布会

国产AI视频软件再迎重大升级丨可灵1.5版本解锁高质感视频生成，效果堪比大片!

华军AI产品榜【2024年9月】榜单发布丨AI视频赛道杀出黑马，二次元动画利器YoYo燃爆B站

特斯拉机器人发布会“擎天柱”背后有人远程操控丨李开复：零一万物没有放弃训练大模型丨快手推出开源文生视频模型

科技新鲜事热点排行

在线教程
开发软件

查看更多软件 

字节跳动发布两款豆包系列视频模型丨ChatGPT「高级语音模式」功能全量上线丨「Apple智能」对存储空间要求进一步提高

字节跳动发布两款豆包系列视频模型：生成效果超可灵AI

ChatGPT重磅新功能「高级语音模式」全量上线

「Apple智能」对手机存储空间要求进一步提高

腾讯发布起居家用机器人「5号」：可协助老人起床

东半球最强法务部出手：任天堂利用AI识别马里奥图像

为您推荐

谷歌Gemini Pro 1.5「百万Tokens长文本」免费全量开放！一小时电影“投喂”进去，大模型直出神级影评

硅谷版“罗密欧与朱丽叶”：马斯克vs奥特曼的爱恨情仇丨从兄弟同心到对薄公堂，8年发生了什么？

首款AI硬件AI Pin上市即遭翻车口碑丨刘强东AI数字人“采销东哥”今日亮相京东直播丨OpenAI成立东京办事处

「AI教父」辛顿获得2024年诺贝尔物理学奖丨字节豆包将于10月10日发布首款智能硬件丨小鹏P7新车将搭载大模型

马斯克预测：到2029年，AI智商超越人类，比所有人加起来还聪明

科技新鲜事最新文章