互联网2024年9月20日报道丨AI资讯早报
快手旗下可灵AI发布V1.5版本模型:新增“运动笔刷”
9月19日,快手旗下AI视频创作平台「可灵AI」对外发布可灵V1.5 模型,新增“运动笔刷”功能。可灵 V1.5 模型是可灵 AI 首个较大数字的版本迭代,针对用户反馈的需求,增强了 AI 视频的生成后编辑能力。
本次版本升级,主要有两大变化。第一是,画质明显提升,可以输出分辨率 1080p 的视频,其二是新增了“运动笔刷”功能,该功能最早由国外 AI 视频平台 Runway 率先打造,被越来越多的用户所青睐。
据介绍,“运动笔刷”功能为图片中的元素(人或物体等)指定运动轨迹,还支持额外指定静止区域,提升画面可控性。
可灵 AI 的视频画质有所提升,同时构图更美观、动作更合理、文本相关性提升,还可以输出多种主流视频尺寸,对于“吃面条”这种难度较大的场景,可灵 AI 生成的画面内容也越来越自然,越来越逼真。
在本次新版本发布的同时,可灵AI团队还对外预告了近期上线的其他值得关注的新功能,包括:
- 一次性生成4条短视频
- 10 秒时长,支持增加尾帧
- 支持视频画质增强
快手高级副总裁盖坤在前几天的 9 月 13 日快手投资者日上披露,截至目前,已有超过 260 万人使用过快手的视频生成大模型可灵 AI,并累计生成超 2700 万个视频。产品发布以来,可灵 AI 已进行了 9 次迭代和升级。
阿里云通义千问发布开源大模型Qwen2.5,旗舰大模型Qwen-Max升级
9月19日,阿里云举办一年一度的云栖大会,在本次大会上,阿里云带来了旗下多款 Qwen系列的 AI 大模型和产品的更新。
通义千问的新一代开源模型 Qwen2.5 正式对外发布,旗舰模型 Qwen2.5-72B 号称在性能上超越 Llama 405B。
Qwen2.5 全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个模型都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型。
值得一提当时 ,通义千问的旗舰大模型 Qwen-Max 也迎来升级,号称性能接近 OpenAI 的 GPT-4o。官方介绍称,相比上一代,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐指令,最终达到了更高的智能水平,数学和代码能力超越了今年 5 月首发的 GPT-4o 版本。
阿里云“通义万相”推出AI文生视频功能
9月19日,在杭州举行的阿里云云栖大会上,阿里云旗下的通义万相视觉内容创作平台仅用数分钟就能生成一段高清、逼真的视频。这是阿里云CTO周靖人首次对外演示通义万相视频生成模型强大的运动生成和概念组合能力。
据悉,通义万相也正式上线了视频生成模型,基于类似Sora 的 DiT 架构,该架构已经被国内 AI 企业所认可。
通义万相对外开放了「文生视频」「图生视频」两个创作入口,支持运动生成、复杂语义理解和概念组合生成等能力,以及勾线动画、国漫 3D、毛毡动画、CG 厚涂、3D 动画、国风画风和元素等风格。
据介绍,通义万相全新视频生成模型,可生成影视级高清视频,可应用于影视创作、动画设计、广告设计等领域。即日起,所有用户可通过通义APP及通义万相官网免费体验。
阿里CEO吴泳铭:AI的想象力可延展改变物理世界
在 2024 年云栖大会上,阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭发表了演讲,谈到了他对于 AI 行业未来发展的看法。
吴泳铭表示,AI 最大的想象力并非在手机屏幕上,而是通过渗透、接管数字世界,并改变物理世界,物理世界的大部分事物将具备 AI 能力,形成下一代全新产品,并与云端 AI 驱动的数字世界连接产生协同效应。
他也认为,和汽车一样,未来每个城市家庭里都会有两三个机器人,帮助人们提升生活中的效率。
生成式AI耗电量巨大:使用GPT-4生成100字需要消耗3瓶水
近日,据《华盛顿邮报》报道,美国加州大学河滨分校的一项新研究揭示了生成式 AI 的惊人环境成本,尤其是其对水资源的消耗。
研究发现,即使只是生成文本,AI 也需要大量的水来冷却服务器。再加上其对电网的巨大压力,进一步凸显了 AI 发展的环境挑战。
研究指出,AI 的用水量因州和数据中心位置的不同而有所差异,但总体而言,水耗与电费成反比。得克萨斯州的水耗比例是最低,生成一封 100 字的电子邮件仅需 235 毫升水,而华盛顿则高达 1.408 毫升,相当于三瓶 16.9 盎司的矿泉水。
此外,数据中心本身就是水电的消耗大户,这也推高了所在地区居民的水电费用。GPT-4 的电力成本也非常高,如果十分之一的美国上班族每周使用一次 GPT-4,那么一年换算下来,其用于生成式 AI 操作的电力消耗将相当于整个华盛顿特区居民 20 天的用电量。