热搜：编程 Python Microsoft 编程语言 C++

首页> 网络资讯 > 科技新鲜事 > 正文

Stable Diffusion 3将在6月12日正式开源！照片真实感、样式、图片质量、算力资源消耗等大幅优化

发布时间：2024-06-04 15:56:24 来源：网络

.

6月3日晚，著名开源大模型平台Stability AI的联合首席执行官Christian Laforte，在AMD的产品发布会上宣布，文生图模型 Stable

6月3日晚，著名开源大模型平台Stability AI的联合首席执行官Christian Laforte，在AMD的产品发布会上宣布，文生图模型 Stable Diffusion 3将于6月12日在Hugging Face开源权重。

本次开源的是Stable Diffusion 3的Medium模型，有20亿参数，在照片真实感、样式、图片质量、算力资源消耗等方面都进行了大幅度优化，将比前两代更好。

同时Stable Diffusion 3也是对标闭源文生图产品Midjourney、DALL·E 3的最佳模型之一，该系列已经被全球数百万开发者使用，很多文生视频/3D模型也借鉴了该架构。

今年2月22日，Stability AI首次预览了Stable Diffusion 3.其逼真的图片质量、更好的文本语义理解与文字嵌入，使得全球开发者们对这个模型相当期待。

但在3月23日，Stability AI的首席执行官Emad Mostaque被辞退，随后又爆出财务危机正在寻求买家等不少负面新闻，大家开始担心Stable Diffusion 3的开源还能否顺利进行。

好在Stability AI都挺过来了，而此时其新上任的联合首席执行官在AMD的产品发布会宣布这个事情，估计已经获得了ADM的赞助还很可能被全资收购。

与英伟达相比，AMD在大模型、生成式AI的部署、开发等方面略处于落后，Stability AI开源的大语言模型、扩散模型等的下载量合计超过千万级别，拿下它等同于收获了一大批开发者。

Stable Diffusion 3架构简单介绍

根据Stable Diffusion 3论文显示，使用了与Sora相同的架构Diffusion Transformer。

Diffusion模型作为生成模型的一种，主要通过数据到噪声的逆过程来创造新的数据点。这种方法在图像和视频生成方面应用非常广泛。

但是随着Diffusion不断迭代，预训练、推理对算力需求呈指数级增长，对于中小企业、个人开发者来说非常不友好。

所以，在Diffusion基础之上又融合了大模型界非常知名的Transformer架构，通过独立的权重处理图像和文本模态，并实现了这两种模态之间的双向信息流。

Diffusion Transformer架构引入新的噪声采样技术，改进了训练Rectified Flow模型的方法。通过偏向感知上相关的尺度，提高了训练的效率和性能。

该架构采用了模拟无关的流训练方法，直接回归一个向量场，用于生成数据分布和噪声分布之间的概率路径，有效避免了求解常微分方程所带来的超高算力成本，同时也极大增强了文本语义理解、文字嵌入和图片样式等。

Stable Diffusion 3生成展示

其实在Stability AI发布预览版时，已经公布了一大批Stable Diffusion 3生成的图片，基本上与Midjourney、DALL·E 3这两款知名产品差不多。

例如，教室里，黑板上用白色粉笔写着 "GPUs go brrmr"，这是一个肯定而幽默的场景。黑板前，一群学生正在庆祝。这些学生被独特地描绘成鳄梨，长着小胳膊小腿，脸上洋溢着喜悦和兴奋的表情。

这个场景捕捉到了一种充满童趣和想象力的氛围，将传统教室的概念与牛油果学生的奇特形象融为一体。

一只半透明的猪，里面是一只更小的猪。

一只青蛙坐在20世纪50年代的快餐厅里，穿着皮夹克，戴着礼帽。桌子上有一个巨大的汉堡和一个写着“Froggy Fridays”的牌子。

一只巨大、威严的白色巨龙，它有多个角和类似须的触角，翱翔在崎岖的山脉景观之上。

这条龙有着明亮的橙色眼睛，似乎在清澈的蓝天下飞翔在蓬松的白云之间。周围有尖锐的积雪覆盖的山峰，以及一座类似古代寺庙或塔楼的小建筑。

目前，Stable Diffusion 3 Medium模型只能用于学术研究无法商业化。如果在正式开源后，想商业化的开发者可以联系Stability AI。

想使用Stable Diffusion 3 Turbo和其他版本的需要开通Stability AI的会员。

申请地址：https://stability.ai/stablediffusion3

以下您可能有感兴趣的文章:

标签： Stability AI Stable Diffusion stable diffusion 3

OpenAI发布ChatGPT Windows客户端丨微软Azure OpenAI接口终止向国服提供服务丨苹果AI整合ChatGPT将支持文本/图像生成

华军软件园发布9月AI产品榜丨零一万物发布新版大模型Yi-Lightning丨李开复：中美顶尖大模型性能差距只有五个月

苹果发布新一代iPad mini 7搭载「苹果AI」丨Adobe发布多款在线AI修图工具丨微软AI部门副总裁离职加盟OpenAI

重塑AI大模型智能终端新体验，TCL实业亮相中国移动全球合作伙伴大会

OpenAI o1推理能力极限测试丨大模型的推理能力究竟有多脆弱？

苹果10月28日发布iOS 18.1推送「苹果AI」丨Adobe发布AI视频创作工具丨荣耀手机本月底举行两场AI产品发布会

国产AI视频软件再迎重大升级丨可灵1.5版本解锁高质感视频生成，效果堪比大片!

华军AI产品榜【2024年9月】榜单发布丨AI视频赛道杀出黑马，二次元动画利器YoYo燃爆B站

特斯拉机器人发布会“擎天柱”背后有人远程操控丨李开复：零一万物没有放弃训练大模型丨快手推出开源文生视频模型

科技新鲜事热点排行

在线教程
开发软件

查看更多软件 

Stable Diffusion 3将在6月12日正式开源！照片真实感、样式、图片质量、算力资源消耗等大幅优化

Stable Diffusion 3架构简单介绍

Stable Diffusion 3生成展示

为您推荐

Adobe与OpenAI、Runway、Pika达成合作丨奥特曼：AI成本最终趋于零丨斯坦福报告：中国AI专利数全球遥遥领先

一篇关于OpenAI的PDF文档全网疯传 - 计划2027年前开发出通用人工智能（AGI）？

国内大模型创企“月之暗面”发布Kimi模型重磅升级：扩容200万字上下文窗口，新增「继续」延长回复按钮

下一个OpenAI来了？Mistral超大杯模型直逼GPT-4，93年创始人6人公司被微软认领

马斯克 xAI 推出 Grok-1.5 大语言模型：提升推理能力，可处理128k上下文

科技新鲜事最新文章