Flux 是由 Black Forest Labs(Stable Diffusion 原班人马创立)推出的最新一代开源图像生成模型。Flux 在图像质量、文字渲染和指令跟随方面达到了开源模型的新高度,被社区广泛认为是目前最强的开源文生图模型。它同时提供开源版本(Flux.1 Dev / Schnell)和闭源 API 版本(Flux.1 Pro),覆盖从个人创作者到企业级部署的全场景需求。
核心能力
- 开源旗舰画质:Flux.1 Dev 在多项基准测试中超越 SD3 和 DALL·E 3
- 精准文字渲染:在图像中生成清晰的英文文字,支持复杂排版和多行文本
- 指令跟随优秀:对复杂描述的细节还原度高,包括数量、颜色、位置等
- 多种变体:Flux.1 Pro(闭源 API)、Flux.1 Dev(开源非商用)、Flux.1 Schnell(极速开源)
- LoRA 训练支持:社区已推出大量 Flux LoRA 模型,可微调特定风格和角色
- ComfyUI / WebUI 兼容:与主流开源绘图界面无缝集成
- ControlNet 支持:社区已开发出 Flux 版 ControlNet,实现精准构图控制
版本对比
| 版本 | 价格 | 特点 |
|---|---|---|
| Flux.1 Schnell | 免费开源 | 1-4 步快速生成,Apache 2.0 许可 |
| Flux.1 Dev | 免费开源 | 高质量非商用,需遵守许可协议 |
| Flux.1 Pro | API 按量计费 | 最高质量,商用许可 |
适用场景
- 商业设计:海报、Banner、社交媒体配图——文字渲染能力特别适合带文字的设计
- 概念艺术:游戏和影视的概念设定
- 电商素材:产品展示图、广告图
- 内容创作:博客配图、新闻封面、演示文稿插图
- 风格迁移:通过 LoRA 微调实现特定画风的定制化生成
优点与不足
优点
- 开源模型中的画质天花板,尤其文字渲染远超同类
- Black Forest Labs 团队技术实力强,迭代速度快
- 社区生态快速成长,LoRA 模型数量爆发式增长
- Schnell 版本生成速度极快,适合批量生产
不足
- 对硬件要求较高(Flux.1 Dev 推荐 12GB+ 显存)
- 中国大陆需要科学上网下载模型(HuggingFace)
- LoRA 训练需要较大的计算资源
- 非技术用户上手有一定门槛
访问方式
本地部署:从 HuggingFace 下载模型权重,配合 ComfyUI 使用。API 使用:通过 Replicate、fal.ai 等平台调用 Flux.1 Pro。国内部分云 GPU 平台也已提供 Flux 一键部署服务。