聊天图标
群聊 - 0 用户在线

欢迎来到 AI 图像与视频中心。所有 AI 生成内容 - 版权所有 2023-2026

进入论坛 提示词搜索 图像/视频搜索 关于 街机 规则

🎨 文本生成图像模型

Flux

前沿的文本生成图像技术。包括:Z-Image Turbo、Ernie Turbo、Shuttle AI 3.0 和 3.1、Flux Unchained、Flux Dev Turbo、Flux Dev Enhanced。卓越的提示词遵循能力和照片级真实感。

7 个模型 1280x768 1920x1080 1536x1536 2倍放大 Turbo 和增强版 最佳质量

Qwen 图像 和 Qwen 编辑

高分辨率生成,支持放大功能。原生分辨率 1280x768 和 1920x1080,可选 2 倍放大。Qwen 编辑支持通过文本指令进行精确的图像修复和修改。

1280x768 1920x1080 1536x1536 2倍放大 文本引导编辑 3 个图像输入

FLUX Fill(图像修复)

使用 FLUX 架构的高级图像修复。替换物体或删除不需要的元素,结果自然且融合良好。

图像修复 遮罩 无缝修改

Stable Diffusion 3.5

5 种不同的 SD3.5 模型。相比 SDXL,提示词遵循能力更强、排版效果更好、构图更一致。Stable Diffusion 技术的下一个进化。

5 个模型 1280x768 1024x1024 2倍放大 更好的提示词遵循 高质量

SDXL(Stable Diffusion XL)

经典可靠!23 种不同的 SDXL 模型和 38 个 LoRA。种类繁多,模型库庞大,但模型较旧——提示词遵循能力较弱。适合实验和多种风格。

23 个模型 38+ LoRA 1280x768 1024x1024 2倍放大 种类繁多

🎬 视频生成

文本生成视频(WAN 2.2)

直接从文本描述生成视频。WAN 2.2 模型可生成最长 10 秒的一致动态场景。调整时长、帧率和种子以实现可重复性。视频保存到库中并附带所有元数据。

WAN 2.2 528x288 640x360 960x512 1-10 秒 15-30 帧/秒 种子控制

文本生成视频(LTX 2.3)

直接从文本描述生成视频。LTX 2.3 模型可生成最长 10 秒的一致动态场景。调整时长、帧率和种子以实现可重复性。视频保存到库中并附带所有元数据。该模型还增加了音频控制!

LTX 2.3 512x320 640x384 960x512 1-10 秒 15-30 帧/秒 种子控制 音频

图像生成视频(WAN 2.2)

用 AI 让任何图像动起来。上传起始图像并添加运动提示词。WAN 2.2 让您的静态图像栩栩如生,实现流畅的运动、平移、缩放和物体移动,同时保持原始构图。

WAN 2.2 528x288 640x360 960x512 1-10 秒 15-30 帧/秒 种子控制

图像生成视频(LTX 2.3)

用 AI 让任何图像动起来。上传起始图像并添加运动提示词。LTX 2.3 让您的静态图像栩栩如生,实现流畅的运动、平移、缩放和物体移动,同时保持原始构图。该模型还增加了音频控制!

LTX 2.3 512x320 640x384 960x512 1-10 秒 15-30 帧/秒 种子控制 音频

🎵 音频生成

Ace Step v1.5 - 音乐和歌曲生成

只需一个简单的文本提示即可创作真正的歌曲!生成完整的器乐曲或带歌词的歌曲。描述流派、情绪、节奏和歌词主题。该模型可创建连贯的音乐作品,包括人声、伴奏音轨和适当的结构。

器乐或歌词 任何流派 真正的歌曲 高质量