通过Qwen2VL的视觉理解能力增强FLUX的一款多模态图像生成模型:Qwen2

JavaEdge聊AIss 2024-11-26 01:52:24

通过Qwen2VL的视觉理解能力增强FLUX的一款多模态图像生成模型:Qwen2vl-Flux,核心能力是更能“理解”图片 支持多种生成模式,比如图像变体,可以保持原图风格,生成相似但不同的版本,且能很好的保持原图关键特征。还有图像到图像转换、图像修复等 能控制结构,理解图片里的线条、深度,使生成的图片结构更准确,以防扭曲或变形 支持多种宽高比,最高1536x1024 编程严选网

0 阅读:0
JavaEdge聊AIss

JavaEdge聊AIss

感谢大家的关注