OOTDiffusion：虚拟服装模特试穿开源工具 | AI启航工具箱（OPEN AICHINES）

OOTDiffusion：一个高度可控的虚拟服装试穿开源工具，可以根据不同性别和体型自动调整，和模特非常贴合。也可以根据自己的需求和偏好调整试穿效果，OOTDiffusion支持半身模型和全身模型两种模式。

OOTDiffusion GitHub：https://github.com/levihsu/OOTDiffusion

OOTDiffusion：虚拟服装模特试穿开源工具

OOTDiffusion核心功能：

OOTDiffusion基于潜在扩散模型技术，实现了高质量的服装图像生成和融合，确保试穿效果自然且逼真。
OOTDiffusion支持两种模型虚拟试穿，一个是半身模型，专为上半身的服装试穿设计，适合T恤、衬衫等上身服装。另外一个是全身模型，支持全身的服装试穿，包括上身、下身和连衣裙等服装类型，用户可以根据需求选择适合的模型进行试穿。
OOTDiffusion支持参数调整，你可以通过调整模型路径、服装路径、缩放比例和采样次数等参数来精细控制试穿的细节和效果，以满足不同的试穿需求。
通过精心设计的算法，OOTDiffusion能够将选定的服装自然且逼真地融合到用户提供的模型图像中，无论是纹理、光影还是服装的自然摆动都能精确呈现。

不过，试玩一下后，发现用OOTDiffusion自己的DEMO图片效果非常好，换了自已上传的素材，效果差很多，说明对人像位置体型，以及服装款式的要求还是比较高的。

OOTDiffusion如何用？

选择好性别、体型和右边的服装，然后点下面的RUN按钮，稍等十几秒就可以生成了。

相关导航

DiffusionGPT：LLM驱动的文本生成图像

DiffusionGPT: LLM-Driven Text-to-Image Generation SystemDiffusionGPT，字节跳动开发的由LLM驱动文本生成图像多合一系统，专门设计用于为不同的输入提示生成高质量的图像。其主要目标是解析输入提示并确定产生最优结果的生成模型，该模型具有高泛化、高效用和方便的特点。

DreamTalk：可以让人物照片说话的开源框架

DreamTalk，一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话，支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。

Audio2Photoreal：音频生成逼真的虚拟人物

Meta ai最近发布了一项炸裂的技术：Audio2PhotoReal，从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。GitHub is where over 100 million developers shape the future of software, together. Contribute to the open source community, manage your Git repositories, review code like a pro, track bugs and features, power your CI/CD and DevOps workflows, and secure code before you commit it.

Zero123：单张图片生成高质量3D

Zero123：单张图片生成高质量3D

SoraWebui：文生视频开源项目

SoraWebui 是一个开源 Web 平台，使用户能够使用 Openai 的 Sora 模型从文本生成视频。SoraWebui简化了视频创建过程，支持在Vercel上进行一键部署，让开发者能够方便地进行使用和测试。

Make-A-Character：文生3D人

Make-A-Character，通过一句话描述人的脸型、五官、发型特征，即可高效率、规模化地生成具备全栈式美术能力的超写实3D数字人。生成结果包含人头人体，配饰服装，并支持表情动画资产进行驱动，让3D数字人栩栩如生地动态化展示。你也可以自定义面部特征，例如脸型、眼睛颜色、发型、眉毛类型、嘴巴和鼻子，以及添加皱纹和雀斑等。Make-A-Character支持英文和中文提示。