2.应用工具相关

EasyControl:高效灵活的多条件控制图像生成框架

EasyControl简介 EasyControl是由Tiamat AI、上海科技大学、新加坡国立大学和Liblib AI联合开发的高效灵活的条件控制框架,专为扩散Transformer(DiT)设计。...

Free4D:华中科技大学推出的4D场景生成框架

Free4D简介 Free4D是由华中科技大学、南洋理工大学S-Lab以及大湾区大学的研究团队共同开发的一种新型4D场景生成框架。它能够从单张图像生成具有时空一致性的4...

AI-ClothingTryOn:开源的桌面虚拟试衣应用

AI-ClothingTryOn 简介 AI-ClothingTryOn 是一款基于 Google Gemini 技术的开源桌面虚拟试衣应用。用户只需上传人物照片和服装图片,即可生成多达 10 种逼真...

Amodal3R:南洋理工大学等推出的3D生成模型

Amodal3R简介 Amodal3R是由南洋理工大学S-Lab、牛津大学视觉几何组和新加坡科技学院联合开发的新型3D生成模型。该模型专注于从部分遮挡的2D图像中重建完整的3...

Qlib:微软研究院开发的AI导向量化投资平台

Qlib简介 Qlib是由微软研究院开发的AI导向量化投资平台,专为应对AI技术在量化投资领域带来的挑战而设计。它采用模块化架构,涵盖数据处理、模型创建、投资组...

Open Deep Search:华盛顿大学等开源的搜索AI框架

Open Deep Search简介 Open Deep Search(ODS)是由Sentient、华盛顿大学、普林斯顿大学和加州大学伯克利分校的研究团队共同开发的开源搜索AI框架,旨在缩小...

Hi3DGen:字节联合清华等高校推出的3D几何生成框架

Hi3DGen简介 Hi3DGen是由香港中文大学(深圳)、字节跳动和清华大学联合开发的高保真3D几何生成框架。该框架通过法线图作为中间表示,有效解决了从2D图像生成...

MegaTTS 3:字节跳动开源的文本到语音模型

MegaTTS 3简介 MegaTTS 3是由字节跳动开源的高效文本到语音(TTS)模型。它以轻量级和高效性为特点,参数量仅0.45亿,却能实现超高音质的语音克隆,支持中文...

ObjectMover:在移动图像位置时能保持物体的身份和外观

ObjectMover简介 ObjectMover是由香港大学和Adobe Research联合开发的一种新型生成模型。该模型能够在一个图像中移动物体,同时保持物体的身份、调整光照和阴...

PhysGen3D:将单张图像转化为一个交互式的3D世界

PhysGen3D简介 PhysGen3D是由清华大学、伊利诺伊大学香槟分校和哥伦比亚大学的研究团队共同开发的一个创新框架,它能够将单张图像转化为一个交互式的3D世界,...
1 2 3 4 78