AI开源项目
DressRecon:从单目视频重建出包含形状、外观和动态变化的4D人体模型
DressRecon简介 DressRecon是一种创新的4D人体重建方法,旨在从单目视频中生成时间一致的人体模型,特别关注宽松衣物和手持物体的动态交互。该技术由卡内基梅...
Podcastfy:将多种文本内容转换为生动的音频对话
Podcastfy简介 Podcastfy 是一个开源 Python 包,旨在将多种文本内容(如网页和 PDF 文件)转换为生动的音频对话。它利用先进的生成式人工智能技术,支持多语...
Inverse Painting:从一幅已完成的绘画作品中重建其创作过程
Inverse Painting简介 Inverse Painting是一种创新的人工智能技术,由华盛顿大学的研究团队开发。这项技术能够从一幅已完成的绘画作品中重建其创作过程,生成...
Playground v3:Playground Research推出的文本到图像生成模型
Playground v3简介 Playground v3(PGv3)是由Playground Research团队最新开发的文本到图像生成模型,它通过深度融合大型语言模型(LLMs),在文本提示的遵...
Lotus:基于扩散的高质量密集预测可视化基础模型
Lotus简介 Lotus是由香港科技大学(广州)、阿德莱德大学和华为诺亚方舟实验室的研究人员联合开发的一种新型视觉基础模型。该模型基于扩散模型,专门针对高质...
CapsWriter-Offline:一个 PC 端的语音输入、字幕转录工具
CapsWriter-Offline简介 CapsWriter-Offline是一款离线语音输入和转录工具,专为PC用户设计。它允许用户在没有互联网连接的情况下进行长时间的语音录入和实时...
GS-VTON:可以在3D空间中试穿服装 无需实体试衣
GS-VTON简介 GS-VTON是一种先进的3D虚拟试穿技术,由南洋理工大学S-Lab、上海人工智能实验室和伊斯法罕理工大学的研究团队共同开发。这项技术通过3D高斯绘制...
VirtualWife:一个虚拟数字人项目 支持B站直播
VirtualWife简介 VirtualWife是一个AI虚拟数字人项目,专注于开发具备人工智能的互动角色,主要用于直播平台如B站。该项目结合了自然语言处理和机器学习技术...
ChopperBot:一个AI驱动的直播视频编辑与发布机器人
ChopperBot简介 ChopperBot是一个AI驱动直播视频编辑与发布机器人,旨在帮助内容创作者高效管理和分发直播内容。它支持多平台,如斗鱼、虎牙、B站、抖音和Twi...
Depth Pro:苹果公司推出的一款零样本单目深度估计模型
Depth Pro简介 Depth Pro是由苹果公司推出的一款零样本单目深度估计模型。它能够快速生成高分辨率、细节丰富的度量深度图,无需依赖相机内部参数。Depth Pro...