AI项目合集

Imagen 3:谷歌推出的文本到图像生成模型,现已通过ImageFX向公众开放

Imagen 3简介 Imagen 3是Google DeepMind开发的一款文本到图像的生成模型,它通过深度学习技术,能够根据用户输入的文本描述生成高质量的图像。该模型支持多...

WiseFlow:用于在海量信息中高效地挖掘和整理数据的开源工具

WiseFlow简介 WiseFlow 是一个开源的智能信息挖掘工具,专门设计用于在海量信息中高效地挖掘和整理数据。它利用先进的自然语言处理技术和大型语言模型,能够...

EAFormer:复旦大学研发的边缘感知文本分割技术

EAFormer简介 EAFormer是一种先进的场景文本分割技术,由复旦大学的智能信息处理研究团队开发。这项技术通过利用边缘感知变换器(Edge-Aware Transformers)...

ReSyncer:可以实现音视频唇型同步、说话风格迁移和换脸

ReSyncer简介 ReSyncer是由清华大学BNRist实验室与百度公司共同开发的先进框架,它通过创新性地重新配置基于风格的生成器,并融合3D人脸动态预测技术,实现了...

HumanVid:为人类图像动画提供训练资料的大型高质量数据集

HumanVid简介 HumanVid 是由香港中文大学和上海人工智能实验室联合开发的大型高质量数据集,旨在为人类图像动画提供训练资料。该数据集通过结合精心挑选的现...

UniBench:Meta等推出的视觉语言模型的系统性评估工具

UniBench简介 UniBench 是由 Meta、Univ Gustave Eiffel、CNRS 和 LIGM 联合开发的一项创新工具,旨在为视觉-语言模型(VLM)提供一个统一的评估平台。它集成...

Agents:以数据为中心、自我进化的自主语言代理的开源框架

Agents简介 Agents是由AIWaves开发的一种先进的语言代理框架,它通过结合大型语言模型(LLMs)的强大计算能力和复杂的提示技术,使得这些代理能够自主解决现...

VideoDoodles:可在视频中插入手绘动画 且与原视频内容无缝融合

VideoDoodles简介 VideoDoodles 是一项创新的视频编辑技术,它通过先进的3D场景重建和自定义追踪算法,使用户能够在视频中轻松添加手绘动画。这些动画不仅能...

ExAvatar:从单个视频中创建出全身3D模型,包括面部、身体和手部。

ExAvatar简介 ExAvatar是由DGIST和Meta公司的Codec Avatars Lab开发团队创造的3D数字形象生成模型。它通过结合全身参数化网格模型(SMPL-X)和3D高斯Splattin...

Tailor:一款视频智能裁剪、视频生成和视频优化的工具

Tailor简介 Tailor是一款免费开源的视频编辑工具,它集成了先进的人工智能技术,提供视频剪辑、生成和优化三大功能。用户可以轻松实现人脸和语音的精准剪辑,...
1 14 15 16 17 18 39