AI项目合集

VFusion3D:根据单个图像或文本描述生成高质量的 3D 素材

VFusion3D简介 VFusion3D是由Meta公司的GenAI团队和牛津大学Torr Vision Group联合开发的一种创新3D生成模型。这项技术突破性地利用预训练的视频扩散模型,通...

CodeFormer:南洋理工大学推出的一种盲人面部修复方法

CodeFormer简介 CodeFormer是由南洋理工大学S-Lab团队开发的一种先进的盲人面部修复方法。它利用一个学习到的离散代码本先验和基于Transformer的预测网络,将...

EXAONE 3.0:LG AI Research开发的7.8B参数指令调整型语言模型

EXAONE 3.0简介 EXAONE 3.0是由LG AI Research团队开发的先进语言模型,具有7.8亿参数的指令调优能力,专门设计以提升双语环境下的表现,尤其在韩语上表现卓...

MDM:苹果开源的新型图像&视频生成模型

MDM简介 Matryoshka Diffusion Models(MDM)是由苹果公司开发的创新框架,旨在解决生成高分辨率图像和视频时面临的计算和优化挑战。MDM通过一个端到端的多分...

LSLM:具备边听边说能力的语音模型,实现实时的双向交流

LSLM简介 LSLM(Listening-while-Speaking Language Model)是由上海交通大学人工智能教育部重点实验室X-LANCE实验室与字节跳动公司联合开发的创新性端到端模...

Deep-Live-Cam:一款开源的 AI 实时换脸工具

Deep-Live-Cam简介 Deep-Live-Cam 是一个开源的 AI 实时换脸工具,它通过先进的实时面部识别和替换技术,仅需一张静态图片,便能在视频流或直播中以假乱真地...

Aide:一款免费开源的AI 编程插件

Aide简介 Aide是一个开源的Visual Studio Code插件,它通过一系列强大的功能,如一键代码转换、智能注释添加、内容智能粘贴、AI驱动的批量文件处理、变量名智...

Qwen2-Math:阿里通义团队推出的的数学专用AI模型

Qwen2-Math简介 Qwen2-Math是阿里巴巴通义团队开发的一款先进的数学解决方案模型,它通过专门化的预训练和精细调整,显著提升了解决包括代数、几何、概率在内...

Matting by Generation:一种新型的图像抠图技术

Matting by Generation简介 'Matting by Generation'是一种前沿的图像抠图技术,它将传统的基于回归的抠图任务转化为一种生成模型问题。这项技术通过使用潜在...

SAM-Graph:基于多视图信息的3D实例分割框架

SAM-Graph简介 SAM-Graph是一种创新的3D实例分割方法,由浙江大学、北京师范大学、蚂蚁集团和深圳大学的联合研究团队开发。该方法通过结合3D几何信息和多视图...
1 15 16 17 18 19 39