AI开源项目
UniBench:Meta等推出的视觉语言模型的系统性评估工具
UniBench简介 UniBench 是由 Meta、Univ Gustave Eiffel、CNRS 和 LIGM 联合开发的一项创新工具,旨在为视觉-语言模型(VLM)提供一个统一的评估平台。它集成...
Agents:以数据为中心、自我进化的自主语言代理的开源框架
Agents简介 Agents是由AIWaves开发的一种先进的语言代理框架,它通过结合大型语言模型(LLMs)的强大计算能力和复杂的提示技术,使得这些代理能够自主解决现...
VideoDoodles:可在视频中插入手绘动画 且与原视频内容无缝融合
VideoDoodles简介 VideoDoodles 是一项创新的视频编辑技术,它通过先进的3D场景重建和自定义追踪算法,使用户能够在视频中轻松添加手绘动画。这些动画不仅能...
Tailor:一款视频智能裁剪、视频生成和视频优化的工具
Tailor简介 Tailor是一款免费开源的视频编辑工具,它集成了先进的人工智能技术,提供视频剪辑、生成和优化三大功能。用户可以轻松实现人脸和语音的精准剪辑,...
VFusion3D:根据单个图像或文本描述生成高质量的 3D 素材
VFusion3D简介 VFusion3D是由Meta公司的GenAI团队和牛津大学Torr Vision Group联合开发的一种创新3D生成模型。这项技术突破性地利用预训练的视频扩散模型,通...
CodeFormer:南洋理工大学推出的一种盲人面部修复方法
CodeFormer简介 CodeFormer是由南洋理工大学S-Lab团队开发的一种先进的盲人面部修复方法。它利用一个学习到的离散代码本先验和基于Transformer的预测网络,将...
EXAONE 3.0:LG AI Research开发的7.8B参数指令调整型语言模型
EXAONE 3.0简介 EXAONE 3.0是由LG AI Research团队开发的先进语言模型,具有7.8亿参数的指令调优能力,专门设计以提升双语环境下的表现,尤其在韩语上表现卓...
MDM:苹果开源的新型图像&视频生成模型
MDM简介 Matryoshka Diffusion Models(MDM)是由苹果公司开发的创新框架,旨在解决生成高分辨率图像和视频时面临的计算和优化挑战。MDM通过一个端到端的多分...
Deep-Live-Cam:一款开源的 AI 实时换脸工具
Deep-Live-Cam简介 Deep-Live-Cam 是一个开源的 AI 实时换脸工具,它通过先进的实时面部识别和替换技术,仅需一张静态图片,便能在视频流或直播中以假乱真地...
Aide:一款免费开源的AI 编程插件
Aide简介 Aide是一个开源的Visual Studio Code插件,它通过一系列强大的功能,如一键代码转换、智能注释添加、内容智能粘贴、AI驱动的批量文件处理、变量名智...