3.AI大模型数据库
Cradle:使AI Agent像人一样通过控制键盘鼠标来完成计算机任务
Cradle简介 Cradle是由北京人工智能研究院(BAAI)、新加坡南洋理工大学和北京大学计算机学院的联合研究团队开发的一款新型智能代理框架。该框架旨在通过模拟...
Data-Juicer :阿里推出的一站式大型语言模型(LLMs)数据处理系统
Data-Juicer简介 Data-Juicer 是由阿里推出的一款一站式大型语言模型(LLMs)数据处理系统。它通过提供超过50个内置操作符,支持用户灵活地组合和扩展,以生...
VITA:腾讯等推出的开源多模态大型语言模型
VITA简介 VITA是由腾讯优图实验室联合南京大学、厦门大学以及中国科学院自动化研究所的研究人员共同开发的开源多模态大型语言模型。它集成了对视频、图像、文...
CharacterFactory:大连理工推出的能创建具有一致身份特征角色的框架
CharacterFactory简介 CharacterFactory是由中国大连理工大学的研究团队开发的一项创新技术,它是一个利用生成对抗网络(GANs)和扩散模型来创建具有一致身份...
ReSyncer:可以实现音视频唇型同步、说话风格迁移和换脸
ReSyncer简介 ReSyncer是由清华大学BNRist实验室与百度公司共同开发的先进框架,它通过创新性地重新配置基于风格的生成器,并融合3D人脸动态预测技术,实现了...
HumanVid:为人类图像动画提供训练资料的大型高质量数据集
HumanVid简介 HumanVid 是由香港中文大学和上海人工智能实验室联合开发的大型高质量数据集,旨在为人类图像动画提供训练资料。该数据集通过结合精心挑选的现...
VideoDoodles:可在视频中插入手绘动画 且与原视频内容无缝融合
VideoDoodles简介 VideoDoodles 是一项创新的视频编辑技术,它通过先进的3D场景重建和自定义追踪算法,使用户能够在视频中轻松添加手绘动画。这些动画不仅能...
Tailor:一款视频智能裁剪、视频生成和视频优化的工具
Tailor简介 Tailor是一款免费开源的视频编辑工具,它集成了先进的人工智能技术,提供视频剪辑、生成和优化三大功能。用户可以轻松实现人脸和语音的精准剪辑,...
VFusion3D:根据单个图像或文本描述生成高质量的 3D 素材
VFusion3D简介 VFusion3D是由Meta公司的GenAI团队和牛津大学Torr Vision Group联合开发的一种创新3D生成模型。这项技术突破性地利用预训练的视频扩散模型,通...
EXAONE 3.0:LG AI Research开发的7.8B参数指令调整型语言模型
EXAONE 3.0简介 EXAONE 3.0是由LG AI Research团队开发的先进语言模型,具有7.8亿参数的指令调优能力,专门设计以提升双语环境下的表现,尤其在韩语上表现卓...