AI项目合集

MUMU:一款创新的多模态图像生成模型

MUMU简介 MUMU是由Sutter Hill Ventures的研究团队开发的一款创新的多模态图像生成模型,它能够通过结合文本和图像输入生成新的图像。该模型通过自举方法构建...

HMoE:腾讯混元联合实验室提出的一种新型混合专家模型

HMoE简介 HMoE(Heterogeneous Mixture of Experts)是由腾讯混元联合实验室提出的一种新型混合专家模型,它通过引入大小不同的专家以处理不同复杂性的输入数...

KEEP:将低分辨率的视频人脸图像提升到高分辨率

KEEP简介 KEEP是由新加坡南洋理工大学推出的一种创新的视频人脸超分辨率框架。该框架采用了受卡尔曼滤波原理启发的特征传播技术,能够在视频帧之间保持稳定的...

Magic Fixup:Adobe 推出的一项创新图像编辑技术

Magic Fixup简介 Magic Fixup 是由 Adobe 和马里兰大学帕克分校的研究团队共同开发的一项创新图像编辑技术。这项技术通过观察动态视频,利用扩散模型将粗略编...

awesome-digital-human-live2d:一个开源的数字人技术框架

awesome-digital-human-live2d简介 awesome-digital-human-live2d是一个开源的数字人技术框架,它以模块化和扩展性为核心,支持Docker快速部署和Dify服务集成...

源2.0-M32:浪潮信息推出推出的双语混合专家(MoE)语言模型

源2.0-M32简介 源2.0-M32是由浪潮信息推出推出的先进双语混合专家(MoE)语言模型,采用具有32个专家的架构,其中每次激活2个专家。该模型引入了创新的'Atten...

TrackGo:一种灵活高效的可控视频生成方法

TrackGo简介 TrackGo是由北京航空航天大学和AISphere Tech的联合研究团队开发的一种创新视频生成方法。这项技术允许用户通过自由形式的遮罩和箭头来指定目标...

eSearch:集成了截屏、OCR识别、全文搜索、翻译及录屏等多项实用工具

eSearch简介 eSearch是一款功能全面的开源AI桌面应用,集成了截屏、OCR识别、全文搜索、翻译及录屏等多项实用工具。它基于强大的Lucene全文检索引擎构建,提...

Dify:一个开源的AI应用开发平台

Dify简介 Dify是一个开源的AI应用开发平台,它通过结合后端即服务和LLMOps的理念,为开发者提供了一个快速构建生产级生成式AI应用的可视化界面。它支持广泛的...

MetaHuman-Stream:实时交互流式数字人,实现音视频同步对话

MetaHuman-Stream简介 MetaHuman-Stream 是一项前沿的实时交互技术,它能将数字人类虚拟形象与真实世界无缝融合。通过集成多种AI模型,该技术能够实现高度逼...
1 10 11 12 13 14 39