OmniConsistency:新加坡国立大学推出的图像风格迁移模型
OmniConsistency项目简介 OmniConsistency是由新加坡国立大学Show Lab团队提出的一种创新的图像风格化方法,旨在解决扩散模型在复杂场景中保持风格一致性和防...
MagicTryOn:浙大联合vivo等推出的视频虚拟试衣框架
MagicTryOn项目简介 MagicTryOn是由浙江大学计算机科学与技术学院、vivo移动通信有限公司以及BoardWare Information System Limited的联合开发团队提出的一种...
FLUX.1 Kontext:Black Forest Labs 推出的图像生成与编辑模型
FLUX.1 Kontext项目简介 FLUX.1 Kontext是由Black Forest Labs开发的一种先进的生成式流匹配模型,旨在将图像生成与编辑功能融合于单一架构之中。该模型借助...
2025年6月AI快讯
2025.6.23 1.MiniMax“技术发布周”落幕:发布五款AI新品 6月23日,上海AI独角兽公司MiniMax“技术发布周”已结束,宣告其在基座模型、多模态技术和通用智能体Age...
HunyuanCustom:多模态定制化视频生成框架
HunyuanCustom项目简介 HunyuanCustom是由腾讯Hunyuan团队开发的多模态定制化视频生成框架。它支持基于文本、图像、音频和视频输入生成具有特定主体的视频,...
WebThinker:人民大学联合BAAI等机构开发的深度研究代理框架
WebThinker项目简介 WebThinker是由中国人民大学、北京人工智能研究院(BAAI)和华为泊松实验室联合开发的深度研究代理框架。它旨在通过增强大型推理模型(LR...
OpenCodeReasoning:NVIDIA团队开发的一个大型合成数据集
OpenCodeReasoning项目简介 OpenCodeReasoning是由NVIDIA团队开发的一个大型合成数据集,旨在提升大型语言模型(LLMs)在编程任务中的推理能力。该数据集包含...
KuaiMod:一款基于普通法理念的短视频内容治理框架
KuaiMod项目简介 KuaiMod是由快手公司联合清华大学、中科院自动化所等机构共同开发的一款基于普通法理念的短视频内容治理框架。它通过模拟普通法系统“依据案...
VITA-Audio:一款新型端到端大型语音模型
VITA-Audio项目简介 VITA-Audio是由腾讯优图实验室、南京大学和厦门大学联合开发的一款新型端到端大型语音模型。该模型通过轻量级的多跨模态标记预测(MCTP)...
SuperEdit:字节等推出的新型图像编辑方法
SuperEdit项目简介 SuperEdit是由字节跳动智能创作团队(ByteDance Intelligent Creation)和佛罗里达中央大学计算机视觉研究中心(Center for Research in C...