AI项目库
新FLUX.1 Kontext:Black Forest Labs 推出的图像生成与编辑模型
FLUX.1 Kontext项目简介 FLUX.1 Kontext是由Black Forest Labs开发的一种先进的生成式流匹配模型,旨在将图像生成与编辑功能融合于单一架构之中。该模型借助...
HunyuanCustom:多模态定制化视频生成框架
HunyuanCustom项目简介 HunyuanCustom是由腾讯Hunyuan团队开发的多模态定制化视频生成框架。它支持基于文本、图像、音频和视频输入生成具有特定主体的视频,...
WebThinker:人民大学联合BAAI等机构开发的深度研究代理框架
WebThinker项目简介 WebThinker是由中国人民大学、北京人工智能研究院(BAAI)和华为泊松实验室联合开发的深度研究代理框架。它旨在通过增强大型推理模型(LR...
OpenCodeReasoning:NVIDIA团队开发的一个大型合成数据集
OpenCodeReasoning项目简介 OpenCodeReasoning是由NVIDIA团队开发的一个大型合成数据集,旨在提升大型语言模型(LLMs)在编程任务中的推理能力。该数据集包含...
KuaiMod:一款基于普通法理念的短视频内容治理框架
KuaiMod项目简介 KuaiMod是由快手公司联合清华大学、中科院自动化所等机构共同开发的一款基于普通法理念的短视频内容治理框架。它通过模拟普通法系统“依据案...
VITA-Audio:一款新型端到端大型语音模型
VITA-Audio项目简介 VITA-Audio是由腾讯优图实验室、南京大学和厦门大学联合开发的一款新型端到端大型语音模型。该模型通过轻量级的多跨模态标记预测(MCTP)...
SuperEdit:字节等推出的新型图像编辑方法
SuperEdit项目简介 SuperEdit是由字节跳动智能创作团队(ByteDance Intelligent Creation)和佛罗里达中央大学计算机视觉研究中心(Center for Research in C...
Insert Anything:浙大联合哈佛大学等推出的图像插入框架
Insert Anything项目简介 “Insert Anything”是由浙江大学、哈佛大学和南洋理工大学联合开发的创新图像插入框架。该框架能够将参考图像中的对象无缝集成到目标...
D-DiT:字节联合耶鲁大学等推出的多模态扩散模型
D-DiT项目简介 D-DiT(Dual Diffusion Transformer)是由卡内基梅隆大学、耶鲁大学和字节跳动联合开发的一种新型多模态扩散模型。它通过创新的双分支架构,将...
ICEdit:浙大联合哈佛大学推出的新型指令式图像编辑方法
ICEdit项目简介 ICEdit是由浙江大学与哈佛大学共同开发的一种新型指令式图像编辑方法。该方法基于大规模扩散变换器(Diffusion Transformer),通过上下文生...