博客 | 第 2 页 | 柒柒AI导航

Insert Anything：浙大联合哈佛大学等推出的图像插入框架

Insert Anything项目简介 “Insert Anything”是由浙江大学、哈佛大学和南洋理工大学联合开发的创新图像插入框架。该框架能够将参考图像中的对象无缝集成到目标...

2-2.应用工具图像

2个月前

D-DiT项目简介 D-DiT（Dual Diffusion Transformer）是由卡内基梅隆大学、耶鲁大学和字节跳动联合开发的一种新型多模态扩散模型。它通过创新的双分支架构，将...

2-5.应用工具其他

2个月前

ICEdit项目简介 ICEdit是由浙江大学与哈佛大学共同开发的一种新型指令式图像编辑方法。该方法基于大规模扩散变换器（Diffusion Transformer），通过上下文生...

2-2.应用工具图像

2个月前

FlexiAct项目简介 FlexiAct是由清华大学深圳国际研究生院和腾讯ARC实验室联合开发的一种灵活动作控制技术。该技术能够在异构场景中将参考视频的动作精准地转...

AI项目库

2个月前

LaRI项目简介 LaRI（Layered Ray Intersections）是由KAUST（阿卜杜拉国王科技大学）、Google和慕尼黑工业大学联合开发的一种从单张图像中推理三维几何结构的...

2-2.应用工具图像

2个月前

ACE-Step项目简介 ACE-Step是由ACE Studio和StepFun联合开发的开源音乐生成模型。它通过整合多种先进技术，如基于扩散的生成方式、深度压缩自编码器和轻量级...

AI项目库

2个月前

T2I-R1项目简介 T2I-R1是由中国香港中文大学（深圳）多媒体实验室（MMLab）和上海人工智能实验室联合开发的一种新型推理增强型文本到图像生成模型。该模型通...

2-2.应用工具图像

2个月前

ReasonIR-8B项目简介 ReasonIR-8B是由 Meta AI研究团队开发的一种新型检索器。它是首个专门针对推理密集型任务训练的检索器，通过结合公共数据和合成数据进行...

2-5.应用工具其他

2个月前

Voila项目简介 Voila是由Maitrix.org、加州大学圣地亚哥分校和穆罕默德·本·扎耶德人工智能大学（MBZUAI）联合开发的语音语言基础模型家族。该团队致力于打造...

AI项目库

2个月前

UniTok项目简介 UniTok是由香港大学、字节跳动公司和华中科技大学联合开发的一种创新的统一视觉分词器。它旨在弥合视觉生成与理解之间的差距，为多模态大语言...

2-2.应用工具图像

2个月前