Genesis:卡内基梅隆大学联合多所机构推出的开源生成式物理引擎
Genesis简介 Genesis是由卡内基梅隆大学(CMU)与20多所研究机构联合开发的开源生成式物理引擎,旨在推动机器人技术和物理模拟的进步。该引擎以其超高性能著...
FluxSpace:允许用户通过文本提示来引导图像编辑过程
FluxSpace简介 FluxSpace是一种基于流匹配变换器的图像编辑方法,它能够在不需要手动掩码的情况下,对图像进行细粒度到粗粒度的语义编辑。这种方法通过控制变...
SUGAR:能够根据输入的单个主体图像生成视频
SUGAR简介 SUGAR是一种创新的零样本主体驱动视频定制方法,能够在无需测试时微调的情况下,根据用户输入的图像和文本描述生成与文本视觉属性对齐的视频。它通...
MIVE:Adobe联合韩国高校推出的多实例视频编辑框架
MIVE简介 MIVE是由Adobe联合韩国科学技术院、 韩国中央大学推出的多实例视频编辑框架。该框架通过创新的Disentangled Multi-instance Sampling(DMS)和Insta...
ObjectMate:将对象无缝且逼真地插入到由图像或文本描述的场景中
ObjectMate简介 ObjectMate是由谷歌和耶路撒冷希伯来大学联合开发的一种先进的图像合成方法,它能够在无需额外调整的情况下,将对象无缝且逼真地插入到由图像...
Genex:允许智能体在心理上探索3D环境
Genex简介 Genex是由约翰霍普金斯大学的研究团队开发的一种创新框架,它允许智能体在无需物理移动的情况下,通过心理上探索大规模3D环境并更新其对世界状态的...
EMMA-X:新加坡科技设计大学推出的多模态动作模型
EMMA-X简介 EMMA-X是由新加坡科技设计大学的研究团队开发的一个多模态动作模型,它通过结合具体化的思考链和前瞻性空间推理,显著提升了机器人在复杂任务中的...
MV-Adapter:生成在不同视角下一致的图像
MV-Adapter简介 MV-Adapter是由北京航空航天大学软件学院、VAST以及上海交通大学的研究团队共同开发的一种创新适配器,旨在简化多视图一致图像的生成过程。它...
ColorFlow:腾讯联合清华大学推出的图像序列着色模型
ColorFlow简介 ColorFlow是由清华大学与腾讯PCG的ARC实验室联合开发的一种先进的图像序列着色模型,旨在自动化地将黑白图像转换为彩色版本,同时精确保持角色...
RDT-1B:清华大学推出的机器人双手臂操作的基础模型
RDT-1B简介 RDT-1B是由清华大学的研究团队开发的机器人双手臂操作的基础模型,它基于扩散模型,能够有效地表示多模态性,并采用创新的可扩展Transformer架构...