2.应用工具相关
DynamicCity:卡内基梅隆大学等推出的4D动态场景生成框架
DynamicCity简介 DynamicCity是由上海人工智能实验室联合卡内基梅隆大学、新加坡国立大学和南洋理工大学S-Lab团队共同开发的4D LiDAR场景生成框架。该框架专...
MoBA:Moonshot AI提出的新型注意力架构
MoBA简介 MoBA(Mixture of Block Attention)是由Moonshot AI团队开发的一种创新的注意力架构,旨在提升大型语言模型(LLMs)处理长文本序列的效率和性能。M...
ToddlerBot:斯坦福大学开源、兼容机器学习的人形机器人平台
ToddlerBot简介 ToddlerBot是由斯坦福大学的研究团队开发的一款开源、兼容机器学习的人形机器人平台。它专为可扩展的策略学习和机器人与人工智能研究而设计,...
Magma:微软研究院等推出的多模态基础模型
Magma简介 Magma是由微软研究院、马里兰大学、威斯康星大学麦迪逊分校、KAIST和华盛顿大学的研究团队共同开发的多模态基础模型,旨在为数字和物理环境中的多...
Phantom:字节跳动推出的视频生成框架
Phantom简介 Phantom是由字节跳动智能创作团队开发的一种创新视频生成框架,专注于主体一致性的视频生成任务(Subject-to-Video,S2V)。该框架通过跨模态对...
RSIDiff:生成细节丰富、风格多样的高质量图像
RSIDiff简介 RSIDiff是由香港理工大学和中国科学院相关研究团队共同开发的一种创新的扩散模型优化方法。该方法通过递归自我训练(Recursive Self-Improvement...
SkyReels-V1:昆仑万维开源的中国首个面向AI短剧创作的视频生成模型
SkyReels V1简介 SkyReels V1 是由昆仑万维开源的中国首个面向AI短剧创作的视频生成模型。通过在超过1000万高质量影视片段上微调,SkyReels V1 实现了开源模...
SkyReels-A1:昆仑万维开源的肖像动画框架
SkyReels-A1简介 SkyReels-A1是由昆仑万维开源的肖像动画框架,基于视频扩散Transformer(DiT)架构,旨在生成高质量的动态肖像动画。该框架通过表情感知条件...
Matrix3D:苹果联合南京大学等推出的摄影测量模型
Matrix3D简介 Matrix3D是由南京大学、苹果公司和香港科技大学联合开发的新型的统一摄影测量模型。该模型通过融合多模态扩散变换器(DiT),实现了姿态估计、...
ImageRAG:利用检索增强生成的图像生成技术
ImageRAG简介 ImageRAG 是由特拉维夫大学、英伟达和雷赫曼大学联合开发的一种创新图像生成方法,旨在通过动态检索相关图像来增强预训练文本到图像(T2I)模型...