AI项目库
Aether:通过几何感知推理推动世界模型的发展
Aether项目简介 AETHER是由上海人工智能实验室开发的一个创新性统一框架,旨在通过几何感知推理推动世界模型的发展。该框架通过联合优化4D动态重建、动作条件...
Infinite Mobility:大规模合成高保真的关节物体
Infinite Mobility项目简介 Infinite Mobility是由上海人工智能实验室、华南理工大学、中国科学技术大学、同济大学、复旦大学、哈尔滨工业大学(深圳)、中国...
ChatTS:清华联合字节推出的新型多模态大语言模型
ChatTS项目简介 ChatTS是由清华大学和字节跳动的研究团队共同开发的一种新型多模态大语言模型(MLLM),专门用于时间序列分析。该模型通过合成数据进行训练,...
GigaTok:用于自回归图像生成的视觉分词器
GigaTok项目简介 GigaTok是由香港大学和字节跳动联合开发的项目,旨在通过扩展视觉分词器的参数规模来提升自回归图像生成的性能。该项目首次提出了一种语义正...
SkyReels-V2:昆仑万维SkyReels团队推出的无限时长电影生成模型
SkyReels-V2项目简介 SkyReels-V2是由Skywork AI团队开发的无限长度电影生成模型,旨在突破现有视频生成技术在视觉质量、运动动态和持续时间上的限制。该模型...
InstantCharacter:腾讯联合InstantX推出的角色定制化框架
InstantCharacter项目简介 InstantCharacter是由腾讯混元团队和InstantX团队共同开发的创新性角色定制化框架。它基于可扩展的扩散变换器(Diffusion Transfor...
FramePack:斯坦福大学推出的神经网络结构
FramePack项目简介 FramePack是由斯坦福大学的研究团队提出的一种创新神经网络结构,专门用于提升视频生成中下一帧预测模型的性能。该技术通过巧妙地对输入帧...
MineWorld:微软研究院开发的一个实时交互式世界模型
MineWorld项目简介 MineWorld是由微软研究院开发的一个实时交互式世界模型,基于热门游戏Minecraft。该模型利用视觉-动作自回归Transformer架构,通过将游戏...
HumanRig:阿里开发的首个大规模3D人形角色骨骼绑定数据集
HumanRig项目简介 HumanRig是由阿里巴巴AMAP团队开发的首个大规模3D人形角色骨骼绑定数据集。该数据集包含11,434个精心策划的T姿势网格模型,这些模型都符合...
Cobra:清华大学联合腾讯推出的高效线稿上色框架
Cobra简介 Cobra是由清华大学和腾讯ARC实验室联合开发的高效线稿上色框架,专为漫画行业设计。它通过整合超过200张参考图像,实现高精度、高效率和灵活的上色...