Magic Mirror:生成具有电影级质量和动态运动的身份保持视频
Magic Mirror简介 Magic Mirror是由来自香港中文大学、香港科技大学、SmartMore和卡内基梅隆大学的研究团队共同开发的创新框架,旨在生成具有电影级质量和动...
MagicFace:芬兰奥卢大学联合东南大学推出的面部表情编辑框架
MagicFace简介 MagicFace是由芬兰奥卢大学机器视觉与信号分析中心和东南大学生物科学与医学工程学院联合开发的高保真面部表情编辑框架。该框架通过控制面部动...
DaS:将简单的动画网格转换成视觉上丰富且高质量的视频
Diffusion as Shader简介 Diffusion as Shader(DaS)是由香港科技大学、浙江大学、武汉大学、南洋理工大学、新加坡国立大学、德克萨斯A&M大学等高校和研...
STAR:将低分辨率的现实世界视频恢复成高分辨率版本
STAR简介 STAR是由南京大学、字节跳动和西南大学联合开发的一种新颖的现实世界视频超分辨率(VSR)框架。该框架通过整合强大的文本到视频(T2V)扩散模型,旨...
SPRIGHT:首个专注于空间关系的大规模视觉-语言数据集
SPRIGHT简介 SPRIGHT是由亚利桑那州立大学、英特尔实验室、Hugging Face、华盛顿大学和马里兰大学巴尔的摩分校的研究团队共同开发的首个专注于空间关系的大规...
LIGER:Meta推出的结合生成式与密集检索的混合推荐模型
LIGER简介 LIGER(LeveragIng dense retrieval for GEnerative Retrieval)是由Meta AI团队提出的一种创新的混合推荐模型。该模型巧妙地融合了生成式检索和序...
SeedVR:能够从低质量输入视频中重建出高质量的输出视频
SeedVR简介 SeedVR是由Nanyang Technological University和ByteDance联合开发的一款创新的扩散变换器模型,旨在实现高质量的通用视频修复。该模型通过引入移...
AutoDroid-V2:清华大学推出的移动UI自动化代理系统
AutoDroid-V2 简介 AutoDroid-V2 是由清华大学人工智能产业研究院(AIR)开发的一款创新的移动 UI 自动化代理系统。该系统通过将 UI 任务自动化问题转化为代...
EnerVerse:智元机器人团队推出的首个机器人4D世界模型
EnerVerse简介 EnerVerse是由智元机器人团队推出的首个机器人4D世界模型,旨在为机器人操纵任务生成具身未来空间。该框架通过块状自回归扩散模型和自由锚视图...
Seer:实现对机器人动作的高效学习和精准预测
Seer简介 Seer是由上海人工智能实验室、北京大学计算机学院、北京大学软件与微电子学院、香港中文大学等机构联合开发的一款先进的机器人操控模型。该模型基于...