TaoAvatar:阿里推出的实时生成逼真全身动态3D虚拟形象的系统
TaoAvatar简介 TaoAvatar是由阿里巴巴集团开发的实时生成逼真全身动态3D虚拟形象的系统。该系统基于3D高斯点绘(3DGS)技术,结合个性化的人体参数化模板和轻...
DeepMesh:清华联合南洋理工大学等推出的3D网格生成框架
DeepMesh简介 DeepMesh是由清华大学、南洋理工大学和圣书科技的研究团队共同开发的一种创新的3D网格生成框架,旨在通过结合自回归方法和强化学习技术高效生成...
URAE:用于超高分辨率图像生成的适应框架
URAE简介 URAE(Ultra-Resolution Adaptation with Ease)是由新加坡国立大学(National University of Singapore)的研究团队开发的一套用于超高分辨率图像...
MoshiVis:Kyutai开源的多模态语音模型
MoshiVis简介 MoshiVis是由Kyutai开源的多模态语音模型,旨在结合视觉理解和语音交互能力,使模型能够自然地与用户进行关于图像内容的实时语音对话。该模型基...
Video-T1:通过测试时扩展(TTS)显著提升视频生成质量
Video-T1简介 Video-T1 是一种创新的视频生成框架,旨在通过测试时扩展(Test-Time Scaling, TTS)显著提升视频生成质量。它将视频生成的 TTS 重新定义为从高...
BlockDance:复旦大学联合字节推出的扩散模型加速方法
BlockDance简介 BlockDance是由复旦大学智能信息处理实验室、上海智能视觉计算协同创新中心以及字节跳动智能创作团队共同开发的一种加速扩散变换器(Diffusio...
SISO:个性化图像生成和编辑技术
SISO简介 SISO(Single Image Subject Optimization)是一种图像生成和编辑技术,能够在无需训练的情况下,仅通过一张特定主题的图像来个性化图像生成和编辑...
Qwen2.5-VL-32B:阿里开源的最新多模态模型
Qwen2.5-VL-32B简介 Qwen2.5-VL-32B 是由阿里巴巴团队开发的最新多模态模型,参数规模为为32B。该模型在视觉语言理解和生成方面表现出色,能够处理图像描述、...
百度正式全量上线国内首个对话式应用开发平台“秒哒”
2025年3月24日,百度正式全量上线国内首个对话式应用开发平台“秒哒”。该平台以无代码开发为核心,通过自然语言交互即可生成应用代码,最快3分钟完成开发。依...
DeepSeek-V3 模型完成小版本升级
DeepSeek-V3 模型在 2025 年 3 月 24 日完成了小版本升级,版本号更新为 DeepSeek-V3-0324。此次升级带来了显著的性能优化,特别是在编程能力方面大幅提升,...