PixelFlow:香港大学联合Adobe推出的图像生成模型
PixelFlow简介 PixelFlow是由香港大学和Adobe联合开发的一种新型图像生成模型。它摒弃了传统潜在空间模型依赖预训练变分自编码器(VAE)的模式,直接在原始像...
MedReason:南洋理工大学等推出的医学推理框架
MedReason简介 MedReason是由美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等多所高校和机构推出的医学推理框架。该框架旨在通过...
Seaweed-7B:字节跳动推出的视频生成基础模型
Seaweed-7B简介 Seaweed-7B是由字节跳动公司开发的一款视频生成基础模型,拥有约70亿参数。该模型由字节跳动的研究团队精心打造,旨在以较低的计算成本实现高...
ScholarCopilot:卡内基梅隆大学等推出的学术写作辅助框架
ScholarCopilot简介 ScholarCopilot是由加拿大滑铁卢大学、卡内基梅隆大学、多伦多向量研究所等机构的联合研究团队开发的学术写作辅助框架。它通过动态检索令...
HoloPart:香港大学等推出的新型3D部分感知分割模型
HoloPart简介 HoloPart是由香港大学和VAST项目团队共同开发的新型3D部分感知分割模型。该模型旨在将3D形状分解为完整的语义部分,即使这些部分被遮挡。Hol...
UniRig:清华推出的新型自动骨骼绑定框架
UniRig简介 UniRig是由清华大学计算机科学与技术系BNRist团队开发的一种新型自动骨骼绑定框架。该框架旨在为多样化3D模型(包括人类、动物和虚构角色等)提供...
FlexIP:腾讯推出的新型图像生成编辑框架
FlexIP简介 FlexIP是由腾讯推出的一种新型图像生成编辑框架,旨在解决在个性化图像生成中身份保持与多样化编辑之间的权衡问题。该框架通过引入双适配器架...
FantasyTalking:阿里联合北邮推出的音视频驱动的肖像动画生成框架
FantasyTalking简介 FantasyTalking是由阿里巴巴集团AMAP团队和北京邮电大学联合开发的一种新型音视频驱动的肖像动画生成框架。该技术利用预训练的视频扩...
字节豆包发布 GUI Agent 模型豆包1.5·UI-TARS
2025年4月17日,字节跳动豆包大模型团队(Seed)正式发布并开源了UI-TARS-1.5。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行...
微信上线首个AI助手“元宝”
2025年4月16日,微信正式上线了首个AI助手“元宝”。用户可以通过搜索“元宝”并将其添加为好友,直接在微信聊天界面与其互动。元宝搭载了腾讯混元和DeepSeek双模...