2.应用工具相关
Cube 3D:Roblox推出的AI 3D 生成模型
Cube 3D简介 Cube 3D 是由 Roblox 开发团队推出的一款 AI 3D 生成模型,旨在通过生成式 AI 技术简化 3D 内容创作。它能够根据文本描述快速生成 3D 模型和环境...
ReasonGraph:可视化和分析大型语言模型的推理过程
ReasonGraph简介 ReasonGraph是由剑桥大学和莫纳什大学的研究团队共同开发的一个基于网络的平台,旨在可视化和分析大型语言模型(LLMs)的推理过程。该平台支...
GR00T N1:英伟达开源的人形机器人基础模型
GR00T N1简介 GR00T N1 是由 NVIDIA 开发团队推出的一款面向人形机器人的开源基础模型。该团队致力于开发能够理解人类世界、遵循语言指令并执行多样化任务的...
Skywork R1V:昆仑万维开源的多模态推理模型
Skywork R1V简介 Skywork R1V是由昆仑万维开源的多模态推理模型,它通过高效的多模态转移技术,将R1系列大型语言模型的推理能力扩展到视觉模态。该模型利用轻...
SmolDocling:专为端到端多模态文档转换而设计
SmolDocling简介 SmolDocling是由IBM Research和HuggingFace联合开发的超紧凑型视觉-语言模型,专为端到端多模态文档转换而设计。该模型通过生成DocTags标记...
Silent Branding Attack:在生成的图像中嵌入特定品牌标志或符号
Silent Branding Attack简介 Silent Branding Attack 是由韩国科学技术院(KAIST)和 DeepAuto.ai 团队开发的一种新型数据投毒攻击方法,专门针对文本到图像...
I2V3D:将静态图像转化为具有精确 3D 控制的动态视频
I2V3D简介 I2V3D 是由香港城市大学和微软通用人工智能项目团队共同开发的一种创新框架,旨在将静态图像转化为具有精确 3D 控制的动态视频。该技术结合了计算...
AMIS:百度团队开发的前端低代码框架
AMIS 简介 AMIS 是由百度团队开发的前端低代码框架,旨在通过简洁的 JSON 配置快速生成各种后台页面。它极大地降低了开发成本,即使开发者对前端技术不熟悉,...
Chirp 3:谷歌云推出的高清语音合成模型
Chirp 3 简介 Chirp 3 是由谷歌云开发的高清语音合成模型。该模型专为生成自然、生动且富有情感的语音而设计,支持 248 种不同声音和 31 种语言,能够捕捉人...
ReCamMaster:快手联合浙大等推出的视频重渲染框架
ReCamMaster简介 ReCamMaster是由浙江大学、快手科技、香港中文大学和华中科技大学的研究团队共同开发的一种创新的视频重渲染框架。该框架能够通过改变相机轨...