AI开源项目
FIND3D:加州理工学院开发的3D部分分割模型
FIND3D简介 FIND3D是由加州理工学院开发的一种先进的3D部分分割模型,它能够在无需人工标注的情况下,通过文本提示自动分割任何对象的任何部分。该模型结合了...
Mooncake:月之暗面与清华合作开发的先进大型语言模型服务平台
Mooncake简介 Mooncake是由Moonshot AI与清华大学合作开发的先进大型语言模型(LLM)服务平台,旨在为Kimi提供高效、可扩展的服务。该平台采用创新的KVCache...
ShowUI:新加坡国立大学和微软共同推出的视觉-语言-动作模型
ShowUI简介 ShowUI是由新加坡国立大学Show Lab和微软共同开发的一个创新的视觉-语言-动作模型,旨在提升图形用户界面(GUI)自动化的效率和效果。该模型通过UI...
NVLM 1.0:英伟达推出的一款多模态大型语言模型
NVLM 1.0简介 NVLM 1.0是NVIDIA开发的一款前沿多模态大型语言模型,它在视觉-语言任务上取得了突破性成果,与业界领先的专有模型和开放访问模型相媲美。该模...
iDP3:斯坦福大学等联合推出的3D视觉动作策略
iDP3简介 iDP3(Improved 3D Diffusion Policy)是由斯坦福大学、西蒙弗雷泽大学、宾夕法尼亚大学、伊利诺伊大学香槟分校和卡内基梅隆大学联合开发的一种先进...
OminiControl:新加坡国立大学推出的高效图像条件控制框架
OminiControl简介 OminiControl是由新加坡国立大学的研究团队开发的一种新型图像生成框架,它通过极少量的额外参数(仅0.1%)将图像条件集成到预训练的Diffus...
FlipSketch:将静态草图转化为动态的、文本引导的草图动画
FlipSketch简介 FlipSketch是由英国萨里大学SketchX, CVSSP实验室开发的一种创新系统,它能够将静态草图转化为动态的、文本引导的草图动画。该系统利用预训练...
Material Anything:为各种3D对象生成基于物理的材料
Material Anything简介 Material Anything是由西北工业大学、上海人工智能实验室和南洋理工大学的联合研究团队开发的一种创新的全自动扩散框架,旨在为各种3D...
Kandinsky 3:一款基于潜在扩散模型的文本到图像生成框架
Kandinsky 3简介 Kandinsky 3是一款基于潜在扩散模型的文本到图像生成框架,以其卓越的质量和逼真度而闻名。它能够处理多种图像生成任务,如文本引导的修复/...
EvolveDirector:新加坡国立大学&阿里联合推出的图像生成框架
EvolveDirector简介 EvolveDirector是由新加坡国立大学Show Lab和阿里巴巴集团共同开发的一种先进文本到图像生成框架。该框架通过与现有先进模型的公共API交...