VideoMaker:零样本定制视频生成框架
VideoMaker简介 VideoMaker是一种创新的零样本定制视频生成框架,它通过挖掘视频扩散模型(VDM)的内在潜力,实现了无需额外训练的高质量定制化视频生成。该...
Story-Adapter:生成与叙述文本相匹配的连贯图像序列
Story-Adapter简介 Story-Adapter是一个由加州大学圣克鲁斯分校(UC Santa Cruz)和杭州电子科技大学(Hangzhou Dianzi University)联合开发的创新框架,专...
MARS:微软亚洲研究院团队推出的金融市场模拟引擎
MARS简介 MARS是由微软亚洲研究院开发的一款金融市场模拟引擎,它利用基于订单级别的生成基础模型——大型市场模型(LMM)来模拟金融市场中的各种行为和市场效...
Auto-RAG:中科院推出的自主检索增强生成模型
Auto-RAG简介 Auto-RAG是由中国科学院计算技术研究所智能信息处理重点实验室开发的自主迭代检索模型,旨在增强大型语言模型在知识密集型任务中的表现。该模型...
LaDeCo:微软联合西安交大推出的自动图形设计组合方法
LaDeCo简介 LaDeCo是西安交通大学与微软研究院共同开发的一种自动图形设计组合方法,它采用分层设计原则,将多模态设计元素自动整合成既美观又平衡的图形设计...
MinT:Snap与多伦多大学团队推出的视频生成模型
MinT简介 MinT(Mind the Time)是由Snap与多伦多大学团队推出的视频生成模型,它能够根据文本提示和预定的时间戳生成具有精确时间控制的视频序列。通过创新...
Wonderland:多伦多大学等推出的3D场景重建框架
Wonderland简介 Wonderland是由多伦多大学、Snap Inc.和加州大学洛杉矶分校的联合研究团队开发的一种创新框架,它能够从单张图片中高效地创建出高质量的3D场...
VersaGen:提供多样化视觉控制的文本到图像合成系统
VersaGen简介 VersaGen是一个先进的文本到图像合成的生成性AI代理,它通过提供多样化的视觉控制选项,使用户能够根据个人创意意图灵活控制图像生成过程。该系...
ILLUME:华为诺亚方舟实验室推出的多模态模型
ILLUME简介 ILLUME是由华为诺亚方舟实验室开发的一款创新的统一多模态大型语言模型(MLLM),它通过集成多模态理解和生成能力,能够在单一的大型语言模型框架...
SemiKong:半导体行业专用大型语言模型
SemiKong简介 SemiKong是专为半导体行业设计的首个大型语言模型,旨在解决该领域特有的复杂物理和化学问题。通过构建一个全面的半导体相关文本语料库和开发深...