2.应用工具相关

1.58-bit FLUX:高效文本到图像生成模型

1.58-bit FLUX简介 1.58-bit FLUX是一种创新的文本到图像生成模型,它通过将最先进的FLUX模型的权重量化到1.58位(即{-1, 0, +1}中的值),在保持图像生成质...

TANGOFLUX:英伟达联合新加坡科大推出的文本到音频生成模型

TANGOFLUX简介 TANGOFLUX是由新加坡科技设计大学和NVIDIA共同开发的文本到音频生成模型,拥有约5.15亿参数,能够在3.7秒内生成长达30秒的44.1kHz音频。该模型...

TryOffAnyone:从模特穿着的照片中生成高保真的平铺服装图像

TryOffAnyone简介 TryOffAnyone是一项利用深度学习和计算机视觉技术从穿着服装的人像照片中生成高保真平铺服装图像的技术。它通过微调StableDiffusion模型,...

Orient Anything:浙江大学等推出的首个单图像物体方向估计模型

Orient Anything简介 Orient Anything是由浙江大学、Sea AI Lab和香港大学的开发团队共同研发的一种创新方法,旨在从单张图像中准确估计物体的方向。该方法通...

VideoMaker:零样本定制视频生成框架

VideoMaker简介 VideoMaker是一种创新的零样本定制视频生成框架,它通过挖掘视频扩散模型(VDM)的内在潜力,实现了无需额外训练的高质量定制化视频生成。该...

Story-Adapter:生成与叙述文本相匹配的连贯图像序列

Story-Adapter简介 Story-Adapter是一个由加州大学圣克鲁斯分校(UC Santa Cruz)和杭州电子科技大学(Hangzhou Dianzi University)联合开发的创新框架,专...

MARS:微软亚洲研究院团队推出的金融市场模拟引擎

MARS简介 MARS是由微软亚洲研究院开发的一款金融市场模拟引擎,它利用基于订单级别的生成基础模型——大型市场模型(LMM)来模拟金融市场中的各种行为和市场效...

Auto-RAG:中科院推出的自主检索增强生成模型

Auto-RAG简介 Auto-RAG是由中国科学院计算技术研究所智能信息处理重点实验室开发的自主迭代检索模型,旨在增强大型语言模型在知识密集型任务中的表现。该模型...

LaDeCo:微软联合西安交大推出的自动图形设计组合方法

LaDeCo简介 LaDeCo是西安交通大学与微软研究院共同开发的一种自动图形设计组合方法,它采用分层设计原则,将多模态设计元素自动整合成既美观又平衡的图形设计...

Wonderland:多伦多大学等推出的3D场景重建框架

Wonderland简介 Wonderland是由多伦多大学、Snap Inc.和加州大学洛杉矶分校的联合研究团队开发的一种创新框架,它能够从单张图片中高效地创建出高质量的3D场...
1 2 3 4 40