AI项目合集

Hyper-SD:字节跳动引领的图像生成技术革新

Hyper-SD项目介绍 Hyper-SD是由字节跳动的Lightning团队发布的一种新的图像模型蒸馏算法。这项技术的主要目标是提升模型的推理效率和性能,特别适用于在资源...

IDM-VTON:深度融合人工智能与时尚,定义未来虚拟试衣标准

IDM-VTON项目介绍 IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是一种先进的AI虚拟试穿技术,由韩国科学技术院和OMNIOUS.AI的研究人员提出。它...

OpenELM:苹果公司开发的一款开源大型语言模型

OpenELM简介 OpenELM是由苹果公司开发的一款开源的大型语言模型(LLM),专为提高效率和透明度而设计。它采用了逐层扩展策略,优化了transformer模型中参数的...

Phi-3:微软公司推出的一系列AI语言模型

Phi-3简介 Phi-3是由微软公司推出的一系列AI语言模型,涵盖了phi-3-mini、phi-3-small和phi-3-medium三种规模。这些模型以其较小的参数量,通过精心设计的训...

Interactive3D:精确控制3D模型的创建过程

VideoGigaGAN简介 Interactive3D是一种创新的3D对象生成框架,它通过两个阶段的交互式设计,使用户能够精确控制3D模型的创建过程。在第一阶段,系统采用高斯...

Vidu:生数科技与清华大学合作发布的视频大模型

Vidu简介 Vidu是一款由生数科技与清华大学合作发布的视频大模型,它能够生成长达16秒、分辨率高达1080P的高清视频内容。Vidu采用了原创的Diffusion与Transfor...

VASA-1框架:微软创新技术让静态照片“开口说话”

VASA-1项目介绍 VASA-1是微软亚洲研究院开发的AI模型,能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。它通过精确的音频与唇部动作同步、丰富的...

FunClip:阿里达摩院开源的视频剪辑工具

FunClip项目介绍 FunClip是一款功能强大的开源视频剪辑工具,它集成了阿里巴巴通义实验室的先进语音识别技术(ASR),为用户提供了高效的视频剪辑体验。通过F...

MuseV:腾讯天琴实验室开源的虚拟人视频生成框架

MuseV简介 MuseV是腾讯天琴实验室(TMElyra Lab)开源的虚拟人视频生成框架,它基于先进的扩散模型技术,能够生成高质量、无限长度的虚拟人物视频。这一创新...

FlashFace:几秒钟内实现零样本的图像个性化定制

FlashFace项目简介 FlashFace是一个创新的人工智能图像生成工具,专注于在几秒钟内实现零样本的人类图像个性化定制。它不仅能够保持人物的高保真身份特征,还...
1 30 31 32 33 34 37