AI项目合集

EchoMimic:通过可编辑地标调节实现逼真的音频驱动肖像动画

EchoMimic简介 EchoMimic是由蚂蚁集团支付宝终端技术部研发的一款创新AI模型,旨在生成逼真的音频驱动肖像动画。该技术能够仅通过音频输入、面部特征点或两者...

PaintsUndo:输入静态图像 自动生成整个绘画过程的视频

Paints-UNDO简介 Paints-Undo是一个致力于模拟人类数字绘画行为的AI项目,旨在帮助未来的人工智能更好地理解并满足艺术家的真实需求。该项目通过一系列模型,...

IMAGDressing-v1:自由编辑与场景控制的虚拟试衣技术

IMAGDressing-v1简介 IMAGDressing-v1是由南京理工大学联合华为公司、腾讯AI实验室和南京大学的研究人员共同开发的一项创新技术。这项技术通过结合先进的服装...

Open-TeleVision:实现远程对机器人手臂和手部动作的精确控制

Open-TeleVision简介 Open-TeleVision 是由加州大学圣地亚哥分校和麻省理工学院的联合研究团队开发的一款沉浸式遥操作系统。该系统通过立体视觉反馈技术,使...

浦语灵笔IXC-2.5:支持长上下文输入和输出的多功能大视觉语言模型

浦语灵笔IXC-2.5简介 浦语灵笔IXC-2.5是由上海人工智能实验室联合香港中文大学、商汤科技集团和清华大学共同开发的一款多功能大型视觉语言模型。它具有长上下...

Image Textualization:自动生成高质量、详细的图像描述

Image Textualization简介 Image Textualization 是由香港科技大学、武汉大学、浙江大学和伊利诺伊大学香槟分校的联合研究团队开发的一项创新技术。这项技术...

Kolors(可图大模型):快手最新开源的AI绘画模型

Kolors简介 Kolors(可图大模型)是快手发布的一款文本到图像合成扩散开源模型,它基于通用语言模型(GLM)构建,具备出色的双语理解和生成能力。Kolors通过...

FunAudioLLM:阿里推出的语音理解和生成模型

FunAudioLLM简介 FunAudioLLM是由阿里通义团队发布的一款先进的语音理解和生成模型家族,旨在提升人类与大型语言模型(LLMs)之间的自然语音交互体验。它包含...

Be-Your-Outpainter:实现视频内容扩展与帧内帧间一致性保持

Be-Your-Outpainter简介 Be-Your-Outpainter是由香港中文大学MMLab团队开发的一项视频外延技术,它通过输入特定适应和模式感知外延两个阶段,实现了在保持视...

LivePortrait:快手推出的能将静态肖像图像转变成动态视频的框架

LivePortrait简介 LivePortrait是由快手科技团队开发的一项创新技术,它能够高效地将静态肖像图像转化为生动的视频动画。这一系统不仅在保持人物原有特征的同...
1 21 22 23 24 25 38