2.应用工具相关

GVHMR:能够从单一视角的视频资料中恢复出人体运动

GVHMR简介 GVHMR是一种创新的人体运动恢复方法,由浙江大学CAD&CG国家重点实验室与香港大学的研究团队共同开发。该技术能够从单目视频中准确估计出基于重...

EzAudio:将文本描述转换为相应逼真的音频内容

EzAudio简介 EzAudio 是由腾讯联合约翰霍普金斯大学开发的一种创新的文本到音频生成框架。该框架通过采用高效的扩散变压器架构和优化的训练策略,在保持模型...

Void:一款开源的智能编程辅助工具

Void简介 Void 是一款开源的智能编程辅助工具,基于 Visual Studio Code 开发,通过集成先进的人工智能技术,为开发者提供代码自动补全、智能搜索和多光标编...

Faster Whisper:基于 OpenAI Whisper 模型的高效语音识别工具

Faster Whisper简介 Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具,它通过采用 CTranslate2 引擎实现快速推理,显著提升了语音转写的效...

InstantDrag:能够在一秒钟内完成逼真的图像拖拽编辑

InstantDrag简介 InstantDrag是由首尔国立大学和POSTECH的研究团队开发的一种创新图像编辑框架,它通过结合光流生成器和基于运动的扩散模型,实现了快速且逼...

Click2Mask:允许用户在图像的特定区域添加、修改或删除内容

Click2Mask简介 Click2Mask 是由耶路撒冷希伯来大学的研究团队开发的一种创新图像编辑方法,它通过用户仅提供一个参考点和内容描述,便能自动生成动态遮罩并...

DrawingSpinUp:将平面的角色绘画转换成具有立体感的3D动画

DrawingSpinUp简介 DrawingSpinUp是由香港城市大学和香港科技大学的研究团队开发的一种创新系统,它能够将单一的角色绘画转换成生动的3D动画。该系统通过识别...

Seed-Music :字节豆包团队推出的一款音乐生成模型

Seed-Music简介 Seed-Music 是由字节跳动公司的豆包团队推出的一款音乐生成模型。它通过结合自回归语言模型和扩散模型,能够根据用户的多样化输入生成高质量...

FaceSwap:一款开源的 AI 换脸工具 静态图像/动态视频都可换

FaceSwap简介 FaceSwap 是一款开源的 AI 换脸工具,能够将一张照片中的面孔与另一张照片中的面孔进行交换。用户只需上传目标照片,FaceSwap 会在几秒钟内完成...

AI Youtube Shorts Generator:快速生成吸引人的短视频内容

AI Youtube Shorts Generator简介 AI YouTube Shorts Generator是一个Python工具,利用GPT-4和Whisper技术从长视频中提取最有趣的片段,检测说话者,并将内容垂...
1 28 29 30 31 32 44