2.应用工具相关

VideoLingo:Netflix级字幕与配音,一键全自动视频搬运

VideoLingo简介 VideoLingo 是一个开源的自动化视频处理工具,它集成了字幕切割、翻译、精确对齐与个性化配音功能,能够帮助用户高效地进行视频搬运与加工。...

Auto-video-generator:给定主题 自动生成解说视频

Auto-video-generator 简介 Auto-video-generator 是一款创新的 AI 驱动视频生成工具,它能够根据用户输入的主题自动撰写解说脚本、合成语音、生成配图,并最...

NarratoAI :一站式 AI 影视解说+自动化剪辑工具

NarratoAI 简介 NarratoAI是一款集成了大型语言模型(LLM)技术的AI影视解说和自动化剪辑工具,它通过自动化的文案撰写、视频剪辑、配音和字幕生成,极大地简...

GameNGen:首个由神经模型驱动的实时游戏引擎

GameNGen简介 GameNGen是由谷歌推出的创新游戏引擎,它完全基于神经模型,能够实现实时与复杂环境的交互。这个引擎能够以高帧率和高质量模拟经典游戏,如DOOM...

LitServe:一款易于使用且灵活的服务引擎,适用于基于 FastAPI 构建的 AI 模型

LitServe 简介 LitServe是由Lightning AI团队开发的一个高性能人工智能模型服务引擎。它旨在为企业提供快速、灵活且易于扩展的AI模型部署解决方案。LitServe...

DiPIR:在真实世界场景图像中逼真地插入虚拟对象

DiPIR简介 DiPIR是由NVIDIA的研究团队开发的先进技术,利用扩散模型作为指导,结合基于物理的逆渲染过程,实现在真实世界场景图像中逼真地插入虚拟对象。这种...

DreamCinema:轻松将自己的故事和想法转换为电影

DreamCinema简介 DreamCinema是由清华大学推出的一种创新的电影转换框架,它融合了先进的人工智能技术,允许用户以一种用户友好的方式进行电影创作。该框架能...

EasyOCR:一个开源的OCR(光学字符识别)项目

EasyOCR 简介 EasyOCR 是一个功能强大的开源OCR(光学字符识别)项目,,它支持超过80种语言的文字识别,包括中文、阿拉伯文和西里尔文。基于深度学习技术,E...

CogVideoX:智谱AI开源的视频生成模型(新增CogVideoX-5B模型)

CogVideo简介 CogVideoX是由智谱AI推出的一款先进的文本到视频扩散模型。是 清影 同源的开源版本视频生成模型。它通过结合3D变分自编码器和专家变换器架构,...

Omages:将复杂的3D格式转换为更易于管理的2D格式

Omages 简介 Omages是一种创新的3D模型生成技术,由西蒙弗雷泽大学和香港城市大学的研究团队开发。该技术通过将3D形状的几何、外观和结构封装在64x64像素的图...
1 4 5 6 7 8 15