AI开源项目 | 第 24 页

AutoCut：一款基于AI的智能视频剪辑工具

AutoCut简介 AutoCut是一款基于AI的智能视频剪辑工具，旨在提升视频编辑效率。它能够自动生成字幕，并将时间标签与文本内容智能匹配，用户只需简单编辑生成的...

2-3.应用工具视频

3个月前

FunASR简介 FunASR是由阿里巴巴达摩院开源的语音识别工具包，它致力于连接学术研究与工业应用。这个工具包不仅提供了语音识别（ASR）、语音活动检测（VAD）、...

2-4.应用工具音频

3个月前

RF-Inversion简介 RF-Inversion是由Google和UT Austin的研究团队开发的一种先进的图像反演和编辑方法，它利用修正随机微分方程（Rectified Stochastic Differ...

2-2.应用工具图像

3个月前

Meissonic简介 Meissonic是由Skywork AI团队开发的一款先进的文本到图像生成模型，它通过创新的非自回归遮蔽图像建模（MIM）技术，实现了与业界领先的扩散模...

3-2.图片生成模型

3个月前

Invoke 5.0简介 Invoke 5.0 是 Invoke AI 平台的重大更新，带来了许多创新功能和增强体验。新推出的控制画布工具使用户能够在一个工作区内生成、迭代和精细化...

2-2.应用工具图像

3个月前

Loong简介 Loong是由香港大学与字节跳动公司联合开发的一款新型的长视频生成模型，它能够生成内容连贯、动态丰富的分钟级长视频。该模型通过将文本和视频标记...

3-3.视频生成模型

3个月前

Surya简介 Surya是一个多语言文档光学字符识别（OCR）工具包，支持超过90种语言的文本识别。它具备精确的逐行文本检测和布局分析能力，能够智能识别文档中的...

2-1.应用工具文本

3个月前

MLE-bench简介 MLE-bench是由OpenAI团队开发的一项基准测试，旨在衡量人工智能代理在机器学习工程领域的表现。该基准测试通过汇集75个来自Kaggle的竞赛，模拟...

2-5.应用工具其他

3个月前

LightRAG简介 LightRAG是由北京邮电大学和香港大学的研究团队共同开发的一种先进的检索增强型生成系统。该系统通过整合图结构到文本索引和检索过程中，显著提...

2-5.应用工具其他

3个月前

FLUX.1-dev-LoRA-One-Click-Creative-Template 简介 FLUX.1-dev-LoRA-One-Click-Creative-Template 是一款创新图像生成模型，旨在通过结合真实照片和卡通插图...

2-2.应用工具图像

3个月前