AI开源项目

AutoCut:一款基于AI的智能视频剪辑工具

AutoCut简介 AutoCut是一款基于AI的智能视频剪辑工具,旨在提升视频编辑效率。它能够自动生成字幕,并将时间标签与文本内容智能匹配,用户只需简单编辑生成的...

FunASR:阿里巴巴达摩院开源的语音识别工具包

FunASR简介 FunASR是由阿里巴巴达摩院开源的语音识别工具包,它致力于连接学术研究与工业应用。这个工具包不仅提供了语音识别(ASR)、语音活动检测(VAD)、...

RF-Inversion:Google推出的一种图像反演和编辑方法

RF-Inversion简介 RF-Inversion是由Google和UT Austin的研究团队开发的一种先进的图像反演和编辑方法,它利用修正随机微分方程(Rectified Stochastic Differ...

Meissonic:开源可商用的非自回归文本到图像生成模型

Meissonic简介 Meissonic是由Skywork AI团队开发的一款先进的文本到图像生成模型,它通过创新的非自回归遮蔽图像建模(MIM)技术,实现了与业界领先的扩散模...

Invoke 5.0:同时支持 Stable Diffusion、Flux等主流AI绘画模型

Invoke 5.0简介 Invoke 5.0 是 Invoke AI 平台的重大更新,带来了许多创新功能和增强体验。新推出的控制画布工具使用户能够在一个工作区内生成、迭代和精细化...

Loong:香港大学与字节跳动联合推出的一款长视频生成模型

Loong简介 Loong是由香港大学与字节跳动公司联合开发的一款新型的长视频生成模型,它能够生成内容连贯、动态丰富的分钟级长视频。该模型通过将文本和视频标记...

Surya:一个多语言文档光学字符识别(OCR)工具包

Surya简介 Surya是一个多语言文档光学字符识别(OCR)工具包,支持超过90种语言的文本识别。它具备精确的逐行文本检测和布局分析能力,能够智能识别文档中的...

MLE-bench:OpenAI团队推出的一项基准测试工具

MLE-bench简介 MLE-bench是由OpenAI团队开发的一项基准测试,旨在衡量人工智能代理在机器学习工程领域的表现。该基准测试通过汇集75个来自Kaggle的竞赛,模拟...

LightRAG:北邮&香港大学推出的检索增强型生成系统

LightRAG简介 LightRAG是由北京邮电大学和香港大学的研究团队共同开发的一种先进的检索增强型生成系统。该系统通过整合图结构到文本索引和检索过程中,显著提...

FLUX.1-dev-LoRA-One-Click-Creative-Template:结合真实照片和卡通插图

FLUX.1-dev-LoRA-One-Click-Creative-Template 简介 FLUX.1-dev-LoRA-One-Click-Creative-Template 是一款创新图像生成模型,旨在通过结合真实照片和卡通插图...
1 22 23 24 25 26 47