2.应用工具相关
RF-Inversion:Google推出的一种图像反演和编辑方法
RF-Inversion简介 RF-Inversion是由Google和UT Austin的研究团队开发的一种先进的图像反演和编辑方法,它利用修正随机微分方程(Rectified Stochastic Differ...
Animate-X:从参考图像和目标姿势序列生成高质量的视频
Animate-X简介 Animate-X是由蚂蚁集团和阿里巴巴集团的研究人员共同开发的一种先进的角色图像动画技术。这项技术通过引入创新的姿势指示器(Pose Indicator)...
Invoke 5.0:同时支持 Stable Diffusion、Flux等主流AI绘画模型
Invoke 5.0简介 Invoke 5.0 是 Invoke AI 平台的重大更新,带来了许多创新功能和增强体验。新推出的控制画布工具使用户能够在一个工作区内生成、迭代和精细化...
Surya:一个多语言文档光学字符识别(OCR)工具包
Surya简介 Surya是一个多语言文档光学字符识别(OCR)工具包,支持超过90种语言的文本识别。它具备精确的逐行文本检测和布局分析能力,能够智能识别文档中的...
MLE-bench:OpenAI团队推出的一项基准测试工具
MLE-bench简介 MLE-bench是由OpenAI团队开发的一项基准测试,旨在衡量人工智能代理在机器学习工程领域的表现。该基准测试通过汇集75个来自Kaggle的竞赛,模拟...
LightRAG:北邮&香港大学推出的检索增强型生成系统
LightRAG简介 LightRAG是由北京邮电大学和香港大学的研究团队共同开发的一种先进的检索增强型生成系统。该系统通过整合图结构到文本索引和检索过程中,显著提...
FLUX.1-dev-LoRA-One-Click-Creative-Template:结合真实照片和卡通插图
FLUX.1-dev-LoRA-One-Click-Creative-Template 简介 FLUX.1-dev-LoRA-One-Click-Creative-Template 是一款创新图像生成模型,旨在通过结合真实照片和卡通插图...
Momo XL:一款基于SDXL模型的动漫风格图像生成模型
Momo XL简介 Momo XL是一款基于SDXL模型的动漫风格图像生成模型,经过精细调优,旨在生成高质量、细致且生动的动漫图像。该模型特别适合创作各种风格的动漫角...
DreamMesh4D:将单目视频转换成高质量的4D动态网格模型
DreamMesh4D简介 DreamMesh4D是由浙江大学和西湖大学的研究团队开发的一种创新框架,它能够将单目视频转换成高质量的4D动态网格模型。这项技术采用了稀疏控制...
LosslessCut:一款开源的无损视频和音频编辑工具
LosslessCut简介 LosslessCut是一款跨平台的无损视频和音频编辑工具,旨在快速、简便地进行剪辑而不损失原始质量。它利用FFmpeg框架,支持多种格式如MP4、MOV...