2.应用工具相关

Speech To Speech:HuggingFace推出的语音模型 可以实现低延迟语音对话

Speech To Speech简介 Speech-to-Speech 是由 Hugging Face 组织开发的一个开源项目,旨在构建一个模块化的语音到语音转换系统。该项目利用先进的人工智能技...

VideoGameBunny:专为理解视频游戏图像而设计的多模态模型

VideoGameBunny简介 VideoGameBunny是一个专为理解视频游戏图像而设计的多模态模型,基于Bunny模型并采用LLaVA风格架构。它通过分析来自413款游戏的185,259张...

LanceDB :专为人工智能应用设计的无服务器向量数据库

LanceDB 简介 Lancedb是一个为人工智能应用设计的无服务器向量数据库,专注于提供开发者友好的体验。它旨在轻松地为大型语言模型(LLM)应用添加长期记忆功能...

Melty:能够洞察开发者的工作模式,辅助编写高质量的代码

Melty简介 Melty 是一个创新的开源AI编程助手,旨在通过智能协作和代码生成来强化开发流程。它能够洞察开发者的工作模式,并适应其个人风格,从而辅助编写高...

FLUX.1-dev-LoRA :能够将现实与插画风格融合的图像生成模型

FLUX.1-dev-LoRA 简介 FLUX.1-dev-LoRA 是一款能够将现实与插画风格融合的图像生成模型,它基于 FLUX.1-dev 模型训练而成,这个模型特别适合创造出前景为插画...

AWPortrait-FL:能够生成高真实感和时尚摄影作品的图像生成模型

AWPortrait-FL简介 AWPortrait-FL 是一个基于 FLUX.1-dev 训练的图像生成模型,专注于创造出高质量、高真实感的人像摄影作品。它通过精心挑选的训练数据集,...

NanoFlow :通过设备内并行性提高大型语言模型的服务吞吐量

NanoFlow 简介 NanoFlow是由华盛顿大学和密歇根大学的研究团队开发的一种新型服务框架,旨在通过设备内并行性显著提高大型语言模型(LLM)的服务吞吐量。该框...

HivisionIDPhotos:一个开源的AI证件照制作工具

HivisionIDPhotos简介 HivisionIDPhotos是一个开源的AI证件照制作工具,旨在通过轻量级算法快速生成符合标准的证件照片。它利用最新的人工智能技术,简化了证...

PGTFormer :从视频中恢复出高质量的人脸图像

PGTFormer 简介 PGTFormer是由西安电子科技大学的研究团队开发的一种先进的盲视频人脸恢复方法。这种方法不依赖于预先对齐,而是利用解析引导的时序一致性变...

STranslate:一款即开即用、即用即走的翻译、OCR工具

STranslate简介 STranslate是由开发者ZGGSONG在GitHub上开发的一款多功能翻译和OCR工具。它采用WPF技术开发,具备即开即用、即用即走的特点,为用户提供了便...
1 2 3 4 5 6 15