LHM:阿里通义推出的新型3D人类重建模型

LHM简介 LHM(Large Animatable Human Reconstruction Model)是由阿里巴巴集团通义实验室开发的一种新型3D人类重建模型。该模型能够在几秒钟内从单张图像中...

Orpheus-TTS:无需预先微调即可克隆任意声音

Orpheus-TTS简介 Orpheus-TTS是由Canopy AI团队开发的开源文本到语音(TTS)系统,基于Llama-3b模型构建。它展现了使用大型语言模型(LLM)进行语音合成的新...

Umi-OCR:一款开源、免费的离线OCR软件

Umi-OCR简介 Umi-OCR是一款开源、免费的离线OCR软件,适用于Windows 7 x64和Linux x64系统。它无需网络连接,解压即可使用,支持截图OCR、批量图片识别、PDF...

EXAONE Deep:专注于推理任务的语言模型

EXAONE Deep简介 EXAONE Deep是由LG AI Research开发的一系列专注于推理任务的先进语言模型。该团队通过使用监督微调(SFT)、直接偏好优化(DPO)和在线强化...

CrackCode:专为技术面试中的编程问题设计

CrackCode简介 CrackCode 是一个开源的 AI 助手,专为技术面试中的编程问题设计。它能在后台运行,完全隐形,不会被屏幕录制或监控软件检测到。该工具支持多...

YT Navigator:AI 驱动的 YouTube 内容搜索工具

YT Navigator 简介 YT Navigator 是一款 AI 驱动的 YouTube 内容搜索工具。它能够帮助用户高效地搜索和浏览 YouTube 频道中的视频内容,通过自然语言查询快速...

InternVL:OpenGVLab等推出的多模态大模型

InternVL简介 InternVL是由上海人工智能实验室(OpenGVLab)联合南京大学、香港大学、香港中文大学、清华大学、中国科学技术大学和商汤科技等机构共同开发的...

OLMo 2 32B:Allen Institute for AI推出的大型语言模型

OLMo 2 32B简介 OLMo 2 32B 是由 Allen Institute for AI (Ai2) 开发的大型语言模型,是 OLMo 2 系列中规模最大且性能最强的模型。它拥有 320 亿参数,经过 6...

Maestro:专为移动和Web应用设计的端到端自动化测试框架

Maestro简介 Maestro是一个专为移动和Web应用设计的端到端自动化测试框架。它通过内置的容错机制和自动等待延迟功能,解决了传统测试框架中常见的不稳定性问...

Stable Virtual Camera:Stability AI推出的单图秒变 3D 视频模型

Stable Virtual Camera简介 Stable Virtual Camera(简称SEVA)是由Stability AI团队开发的一种先进的扩散模型,专门用于生成任意数量输入视图和目标相机下的...
1 19 20 21 22 23 214