AI项目合集

Sapiens:Meta推出的AI视觉模型 可识别图像中人体的各个关键点

Sapiens简介 Sapiens是由Meta公司的Reality Labs团队开发的一款先进的人工智能视觉模型。它专为理解人体而设计,能够处理包括2D姿态估计、身体部位分割、深度...

心辰Lingo:西湖心辰推出的国内首个端到端语音大模型

心辰Lingo简介 '心辰Lingo'是西湖心辰推出的端到端语音大模型,它具备原生的语音理解能力,能够识别语音中的文字信息以及情感、语气、音调等重要特征,提供更...

mPLUG-Owl3:阿里推出的一款多模态大型语言模型

mPLUG-Owl3简介 mPLUG-Owl3是由阿里开发的一款先进的多模态大型语言模型,它在处理长图像序列理解方面取得了突破性进展。该模型通过创新的超注意力机制,有效...

RAGFlow:一款基于深度文档理解的开源 RAG(检索增强生成)引擎

RAGFlow简介 RAGFlow是一个开源的RAG(Retrieval-Augmented Generation)引擎,专注于深度文档理解,旨在通过先进的检索增强技术,自动化工作流程和提升开发...

Show-o:一个 Transformer 即可统一多模态理解和生成

Show-o简介 Show-o是由新加坡国立大学的Show Lab和字节跳动公司联合开发的一个创新的统一变换器模型。它通过结合自回归和离散扩散建模,有效地整合了多模态理...

NextChat:允许用户一键部署私人的 ChatGPT 网页应用

NextChat简介 NextChat 是一个开源项目,它允许用户一键部署私人的 ChatGPT 网页应用。这个项目支持跨平台部署,包括 Web、PWA、Linux、Windows 和 MacOS,并...

StockBot:一款基于 Llama3 模型的 AI 金融助手

StockBot简介 StockBot 是一款基于 Llama3 模型的 AI 金融助手,专为投资者设计以提升股票市场分析和投资决策效率。它通过自然语言处理能力,提供实时股票信...

MooER:摩尔线程推出的自动语音识别&语音翻译模型

GPT Pilot简介 MooER是由摩尔线程开发的基于大型语言模型(LLM)的自动语音识别(ASR)和自动语音翻译(AST)模型。该模型利用5000小时的伪标记数据集进行训...

LMMs-Eval:一个统一且标准化的多模态评估框架

LMMs-Eval简介 LMMs-Eval是由新加坡南洋理工大学LMMs-Lab团队开发的一个统一且标准化的多模态评估框架,旨在对大型多模态模型进行全面、透明和可复现的评估。...

GPT Pilot:不仅可以生成代码,还可以构建应用程序

GPT Pilot简介 GPT Pilot 是一款AI编程工具,旨在帮助开发者通过自动化的方式构建应用程序。它具备多种功能,包括自动化编码、交互式开发、环境任务配置、技...
1 9 10 11 12 13 39