2.应用工具相关
DreamCinema:轻松将自己的故事和想法转换为电影
DreamCinema简介 DreamCinema是由清华大学推出的一种创新的电影转换框架,它融合了先进的人工智能技术,允许用户以一种用户友好的方式进行电影创作。该框架能...
EasyOCR:一个开源的OCR(光学字符识别)项目
EasyOCR 简介 EasyOCR 是一个功能强大的开源OCR(光学字符识别)项目,,它支持超过80种语言的文字识别,包括中文、阿拉伯文和西里尔文。基于深度学习技术,E...
CogVideoX:智谱AI开源的视频生成模型(新增CogVideoX-5B模型)
CogVideo简介 CogVideoX是由智谱AI推出的一款先进的文本到视频扩散模型。是 清影 同源的开源版本视频生成模型。它通过结合3D变分自编码器和专家变换器架构,...
Omages:将复杂的3D格式转换为更易于管理的2D格式
Omages 简介 Omages是一种创新的3D模型生成技术,由西蒙弗雷泽大学和香港城市大学的研究团队开发。该技术通过将3D形状的几何、外观和结构封装在64x64像素的图...
Sapiens:Meta推出的AI视觉模型 可识别图像中人体的各个关键点
Sapiens简介 Sapiens是由Meta公司的Reality Labs团队开发的一款先进的人工智能视觉模型。它专为理解人体而设计,能够处理包括2D姿态估计、身体部位分割、深度...
mPLUG-Owl3:阿里推出的一款多模态大型语言模型
mPLUG-Owl3简介 mPLUG-Owl3是由阿里开发的一款先进的多模态大型语言模型,它在处理长图像序列理解方面取得了突破性进展。该模型通过创新的超注意力机制,有效...
RAGFlow:一款基于深度文档理解的开源 RAG(检索增强生成)引擎
RAGFlow简介 RAGFlow是一个开源的RAG(Retrieval-Augmented Generation)引擎,专注于深度文档理解,旨在通过先进的检索增强技术,自动化工作流程和提升开发...
NextChat:允许用户一键部署私人的 ChatGPT 网页应用
NextChat简介 NextChat 是一个开源项目,它允许用户一键部署私人的 ChatGPT 网页应用。这个项目支持跨平台部署,包括 Web、PWA、Linux、Windows 和 MacOS,并...
StockBot:一款基于 Llama3 模型的 AI 金融助手
StockBot简介 StockBot 是一款基于 Llama3 模型的 AI 金融助手,专为投资者设计以提升股票市场分析和投资决策效率。它通过自然语言处理能力,提供实时股票信...
MooER:摩尔线程推出的自动语音识别&语音翻译模型
GPT Pilot简介 MooER是由摩尔线程开发的基于大型语言模型(LLM)的自动语音识别(ASR)和自动语音翻译(AST)模型。该模型利用5000小时的伪标记数据集进行训...