2-1.应用工具文本

通古大模型:专注于古籍理解和处理的大语言模型

通古大模型简介 通古大模型是由华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)开发的一款专注于古籍理解和处理的大语言模型。该模型基于Baichuan2-7B...

OmniThink:阿里通义联合浙江大学推出的机器写作框架

OmniThink简介 OmniThink是由浙江大学和阿里巴巴集团通义实验室联合开发的机器写作框架,旨在通过模拟人类的迭代扩展和反思过程来提升机器写作的质量。该框架...

LLaVA-o1:清华&北大等联合推出的一种新型视觉语言模型

LLaVA-o1简介 LLaVA-o1是由北京大学电子与计算机工程学院、清华大学跨学科信息科学研究所、鹏城实验室以及AI for Science (AI4S)-Preferred Program联合开发...

PaddleOCR 2.9:百度飞桨推出的开源光学字符识别(OCR)工具包

PaddleOCR 2.9简介 PaddleOCR 2.9是由百度飞桨(PaddlePaddle)推出的一款开源光学字符识别(OCR)工具包。该版本引入了多项新特性,包括直接保存OCR输出结果...

mPLUG-DocOwl 1.5:阿里&中国人民大学推出的一款OCR-free文档理解模型

mPLUG-DocOwl 1.5简介 mPLUG-DocOwl 1.5是由阿里巴巴集团与中国人民大学联合开发的一款先进的OCR-free文档理解模型。该模型通过统一结构学习,能够在无需光学...

Surya:一个多语言文档光学字符识别(OCR)工具包

Surya简介 Surya是一个多语言文档光学字符识别(OCR)工具包,支持超过90种语言的文本识别。它具备精确的逐行文本检测和布局分析能力,能够智能识别文档中的...

GraphReasoning:能将大量科学文献转化为结构化的知识图谱

GraphReasoning简介 GraphReasoning是一种利用生成性人工智能和知识图谱来加速科学发现的方法。它通过将大量科学论文转换成知识图谱,然后对这些图谱进行深入...

RapidLayoutRecover :将扫描的书页、PDF页面等文档图像转换成可编辑的格式

RapidLayoutRecover 简介 RapidLayoutRecover 是一款先进的文档图像处理工具,专门设计用于将扫描的书页、PDF页面等文档图像还原为可编辑的Word或TXT文本格式...

Kotaemon:一个基于 RAG 的开源工具,用于与你的文档进行聊天

Kotaemon简介 Kotaemon是一个由Cinnamon开发的开源工具,基于先进的Retrieval-Augmented Generation(RAG)技术,旨在通过聊天方式与您的文档进行互动。这个...

OmniCorpus:迄今为止最大的多模态数据集

OmniCorpus简介 OmniCorpus 是由上海人工智能实验室领衔,联合哈尔滨工业大学、南京大学、复旦大学、香港中文大学、商汤科技研究院、清华大学等机构共同开发...
1 2