2-1.应用工具文本

RapidLayoutRecover :将扫描的书页、PDF页面等文档图像转换成可编辑的格式

RapidLayoutRecover 简介 RapidLayoutRecover 是一款先进的文档图像处理工具,专门设计用于将扫描的书页、PDF页面等文档图像还原为可编辑的Word或TXT文本格式...

Kotaemon:一个基于 RAG 的开源工具,用于与你的文档进行聊天

Kotaemon简介 Kotaemon是一个由Cinnamon开发的开源工具,基于先进的Retrieval-Augmented Generation(RAG)技术,旨在通过聊天方式与您的文档进行互动。这个...

OmniCorpus:迄今为止最大的多模态数据集

OmniCorpus简介 OmniCorpus 是由上海人工智能实验室领衔,联合哈尔滨工业大学、南京大学、复旦大学、香港中文大学、商汤科技研究院、清华大学等机构共同开发...

ancient_text_generation_LLM:输入现代汉语句子,生成古汉语风格的句子

ancient_text_generation_LLM简介 'ancient_text_generation_LLM'是一个现代文转古文的模型。该模型利用荀子基座大模型,并通过'文言文-现代文'的平行语料库...

EasyOCR:一个开源的OCR(光学字符识别)项目

EasyOCR 简介 EasyOCR 是一个功能强大的开源OCR(光学字符识别)项目,,它支持超过80种语言的文字识别,包括中文、阿拉伯文和西里尔文。基于深度学习技术,E...

mPLUG-Owl3:阿里推出的一款多模态大型语言模型

mPLUG-Owl3简介 mPLUG-Owl3是由阿里开发的一款先进的多模态大型语言模型,它在处理长图像序列理解方面取得了突破性进展。该模型通过创新的超注意力机制,有效...

RAGFlow:一款基于深度文档理解的开源 RAG(检索增强生成)引擎

RAGFlow简介 RAGFlow是一个开源的RAG(Retrieval-Augmented Generation)引擎,专注于深度文档理解,旨在通过先进的检索增强技术,自动化工作流程和提升开发...

WiseFlow:用于在海量信息中高效地挖掘和整理数据的开源工具

WiseFlow简介 WiseFlow 是一个开源的智能信息挖掘工具,专门设计用于在海量信息中高效地挖掘和整理数据。它利用先进的自然语言处理技术和大型语言模型,能够...

EAFormer:复旦大学研发的边缘感知文本分割技术

EAFormer简介 EAFormer是一种先进的场景文本分割技术,由复旦大学的智能信息处理研究团队开发。这项技术通过利用边缘感知变换器(Edge-Aware Transformers)...

LSLM:具备边听边说能力的语音模型,实现实时的双向交流

LSLM简介 LSLM(Listening-while-Speaking Language Model)是由上海交通大学人工智能教育部重点实验室X-LANCE实验室与字节跳动公司联合开发的创新性端到端模...
1 2