AI开源项目
RepText:Shakker Labs推出的的文本渲染框架
RepText项目简介 RepText是由Shakker Labs开发的一种创新的文本渲染框架,旨在通过复制字符形状而非理解文本内容,实现高质量的多语言视觉文本渲染。该框架基...
Xiaomi MiMo:小米推出的人工智能大语言模型项目
Xiaomi MiMo项目简介 Xiaomi MiMo 是小米公司推出的人工智能大语言模型项目。该项目由小米人工智能与云服务部的自然语言处理团队主导开发,汇聚了众多在人工...
UniToken:复旦大学联合美团等机构推出的视觉编码框架
UniToken项目简介 UniToken是由复旦大学智能信息处理实验室、上海智能视觉计算协同创新中心以及美团联合开发的自回归生成模型。该模型通过结合离散和连续的视...
DreamO:字节联合北大推出的统一图像定制框架
DreamO项目简介 DreamO是由字节跳动智能创作团队与北京大学电子与计算机工程学院联合开发的统一图像定制框架。它基于扩散变换器(DiT)架构,通过大规模训练...
WebSSL:Meta联合纽约大学等推出的自监督学习系列模型
WebSSL项目简介 WebSSL(Web-scale Self-Supervised Learning)是Meta联合纽约大学等机构推出的视觉自监督学习(SSL)系列模型,,旨在通过大规模无监督学习...
Paper2Code:将机器学习领域的论文自动转换为可执行的代码库
Paper2Code项目简介 Paper2Code是由韩国科学技术院(KAIST)和DeepAuto.ai联合开发的创新框架,旨在将机器学习领域的研究论文自动转换为可执行的代码库。该框...
Concept Lancet:宾夕法尼亚大学推出的新型图像编辑框架
Concept Lancet项目简介 Concept Lancet(CoLan)是由宾夕法尼亚大学的研究团队开发的一种新型图像编辑框架,旨在通过精确的表示操作改善基于扩散模型的图像...
Ev-DeblurVSR:中科大等推出的新型事件增强型网络
Ev-DeblurVSR项目简介 Ev-DeblurVSR是由中国科学技术大学脑智感知与认知教育部重点实验室、合肥综合性国家科学中心人工智能研究所以及新加坡国立大学的研究团...
OpenMath-Nemotron:NVIDIA推出的数学推理模型
OpenMath-Nemotron项目简介 OpenMath-Nemotron是由NVIDIA团队开发的一系列先进的数学推理模型,专为解决复杂数学问题而设计。这些模型基于大规模数据集OpenMa...
Step1X-Edit:阶跃星辰开源的图像编辑模型
Step1X-Edit项目简介 Step1X-Edit是由阶跃星辰开源的图像编辑模型,旨在缩小开源与闭源图像编辑模型之间的性能差距。该模型结合了多媒体大型语言模型(MLLM)...