AI开源项目 | 第 2 页

TesserAct：哈佛大学等推出的4D体现世界模型

TesserAct项目简介 TesserAct 是由 UMass Amherst、HKUST 和 Harvard University 的研究团队共同开发的一种创新的 4D 体现世界模型。该模型通过输入图像和文...

2-6.应用工具3D

2个月前

Embodied Reasoner项目简介 Embodied Reasoner是由浙江大学计算机科学与技术学院、中国科学院软件研究所、阿里巴巴集团和达摩院等机构联合开发的具身化交互模...

2-5.应用工具其他

2个月前

RepText项目简介 RepText是由Shakker Labs开发的一种创新的文本渲染框架，旨在通过复制字符形状而非理解文本内容，实现高质量的多语言视觉文本渲染。该框架基...

2-2.应用工具图像

2个月前

Xiaomi MiMo项目简介 Xiaomi MiMo 是小米公司推出的人工智能大语言模型项目。该项目由小米人工智能与云服务部的自然语言处理团队主导开发，汇聚了众多在人工...

3-9.其他模型

2个月前

UniToken项目简介 UniToken是由复旦大学智能信息处理实验室、上海智能视觉计算协同创新中心以及美团联合开发的自回归生成模型。该模型通过结合离散和连续的视...

2-5.应用工具其他

2个月前

DreamO项目简介 DreamO是由字节跳动智能创作团队与北京大学电子与计算机工程学院联合开发的统一图像定制框架。它基于扩散变换器（DiT）架构，通过大规模训练...

2-2.应用工具图像

2个月前

WebSSL项目简介 WebSSL（Web-scale Self-Supervised Learning）是Meta联合纽约大学等机构推出的视觉自监督学习（SSL）系列模型，，旨在通过大规模无监督学习...

2-5.应用工具其他

2个月前

Paper2Code项目简介 Paper2Code是由韩国科学技术院（KAIST）和DeepAuto.ai联合开发的创新框架，旨在将机器学习领域的研究论文自动转换为可执行的代码库。该框...

2-5.应用工具其他

2个月前

Concept Lancet项目简介 Concept Lancet（CoLan）是由宾夕法尼亚大学的研究团队开发的一种新型图像编辑框架，旨在通过精确的表示操作改善基于扩散模型的图像...

2-2.应用工具图像

2个月前

Ev-DeblurVSR项目简介 Ev-DeblurVSR是由中国科学技术大学脑智感知与认知教育部重点实验室、合肥综合性国家科学中心人工智能研究所以及新加坡国立大学的研究团...

2-5.应用工具其他

2个月前