2-5.应用工具其他

DeepGEMM:DeepSeek 推出的 FP8 矩阵乘法库

DeepGEMM简介 DeepGEMM 是由 DeepSeek 推出的一个高效 FP8 矩阵乘法(GEMM)库,专为 NVIDIA Hopper 架构 GPU 设计。它以简洁高效为理念,支持普通和混合专家...

3FS:DeepSeek 推出的高性能分布式文件系统

3FS简介 Fire-Flyer File System(3FS)是由 DeepSeek 推出的高性能分布式文件系统,专为应对人工智能训练和推理工作负载的挑战而设计。它利用现代 SSD 和 RD...

DeepEP:DeepSeek开源的专家并行通信库

DeepEP简介 DeepEP是由DeepSeek团队开发的一款高效专家并行通信库,专为混合专家模型(Mixture-of-Experts, MoE)和专家并行(EP)任务设计。它通过优化的全...

AgentSociety:清华大学推出的大型社会模拟器

AgentSociety简介 AgentSociety是由清华大学电子工程系、经济研究所、公共政策与管理学院联合开发的大型社会模拟器。该平台结合了大型语言模型(LLM)驱动的...

SigLIP 2:谷歌推出的多语言视觉-语言编码器

SigLIP 2简介 SigLIP 2是由Google DeepMind团队开发的一种新型多语言视觉-语言编码器。它在SigLIP的基础上进行了多项改进,通过结合基于标题的预训练、自监督...

ComfyUI-Copilot:阿里推出的基于ComfyUI框架的AI智能助手

ComfyUI-Copilot简介 ComfyUI-Copilot是由阿里巴巴国际数字商务团队(Alibaba International Digital Commerce)开发的一款基于ComfyUI框架的AI智能助手。它...

HOMIE:上海人工智能实验室等推出的人形机器人遥操作系统

HOMIE简介 HOMIE(Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit)是由上海人工智能实验室和香港中文大学多媒体实验室联合开发的人形机器...

Muse:微软推出的专为游戏创意设计的生成式AI模型

Muse简介 Muse是由微软研究院的Game Intelligence团队和Teachable AI Experiences团队联合开发的首个生成式AI模型,专为游戏创意设计。该模型能够生成游戏视...

Helix:Figure推出的通用视觉-语言-动作模型

Helix简介 Helix是由Figure推出的视觉-语言-行动(Vision-Language-Action, VLA)模型,旨在实现通用人形机器人的全身控制。该模型通过结合视觉感知、语言理...

CRAW4LLM:清华大学等推出的高效网络爬虫方法

CRAW4LLM简介 CRAW4LLM是由清华大学计算机科学与技术系和卡内基梅隆大学计算机学院联合开发的一种高效网络爬虫方法,旨在为大型语言模型(LLM)的预训练提供...
1 6 7 8 9 10 27