LeX-Art:满足用户对于图像质量和视觉效果的高要求

LeX-Art简介 LeX-Art是一个致力于提升文本到图像合成质量的综合性研究项目。它通过数据驱动的方法,构建了LeX-10K这一包含10,000张高分辨率、高质量文本图像...

ModelEngine:华为开源的全流程 AI 开发工具链

ModelEngine 简介 ModelEngine 是由华为开发团队推出的开源全流程 AI 开发工具链。它为开发者提供从模型设计、训练、优化到部署的全生命周期支持,涵盖计算机...

BizGen:专注于推进文章级别的视觉文本渲染技术

BizGen简介 BizGen是由清华大学、布朗大学、利物浦大学、微软亚洲研究院和微软联合推出的AI信息图生成工具,专注于推进文章级别的视觉文本渲染技术,尤其在信...

Bolt3D:谷歌联合牛津大学等推出的3D场景生成模型

Bolt3D简介 Bolt3D是由Google Research、VGG – University of Oxford以及Google DeepMind联合开发的3D场景生成模型。它能够在几秒钟内从一张或多张输入图像直...

Piece it Together:高效地生成完整且连贯的概念设计

Piece it Together简介 Piece it Together(PiT)是由特拉维夫大学和Bria AI联合开发的一种创新的生成框架,旨在帮助视觉设计师和艺术家从部分视觉组件出发,...

艾伦AI研究所推出文献搜索系统 Ai2 Paper Finder

Ai2 Paper Finder 是由艾伦人工智能研究所(Allen Institute for AI)于2025年3月28日发布的一款基于大型语言模型(LLM)的文献搜索系统。它模拟人类研究者查...

生数科技推出的高可控视频大模型Vidu Q1

2025年3月29日,在中关村论坛人工智能日的主题演讲上,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军发布了高可控视频大模型Vidu Q1。这是...

OpenAI 宣布升级 GPT-4o 并面向所有付费用户开放

2025年3月27日,OpenAI宣布对GPT-4o模型进行功能更新。此次更新聚焦于四大核心部分:多指令解析优化、技术问题处理增强、逻辑推理与创造力提升以及交互界面精...

阿里通义推出视觉推理模型QVQ-Max

2025 年 3 月 28 日凌晨,阿里通义千问团队正式推出新一代视觉推理模型 QVQ-Max。作为 QVQ-72B-Preview 的升级版,QVQ-Max 不仅能够理解图片和视频内容,还能...

可灵AI迎来全新改版 全面升级视觉体系与交互体验

2025年3月27日,可灵AI平台完成全面改版,以“可灵AI,灵感成真”为核心理念,对视觉体系和交互体验进行升级。视觉方面采用极简主义设计,减少视觉干扰,突出创...
1 13 14 15 16 17 214