Pika推出视频编辑功能Pika Twists
Pika Labs 于 2025 年 4 月 11 日推出一项 AI 视频编辑功能Pika Twists 。它允许用户通过简单的文本提示或直观工具,精准操控视频中特定角色或物体的动作、位...
Notion MCP Server:Notion官方开发的开源项目
Notion MCP Server 简介 Notion MCP Server 是一个由 Notion 官方开发的开源项目,旨在通过 MCP(Machine Content Processing)技术为 Notion API 提供强大的...
UNO:字节跳动推出的新型图像生成模型
UNO简介 UNO是由字节跳动推出的新型图像生成模型。它通过“少到多”的泛化方法,利用上下文生成能力解锁了更多的可控性,能够实现从单主体到多主体的高一致性图...
Krea 推出 2D 图像转 3D 场景的 AI 工具Krea Stage
2025年4月10日,Krea正式发布了全新AI工具Krea Stage。该工具能够将2D图像快速转换为可编辑的3D场景,并进一步生成高质量视频内容。用户只需上传一张图片,Kr...
Versatile-OCR-Program:一款开源的多模态OCR工具
Versatile-OCR-Program简介 Versatile-OCR-Program是一个专为机器学习训练优化的多模态OCR系统,能从复杂教育材料(如考试试卷)中提取结构化数据。它支持多...
BrowseComp:OpenAI 开源的 AI Agent 网络浏览能力基准
BrowseComp简介 BrowseComp是由OpenAI开源的一个用于衡量智能代理网络浏览能力的基准测试。它包含1266个问题,这些问题需要在互联网上进行深入搜索才能找到答...
Fourier N1:傅利叶开源的首款开源人形机器人
Fourier N1 简介 Fourier N1 是由通用机器人公司傅利叶开源的首款开源人形机器人。它身高1.3米,重38公斤,拥有23个自由度,搭载自研的FSA 2.0一体化执行器和...
商汤科技发布“日日新SenseNova V6”多模态融合大模型
2025年4月10日,商汤科技发布了“日日新SenseNova V6”多模态融合大模型。该模型具备最长64K思维链、数理分析、多模态深度推理和全局记忆等能力,支持长达10分...
ChatGPT正式上线了全新的记忆功能
2025年4月11日,ChatGPT正式上线了全新的记忆功能。该功能使ChatGPT能够在每次对话中参考用户过去的所有聊天记录,从而提供更个性化、贴合用户需求的回复。用...
Creati:去除背景、更换背景,并提供虚拟试穿功能
Creati简介 Creati – AI照片生成应用 是一款基于先进AI技术的创新工具,旨在帮助用户轻松创建高质量、专业级照片。通过一键操作,Creati能够自动优化照片,去...