RobotFingerPrint:为多种不同的机械夹爪生成有效的抓取姿态

RobotFingerPrint简介 RobotFingerPrint是由德克萨斯大学达拉斯分校计算机科学系的研究团队开发的一种创新性抓取合成方法。该技术提出了统一夹爪坐标空间(UG...

DepthFlow:一款高度可定制的 2.5D 平面动画工具

DepthFlow简介 DepthFlow 是一款高度可定制的 2.5D 平面动画工具,旨在为图像创建生动的视差效果。作为一个免费开源的项目,它通过 Gradio 提供用户友好的网...

Oryx MLLM:清华、腾讯以及南洋理工联合推出的多模态大型语言模型

Oryx MLLM简介 Oryx MLLM是由清华大学、腾讯公司以及南洋理工大学S-Lab联合开发的多模态大型语言模型。该模型通过创新的预训练OryxViT视觉编码器和动态压缩模...

PMRF:一种新颖的照片级真实感图像恢复算法

PMRF简介 Posterior-Mean Rectified Flow (PMRF) 是一种先进的图像恢复算法,由以色列理工学院的开发团队提出,旨在实现最小均方误差(MSE)的图像复原,同时...

Stable Video Portraits:创建逼真的谈话面部视频,具有照片级真实感

Stable Video Portraits简介 Stable Video Portraits 是由德国马克斯·普朗克智能系统研究所和达姆施塔特工业大学的团队开发的一种创新技术。这项技术能够生成...

Emu3:BAAI推出的一款高效多模态模型

Emu3简介 Emu3是由BAAI推出的一款多模态模型,它通过单一的Transformer架构和next-token prediction方法,在视频、图像和文本的生成与感知任务上取得了突破性...

HouseCrafter:将二维平面图转换成三维室内场景

HouseCrafter简介 HouseCrafter是由东北大学与Stability AI的研究人员共同开发的一种创新方法,能够将二维平面图转换成逼真的大型三维室内场景。该技术依托于...

WebDesignAgent:一款自动化网站设计工具

WebDesignAgent 简介 WebDesignAgent 是一款自动化网站设计工具,旨在简化网站创建过程。用户只需输入文本描述、上传图片或提供视觉布局,WebDesignAgent 就...

Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具

Voice-Pro简介 Voice-Pro是一款集字幕、翻译和文本转语音(TTS)于一体的多语言音频处理工具,旨在为内容创作者提供高效的解决方案。它支持超过90种语言的实...

人工智能平台联盟将系统和芯片公司聚集在一起

AI Platform Alliance是一个致力于将关键芯片和硬件结合在一起,以提供更开放、经济和可持续的解决方案来运行现代AI计算服务的联盟。该联盟最初由AI加速器公...
1 103 104 105 106 107 214