SceneTeller：通过文本描述生成高质量3D场景

2-2.应用工具图像3个月前更新 AI-77

0 20

SceneTeller简介

SceneTeller是由阿姆斯特丹大学的UvA-Bosch Delta Lab与博世公司的Bosch Center for AI合作开发的一项创新技术。这项技术能够根据自然语言描述的文本提示，生成高质量、逼真的3D室内场景。用户可以通过简单的文本指令来设计个性化的空间，包括控制对象的放置和风格。SceneTeller的推出，标志着3D设计领域向民主化迈出了重要一步，使得非专业用户也能轻松创建和编辑3D场景。

SceneTeller：通过文本描述生成高质量3D场景

SceneTeller主要功能

文本到3D场景生成：用户可以用自然语言描述场景布局和对象摆放，SceneTeller据此生成3D场景。
风格编辑：用户可以对整个场景或场景中的个别对象进行风格修改，通过文本指令实现不同风格的应用。
易于使用：即使是3D设计的新手，也能通过简单的文本交互来创建和修改3D场景。
高质量渲染：利用3D Gaussian Splatting技术实现快速且高质量的场景渲染。
灵活性和实用性：提供了一个灵活的框架，支持用户进行个性化设计和场景编辑。

SceneTeller技术原理

上下文学习：SceneTeller使用大型语言模型（LLMs）通过上下文学习来理解文本提示，并生成符合描述的3D布局。
3D布局生成：系统将文本描述转换为3D空间中的对象布局，包括对象的位置、尺寸和方向。
CAD模型检索：根据生成的3D布局，从数据库中检索相应的CAD模型以构建场景。
3D Gaussian Splatting：使用3D高斯溅射技术来表示场景，允许对场景进行快速渲染和编辑。
场景编辑：通过训练3D Gaussian Splatting模型，根据用户文本指令对场景或特定对象进行风格化编辑。
优化和损失函数：在3D Gaussian Splatting模型训练中使用L1损失和SSIM损失函数，确保场景编辑的质量和一致性。
二阶段渲染：首先将3D场景渲染为RGB图像，然后使用2D分割掩码进行编辑，实现对特定对象的精确控制。

SceneTeller：通过文本描述生成高质量3D场景

SceneTeller应用场景

室内装修设计：用户可以快速预览不同家具布局和风格选择，辅助室内设计决策。
游戏开发：为游戏设计师提供快速生成复杂室内场景的工具，提高开发效率。
电影和动画制作：用于创建虚拟的3D场景，减少实际布景的需求，节省成本。
虚拟现实(VR)体验：生成逼真的3D环境，提供沉浸式的VR体验。
教育和培训：在建筑学和室内设计课程中作为教学工具，帮助学生理解空间布局。
房地产展示：为潜在买家展示房产的3D视图，提供更加直观的房产信息。

SceneTeller项目入口

官方项目主页：https://sceneteller.github.io/
arXiv研究论文：https://arxiv.org/abs/2407.20727

# 2-2.应用工具图像 # 2.应用工具相关 # 3-2.图片生成模型 # 3.AI大模型数据库 # AI项目库

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

HelloMeme：专注于生成具有高度细节和真实感的表情包视频

AI-77cn

20

Make-It-Animatable：中科大联合腾讯推出的3D角色动画框架

AI-77cn

20

ReasonIR-8B：Meta AI研究团队开发的新型检索器

AI-77cn

30

Real-time-translation-typing：实时翻译打字功能

AI-77cn

60

mPLUG-DocOwl 1.5：阿里&中国人民大学推出的一款OCR-free文档理解模型

AI-77cn

60

CAVIA：苹果、谷歌等团队联合推出的多视图视频生成框架

AI-77cn

30

暂无评论

暂无评论...

一站式AI信息服务平台：AI工具大全、AI每日快讯、AI项目库、AI融资快报、AI研究报告、AI教程、AI副业、AI考证等。助您全面系统了解AI、使用AI

关于我们广告合作免责声明柒柒快讯

Copyright © 2025 柒柒AI导航粤ICP备2023146609号-1

粤公网安备44011102483711号