TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Image Generation	ARKitScenes	GAUDI	FID	37.35	# 1
Image Generation	ARKitScenes	GAUDI	FID (SwAV)	4.14	# 4
Image Generation	ARKitScenes	GSN	FID	79.54	# 2
Image Generation	ARKitScenes	GSN	FID (SwAV)	10.21	# 3
Image Generation	ARKitScenes	π-GAN	FID	134.8	# 4
Image Generation	ARKitScenes	π-GAN	FID (SwAV)	15.58	# 1
Image Generation	ARKitScenes	GRAF	FID	87.06	# 3
Image Generation	ARKitScenes	GRAF	FID (SwAV)	13.44	# 2
Image Generation	Replica	GRAF	FID	65.37	# 3
Image Generation	Replica	GRAF	FID (SwAV)	5.76	# 2
Image Generation	Replica	π-GAN	FID	166.55	# 4
Image Generation	Replica	π-GAN	FID (SwAV)	13.17	# 1
Image Generation	Replica	GSN	FID	41.75	# 2
Image Generation	Replica	GSN	FID (SwAV)	4.14	# 3
Image Generation	Replica	GAUDI	FID	18.75	# 1
Image Generation	Replica	GAUDI	FID (SwAV)	1.76	# 4
Image Generation	VizDoom	GAUDI	FID	33.7	# 1
Image Generation	VizDoom	GAUDI	FID (SwAV)	3.24	# 4
Image Generation	VizDoom	GSN	FID	37.21	# 2
Image Generation	VizDoom	GSN	FID (SwAV)	4.56	# 3
Image Generation	VizDoom	π-GAN	FID	143.55	# 4
Image Generation	VizDoom	π-GAN	FID (SwAV)	15.26	# 1
Image Generation	VizDoom	GRAF	FID	47.5	# 3
Image Generation	VizDoom	GRAF	FID (SwAV)	5.44	# 2
Image Generation	VLN-CE	GRAF	FID	90.43	# 3
Image Generation	VLN-CE	GRAF	FID (SwAV)	8.65	# 2
Image Generation	VLN-CE	GAUDI	FID	18.52	# 1
Image Generation	VLN-CE	GAUDI	FID (SwAV)	3.63	# 4
Image Generation	VLN-CE	π-GAN	FID	151.26	# 4
Image Generation	VLN-CE	π-GAN	FID (SwAV)	14.07	# 1
Image Generation	VLN-CE	GSN	FID	43.32	# 2
Image Generation	VLN-CE	GSN	FID (SwAV)	6.19	# 3

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gaudi-a-neural-architect-for-immersive-3d/image-generation-on-arkitscenes)](https://paperswithcode.com/sota/image-generation-on-arkitscenes?p=gaudi-a-neural-architect-for-immersive-3d)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gaudi-a-neural-architect-for-immersive-3d/image-generation-on-replica)](https://paperswithcode.com/sota/image-generation-on-replica?p=gaudi-a-neural-architect-for-immersive-3d)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gaudi-a-neural-architect-for-immersive-3d/image-generation-on-vizdoom)](https://paperswithcode.com/sota/image-generation-on-vizdoom?p=gaudi-a-neural-architect-for-immersive-3d)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gaudi-a-neural-architect-for-immersive-3d/image-generation-on-vln-ce)](https://paperswithcode.com/sota/image-generation-on-vln-ce?p=gaudi-a-neural-architect-for-immersive-3d)`

GAUDI: A Neural Architect for Immersive 3D Scene Generation

27 Jul 2022 · Miguel Angel Bautista, Pengsheng Guo, Samira Abnar, Walter Talbott, Alexander Toshev, Zhuoyuan Chen, Laurent Dinh, Shuangfei Zhai, Hanlin Goh, Daniel Ulbricht, Afshin Dehghan, Josh Susskind ·

We introduce GAUDI, a generative model capable of capturing the distribution of complex and realistic 3D scenes that can be rendered immersively from a moving camera. We tackle this challenging problem with a scalable yet powerful approach, where we first optimize a latent representation that disentangles radiance fields and camera poses. This latent representation is then used to learn a generative model that enables both unconditional and conditional generation of 3D scenes. Our model generalizes previous works that focus on single objects by removing the assumption that the camera pose distribution can be shared across samples. We show that GAUDI obtains state-of-the-art performance in the unconditional generative setting across multiple datasets and allows for conditional generation of 3D scenes given conditioning variables like sparse image observations or text that describes the scene.

PDF Abstract

Code

Add Remove Mark official

apple/ml-gaudi official

604

Tasks

Add Remove

Image Generation

Scene Generation

Datasets

NeRF

Replica

VizDoom

VLN-CE

ARKitScenes

Results from the Paper

Edit

Ranked #1 on Image Generation on ARKitScenes

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Image Generation	ARKitScenes	GAUDI	FID	37.35	# 1	Compare
Image Generation	ARKitScenes	GAUDI	FID (SwAV)	4.14	# 4	Compare
Image Generation	ARKitScenes	GSN	FID	79.54	# 2	Compare
Image Generation	ARKitScenes	GSN	FID (SwAV)	10.21	# 3	Compare
Image Generation	ARKitScenes	π-GAN	FID	134.8	# 4	Compare
Image Generation	ARKitScenes	π-GAN	FID (SwAV)	15.58	# 1	Compare
Image Generation	ARKitScenes	GRAF	FID	87.06	# 3	Compare
Image Generation	ARKitScenes	GRAF	FID (SwAV)	13.44	# 2	Compare
Image Generation	Replica	GRAF	FID	65.37	# 3	Compare
Image Generation	Replica	GRAF	FID (SwAV)	5.76	# 2	Compare
Image Generation	Replica	π-GAN	FID	166.55	# 4	Compare
Image Generation	Replica	π-GAN	FID (SwAV)	13.17	# 1	Compare
Image Generation	Replica	GSN	FID	41.75	# 2	Compare
Image Generation	Replica	GSN	FID (SwAV)	4.14	# 3	Compare
Image Generation	Replica	GAUDI	FID	18.75	# 1	Compare
Image Generation	Replica	GAUDI	FID (SwAV)	1.76	# 4	Compare
Image Generation	VizDoom	GAUDI	FID	33.7	# 1	Compare
Image Generation	VizDoom	GAUDI	FID (SwAV)	3.24	# 4	Compare
Image Generation	VizDoom	GSN	FID	37.21	# 2	Compare
Image Generation	VizDoom	GSN	FID (SwAV)	4.56	# 3	Compare
Image Generation	VizDoom	π-GAN	FID	143.55	# 4	Compare
Image Generation	VizDoom	π-GAN	FID (SwAV)	15.26	# 1	Compare
Image Generation	VizDoom	GRAF	FID	47.5	# 3	Compare
Image Generation	VizDoom	GRAF	FID (SwAV)	5.44	# 2	Compare
Image Generation	VLN-CE	GRAF	FID	90.43	# 3	Compare
Image Generation	VLN-CE	GRAF	FID (SwAV)	8.65	# 2	Compare
Image Generation	VLN-CE	GAUDI	FID	18.52	# 1	Compare
Image Generation	VLN-CE	GAUDI	FID (SwAV)	3.63	# 4	Compare
Image Generation	VLN-CE	π-GAN	FID	151.26	# 4	Compare
Image Generation	VLN-CE	π-GAN	FID (SwAV)	14.07	# 1	Compare
Image Generation	VLN-CE	GSN	FID	43.32	# 2	Compare
Image Generation	VLN-CE	GSN	FID (SwAV)	6.19	# 3	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

GAUDI: A Neural Architect for Immersive 3D Scene Generation

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove