Awesome 3D Diffusion

This repo collects papers that use diffusion models for 3D generation.

🔥🔥🔥 Check out our collection of papers on 4D generation: https://github.com/cwchenwang/awesome-4d-generation

🔥🔥🔥 Please take a look at our survey on diffusion models for 3D Generation, which gives a summary of the papers of this list: https://github.com/cwchenwang/awesome-3d-diffusion/blob/main/survey.pdf

If you consider our paper or list useful, please cite our paper:

@article{wang2024diffusion,
  title={Diffusion Models for 3D Generation: A Survey},
  author={Wang, Chen and Peng, Hao-Yang and Liu, Ying-Tian and Gu, Jiatao and Hu, Shi-Min},
  journal={arXiv},
  year={2024}
}

Note: This list is far from complete, please directly open a pull request if you want to add a paper or modify the information. You don't need to open an issue.

2D Diffusion with Pretraining

2D Diffusion without Pretraining

3D Objects

Novel View Synthesis with Diffusion Models, Watson et al., ICLR 2023
Generative Novel View Synthesis with 3D-Aware Diffusion Models, Chan et al., Arxiv 2023
NerfDiff: Single-image View Synthesis with NeRF-guided Distillation from 3D-aware Diffusion, Gu et al., ICML 2023
3DDesigner: Towards Photorealistic 3D Object Generation and Editing with Text-guided Diffusion Models, Li et al., Arxiv 2022
SparseFusSparseFusion: Distilling View-conditioned Diffusion for 3D Reconstruction, Zhou and Tulsiani, CVPR 2023
HoloDiffusion: Training a 3D Diffusion Model using 2D Images, Karnewar et al., CVPR 2023
Renderdiffusion: Image Diffusion for 3D Reconstruction, Inpainting and Generation, Anciukevičius et al., CVPR 2023
Diffusion with Forward Models: Solving Stochastic Inverse Problems Without Direct Supervision, Tewari et al., Arxiv 2023
3D-aware Image Generation using 2D Diffusion Models, Xiang et al., Arxiv 2023
Viewset Viewset Diffusion: (0-)Image-Conditioned 3D Generative Models from 2D Data, Szymanowicz et al., Arxiv 2023
HOLOFUSION: Towards Photo-realistic 3D Generative Modeling, Karnewar et al., Arxiv 2023
ZeroNVS: Zero-Shot 360-Degree View Synthesis from a Single Real Image, Sargent et al., Arxiv 2023
Instant3D: Fast Text-to-3D with Sparse-view Generation and Large Reconstruction Model, Li et al., Arxiv 2023
DMV3D: Denoising Multi-View Diffusion using 3D Large Reconstruction Model, Xu et al., Arxiv 2023
LRM: Large Reconstruction Model for Single Image to 3D, Hong et al., Arxiv 2023
WildFusion: Learning 3D-Aware Latent Diffusion Models in View Space, Schwarz et al., Arxiv 2023
ViewFusion: Learning Composable Diffusion Models for Novel View Synthesis, Spiegl et al., Arxiv 2024

3D Scenes

Consistent View Synthesis with Pose-Guided Diffusion Models, Tseng et al., CVPR 2023
Long-Term Photometric Consistent Novel View Synthesis with Diffusion Models, Yu et al., Arxiv 2023
DiffDreamer: Towards Consistent Unsupervised Single-view Scene Extrapolation with Conditional Diffusion Models, Cai et al., Arxiv 2023
SemCity: Semantic Scene Generation with Triplane Diffusion, Lee et al., CVPR 2024

Diffusion in 3D Space

3D Gaussians

GVGEN: Text-to-3D Generation with Volumetric Representation, He et al., Arxiv 2024
GaussianCube: Structuring Gaussian Splatting using Optimal Transport for 3D Generative Modeling, Zhang et al., Arxiv 2024
Atlas Gaussians Diffusion for 3D Generation with Infinite Number of Points, Yang et al., Arxiv 2024

Point Cloud, Meshs, Volumes

Diffusion Probabilistic Models for 3D Point Cloud Generation, Luo et al., CVPR 2021
3d shape generation and completion through point-voxel diffusion, Zhou et al., Arxiv 2021
A Diffusion-ReFinement Model for Sketch-to-Point Modeling, Kong et al., ACCV 2022
Controllable Mesh Generation Through Sparse Latent Point Diffusion Models, Lyu et al., CVPR 2023
Point-E: A System for Generating 3D Point Clouds from Complex Prompts, Nichol et al., ICML 2023
DiffFacto: Controllable Part-Based 3D Point Cloud Generation with Cross Diffusion, Nakayama et al., Arxiv 2023
Sketch and Text Guided Diffusion Model for Colored Point Cloud Generation, Wu et al., ICCV 2023
DiT-3D: Exploring Plain Diffusion Transformers for 3D Shape Generation, Mo et al., Arxiv 2023
MeshGPT: Generating Triangle Meshes with Decoder-Only Transformers, Siddiqui et al., CVPR 2024
ShapeGPT: 3D Shape Generation with A Unified Multi-modal Language Model, Yin et al., Arxiv 2023
VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder, Tang et al., Arxiv 2023
SPiC·E: Structural Priors in 3D Diffusion Models using Cross-Entity Attention, Sella et al., Arxiv 2023
PolyDiff: Generating 3D Polygonal Meshes with Diffusion Models, Alliegro et al., Arxiv 2023

Implicit Representation

Learning A Diffusion Prior For Nerfs, Yang et al., ICLRW 2023
Tetrahedral Diffusion Models for 3D Shape Generation, Nikolai and Torben et al., Arxiv 2022
MeshDiffusion: Score-based Generative 3D Mesh Modeling, Liu et al., ICLR 2023
Neural Wavelet-domain Diffusion for 3D Shape Generation, Hui et al., SIGGRAPH Asia 2022
Neural Wavelet-domain Diffusion for 3D Shape Generation, Inversion, and Manipulation, Hu and Hui et al., Arxiv 2023
DiffRF: Rendering-Guided 3D Radiance Field Diffusion, Muller et al., CVPR 2023
Locally Attentional SDF Diffusion for Controllable 3D Shape Generation, Zheng et al., SIGGRAPH 2023
HyperDiffusion: Generating Implicit Neural Fields with Weight-Space Diffusion, Erkoç et al., ICCV 2023
DiffComplete: Diffusion-based Generative 3D Shape Completion, Chu et al., Arxiv 2023
DiffRoom: Diffusion-based High-Quality 3D Room Reconstruction and Generation, Ju et al., Arxiv 2023
Surf-D: High-Quality Surface Generation for Arbitrary Topologies using Diffusion Models, Yu et al., Arxiv 2023

Triplane

3D Neural Field Generation using Triplane Diffusion, Shue et al., Arxiv 2022
DiffusionSDF: Conditional Generative Modeling of Signed Distance Functions, Chou et al., Arxiv 2022
Rodin: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion, Wang et al., CVPR 2023
3DGen: Triplane Latent Diffusion for Textured Mesh Generation, Gupta et al., Arxiv 2023
Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction, Chen et al., Arxiv 2023
Learning Controllable 3D Diffusion Models from Single-view Images, Gu et al., Arxiv 2023
Compress3D: a Compressed Latent Space for 3D Generation from a Single Image, Zhang et al., Arxiv 2024
Dual3D: Efficient and Consistent Text-to-3D Generation with Dual-mode Multi-view Latent Diffusion, Li et al., Arxiv 2024
Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer, Wu et al., Arxiv 2024

Latent Representation

GAUDI: A Neural Architect for Immersive 3D Scene Generation, Bautista et al., NeurIPS 2022
LION: Latent Point Diffusion Models for 3D Shape Generation, Zeng et al., NeurIPS 2022
Diffusion-SDF: Text-to-Shape via Voxelized Diffusion, Li et al., CVPR 2023
3D-LDM: Neural Implicit 3D Shape Generation with Latent Diffusion Models, Nam et al., Arxiv 2022
3DShape2VecSet: A 3D Shape Representation for Neural Fields and Generative Diffusion Models, Zhang et al., SIGGRAPH 2023
Shap-E: Generating Conditional 3D Implicit Functions, Jun et al., Arxiv 2023
StyleAvatar3D: Leveraging Image-Text Diffusion Models for High-Fidelity 3D Avatar Generation, Zhang et al., Arxiv 2023
AutoDecoding Latent 3D Diffusion Models, Ntavelis et al., Arxiv 2023
XCube: Large-Scale 3D Generative Modeling using Sparse Voxel Hierarchies, Ren et al., CVPR 2024
LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation, Lan et al., Arxiv 2024

Novel Representations

X-Ray: A Sequential 3D Representation for Generation, Hu et al., Arxiv 2024
Geometry Image Diffusion: Fast and Data-Efficient Text-to-3D with Image-Based Surface Representation, Elizarov et al., Arxiv 2024
3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion, Chen et al., Arxiv 2024

Diffusion for Motion

Human Motion

SMooDi: Stylized Motion Diffusion Model, Lei et al., ECCV 2024
Single Motion Diffusion, Raab et al., ICLR 2024
OmniControl: Control Any Joint at Any Time for Human Motion Generation, Xie et al., ICLR 2024
Human Motion Diffusion as a Generative Prior, Shafir et al., ICLR 2024
MotionMix: Weakly-Supervised Diffusion for Controllable Motion Generation, Hoang et al., AAAI 2024
DNO: Optimizing Diffusion Noise Can Serve As Universal Motion Priors, Karunratanakul et al., Arxiv 2023
RoHM: Robust Human Motion Reconstruction via Diffusion, Zhang et al., Arxiv 2023
EMDM: Efficient Motion Diffusion Model for Fast, High-Quality Human Motion Generation, Zhou et al., Arxiv 2023
DiffusionPhase: Motion Diffusion in Frequency Domain, Wan et al., Arxiv 2023
InterControl: Generate Human Motion Interactions by Controlling Every Joint, Wang et al., Arxiv 2023
AAMDM: Accelerated Auto-regressive Motion Diffusion Model, Li et al., Arxiv 2023
ReMoS: Reactive 3D Motion Synthesis for Two-Person Interactions, Ghosh et al., Arxiv 2023
HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using Diffusion Models, Peng et al., Arxiv 2023
Controllable Motion Diffusion Model, Shi et al., Arxiv 2023
MAS: Multi-view Ancestral Sampling for 3D motion generation using 2D diffusion, Kapon et al., Arxiv 2023
CG-HOI: Contact-Guided 3D Human-Object Interaction Generation, Diller et al., Arxiv 2023
A Unified Framework for Multimodal, Multi-Part Human Motion Synthesis, Zhou et al., Arxiv 2023
Controllable Motion Synthesis and Reconstruction with Autoregressive Diffusion Models, Yin et al., Arxiv 2023
Guided Motion Diffusion for Controllable Human Motion Synthesis, Karunratanakul et al., ICCV 2023
Hierarchical Generation of Human-Object Interactions with Diffusion Probabilistic Models, Pi et al., ICCV 2023
PhysDiff: Physics-Guided Human Motion Diffusion Model, Yuan et al., ICCV 2023
Priority-Centric Human Motion Generation in Discrete Latent Space, Kong et al., ICCV 2023
ReMoDiffuse: Retrieval-Augmented Motion Diffusion Model, Zhang et al., ICCV 2023
Flame: Free-form language-based motion synthesis & editing, Kim et al., AAAI 2023
Object Motion Guided Human Motion Synthesis, Li et al., SIG ASIA 2023, TOG 2023
Controllable Group Choreography using Contrastive Diffusion, Le et al., TOG 2023
Listen, denoise, action! Audio-driven motion synthesis with diffusion models, Alexanderson et al., SIG 2023, TOG 2023
GestureDiffuCLIP: Gesture Diffusion Model with CLIP Latents Ao et al., SIG 2023, TOG 2023
Taming Diffusion Models for Audio-Driven Co-Speech Gesture Generation, Zhu et al., CVPR 2023
MoFusion: A Framework for Denoising-Diffusion-based Motion Synthesis, Dabral et al., CVPR 2023
Executing your Commands via Motion Diffusion in Latent Space, Jiang et al., CVPR 2023
MDM: Human Motion Diffusion Model, Tevet et al., ICLR 2023
MotionDiffuse: Text-Driven Human Motion Generation with Diffusion Model, Zhang et al., Arxiv 2022

Name		Name	Last commit message	Last commit date
Latest commit History 60 Commits
LICENSE		LICENSE
README.md		README.md
survey.pdf		survey.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Awesome 3D Diffusion

Table of Contents

2D Diffusion with Pretraining

Text-to-3D Object Generation

Compositional or Scene Generation

Image-to-3D

Human and Animal

3D Editing

Texturing

Multi-view Diffusion

2D Diffusion without Pretraining

3D Objects

3D Scenes

Diffusion in 3D Space

3D Gaussians

Point Cloud, Meshs, Volumes

Implicit Representation

Triplane

Latent Representation

Novel Representations

Diffusion for Motion

Human Motion

About

Releases

Packages

Contributors 10

License

cwchenwang/awesome-3d-diffusion

Folders and files

Latest commit

History

Repository files navigation

Awesome 3D Diffusion

Table of Contents

2D Diffusion with Pretraining

Text-to-3D Object Generation

Compositional or Scene Generation

Image-to-3D

Human and Animal

3D Editing

Texturing

Multi-view Diffusion

2D Diffusion without Pretraining

3D Objects

3D Scenes

Diffusion in 3D Space

3D Gaussians

Point Cloud, Meshs, Volumes

Implicit Representation

Triplane

Latent Representation

Novel Representations

Diffusion for Motion

Human Motion

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 10

Packages