open-mmlab · zengyh1900 · Mar 9, 2023 · Mar 9, 2023 · Mar 9, 2023 · Mar 9, 2023
diff --git a/configs/disco_diffusion/disco-diffusion_adm-u-finetuned_imagenet-256x256.py b/configs/disco_diffusion/disco-diffusion_adm-u-finetuned_imagenet-256x256.py
@@ -26,7 +26,7 @@
 secondary_model = dict(type='SecondaryDiffusionImageNet2')
 
 diffusion_scheduler = dict(
-    type='DDIMScheduler',
+    type='EditDDIMScheduler',
     variance_type='learned_range',
     beta_schedule='linear',
     clip_sample=False)

diff --git a/configs/disco_diffusion/disco-diffusion_adm-u-finetuned_imagenet-512x512.py b/configs/disco_diffusion/disco-diffusion_adm-u-finetuned_imagenet-512x512.py
@@ -26,7 +26,7 @@
 secondary_model = dict(type='SecondaryDiffusionImageNet2')
 
 diffusion_scheduler = dict(
-    type='DDIMScheduler',
+    type='EditDDIMScheduler',
     variance_type='learned_range',
     beta_schedule='linear',
     clip_sample=False)

diff --git a/configs/stable_diffusion/stable-diffusion_ddim_denoisingunet.py b/configs/stable_diffusion/stable-diffusion_ddim_denoisingunet.py
@@ -38,7 +38,7 @@
     ])
 
 diffusion_scheduler = dict(
-    type='DDIMScheduler',
+    type='EditDDIMScheduler',
     variance_type='learned_range',
     beta_end=0.012,
     beta_schedule='scaled_linear',

diff --git a/mmedit/models/base_archs/__init__.py b/mmedit/models/base_archs/__init__.py
@@ -1,5 +1,9 @@
 # Copyright (c) OpenMMLab. All rights reserved.
 # To register Deconv
+import warnings
+from typing import List
+
+from mmedit.utils import try_import
 from .all_gather_layer import AllGatherLayer
 from .aspp import ASPP
 from .conv import *  # noqa: F401, F403
@@ -19,6 +23,38 @@
 from .upsample import PixelShufflePack
 from .vgg import VGG16
 
+
+def register_diffusers_models() -> List[str]:
+    """Register models in ``diffusers.models`` to the ``MODELS`` registry.
+    Specifically, the registered models from diffusers only defines the network
+    forward without training. See more details about diffusers in:
+    https://huggingface.co/docs/diffusers/api/models.
+
+    Returns:
+        List[str]: A list of registered DIFFUSION_MODELS' name.
+    """
+    import inspect
+
+    from mmedit.registry import MODELS
+
+    diffusers = try_import('diffusers')
+    if diffusers is None:
+        warnings.warn('Diffusion Models are not registered as expect. '
+                      'If you want to use diffusion models, '
+                      'please install diffusers>=0.12.0.')
+        return None
+
+    DIFFUSERS_MODELS = []
+    for module_name in dir(diffusers.models):
+        module = getattr(diffusers.models, module_name)
+        if inspect.isclass(module):
+            MODELS.register_module(name=module_name, module=module)
+            DIFFUSERS_MODELS.append(module_name)
+    return DIFFUSERS_MODELS
+
+
+REGISTERED_DIFFUSERS_MODELS = register_diffusers_models()
+
 __all__ = [
     'ASPP', 'DepthwiseSeparableConvModule', 'SimpleGatedConvModule',
     'LinearModule', 'conv2d', 'conv_transpose2d', 'pixel_unshuffle',

diff --git a/mmedit/models/diffusion_schedulers/__init__.py b/mmedit/models/diffusion_schedulers/__init__.py
@@ -0,0 +1,48 @@
+# Copyright (c) OpenMMLab. All rights reserved.
+import warnings
+from typing import List
+
+from mmedit.utils import try_import
+from .ddim_scheduler import EditDDIMScheduler
+from .ddpm_scheduler import EditDDPMScheduler
+
+
+def register_diffusers_schedulers() -> List[str]:
+    """Register schedulers in ``diffusers.schedulers`` to the
+    ``DIFFUSION_SCHEDULERS`` registry. Specifically, the registered schedulers
+    from diffusers define the methodology for iteratively adding noise to an
+    image or for updating a sample based on model outputs. See more details
+    about schedulers in diffusers here:
+    https://huggingface.co/docs/diffusers/api/schedulers/overview.
+
+    Returns:
+        List[str]: A list of registered DIFFUSION_SCHEDULERS' name.
+    """
+
+    import inspect
+
+    from mmedit.registry import DIFFUSION_SCHEDULERS
+
+    diffusers = try_import('diffusers')
+    if diffusers is None:
+        warnings.warn('Diffusion Schedulers are not registered as expect. '
+                      'If you want to use diffusion models, '
+                      'please install diffusers>=0.12.0.')
+        return None
+
+    DIFFUSERS_SCHEDULERS = []
+    for module_name in dir(diffusers.schedulers):
+        if module_name.startswith('Flax'):
+            continue
+        elif module_name.endswith('Scheduler'):
+            _scheduler = getattr(diffusers.schedulers, module_name)
+            if inspect.isclass(_scheduler):
+                DIFFUSION_SCHEDULERS.register_module(
+                    name=module_name, module=_scheduler)
+                DIFFUSERS_SCHEDULERS.append(module_name)
+    return DIFFUSERS_SCHEDULERS
+
+
+REGISTERED_DIFFUSERS_SCHEDULERS = register_diffusers_schedulers()
+
+__all__ = ['EditDDIMScheduler', 'EditDDPMScheduler']
diff --git a/mmedit/models/editors/ddim/ddim_scheduler.py → ...ls/diffusion_schedulers/ddim_scheduler.py b/mmedit/models/editors/ddim/ddim_scheduler.py → ...ls/diffusion_schedulers/ddim_scheduler.py
@@ -9,9 +9,9 @@
 
 
 @DIFFUSION_SCHEDULERS.register_module()
-class DDIMScheduler:
-    """```DDIMScheduler``` support the diffusion and reverse process formulated
-    in https://arxiv.org/abs/2010.02502.
+class EditDDIMScheduler:
+    """```EditDDIMScheduler``` support the diffusion and reverse process
+    formulated in https://arxiv.org/abs/2010.02502.
 
     The code is heavily influenced by https://github.com/huggingface/diffusers/blob/main/src/diffusers/schedulers/scheduling_ddim.py. # noqa
     The difference is that we ensemble gradient-guided sampling in step function.

diff --git a/mmedit/models/editors/ddpm/ddpm_scheduler.py → ...ls/diffusion_schedulers/ddpm_scheduler.py b/mmedit/models/editors/ddpm/ddpm_scheduler.py → ...ls/diffusion_schedulers/ddpm_scheduler.py
@@ -9,7 +9,7 @@
 
 
 @DIFFUSION_SCHEDULERS.register_module()
-class DDPMScheduler:
+class EditDDPMScheduler:
 
     def __init__(self,
                  num_train_timesteps: int = 1000,
@@ -19,7 +19,7 @@ def __init__(self,
                  trained_betas: Optional[Union[np.array, list]] = None,
                  variance_type='fixed_small',
                  clip_sample=True):
-        """```DDPMScheduler``` support the diffusion and reverse process
+        """```EditDDPMScheduler``` support the diffusion and reverse process
         formulated in https://arxiv.org/abs/2006.11239.
 
         The code is heavily influenced by https://github.com/huggingface/diffusers/blob/main/src/diffusers/schedulers/scheduling_ddpm.py. # noqa

diff --git a/mmedit/models/editors/__init__.py b/mmedit/models/editors/__init__.py
@@ -7,8 +7,7 @@
 from .cain import CAIN, CAINNet
 from .cyclegan import CycleGAN
 from .dcgan import DCGAN
-from .ddim import DDIMScheduler
-from .ddpm import DDPMScheduler, DenoisingUnet
+from .ddpm import DenoisingUnet
 from .deepfillv1 import (ContextualAttentionModule, ContextualAttentionNeck,
                          DeepFillDecoder, DeepFillEncoder, DeepFillRefiner,
                          DeepFillv1Discriminators, DeepFillv1Inpaintor)
@@ -85,7 +84,6 @@
     'ProgressiveGrowingGAN', 'SinGAN', 'AblatedDiffusionModel',
     'DiscoDiffusion', 'IDLossModel', 'PESinGAN', 'MSPIEStyleGAN2',
     'StyleGAN3Generator', 'InstColorization', 'NAFBaseline',
-    'NAFBaselineLocal', 'NAFNet', 'NAFNetLocal', 'DDIMScheduler',
-    'DDPMScheduler', 'DenoisingUnet', 'ClipWrapper', 'EG3D', 'Restormer',
-    'SwinIRNet', 'StableDiffusion'
+    'NAFBaselineLocal', 'NAFNet', 'NAFNetLocal', 'DenoisingUnet',
+    'ClipWrapper', 'EG3D', 'Restormer', 'SwinIRNet', 'StableDiffusion'
 ]
diff --git a/mmedit/models/editors/ddim/__init__.py b/mmedit/models/editors/ddim/__init__.py
diff --git a/mmedit/models/editors/ddpm/__init__.py b/mmedit/models/editors/ddpm/__init__.py
@@ -1,5 +1,4 @@
 # Copyright (c) OpenMMLab. All rights reserved.
-from .ddpm_scheduler import DDPMScheduler
 from .denoising_unet import DenoisingUnet
 
-__all__ = ['DDPMScheduler', 'DenoisingUnet']
+__all__ = ['DenoisingUnet']
diff --git a/mmedit/registry.py b/mmedit/registry.py
@@ -155,7 +155,7 @@
 # modules for diffusion models that support adding noise and denoising
 DIFFUSION_SCHEDULERS = Registry(
     'diffusion scheduler',
-    locations=['mmedit.models'],
+    locations=['mmedit.models.diffusion_schedulers'],
 )
 
 #######################################################################

diff --git a/requirements/runtime.txt b/requirements/runtime.txt
@@ -1,5 +1,6 @@
 av
 av==8.0.3; python_version < '3.7'
+diffusers>=0.12.0
 einops
 face-alignment
 facexlib

diff --git a/tests/data/video_interpolation_result.mp4 b/tests/data/video_interpolation_result.mp4
diff --git a/tests/test_apis/test_inferencers/test_text2image_inferencers.py b/tests/test_apis/test_inferencers/test_text2image_inferencers.py
@@ -10,7 +10,8 @@
 from torchvision.version import __version__ as TV_VERSION
 
 from mmedit.apis.inferencers.text2image_inferencer import Text2ImageInferencer
-from mmedit.models import DDIMScheduler, DenoisingUnet, DiscoDiffusion
+from mmedit.models import DenoisingUnet, DiscoDiffusion
+from mmedit.models.diffusion_schedulers import EditDDIMScheduler
 from mmedit.utils import register_all_modules
 
 register_all_modules()
@@ -66,7 +67,7 @@ def setUp(self):
         # mock clip
         self.clip_models = [clip_mock_wrapper(), clip_mock_wrapper()]
         # diffusion_scheduler
-        self.diffusion_scheduler = DDIMScheduler(
+        self.diffusion_scheduler = EditDDIMScheduler(
             variance_type='learned_range',
             beta_schedule='linear',
             clip_sample=False)

diff --git a/..._editors/test_ddim/test_ddim_scheduler.py → ...ffusion_schedulers/test_ddim_scheduler.py b/..._editors/test_ddim/test_ddim_scheduler.py → ...ffusion_schedulers/test_ddim_scheduler.py
@@ -2,13 +2,13 @@
 import pytest
 import torch
 
-from mmedit.models.editors.ddim.ddim_scheduler import DDIMScheduler
+from mmedit.models.diffusion_schedulers.ddim_scheduler import EditDDIMScheduler
 
 
 def test_ddim():
     modelout = torch.rand((1, 8, 32, 32))
     sample = torch.rand((1, 4, 32, 32))
-    ddim = DDIMScheduler(
+    ddim = EditDDIMScheduler(
         num_train_timesteps=1000, variance_type='learned_range')
     ddim.set_timesteps(10)
     result = ddim.step(modelout, 980, sample)
@@ -22,22 +22,22 @@ def test_ddim():
 
 
 def test_ddim_init():
-    ddim = DDIMScheduler(
+    ddim = EditDDIMScheduler(
         num_train_timesteps=1000, beta_schedule='scaled_linear')
 
-    ddim = DDIMScheduler(
+    ddim = EditDDIMScheduler(
         num_train_timesteps=1000, beta_schedule='squaredcos_cap_v2')
 
-    assert isinstance(ddim, DDIMScheduler)
+    assert isinstance(ddim, EditDDIMScheduler)
 
     with pytest.raises(Exception):
-        DDIMScheduler(num_train_timesteps=1000, beta_schedule='fake')
+        EditDDIMScheduler(num_train_timesteps=1000, beta_schedule='fake')
 
 
 def test_ddim_step():
     modelout = torch.rand((1, 8, 32, 32))
     sample = torch.rand((1, 4, 32, 32))
-    ddim = DDIMScheduler(
+    ddim = EditDDIMScheduler(
         num_train_timesteps=1000, variance_type='learned_range')
     with pytest.raises(Exception):
         ddim.step(modelout, 980, sample)

diff --git a/tests/test_models/test_editors/test_ddpm/test_ddpm_scheduler.py b/tests/test_models/test_editors/test_ddpm/test_ddpm_scheduler.py
@@ -2,13 +2,13 @@
 import pytest
 import torch
 
-from mmedit.models.editors.ddpm.ddpm_scheduler import DDPMScheduler
+from mmedit.models.diffusion_schedulers.ddpm_scheduler import EditDDPMScheduler
 
 
 def test_ddpm():
     modelout = torch.rand((1, 8, 32, 32))
     sample = torch.rand((1, 4, 32, 32))
-    ddpm = DDPMScheduler(
+    ddpm = EditDDPMScheduler(
         num_train_timesteps=1000, variance_type='learned_range')
     result = ddpm.step(modelout, 980, sample)
     assert result['prev_sample'].shape == (1, 4, 32, 32)
@@ -32,11 +32,11 @@ def test_ddpm():
 
 
 def test_ddpm_init():
-    DDPMScheduler(trained_betas=1)
+    EditDDPMScheduler(trained_betas=1)
 
-    DDPMScheduler(beta_schedule='scaled_linear')
+    EditDDPMScheduler(beta_schedule='scaled_linear')
 
-    DDPMScheduler(beta_schedule='squaredcos_cap_v2')
+    EditDDPMScheduler(beta_schedule='squaredcos_cap_v2')
 
     with pytest.raises(Exception):
-        DDPMScheduler(beta_schedule='tem')
+        EditDDPMScheduler(beta_schedule='tem')
diff --git a/tests/test_models/test_editors/test_disco_diffusion/test_disco_diffusion.py b/tests/test_models/test_editors/test_disco_diffusion/test_disco_diffusion.py
@@ -9,7 +9,8 @@
 from mmengine.utils import digit_version
 from torchvision.version import __version__ as TV_VERSION
 
-from mmedit.models import DDIMScheduler, DenoisingUnet, DiscoDiffusion
+from mmedit.models import DenoisingUnet, DiscoDiffusion
+from mmedit.models.diffusion_schedulers import EditDDIMScheduler
 from mmedit.utils import register_all_modules
 
 register_all_modules()
@@ -66,7 +67,7 @@ def setUp(self):
         # mock clip
         self.clip_models = [clip_mock_wrapper(), clip_mock_wrapper()]
         # diffusion_scheduler
-        self.diffusion_scheduler = DDIMScheduler(
+        self.diffusion_scheduler = EditDDIMScheduler(
             variance_type='learned_range',
             beta_schedule='linear',
             clip_sample=False)

diff --git a/tests/test_models/test_editors/test_guided_diffusion/test_adm.py b/tests/test_models/test_editors/test_guided_diffusion/test_adm.py
@@ -35,7 +35,7 @@ def setup_class(cls):
                     use_new_attention_order=True),
                 use_scale_shift_norm=True),
             diffusion_scheduler=dict(
-                type='DDIMScheduler',
+                type='EditDDIMScheduler',
                 variance_type='learned_range',
                 beta_schedule='squaredcos_cap_v2'),
             rgb2bgr=True,
@@ -64,7 +64,7 @@ def test_infer(self):
         assert samples.shape == (1, 3, 64, 64)
         # test with ddpm scheduler
         scheduler_kwargs = dict(
-            type='DDPMScheduler',
+            type='EditDDPMScheduler',
             variance_type='learned_range',
             num_train_timesteps=5)
         # test no label infer

diff --git a/tests/test_models/test_editors/test_stable_diffusion/test_stable_diffusion.py b/tests/test_models/test_editors/test_stable_diffusion/test_stable_diffusion.py
@@ -50,7 +50,7 @@
     ])
 
 diffusion_scheduler = dict(
-    type='DDIMScheduler',
+    type='EditDDIMScheduler',
     variance_type='learned_range',
     beta_end=0.012,
     beta_schedule='scaled_linear',