From bef4d1e82efbce882335a52774f84b6c8eb890a7 Mon Sep 17 00:00:00 2001
From: AS <aaron.spring@mpimet.mpg.de>
Date: Fri, 3 May 2019 18:13:38 +0200
Subject: [PATCH 1/4] sshfs annoying tmp files

---
 .gitignore | 1 +
 1 file changed, 1 insertion(+)

diff --git a/.gitignore b/.gitignore
index 67036d160..14c6a60cf 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,5 +1,6 @@
 .DS_Store
 .*.un~
+.fuse_hidden*
 
 # Created by https://www.gitignore.io/api/python
 

From f4819caebf564f68c641ab613b377f88bc47746d Mon Sep 17 00:00:00 2001
From: AS <aaron.spring@mpimet.mpg.de>
Date: Fri, 3 May 2019 18:14:54 +0200
Subject: [PATCH 2/4] create unitests for all comparisons. change _m2e to
 remove ref from ens

---
 climpred/comparisons.py            |  16 ++--
 climpred/tests/test_comparisons.py | 132 ++++++++++++++++++++++++-----
 2 files changed, 122 insertions(+), 26 deletions(-)

diff --git a/climpred/comparisons.py b/climpred/comparisons.py
index 45be94214..7070b45c4 100644
--- a/climpred/comparisons.py
+++ b/climpred/comparisons.py
@@ -132,7 +132,7 @@ def _m2m(ds, supervector_dim='svd'):
 
 def _m2e(ds, supervector_dim='svd'):
     """
-    Create two supervectors to compare all members to ensemble mean.
+    Create two supervectors to compare all members to ensemble mean while leaving out the reference when creating the forecasts.
 
     Args:
         ds (xarray object): xr.Dataset/xr.DataArray with member and ensemble
@@ -145,10 +145,16 @@ def _m2e(ds, supervector_dim='svd'):
         reference (xarray object): reference.
 
     """
-    reference = ds.mean('member')
-    forecast, reference = xr.broadcast(ds, reference)
-    forecast = _stack_to_supervector(forecast, new_dim=supervector_dim)
-    reference = _stack_to_supervector(reference, new_dim=supervector_dim)
+    reference_list = []
+    forecast_list = []
+    for m in ds.member.values:
+        forecast = _drop_members(ds, rmd_member=[m]).mean('member')
+        reference = ds.sel(member=m).squeeze()
+        forecast, reference = xr.broadcast(forecast, reference)
+        forecast_list.append(forecast)
+        reference_list.append(reference)
+    reference = xr.concat(reference_list,'init').rename({'init': supervector_dim})
+    forecast = xr.concat(forecast_list,'init').rename({'init': supervector_dim})
     return forecast, reference
 
 
diff --git a/climpred/tests/test_comparisons.py b/climpred/tests/test_comparisons.py
index a16bfb823..7afe937db 100644
--- a/climpred/tests/test_comparisons.py
+++ b/climpred/tests/test_comparisons.py
@@ -1,38 +1,129 @@
 import numpy as np
 import pytest
 import xarray as xr
-from climpred.comparisons import _drop_members, _m2m
+from xarray.testing import assert_equal
+
+from climpred.comparisons import (_drop_members, _e2c, _m2c, _m2e, _m2m,
+                                  _stack_to_supervector)
 from climpred.loadutils import open_dataset
 
 
 @pytest.fixture
 def PM_da_ds1d():
-    da = open_dataset('MPI-PM-DP-1D')
+    da = open_dataset('MPI-PM-DP-1D').rename({'initialization': 'init'})
     da = da['tos']
     return da
 
 
 @pytest.fixture
 def PM_da_control1d():
-    da = open_dataset('MPI-control-1D')
+    da = open_dataset('MPI-control-1D').rename({'initialization': 'init'})
     da = da['tos']
     return da
 
 
-@pytest.fixture
-def PM_ds_ds1d():
-    ds = open_dataset('MPI-PM-DP-1D')
-    return ds
+def m2e(ds, supervector_dim='svd'):
+    reference_list = []
+    forecast_list = []
+    for m in ds.member.values:
+        forecast = _drop_members(ds, rmd_member=[m]).mean('member')
+        reference = ds.sel(member=m).squeeze()
+        forecast, reference = xr.broadcast(forecast, reference)
+        forecast_list.append(forecast)
+        reference_list.append(reference)
+    reference = xr.concat(reference_list,
+                          'init').rename({'init': supervector_dim})
+    forecast = xr.concat(forecast_list,
+                         'init').rename({'init': supervector_dim})
+    return forecast, reference
 
 
-@pytest.fixture
-def PM_ds_control1d():
-    ds = open_dataset('MPI-control-1D')
-    return ds
+def test_e2c(PM_da_ds1d):
+    """Test ensemble_mean-to-control (which can be any other one member) (e2c) comparison basic functionality.
+
+    Clean comparison: Remove one control member from ensemble to use as reference. Take the remaining member mean as forecasts."""
+    ds = PM_da_ds1d
+    aforecast, areference = _e2c(ds)
+
+    control_member = [0]
+    supervector_dim = 'svd'
+    reference = ds.isel(member=control_member).squeeze()
+    if 'member' in reference.coords:
+        del reference['member']
+    reference = reference.rename({'init': supervector_dim})
+    # drop the member being reference
+    ds = _drop_members(ds, rmd_member=[ds.member.values[control_member]])
+    forecast = ds.mean('member')
+    forecast = forecast.rename({'init': supervector_dim})
+
+    eforecast, ereference = forecast, reference
+    # very weak testing on shape
+    assert eforecast.size == aforecast.size
+    assert ereference.size == areference.size
+
+    assert_equal(eforecast, aforecast)
+    assert_equal(ereference, areference)
+
+
+def test_m2c(PM_da_ds1d):
+    """Test many-to-control (which can be any other one member) (m2c) comparison basic functionality.
+
+    Clean comparison: Remove one control member from ensemble to use as reference. Take the remaining members as forecasts."""
+    ds = PM_da_ds1d
+    aforecast, areference = _m2c(ds)
+
+    supervector_dim = 'svd'
+    control_member = [0]
+    reference = ds.isel(member=control_member).squeeze()
+    # drop the member being reference
+    ds_dropped = _drop_members(ds, rmd_member=ds.member.values[control_member])
+    forecast, reference = xr.broadcast(ds_dropped, reference)
+    forecast = _stack_to_supervector(forecast, new_dim=supervector_dim)
+    reference = _stack_to_supervector(reference, new_dim=supervector_dim)
+
+    eforecast, ereference = forecast, reference
+    # very weak testing on shape
+    assert eforecast.size == aforecast.size
+    assert ereference.size == areference.size
+
+    assert_equal(eforecast, aforecast)
+    assert_equal(ereference, areference)
+
+
+def test_m2e(PM_da_ds1d):
+    """Test many-to-ensemble-mean (m2e) comparison basic functionality.
+
+    Clean comparison: Remove one member from ensemble to use as reference. Take the remaining members as forecasts."""
+    ds = PM_da_ds1d
+    aforecast, areference = _m2e(ds)
+
+    supervector_dim = 'svd'
+    reference_list = []
+    forecast_list = []
+    for m in ds.member.values:
+        forecast = _drop_members(ds, rmd_member=[m]).mean('member')
+        reference = ds.sel(member=m).squeeze()
+        forecast, reference = xr.broadcast(forecast, reference)
+        forecast_list.append(forecast)
+        reference_list.append(reference)
+    reference = xr.concat(reference_list,
+                          'init').rename({'init': supervector_dim})
+    forecast = xr.concat(forecast_list,
+                         'init').rename({'init': supervector_dim})
+
+    eforecast, ereference = forecast, reference
+    # very weak testing on shape
+    assert eforecast.size == aforecast.size
+    assert ereference.size == areference.size
+
+    assert_equal(eforecast, aforecast)
+    assert_equal(ereference, areference)
 
 
 def test_m2m(PM_da_ds1d):
-    "Test m2m basic functionality of many to many comparison"
+    """Test many-to-many (m2m) comparison basic functionality.
+
+    Clean comparison: Remove one member from ensemble to use as reference. Take the remaining members as forecasts."""
     ds = PM_da_ds1d
     aforecast, areference = _m2m(ds)
 
@@ -46,15 +137,14 @@ def test_m2m(PM_da_ds1d):
         for m2 in ds_reduced.member:
             for i in ds.init:
                 reference_list.append(reference.sel(init=i))
-                forecast_list.append(
-                    ds_reduced.sel(member=m2, init=i))
-    reference = xr.concat(
-        reference_list, supervector_dim)
-    reference[supervector_dim] = np.arange(1, 1+reference.svd.size)
-    forecast = xr.concat(
-        forecast_list, supervector_dim)
-    forecast[supervector_dim] = np.arange(1, 1+forecast.svd.size)
+                forecast_list.append(ds_reduced.sel(member=m2, init=i))
+    reference = xr.concat(reference_list, supervector_dim)
+    reference[supervector_dim] = np.arange(1, 1 + reference.svd.size)
+    forecast = xr.concat(forecast_list, supervector_dim)
+    forecast[supervector_dim] = np.arange(1, 1 + forecast.svd.size)
     eforecast, ereference = forecast, reference
-
+    # very weak testing here
     assert eforecast.size == aforecast.size
     assert ereference.size == areference.size
+    #assert_equal(eforecast,aforecast)
+    #assert_equal(ereference,areference)

From 267ba3be82229fe8aa9e3ef8b117d5493f6dfb7d Mon Sep 17 00:00:00 2001
From: AS <aaron.spring@mpimet.mpg.de>
Date: Fri, 3 May 2019 18:15:29 +0200
Subject: [PATCH 3/4] quickfix for new dims, reduced 3d area to increase speed

---
 climpred/tests/test_perfect_model_prediction.py | 16 ++++++++--------
 1 file changed, 8 insertions(+), 8 deletions(-)

diff --git a/climpred/tests/test_perfect_model_prediction.py b/climpred/tests/test_perfect_model_prediction.py
index 6bc9a63ad..728a7489d 100644
--- a/climpred/tests/test_perfect_model_prediction.py
+++ b/climpred/tests/test_perfect_model_prediction.py
@@ -14,16 +14,16 @@
 
 @pytest.fixture
 def PM_da_ds3d():
-    da = open_dataset('MPI-PM-DP-3D')
+    da = open_dataset('MPI-PM-DP-3D').rename({'initialization': 'init','time':'lead'})
     # Box in South Atlantic with no NaNs.
-    da = da.isel(x=slice(0, 50), y=slice(125, 150))
+    da = da.isel(x=slice(0, 5), y=slice(145, 150))
     return da['tos']
 
 
 @pytest.fixture
 def PM_da_control3d():
     da = open_dataset('MPI-control-3D')
-    da = da.isel(x=slice(0, 50), y=slice(125, 150))
+    da = da.isel(x=slice(0, 5), y=slice(145, 150))
     # fix to span 300yr control
     t = list(np.arange(da.time.size))
     da = da.isel(time=t*6)
@@ -33,15 +33,15 @@ def PM_da_control3d():
 
 @pytest.fixture
 def PM_ds_ds3d():
-    ds = open_dataset('MPI-PM-DP-3D')
-    ds = ds.isel(x=slice(0, 50), y=slice(125, 150))
+    ds = open_dataset('MPI-PM-DP-3D').rename({'initialization': 'init','time':'lead'})
+    ds = ds.isel(x=slice(0, 5), y=slice(145, 150))
     return ds
 
 
 @pytest.fixture
 def PM_ds_control3d():
     ds = open_dataset('MPI-control-3D')
-    ds = ds.isel(x=slice(0, 50), y=slice(125, 150))
+    ds = ds.isel(x=slice(0, 5), y=slice(145, 150))
     t = list(np.arange(ds.time.size))
     ds = ds.isel(time=t*6)
     ds['time'] = np.arange(3000, 3000 + ds.time.size)
@@ -50,7 +50,7 @@ def PM_ds_control3d():
 
 @pytest.fixture
 def PM_da_ds1d():
-    da = open_dataset('MPI-PM-DP-1D')
+    da = open_dataset('MPI-PM-DP-1D').rename({'initialization': 'init','time':'lead'})
     da = da['tos']
     return da
 
@@ -64,7 +64,7 @@ def PM_da_control1d():
 
 @pytest.fixture
 def PM_ds_ds1d():
-    ds = open_dataset('MPI-PM-DP-1D')
+    ds = open_dataset('MPI-PM-DP-1D').rename({'initialization': 'init','time':'lead'})
     return ds
 
 

From 5c5f991046320ab6b5dcb60d1df9e8b99f4aa4f9 Mon Sep 17 00:00:00 2001
From: AS <aaron.spring@mpimet.mpg.de>
Date: Fri, 3 May 2019 18:36:24 +0200
Subject: [PATCH 4/4] redo quickfix open_dataset

---
 climpred/tests/test_comparisons.py              | 4 ++--
 climpred/tests/test_perfect_model_prediction.py | 8 ++++----
 2 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/climpred/tests/test_comparisons.py b/climpred/tests/test_comparisons.py
index 7afe937db..f6a513ecc 100644
--- a/climpred/tests/test_comparisons.py
+++ b/climpred/tests/test_comparisons.py
@@ -10,14 +10,14 @@
 
 @pytest.fixture
 def PM_da_ds1d():
-    da = open_dataset('MPI-PM-DP-1D').rename({'initialization': 'init'})
+    da = open_dataset('MPI-PM-DP-1D')
     da = da['tos']
     return da
 
 
 @pytest.fixture
 def PM_da_control1d():
-    da = open_dataset('MPI-control-1D').rename({'initialization': 'init'})
+    da = open_dataset('MPI-control-1D')
     da = da['tos']
     return da
 
diff --git a/climpred/tests/test_perfect_model_prediction.py b/climpred/tests/test_perfect_model_prediction.py
index 728a7489d..5d9f47dd9 100644
--- a/climpred/tests/test_perfect_model_prediction.py
+++ b/climpred/tests/test_perfect_model_prediction.py
@@ -14,7 +14,7 @@
 
 @pytest.fixture
 def PM_da_ds3d():
-    da = open_dataset('MPI-PM-DP-3D').rename({'initialization': 'init','time':'lead'})
+    da = open_dataset('MPI-PM-DP-3D')
     # Box in South Atlantic with no NaNs.
     da = da.isel(x=slice(0, 5), y=slice(145, 150))
     return da['tos']
@@ -33,7 +33,7 @@ def PM_da_control3d():
 
 @pytest.fixture
 def PM_ds_ds3d():
-    ds = open_dataset('MPI-PM-DP-3D').rename({'initialization': 'init','time':'lead'})
+    ds = open_dataset('MPI-PM-DP-3D')
     ds = ds.isel(x=slice(0, 5), y=slice(145, 150))
     return ds
 
@@ -50,7 +50,7 @@ def PM_ds_control3d():
 
 @pytest.fixture
 def PM_da_ds1d():
-    da = open_dataset('MPI-PM-DP-1D').rename({'initialization': 'init','time':'lead'})
+    da = open_dataset('MPI-PM-DP-1D')
     da = da['tos']
     return da
 
@@ -64,7 +64,7 @@ def PM_da_control1d():
 
 @pytest.fixture
 def PM_ds_ds1d():
-    ds = open_dataset('MPI-PM-DP-1D').rename({'initialization': 'init','time':'lead'})
+    ds = open_dataset('MPI-PM-DP-1D')
     return ds