From 916d854b0df3629c86769b495c90dcfb528e7559 Mon Sep 17 00:00:00 2001
From: Jalil Nourisa <jalil.nourisa@gmail.com>
Date: Sat, 21 Sep 2024 12:09:27 +0200
Subject: [PATCH] overal score is added to runs

---
 runs.ipynb                                  | 907 ++++++++++++++------
 scripts/run_benchmark_all.sh                |  11 +-
 src/control_methods/pearson/script.py       |   1 -
 src/utils/util.py                           |   4 -
 src/workflows/run_benchmark/config.vsh.yaml |   5 +-
 src/workflows/run_benchmark/main.nf         |   1 -
 6 files changed, 668 insertions(+), 261 deletions(-)

diff --git a/runs.ipynb b/runs.ipynb
index 26833540d..5ade52ba0 100644
--- a/runs.ipynb
+++ b/runs.ipynb
@@ -25,11 +25,21 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 53,
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "upload: resources/grn_models/default/negative_control.csv to s3://openproblems-data/resources/grn/grn_models/default/negative_control.csv\n",
+      "upload: resources/grn_models/d0_hvgs/negative_control.csv to s3://openproblems-data/resources/grn/grn_models/d0_hvgs/negative_control.csv\n",
+      "upload: resources/results/d0_hvgs/trace.txt to s3://openproblems-data/resources/grn/results/d0_hvgs/trace.txt\n",
+      "delete: s3://openproblems-data/resources/grn/results/d0_hvgs_baseline/trace.txt\n"
+     ]
+    }
+   ],
    "source": [
-    "\n",
     "!aws s3 sync resources/grn-benchmark s3://openproblems-data/resources/grn/grn-benchmark --delete\n",
     "!aws s3 sync resources/grn_models/ s3://openproblems-data/resources/grn/grn_models --delete\n",
     "!aws s3 sync resources/prior/ s3://openproblems-data/resources/grn/prior --delete\n",
@@ -135,105 +145,26 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 13,
+   "execution_count": 54,
    "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "zhao-KDunion. adata shape: (36199, 8442), GT size: (105136, 3), Gene overlap: (8425,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-8RZIHd.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.020129          0.03817  0.009021\n",
-      "(3,) (3,)\n",
-      "zhao-chipunion. adata shape: (36199, 8442), GT size: (60662, 3), Gene overlap: (8378,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-rLuWXt.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.006815         0.064118  0.028652\n",
-      "(3,) (3,)\n",
-      "zhao-chipunion_KDUnion_intersect. adata shape: (36199, 8442), GT size: (9019, 3), Gene overlap: (4493,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-nsE1Jg.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)     Mean\n",
-      "0         -0.004249         0.000488 -0.00188\n",
-      "(3,) (3,)\n",
-      "shalek-KDunion. adata shape: (1211, 9411), GT size: (148047, 3), Gene overlap: (8784,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-54532G.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.010243         0.104809  0.047283\n",
-      "(3,) (3,)\n",
-      "shalek-chipunion. adata shape: (1211, 9411), GT size: (96383, 3), Gene overlap: (8670,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-9tO5h1.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.003727         0.042922  0.019598\n",
-      "(3,) (3,)\n",
-      "shalek-chipunion_KDUnion_intersect. adata shape: (1211, 9411), GT size: (67705, 3), Gene overlap: (7852,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-5SN7ZR.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.002252         0.094459  0.046103\n",
-      "(3,) (3,)\n",
-      "han-KDunion. adata shape: (5520, 7465), GT size: (77400, 3), Gene overlap: (7387,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-eSKe1T.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.019109         0.031554  0.006222\n",
-      "(3,) (3,)\n",
-      "han-chipunion. adata shape: (5520, 7465), GT size: (160038, 3), Gene overlap: (7458,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-VnCHsA.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.013187         0.071785  0.029299\n",
-      "(3,) (3,)\n",
-      "han-chipunion_KDUnion_intersect. adata shape: (5520, 7465), GT size: (8463, 3), Gene overlap: (4141,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-0OpbTu.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.004217         0.004052 -0.000082\n",
-      "(3,) (3,)\n",
-      "jackson-KDunion. adata shape: (17396, 5736), GT size: (27433, 3), Gene overlap: (4785,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-wvATsv.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)     Mean\n",
-      "0         -0.078523         0.238183  0.07983\n",
-      "(3,) (3,)\n",
-      "jackson-chipunion. adata shape: (17396, 5736), GT size: (24481, 3), Gene overlap: (4898,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-GudAWm.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0         -0.027772         0.186608  0.079418\n",
-      "(3,) (3,)\n",
-      "jackson-chipunion_KDUnion_intersect. adata shape: (17396, 5736), GT size: (2661, 3), Gene overlap: (1515,)\n",
-      "/viash_automount/tmp/viash-run-regression_1-lrY1xV.py:56: FutureWarning: X.dtype being converted to np.float32 from float64. In the next version of anndata (0.9) conversion will not be automatic. Pass dtype explicitly to avoid this warning. Pass `AnnData(X, dtype=X.dtype, ...)` to get the future behavour.\n",
-      "  output = ad.AnnData(\n",
-      "   ex(False)_tf(-1)  ex(True)_tf(-1)      Mean\n",
-      "0          0.004694         0.321477  0.163086\n",
-      "(3,) (3,)\n"
-     ]
-    }
-   ],
+   "outputs": [],
    "source": [
-    "import subprocess\n",
-    "import anndata as ad \n",
-    "import pandas as pd\n",
-    "import numpy as np\n",
-    "for cell_type in ['zhao', 'shalek', 'han', 'jackson']:\n",
-    "    adata = ad.read_h5ad(f'resources_local/mccalla_extended/{cell_type}.h5ad')\n",
-    "    adata.layers['norm'] = adata.X\n",
-    "    adata.obs['cell_type'] = 'onecelltype'\n",
-    "    adata.write(f'resources_local/mccalla_extended/{cell_type}.h5ad')\n",
-    "    subsample = min([10000, len(adata)])\n",
-    "    for GT in ['KDunion', 'chipunion', 'chipunion_KDUnion_intersect']:\n",
-    "        GT_df = pd.read_csv(f'resources_local/mccalla_extended/{cell_type}_{GT}.csv')\n",
-    "        gene_overlap = np.intersect1d(adata.var_names, GT_df.target.unique()).shape\n",
-    "        print(f\"{cell_type}-{GT}. adata shape: {adata.shape}, GT size: {GT_df.shape}, Gene overlap: {gene_overlap}\")\n",
-    "        command = f\"viash run src/metrics/regression_1/config.vsh.yaml -- --perturbation_data resources_local/mccalla_extended/{cell_type}.h5ad --prediction resources_local/mccalla_extended/{cell_type}_{GT}.csv --layer norm --subsample {subsample} --apply_tf false --tf_all resources/prior/tf_all.csv --max_n_links -1 --verbose 1 --score output/{cell_type}_{GT}.h5ad\"\n",
-    "        subprocess.run(command, shell=True, check=True)"
+    "# import subprocess\n",
+    "# import anndata as ad \n",
+    "# import pandas as pd\n",
+    "# import numpy as np\n",
+    "# for cell_type in ['zhao', 'shalek', 'han', 'jackson']:\n",
+    "#     adata = ad.read_h5ad(f'resources_local/mccalla_extended/{cell_type}.h5ad')\n",
+    "#     adata.layers['norm'] = adata.X\n",
+    "#     adata.obs['cell_type'] = 'onecelltype'\n",
+    "#     adata.write(f'resources_local/mccalla_extended/{cell_type}.h5ad')\n",
+    "#     subsample = min([10000, len(adata)])\n",
+    "#     for GT in ['KDunion', 'chipunion', 'chipunion_KDUnion_intersect']:\n",
+    "#         GT_df = pd.read_csv(f'resources_local/mccalla_extended/{cell_type}_{GT}.csv')\n",
+    "#         gene_overlap = np.intersect1d(adata.var_names, GT_df.target.unique()).shape\n",
+    "#         print(f\"{cell_type}-{GT}. adata shape: {adata.shape}, GT size: {GT_df.shape}, Gene overlap: {gene_overlap}\")\n",
+    "#         command = f\"viash run src/metrics/regression_1/config.vsh.yaml -- --perturbation_data resources_local/mccalla_extended/{cell_type}.h5ad --prediction resources_local/mccalla_extended/{cell_type}_{GT}.csv --layer norm --subsample {subsample} --apply_tf false --tf_all resources/prior/tf_all.csv --max_n_links -1 --verbose 1 --score output/{cell_type}_{GT}.h5ad\"\n",
+    "#         subprocess.run(command, shell=True, check=True)"
    ]
   },
   {
@@ -243,297 +174,312 @@
     "# d0_hvgs"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Scores"
+   ]
+  },
   {
    "cell_type": "code",
-   "execution_count": 22,
+   "execution_count": 15,
    "metadata": {},
    "outputs": [],
    "source": [
-    "methods = [ 'pearson_corr', 'pearson_causal', 'positive_control', 'portia', 'ppcor', 'genie3', 'grnboost2', 'scenic', 'scglue', 'celloracle']"
+    "methods = [ 'collectri', 'negative_control', 'positive_control', 'pearson_corr', 'pearson_causal',  'portia', 'ppcor', 'genie3', 'grnboost2', 'scenic', 'scglue', 'celloracle']"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 23,
+   "execution_count": 33,
    "metadata": {},
    "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "download: s3://openproblems-data/resources/grn/results/d0_hvgs/scores.yaml to resources/results/d0_hvgs/scores.yaml\n",
-      "download: s3://openproblems-data/resources/grn/results/d0_hvgs/trace.txt to resources/results/d0_hvgs/trace.txt\n",
-      "download: s3://openproblems-data/resources/grn/results/d0_hvgs/metric_configs.yaml to resources/results/d0_hvgs/metric_configs.yaml\n",
-      "download: s3://openproblems-data/resources/grn/results/d0_hvgs/state.yaml to resources/results/d0_hvgs/state.yaml\n"
-     ]
-    },
     {
      "data": {
       "text/html": [
        "<style type=\"text/css\">\n",
-       "#T_65cab_row0_col0 {\n",
+       "#T_a16b3_row0_col0, #T_a16b3_row0_col1, #T_a16b3_row0_col2, #T_a16b3_row0_col3, #T_a16b3_row1_col0, #T_a16b3_row1_col1, #T_a16b3_row1_col2, #T_a16b3_row1_col3 {\n",
+       "  background-color: #000000;\n",
+       "  color: #f1f1f1;\n",
+       "}\n",
+       "#T_a16b3_row2_col0, #T_a16b3_row2_col1, #T_a16b3_row8_col2, #T_a16b3_row8_col3 {\n",
+       "  background-color: #023858;\n",
+       "  color: #f1f1f1;\n",
+       "}\n",
+       "#T_a16b3_row2_col2 {\n",
+       "  background-color: #2484ba;\n",
+       "  color: #f1f1f1;\n",
+       "}\n",
+       "#T_a16b3_row2_col3 {\n",
+       "  background-color: #2a88bc;\n",
+       "  color: #f1f1f1;\n",
+       "}\n",
+       "#T_a16b3_row3_col0 {\n",
        "  background-color: #83afd3;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row0_col1 {\n",
+       "#T_a16b3_row3_col1 {\n",
        "  background-color: #1077b4;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row0_col2 {\n",
+       "#T_a16b3_row3_col2 {\n",
        "  background-color: #b0c2de;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row0_col3 {\n",
+       "#T_a16b3_row3_col3 {\n",
        "  background-color: #e7e3f0;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row1_col0 {\n",
+       "#T_a16b3_row4_col0 {\n",
        "  background-color: #1379b5;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row1_col1 {\n",
+       "#T_a16b3_row4_col1 {\n",
        "  background-color: #046299;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row1_col2 {\n",
+       "#T_a16b3_row4_col2 {\n",
        "  background-color: #045483;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row1_col3 {\n",
+       "#T_a16b3_row4_col3 {\n",
        "  background-color: #6fa7ce;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row2_col0, #T_65cab_row2_col1, #T_65cab_row6_col2, #T_65cab_row6_col3 {\n",
-       "  background-color: #023858;\n",
-       "  color: #f1f1f1;\n",
-       "}\n",
-       "#T_65cab_row2_col2 {\n",
-       "  background-color: #2484ba;\n",
-       "  color: #f1f1f1;\n",
-       "}\n",
-       "#T_65cab_row2_col3 {\n",
-       "  background-color: #2a88bc;\n",
-       "  color: #f1f1f1;\n",
-       "}\n",
-       "#T_65cab_row3_col0 {\n",
+       "#T_a16b3_row5_col0 {\n",
        "  background-color: #c9cee4;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row3_col1 {\n",
+       "#T_a16b3_row5_col1 {\n",
        "  background-color: #d5d5e8;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row3_col2 {\n",
+       "#T_a16b3_row5_col2 {\n",
        "  background-color: #e8e4f0;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row3_col3 {\n",
+       "#T_a16b3_row5_col3 {\n",
        "  background-color: #f2ecf5;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row4_col0, #T_65cab_row4_col1, #T_65cab_row4_col2, #T_65cab_row4_col3 {\n",
+       "#T_a16b3_row6_col0, #T_a16b3_row6_col1, #T_a16b3_row6_col2, #T_a16b3_row6_col3 {\n",
        "  background-color: #fff7fb;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row5_col0 {\n",
+       "#T_a16b3_row7_col0 {\n",
        "  background-color: #056faf;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row5_col1 {\n",
+       "#T_a16b3_row7_col1 {\n",
        "  background-color: #2182b9;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row5_col2 {\n",
+       "#T_a16b3_row7_col2 {\n",
        "  background-color: #034b76;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row5_col3 {\n",
+       "#T_a16b3_row7_col3 {\n",
        "  background-color: #2383ba;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row6_col0 {\n",
+       "#T_a16b3_row8_col0 {\n",
        "  background-color: #056dab;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row6_col1 {\n",
+       "#T_a16b3_row8_col1 {\n",
        "  background-color: #358fc0;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row7_col0 {\n",
+       "#T_a16b3_row9_col0 {\n",
        "  background-color: #c5cce3;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row7_col1 {\n",
+       "#T_a16b3_row9_col1 {\n",
        "  background-color: #dddbec;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row7_col2 {\n",
+       "#T_a16b3_row9_col2 {\n",
        "  background-color: #65a3cb;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row7_col3 {\n",
+       "#T_a16b3_row9_col3 {\n",
        "  background-color: #2c89bd;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row8_col0 {\n",
+       "#T_a16b3_row10_col0 {\n",
        "  background-color: #ede8f3;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row8_col1 {\n",
+       "#T_a16b3_row10_col1 {\n",
        "  background-color: #d1d2e6;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row8_col2 {\n",
+       "#T_a16b3_row10_col2 {\n",
        "  background-color: #eae6f1;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row8_col3 {\n",
+       "#T_a16b3_row10_col3 {\n",
        "  background-color: #e1dfed;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row9_col0 {\n",
+       "#T_a16b3_row11_col0 {\n",
        "  background-color: #96b6d7;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row9_col1 {\n",
+       "#T_a16b3_row11_col1 {\n",
        "  background-color: #a7bddb;\n",
        "  color: #000000;\n",
        "}\n",
-       "#T_65cab_row9_col2 {\n",
+       "#T_a16b3_row11_col2 {\n",
        "  background-color: #348ebf;\n",
        "  color: #f1f1f1;\n",
        "}\n",
-       "#T_65cab_row9_col3 {\n",
+       "#T_a16b3_row11_col3 {\n",
        "  background-color: #157ab5;\n",
        "  color: #f1f1f1;\n",
        "}\n",
        "</style>\n",
-       "<table id=\"T_65cab\">\n",
+       "<table id=\"T_a16b3\">\n",
        "  <thead>\n",
        "    <tr>\n",
        "      <th class=\"blank level0\" >&nbsp;</th>\n",
-       "      <th id=\"T_65cab_level0_col0\" class=\"col_heading level0 col0\" >ex(False)_tf(-1)</th>\n",
-       "      <th id=\"T_65cab_level0_col1\" class=\"col_heading level0 col1\" >ex(True)_tf(-1)</th>\n",
-       "      <th id=\"T_65cab_level0_col2\" class=\"col_heading level0 col2\" >static-theta-0.0</th>\n",
-       "      <th id=\"T_65cab_level0_col3\" class=\"col_heading level0 col3\" >static-theta-0.5</th>\n",
+       "      <th id=\"T_a16b3_level0_col0\" class=\"col_heading level0 col0\" >ex(False)_tf(-1)</th>\n",
+       "      <th id=\"T_a16b3_level0_col1\" class=\"col_heading level0 col1\" >ex(True)_tf(-1)</th>\n",
+       "      <th id=\"T_a16b3_level0_col2\" class=\"col_heading level0 col2\" >static-theta-0.0</th>\n",
+       "      <th id=\"T_a16b3_level0_col3\" class=\"col_heading level0 col3\" >static-theta-0.5</th>\n",
        "    </tr>\n",
        "  </thead>\n",
        "  <tbody>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row0\" class=\"row_heading level0 row0\" >pearson_corr</th>\n",
-       "      <td id=\"T_65cab_row0_col0\" class=\"data row0 col0\" >0.238664</td>\n",
-       "      <td id=\"T_65cab_row0_col1\" class=\"data row0 col1\" >0.514612</td>\n",
-       "      <td id=\"T_65cab_row0_col2\" class=\"data row0 col2\" >0.529502</td>\n",
-       "      <td id=\"T_65cab_row0_col3\" class=\"data row0 col3\" >0.524232</td>\n",
+       "      <th id=\"T_a16b3_level0_row0\" class=\"row_heading level0 row0\" >collectri</th>\n",
+       "      <td id=\"T_a16b3_row0_col0\" class=\"data row0 col0\" >nan</td>\n",
+       "      <td id=\"T_a16b3_row0_col1\" class=\"data row0 col1\" >nan</td>\n",
+       "      <td id=\"T_a16b3_row0_col2\" class=\"data row0 col2\" >nan</td>\n",
+       "      <td id=\"T_a16b3_row0_col3\" class=\"data row0 col3\" >nan</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th id=\"T_a16b3_level0_row1\" class=\"row_heading level0 row1\" >negative_control</th>\n",
+       "      <td id=\"T_a16b3_row1_col0\" class=\"data row1 col0\" >nan</td>\n",
+       "      <td id=\"T_a16b3_row1_col1\" class=\"data row1 col1\" >nan</td>\n",
+       "      <td id=\"T_a16b3_row1_col2\" class=\"data row1 col2\" >nan</td>\n",
+       "      <td id=\"T_a16b3_row1_col3\" class=\"data row1 col3\" >nan</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row1\" class=\"row_heading level0 row1\" >pearson_causal</th>\n",
-       "      <td id=\"T_65cab_row1_col0\" class=\"data row1 col0\" >0.355256</td>\n",
-       "      <td id=\"T_65cab_row1_col1\" class=\"data row1 col1\" >0.578753</td>\n",
-       "      <td id=\"T_65cab_row1_col2\" class=\"data row1 col2\" >0.741328</td>\n",
-       "      <td id=\"T_65cab_row1_col3\" class=\"data row1 col3\" >0.560490</td>\n",
+       "      <th id=\"T_a16b3_level0_row2\" class=\"row_heading level0 row2\" >positive_control</th>\n",
+       "      <td id=\"T_a16b3_row2_col0\" class=\"data row2 col0\" >0.489147</td>\n",
+       "      <td id=\"T_a16b3_row2_col1\" class=\"data row2 col1\" >0.677155</td>\n",
+       "      <td id=\"T_a16b3_row2_col2\" class=\"data row2 col2\" >0.655407</td>\n",
+       "      <td id=\"T_a16b3_row2_col3\" class=\"data row2 col3\" >0.574608</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row2\" class=\"row_heading level0 row2\" >positive_control</th>\n",
-       "      <td id=\"T_65cab_row2_col0\" class=\"data row2 col0\" >0.489147</td>\n",
-       "      <td id=\"T_65cab_row2_col1\" class=\"data row2 col1\" >0.677155</td>\n",
-       "      <td id=\"T_65cab_row2_col2\" class=\"data row2 col2\" >0.655407</td>\n",
-       "      <td id=\"T_65cab_row2_col3\" class=\"data row2 col3\" >0.574608</td>\n",
+       "      <th id=\"T_a16b3_level0_row3\" class=\"row_heading level0 row3\" >pearson_corr</th>\n",
+       "      <td id=\"T_a16b3_row3_col0\" class=\"data row3 col0\" >0.238664</td>\n",
+       "      <td id=\"T_a16b3_row3_col1\" class=\"data row3 col1\" >0.514612</td>\n",
+       "      <td id=\"T_a16b3_row3_col2\" class=\"data row3 col2\" >0.529502</td>\n",
+       "      <td id=\"T_a16b3_row3_col3\" class=\"data row3 col3\" >0.524232</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row3\" class=\"row_heading level0 row3\" >portia</th>\n",
-       "      <td id=\"T_65cab_row3_col0\" class=\"data row3 col0\" >0.148941</td>\n",
-       "      <td id=\"T_65cab_row3_col1\" class=\"data row3 col1\" >0.227248</td>\n",
-       "      <td id=\"T_65cab_row3_col2\" class=\"data row3 col2\" >0.451256</td>\n",
-       "      <td id=\"T_65cab_row3_col3\" class=\"data row3 col3\" >0.518048</td>\n",
+       "      <th id=\"T_a16b3_level0_row4\" class=\"row_heading level0 row4\" >pearson_causal</th>\n",
+       "      <td id=\"T_a16b3_row4_col0\" class=\"data row4 col0\" >0.355256</td>\n",
+       "      <td id=\"T_a16b3_row4_col1\" class=\"data row4 col1\" >0.578753</td>\n",
+       "      <td id=\"T_a16b3_row4_col2\" class=\"data row4 col2\" >0.741328</td>\n",
+       "      <td id=\"T_a16b3_row4_col3\" class=\"data row4 col3\" >0.560490</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row4\" class=\"row_heading level0 row4\" >ppcor</th>\n",
-       "      <td id=\"T_65cab_row4_col0\" class=\"data row4 col0\" >0.022846</td>\n",
-       "      <td id=\"T_65cab_row4_col1\" class=\"data row4 col1\" >0.094107</td>\n",
-       "      <td id=\"T_65cab_row4_col2\" class=\"data row4 col2\" >0.396680</td>\n",
-       "      <td id=\"T_65cab_row4_col3\" class=\"data row4 col3\" >0.509874</td>\n",
+       "      <th id=\"T_a16b3_level0_row5\" class=\"row_heading level0 row5\" >portia</th>\n",
+       "      <td id=\"T_a16b3_row5_col0\" class=\"data row5 col0\" >0.148941</td>\n",
+       "      <td id=\"T_a16b3_row5_col1\" class=\"data row5 col1\" >0.227248</td>\n",
+       "      <td id=\"T_a16b3_row5_col2\" class=\"data row5 col2\" >0.451256</td>\n",
+       "      <td id=\"T_a16b3_row5_col3\" class=\"data row5 col3\" >0.518048</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row5\" class=\"row_heading level0 row5\" >genie3</th>\n",
-       "      <td id=\"T_65cab_row5_col0\" class=\"data row5 col0\" >0.372641</td>\n",
-       "      <td id=\"T_65cab_row5_col1\" class=\"data row5 col1\" >0.490357</td>\n",
-       "      <td id=\"T_65cab_row5_col2\" class=\"data row5 col2\" >0.754073</td>\n",
-       "      <td id=\"T_65cab_row5_col3\" class=\"data row5 col3\" >0.576580</td>\n",
+       "      <th id=\"T_a16b3_level0_row6\" class=\"row_heading level0 row6\" >ppcor</th>\n",
+       "      <td id=\"T_a16b3_row6_col0\" class=\"data row6 col0\" >0.022846</td>\n",
+       "      <td id=\"T_a16b3_row6_col1\" class=\"data row6 col1\" >0.094107</td>\n",
+       "      <td id=\"T_a16b3_row6_col2\" class=\"data row6 col2\" >0.396680</td>\n",
+       "      <td id=\"T_a16b3_row6_col3\" class=\"data row6 col3\" >0.509874</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row6\" class=\"row_heading level0 row6\" >grnboost2</th>\n",
-       "      <td id=\"T_65cab_row6_col0\" class=\"data row6 col0\" >0.381032</td>\n",
-       "      <td id=\"T_65cab_row6_col1\" class=\"data row6 col1\" >0.459860</td>\n",
-       "      <td id=\"T_65cab_row6_col2\" class=\"data row6 col2\" >0.781852</td>\n",
-       "      <td id=\"T_65cab_row6_col3\" class=\"data row6 col3\" >0.609075</td>\n",
+       "      <th id=\"T_a16b3_level0_row7\" class=\"row_heading level0 row7\" >genie3</th>\n",
+       "      <td id=\"T_a16b3_row7_col0\" class=\"data row7 col0\" >0.372641</td>\n",
+       "      <td id=\"T_a16b3_row7_col1\" class=\"data row7 col1\" >0.490357</td>\n",
+       "      <td id=\"T_a16b3_row7_col2\" class=\"data row7 col2\" >0.754073</td>\n",
+       "      <td id=\"T_a16b3_row7_col3\" class=\"data row7 col3\" >0.576580</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row7\" class=\"row_heading level0 row7\" >scenic</th>\n",
-       "      <td id=\"T_65cab_row7_col0\" class=\"data row7 col0\" >0.154399</td>\n",
-       "      <td id=\"T_65cab_row7_col1\" class=\"data row7 col1\" >0.206571</td>\n",
-       "      <td id=\"T_65cab_row7_col2\" class=\"data row7 col2\" >0.600839</td>\n",
-       "      <td id=\"T_65cab_row7_col3\" class=\"data row7 col3\" >0.574294</td>\n",
+       "      <th id=\"T_a16b3_level0_row8\" class=\"row_heading level0 row8\" >grnboost2</th>\n",
+       "      <td id=\"T_a16b3_row8_col0\" class=\"data row8 col0\" >0.381032</td>\n",
+       "      <td id=\"T_a16b3_row8_col1\" class=\"data row8 col1\" >0.459860</td>\n",
+       "      <td id=\"T_a16b3_row8_col2\" class=\"data row8 col2\" >0.781852</td>\n",
+       "      <td id=\"T_a16b3_row8_col3\" class=\"data row8 col3\" >0.609075</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row8\" class=\"row_heading level0 row8\" >scglue</th>\n",
-       "      <td id=\"T_65cab_row8_col0\" class=\"data row8 col0\" >0.078309</td>\n",
-       "      <td id=\"T_65cab_row8_col1\" class=\"data row8 col1\" >0.238859</td>\n",
-       "      <td id=\"T_65cab_row8_col2\" class=\"data row8 col2\" >0.448617</td>\n",
-       "      <td id=\"T_65cab_row8_col3\" class=\"data row8 col3\" >0.527076</td>\n",
+       "      <th id=\"T_a16b3_level0_row9\" class=\"row_heading level0 row9\" >scenic</th>\n",
+       "      <td id=\"T_a16b3_row9_col0\" class=\"data row9 col0\" >0.154399</td>\n",
+       "      <td id=\"T_a16b3_row9_col1\" class=\"data row9 col1\" >0.206571</td>\n",
+       "      <td id=\"T_a16b3_row9_col2\" class=\"data row9 col2\" >0.600839</td>\n",
+       "      <td id=\"T_a16b3_row9_col3\" class=\"data row9 col3\" >0.574294</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th id=\"T_65cab_level0_row9\" class=\"row_heading level0 row9\" >celloracle</th>\n",
-       "      <td id=\"T_65cab_row9_col0\" class=\"data row9 col0\" >0.216897</td>\n",
-       "      <td id=\"T_65cab_row9_col1\" class=\"data row9 col1\" >0.311451</td>\n",
-       "      <td id=\"T_65cab_row9_col2\" class=\"data row9 col2\" >0.639556</td>\n",
-       "      <td id=\"T_65cab_row9_col3\" class=\"data row9 col3\" >0.580147</td>\n",
+       "      <th id=\"T_a16b3_level0_row10\" class=\"row_heading level0 row10\" >scglue</th>\n",
+       "      <td id=\"T_a16b3_row10_col0\" class=\"data row10 col0\" >0.078309</td>\n",
+       "      <td id=\"T_a16b3_row10_col1\" class=\"data row10 col1\" >0.238859</td>\n",
+       "      <td id=\"T_a16b3_row10_col2\" class=\"data row10 col2\" >0.448617</td>\n",
+       "      <td id=\"T_a16b3_row10_col3\" class=\"data row10 col3\" >0.527076</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th id=\"T_a16b3_level0_row11\" class=\"row_heading level0 row11\" >celloracle</th>\n",
+       "      <td id=\"T_a16b3_row11_col0\" class=\"data row11 col0\" >0.216897</td>\n",
+       "      <td id=\"T_a16b3_row11_col1\" class=\"data row11 col1\" >0.311451</td>\n",
+       "      <td id=\"T_a16b3_row11_col2\" class=\"data row11 col2\" >0.639556</td>\n",
+       "      <td id=\"T_a16b3_row11_col3\" class=\"data row11 col3\" >0.580147</td>\n",
        "    </tr>\n",
        "  </tbody>\n",
        "</table>\n"
       ],
       "text/plain": [
-       "<pandas.io.formats.style.Styler at 0x14d6858fdcf0>"
+       "<pandas.io.formats.style.Styler at 0x14bb699dff10>"
       ]
      },
-     "execution_count": 23,
+     "execution_count": 33,
      "metadata": {},
      "output_type": "execute_result"
     }
    ],
    "source": [
     "RUN_ID=\"d0_hvgs\"  \n",
-    "df_all = process_data(RUN_ID, models_all=methods)\n",
-    "df_all.style.background_gradient()"
+    "df_scores = process_data(RUN_ID, models_all=methods)\n",
+    "df_scores.style.background_gradient()"
    ]
   },
   {
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "# Format resourcs used"
+    "## Format resourcs used"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 45,
+   "execution_count": 5,
    "metadata": {},
    "outputs": [
     {
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "/vol/tmp/users/jnourisa/ipykernel_2913022/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
+      "/vol/tmp/users/jnourisa/ipykernel_1653246/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
       "  df = pd.read_csv(io.StringIO(output), delim_whitespace=True)\n",
-      "/vol/tmp/users/jnourisa/ipykernel_2913022/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
+      "/vol/tmp/users/jnourisa/ipykernel_1653246/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
       "  df = pd.read_csv(io.StringIO(output), delim_whitespace=True)\n",
-      "/vol/tmp/users/jnourisa/ipykernel_2913022/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
+      "/vol/tmp/users/jnourisa/ipykernel_1653246/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
       "  df = pd.read_csv(io.StringIO(output), delim_whitespace=True)\n",
-      "/vol/tmp/users/jnourisa/ipykernel_2913022/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
+      "/vol/tmp/users/jnourisa/ipykernel_1653246/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
       "  df = pd.read_csv(io.StringIO(output), delim_whitespace=True)\n",
-      "/vol/tmp/users/jnourisa/ipykernel_2913022/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
+      "/vol/tmp/users/jnourisa/ipykernel_1653246/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
       "  df = pd.read_csv(io.StringIO(output), delim_whitespace=True)\n",
-      "/vol/tmp/users/jnourisa/ipykernel_2913022/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
+      "/vol/tmp/users/jnourisa/ipykernel_1653246/1716007044.py:19: FutureWarning: The 'delim_whitespace' keyword in pd.read_csv is deprecated and will be removed in a future version. Use ``sep='\\s+'`` instead\n",
       "  df = pd.read_csv(io.StringIO(output), delim_whitespace=True)\n"
      ]
     },
@@ -650,7 +596,7 @@
        "scglue     35.933720  "
       ]
      },
-     "execution_count": 45,
+     "execution_count": 5,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -702,7 +648,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 47,
+   "execution_count": 10,
    "metadata": {},
    "outputs": [
     {
@@ -728,6 +674,7 @@
        "      <th></th>\n",
        "      <th>%cpu</th>\n",
        "      <th>peak_rss</th>\n",
+       "      <th>peak_vmem</th>\n",
        "      <th>rchar</th>\n",
        "      <th>wchar</th>\n",
        "      <th>duration</th>\n",
@@ -738,6 +685,7 @@
        "      <th>celloracle</th>\n",
        "      <td>799.6</td>\n",
        "      <td>14.9</td>\n",
+       "      <td>35.4</td>\n",
        "      <td>18.0</td>\n",
        "      <td>86.1</td>\n",
        "      <td>1.472222</td>\n",
@@ -747,17 +695,16 @@
        "</div>"
       ],
       "text/plain": [
-       "             %cpu  peak_rss  rchar  wchar  duration\n",
-       "celloracle  799.6      14.9   18.0   86.1  1.472222"
+       "             %cpu  peak_rss  peak_vmem  rchar  wchar  duration\n",
+       "celloracle  799.6      14.9       35.4   18.0   86.1  1.472222"
       ]
      },
-     "execution_count": 47,
+     "execution_count": 10,
      "metadata": {},
      "output_type": "execute_result"
     }
    ],
    "source": [
-    "\n",
     "# sequra runs\n",
     "base_dir = 'resources/results/d0_hvgs_res/'\n",
     "models = ['celloracle']\n",
@@ -780,11 +727,12 @@
     "\n",
     "\n",
     "for i, method in enumerate(models):\n",
-    "    df = pd.read_csv(f'{base_dir}/{method}.txt', sep='\\t')[cols]\n",
+    "    df = pd.read_csv(f'{base_dir}/{method}.txt', sep='\\t')\n",
+    "    df = df[['%cpu', 'peak_rss', 'peak_vmem', 'rchar', 'wchar', 'duration']]\n",
     "    df = df.drop(1)\n",
     "\n",
     "\n",
-    "    for col in cols:\n",
+    "    for col in df.columns:\n",
     "        if col=='%cpu':\n",
     "            df[col] = df[col].str.replace('%', '').astype(float)\n",
     "        elif col=='duration':\n",
@@ -803,7 +751,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 48,
+   "execution_count": 11,
    "metadata": {},
    "outputs": [
     {
@@ -827,8 +775,8 @@
        "  <thead>\n",
        "    <tr style=\"text-align: right;\">\n",
        "      <th></th>\n",
-       "      <th>Peak memory</th>\n",
-       "      <th>Duration</th>\n",
+       "      <th>Peak memory (GB)</th>\n",
+       "      <th>Duration (hour)</th>\n",
        "    </tr>\n",
        "  </thead>\n",
        "  <tbody>\n",
@@ -872,17 +820,17 @@
        "</div>"
       ],
       "text/plain": [
-       "            Peak memory   Duration\n",
-       "celloracle    14.900000   1.472222\n",
-       "portia        46.943497   0.110556\n",
-       "grnboost2      3.067471   1.568056\n",
-       "scenic        30.356461   1.908056\n",
-       "genie3        13.105103  16.682500\n",
-       "ppcor          3.909119   0.556667\n",
-       "scglue        29.917423   4.380278"
+       "            Peak memory (GB)  Duration (hour)\n",
+       "celloracle         14.900000         1.472222\n",
+       "portia             46.943497         0.110556\n",
+       "grnboost2           3.067471         1.568056\n",
+       "scenic             30.356461         1.908056\n",
+       "genie3             13.105103        16.682500\n",
+       "ppcor               3.909119         0.556667\n",
+       "scglue             29.917423         4.380278"
       ]
      },
-     "execution_count": 48,
+     "execution_count": 11,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -904,6 +852,479 @@
     "df_res"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Merge scores with resources"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 34,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>ex(False)_tf(-1)</th>\n",
+       "      <th>ex(True)_tf(-1)</th>\n",
+       "      <th>static-theta-0.0</th>\n",
+       "      <th>static-theta-0.5</th>\n",
+       "      <th>overall_score</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>collectri</th>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>negative_control</th>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>positive_control</th>\n",
+       "      <td>1.000000</td>\n",
+       "      <td>1.000000</td>\n",
+       "      <td>0.838274</td>\n",
+       "      <td>0.943410</td>\n",
+       "      <td>0.945421</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>pearson_corr</th>\n",
+       "      <td>0.487919</td>\n",
+       "      <td>0.759962</td>\n",
+       "      <td>0.677241</td>\n",
+       "      <td>0.860702</td>\n",
+       "      <td>0.696456</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>pearson_causal</th>\n",
+       "      <td>0.726277</td>\n",
+       "      <td>0.854683</td>\n",
+       "      <td>0.948169</td>\n",
+       "      <td>0.920231</td>\n",
+       "      <td>0.862340</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>portia</th>\n",
+       "      <td>0.304491</td>\n",
+       "      <td>0.335592</td>\n",
+       "      <td>0.577163</td>\n",
+       "      <td>0.850549</td>\n",
+       "      <td>0.516949</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>ppcor</th>\n",
+       "      <td>0.046705</td>\n",
+       "      <td>0.138974</td>\n",
+       "      <td>0.507359</td>\n",
+       "      <td>0.837129</td>\n",
+       "      <td>0.382542</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>genie3</th>\n",
+       "      <td>0.761818</td>\n",
+       "      <td>0.724142</td>\n",
+       "      <td>0.964470</td>\n",
+       "      <td>0.946649</td>\n",
+       "      <td>0.849270</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>grnboost2</th>\n",
+       "      <td>0.778974</td>\n",
+       "      <td>0.679105</td>\n",
+       "      <td>1.000000</td>\n",
+       "      <td>1.000000</td>\n",
+       "      <td>0.864520</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>scenic</th>\n",
+       "      <td>0.315650</td>\n",
+       "      <td>0.305056</td>\n",
+       "      <td>0.768481</td>\n",
+       "      <td>0.942895</td>\n",
+       "      <td>0.583021</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>scglue</th>\n",
+       "      <td>0.160093</td>\n",
+       "      <td>0.352738</td>\n",
+       "      <td>0.573787</td>\n",
+       "      <td>0.865371</td>\n",
+       "      <td>0.487997</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>celloracle</th>\n",
+       "      <td>0.443420</td>\n",
+       "      <td>0.459941</td>\n",
+       "      <td>0.818001</td>\n",
+       "      <td>0.952505</td>\n",
+       "      <td>0.668467</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "                  ex(False)_tf(-1)  ex(True)_tf(-1)  static-theta-0.0  \\\n",
+       "collectri                 0.000000         0.000000          0.000000   \n",
+       "negative_control          0.000000         0.000000          0.000000   \n",
+       "positive_control          1.000000         1.000000          0.838274   \n",
+       "pearson_corr              0.487919         0.759962          0.677241   \n",
+       "pearson_causal            0.726277         0.854683          0.948169   \n",
+       "portia                    0.304491         0.335592          0.577163   \n",
+       "ppcor                     0.046705         0.138974          0.507359   \n",
+       "genie3                    0.761818         0.724142          0.964470   \n",
+       "grnboost2                 0.778974         0.679105          1.000000   \n",
+       "scenic                    0.315650         0.305056          0.768481   \n",
+       "scglue                    0.160093         0.352738          0.573787   \n",
+       "celloracle                0.443420         0.459941          0.818001   \n",
+       "\n",
+       "                  static-theta-0.5  overall_score  \n",
+       "collectri                 0.000000       0.000000  \n",
+       "negative_control          0.000000       0.000000  \n",
+       "positive_control          0.943410       0.945421  \n",
+       "pearson_corr              0.860702       0.696456  \n",
+       "pearson_causal            0.920231       0.862340  \n",
+       "portia                    0.850549       0.516949  \n",
+       "ppcor                     0.837129       0.382542  \n",
+       "genie3                    0.946649       0.849270  \n",
+       "grnboost2                 1.000000       0.864520  \n",
+       "scenic                    0.942895       0.583021  \n",
+       "scglue                    0.865371       0.487997  \n",
+       "celloracle                0.952505       0.668467  "
+      ]
+     },
+     "execution_count": 34,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "# create ranking \n",
+    "df_scores = df_scores.fillna(0)\n",
+    "df_scores[df_scores < 0]=0\n",
+    "df_scores = (df_scores-df_scores.min(axis=0))/(df_scores.max(axis=0)-df_scores.min(axis=0))\n",
+    "df_scores['overall_score'] = df_scores.mean(axis=1)\n",
+    "# df_scores['rank'] = df_scores.mean(axis=1).rank(ascending=False).astype(int)\n",
+    "\n",
+    "df_scores"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 35,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>Peak memory (GB)</th>\n",
+       "      <th>Duration (hour)</th>\n",
+       "      <th>ex(False)_tf(-1)</th>\n",
+       "      <th>ex(True)_tf(-1)</th>\n",
+       "      <th>static-theta-0.0</th>\n",
+       "      <th>static-theta-0.5</th>\n",
+       "      <th>overall_score</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>collectri</th>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>negative_control</th>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>positive_control</th>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>1.000000</td>\n",
+       "      <td>1.000000</td>\n",
+       "      <td>0.838274</td>\n",
+       "      <td>0.943410</td>\n",
+       "      <td>0.945421</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>pearson_corr</th>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.487919</td>\n",
+       "      <td>0.759962</td>\n",
+       "      <td>0.677241</td>\n",
+       "      <td>0.860702</td>\n",
+       "      <td>0.696456</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>pearson_causal</th>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.000000</td>\n",
+       "      <td>0.726277</td>\n",
+       "      <td>0.854683</td>\n",
+       "      <td>0.948169</td>\n",
+       "      <td>0.920231</td>\n",
+       "      <td>0.862340</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>portia</th>\n",
+       "      <td>46.943497</td>\n",
+       "      <td>0.110556</td>\n",
+       "      <td>0.304491</td>\n",
+       "      <td>0.335592</td>\n",
+       "      <td>0.577163</td>\n",
+       "      <td>0.850549</td>\n",
+       "      <td>0.516949</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>ppcor</th>\n",
+       "      <td>3.909119</td>\n",
+       "      <td>0.556667</td>\n",
+       "      <td>0.046705</td>\n",
+       "      <td>0.138974</td>\n",
+       "      <td>0.507359</td>\n",
+       "      <td>0.837129</td>\n",
+       "      <td>0.382542</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>genie3</th>\n",
+       "      <td>13.105103</td>\n",
+       "      <td>16.682500</td>\n",
+       "      <td>0.761818</td>\n",
+       "      <td>0.724142</td>\n",
+       "      <td>0.964470</td>\n",
+       "      <td>0.946649</td>\n",
+       "      <td>0.849270</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>grnboost2</th>\n",
+       "      <td>3.067471</td>\n",
+       "      <td>1.568056</td>\n",
+       "      <td>0.778974</td>\n",
+       "      <td>0.679105</td>\n",
+       "      <td>1.000000</td>\n",
+       "      <td>1.000000</td>\n",
+       "      <td>0.864520</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>scenic</th>\n",
+       "      <td>30.356461</td>\n",
+       "      <td>1.908056</td>\n",
+       "      <td>0.315650</td>\n",
+       "      <td>0.305056</td>\n",
+       "      <td>0.768481</td>\n",
+       "      <td>0.942895</td>\n",
+       "      <td>0.583021</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>scglue</th>\n",
+       "      <td>29.917423</td>\n",
+       "      <td>4.380278</td>\n",
+       "      <td>0.160093</td>\n",
+       "      <td>0.352738</td>\n",
+       "      <td>0.573787</td>\n",
+       "      <td>0.865371</td>\n",
+       "      <td>0.487997</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>celloracle</th>\n",
+       "      <td>14.900000</td>\n",
+       "      <td>1.472222</td>\n",
+       "      <td>0.443420</td>\n",
+       "      <td>0.459941</td>\n",
+       "      <td>0.818001</td>\n",
+       "      <td>0.952505</td>\n",
+       "      <td>0.668467</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "                  Peak memory (GB)  Duration (hour)  ex(False)_tf(-1)  \\\n",
+       "collectri                 0.000000         0.000000          0.000000   \n",
+       "negative_control          0.000000         0.000000          0.000000   \n",
+       "positive_control          0.000000         0.000000          1.000000   \n",
+       "pearson_corr              0.000000         0.000000          0.487919   \n",
+       "pearson_causal            0.000000         0.000000          0.726277   \n",
+       "portia                   46.943497         0.110556          0.304491   \n",
+       "ppcor                     3.909119         0.556667          0.046705   \n",
+       "genie3                   13.105103        16.682500          0.761818   \n",
+       "grnboost2                 3.067471         1.568056          0.778974   \n",
+       "scenic                   30.356461         1.908056          0.315650   \n",
+       "scglue                   29.917423         4.380278          0.160093   \n",
+       "celloracle               14.900000         1.472222          0.443420   \n",
+       "\n",
+       "                  ex(True)_tf(-1)  static-theta-0.0  static-theta-0.5  \\\n",
+       "collectri                0.000000          0.000000          0.000000   \n",
+       "negative_control         0.000000          0.000000          0.000000   \n",
+       "positive_control         1.000000          0.838274          0.943410   \n",
+       "pearson_corr             0.759962          0.677241          0.860702   \n",
+       "pearson_causal           0.854683          0.948169          0.920231   \n",
+       "portia                   0.335592          0.577163          0.850549   \n",
+       "ppcor                    0.138974          0.507359          0.837129   \n",
+       "genie3                   0.724142          0.964470          0.946649   \n",
+       "grnboost2                0.679105          1.000000          1.000000   \n",
+       "scenic                   0.305056          0.768481          0.942895   \n",
+       "scglue                   0.352738          0.573787          0.865371   \n",
+       "celloracle               0.459941          0.818001          0.952505   \n",
+       "\n",
+       "                  overall_score  \n",
+       "collectri              0.000000  \n",
+       "negative_control       0.000000  \n",
+       "positive_control       0.945421  \n",
+       "pearson_corr           0.696456  \n",
+       "pearson_causal         0.862340  \n",
+       "portia                 0.516949  \n",
+       "ppcor                  0.382542  \n",
+       "genie3                 0.849270  \n",
+       "grnboost2              0.864520  \n",
+       "scenic                 0.583021  \n",
+       "scglue                 0.487997  \n",
+       "celloracle             0.668467  "
+      ]
+     },
+     "execution_count": 35,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "df_combined = pd.concat([df_res, df_scores], axis=1).fillna(0)\n",
+    "df_combined = df_combined.reindex(methods)\n",
+    "df_combined"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 36,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/home/jnourisa/miniconda3/envs/py10/lib/python3.10/site-packages/pandas/core/arraylike.py:399: RuntimeWarning: divide by zero encountered in log\n",
+      "  result = getattr(ufunc, method)(*inputs, **kwargs)\n",
+      "/home/jnourisa/miniconda3/envs/py10/lib/python3.10/site-packages/pandas/core/arraylike.py:399: RuntimeWarning: divide by zero encountered in log\n",
+      "  result = getattr(ufunc, method)(*inputs, **kwargs)\n"
+     ]
+    }
+   ],
+   "source": [
+    "summary_all_file = 'output/summary_d0_hvgs.tsv'\n",
+    "summary_plot = 'output/summary_d0_hvgs.pdf'\n",
+    "df_all = df_combined.copy()\n",
+    "# df_combined.index = df_combined.index.map(surragate_names)\n",
+    "\n",
+    "\n",
+    "df_all.index.name = 'method_name' \n",
+    "# df_all['mean_cpu_pct_scaled'] = df_all['%CPU']/df_all['%CPU'].max()\n",
+    "df_all['mean_peak_memory_log_scaled'] = np.log(df_all['Peak memory (GB)'])\n",
+    "# df_all['mean_peak_memory_str'] =  [f\"{int(value/ 1E9)}\" for value in df_all['Peak memory']]\n",
+    "df_all['mean_peak_memory_str'] =  df_all['Peak memory (GB)']\n",
+    "# df_all[\"mean_disk_read_log_scaled\"] = np.log(df_all['Disk read'])\n",
+    "# df_all[\"mean_disk_read_str\"] = [f\"{int(value/ 1E9)}\" for value in df_all['Disk read']]\n",
+    "# df_all[\"mean_disk_write_log_scaled\"] = np.log(df_all['Disk write'])\n",
+    "# df_all[\"mean_disk_write_str\"] =  [f\"{int(value/ 1E9)}\" for value in df_all['Disk write']]\n",
+    "df_all[\"mean_duration_log_scaled\"] = np.log(df_all['Duration (hour)'])\n",
+    "# df_all[\"mean_duration_str\"] = [f\"{int(value/ (60*60))}\" for value in df_all['Duration']]\n",
+    "df_all[\"mean_duration_str\"] = df_all['Duration (hour)']\n",
+    "\n",
+    "\n",
+    "df_all = df_all.reset_index()\n",
+    "df_all.to_csv(summary_all_file, sep='\\t')\n",
+    "\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 37,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "── \u001b[1mAttaching packages\u001b[22m ─────────────────────────────────────── tidyverse 1.3.1 ──\n",
+      "\u001b[32m✔\u001b[39m \u001b[34mggplot2\u001b[39m 3.3.6     \u001b[32m✔\u001b[39m \u001b[34mpurrr  \u001b[39m 0.3.4\n",
+      "\u001b[32m✔\u001b[39m \u001b[34mtibble \u001b[39m 3.1.7     \u001b[32m✔\u001b[39m \u001b[34mdplyr  \u001b[39m 1.0.9\n",
+      "\u001b[32m✔\u001b[39m \u001b[34mtidyr  \u001b[39m 1.2.0     \u001b[32m✔\u001b[39m \u001b[34mstringr\u001b[39m 1.4.0\n",
+      "\u001b[32m✔\u001b[39m \u001b[34mreadr  \u001b[39m 2.1.2     \u001b[32m✔\u001b[39m \u001b[34mforcats\u001b[39m 0.5.1\n",
+      "── \u001b[1mConflicts\u001b[22m ────────────────────────────────────────── tidyverse_conflicts() ──\n",
+      "\u001b[31m✖\u001b[39m \u001b[34mdplyr\u001b[39m::\u001b[32mfilter()\u001b[39m masks \u001b[34mstats\u001b[39m::filter()\n",
+      "\u001b[31m✖\u001b[39m \u001b[34mdplyr\u001b[39m::\u001b[32mlag()\u001b[39m    masks \u001b[34mstats\u001b[39m::lag()\n",
+      "\u001b[?25hError in library(funkyheatmap) : \n",
+      "  there is no package called ‘funkyheatmap’\n",
+      "Execution halted\n",
+      "\u001b[?25h"
+     ]
+    }
+   ],
+   "source": [
+    "\n",
+    "!Rscript ../grn_benchmark/src/summary_figure.R {summary_all_file} {summary_plot}\n"
+   ]
+  },
   {
    "cell_type": "markdown",
    "metadata": {},
diff --git a/scripts/run_benchmark_all.sh b/scripts/run_benchmark_all.sh
index 44b382edf..86fb2fbc3 100644
--- a/scripts/run_benchmark_all.sh
+++ b/scripts/run_benchmark_all.sh
@@ -1,7 +1,6 @@
 #!/bin/bash
 
-# RUN_ID="run_$(date +%Y-%m-%d_%H-%M-%S)"
-RUN_ID="celloracle_d0_hvg"
+RUN_ID="d0_hvgs_baseline"
 # resources_dir="./resources/"
 resources_dir="s3://openproblems-data/resources/grn"
 publish_dir="${resources_dir}/results/${RUN_ID}"
@@ -13,10 +12,7 @@ layer='scgen_pearson'
 metric_ids="[regression_1, regression_2]"
 cell_type_specific=false #for controls
 normalize=false
-only_hvgs=true
-# method_ids="[tigress, ennet, scsgl, pidc]"
-# method_ids="[pearson_corr, pearson_causal, positive_control]"
-method_ids="[celloracle]"
+method_ids="[pearson_corr, pearson_causal, positive_control]"
 
 param_file="./params/${RUN_ID}.yaml"
 
@@ -27,7 +23,7 @@ param_list:
     metric_ids: $metric_ids
     method_ids: $method_ids
     perturbation_data: ${resources_dir}/grn-benchmark/perturbation_data.h5ad
-    multiomics_rna: ${resources_dir}/grn-benchmark/multiomics_rna_0.h5ad
+    multiomics_rna: ${resources_dir}/grn-benchmark/multiomics_rna_0_hvgs.h5ad
     multiomics_atac: ${resources_dir}/grn-benchmark/multiomics_atac_0.h5ad
     reg_type: $reg_type
     subsample: $subsample
@@ -37,7 +33,6 @@ param_list:
     tf_all: ${resources_dir}/prior/tf_all.csv
     cell_type_specific: ${cell_type_specific}
     normalize: ${normalize}
-    only_hvgs: ${only_hvgs}
 
 output_state: "state.yaml"
 publish_dir: "$publish_dir"
diff --git a/src/control_methods/pearson/script.py b/src/control_methods/pearson/script.py
index dde473edd..1674312c1 100644
--- a/src/control_methods/pearson/script.py
+++ b/src/control_methods/pearson/script.py
@@ -7,7 +7,6 @@
     'max_n_links': 50000,
     'prediction': 'resources/grn_models/donor_0_default/pearson.csv',
     "seed": 32,
-    'only_hvgs': True,
     'normalize': False
 }
 ## VIASH END
diff --git a/src/utils/util.py b/src/utils/util.py
index d8c395edc..9339483ce 100644
--- a/src/utils/util.py
+++ b/src/utils/util.py
@@ -50,10 +50,6 @@ def process_data(adata, par):
         adata.X = adata.X.toarray()  # You can also use .todense(), but .toarray() gives a NumPy array directly
     else:
         print("adata.X is already dense.")
-    if par['only_hvgs']:
-        print('Subsetting data to hvgs')
-        adata = adata[:, adata.var.hvg_counts]
-        print('New dimension of data: ', adata.shape)
         
 def create_corr_net(par):
     print(par)
diff --git a/src/workflows/run_benchmark/config.vsh.yaml b/src/workflows/run_benchmark/config.vsh.yaml
index d1604cc86..ed8361f9c 100644
--- a/src/workflows/run_benchmark/config.vsh.yaml
+++ b/src/workflows/run_benchmark/config.vsh.yaml
@@ -58,10 +58,7 @@ functionality:
           type: boolean
           required: false
           direction: input
-        - name: --only_hvgs
-          type: boolean
-          required: false
-          direction: input
+
           
         
     - name: Outputs
diff --git a/src/workflows/run_benchmark/main.nf b/src/workflows/run_benchmark/main.nf
index 4520e47bf..17ee2fb90 100644
--- a/src/workflows/run_benchmark/main.nf
+++ b/src/workflows/run_benchmark/main.nf
@@ -85,7 +85,6 @@ workflow run_wf {
         perturbation_data:"perturbation_data",
         cell_type_specific:"cell_type_specific",
         normalize:"normalize",
-        only_hvgs:"only_hvgs",
         num_workers:"num_workers"
 
       ],