Write solver for p_mut_given_span

rouskinlab · matthewfallan · Mar 27, 2024 · Mar 5, 2024 · Mar 5, 2024 · Mar 8, 2024
commit d5d2def0ae5bafabc53555106c8839371d27e6d0
diff --git a/src/seismicrna/cluster/em.py b/src/seismicrna/cluster/em.py
@@ -7,7 +7,7 @@
 from .names import ADJ_NAME, OBS_NAME
 from .uniq import UniqReads
 from ..core.header import index_order_clusts
-from ..core.mu import calc_p_noclose_given_ends_numpy, calc_mu_adj_numpy, calc_prop_adj_numpy
+from ..core.mu import calc_p_noclose_given_ends_numpy, calc_p_mut_p_ends_numpy, calc_prop_adj_numpy
 
 logger = getLogger(__name__)
 
@@ -221,9 +221,9 @@ def _max_step(self):
                            / self.nreads_obs)
         # Solve for the real mutation rates that are expected to yield
         # the observed mutation rates after considering read drop-out.
-        self.mus = calc_mu_adj_numpy(self.sparse_mus,
-                                     self.uniq_reads.min_mut_gap,
-                                     mus_guess)[self.unmasked]
+        self.mus = calc_p_mut_p_ends_numpy(self.sparse_mus,
+                                           self.uniq_reads.min_mut_gap,
+                                           mus_guess)[self.unmasked]
 
     def _exp_step(self):
         """ Run the Expectation step of the EM algorithm. """

diff --git a/src/seismicrna/core/mu/unbias/algo.py b/src/seismicrna/core/mu/unbias/algo.py
diff --git a/src/seismicrna/core/mu/unbias/frame.py b/src/seismicrna/core/mu/unbias/frame.py
@@ -1,6 +1,6 @@
 import pandas as pd
 
-from .algo import calc_p_noclose_given_ends_numpy, calc_mu_adj_numpy, calc_prop_adj_numpy
+from .algo import calc_p_noclose_given_ends_numpy, calc_p_mut_p_ends_numpy, calc_prop_adj_numpy
 from ...seq import Section
 
 
@@ -65,7 +65,7 @@ def calc_mu_adj_frame(mu_obs: pd.DataFrame | pd.Series,
         Data frame of the adjusted mutation rates with the same index
         and columns as `mu_obs`.
     """
-    mu_adj = calc_mu_adj_numpy(_mus_to_matrix(mu_obs, section), min_gap)
+    mu_adj = calc_p_mut_p_ends_numpy(_mus_to_matrix(mu_obs, section), min_gap)
     if isinstance(mu_obs, pd.DataFrame):
         mu_adj_frame = pd.DataFrame(mu_adj, section.range, mu_obs.columns)
     elif isinstance(mu_obs, pd.Series):

diff --git a/src/seismicrna/core/mu/unbias/tests/algo_test.py b/src/seismicrna/core/mu/unbias/tests/algo_test.py
@@ -5,7 +5,7 @@
 
 from seismicrna.core.mu.unbias.algo import (_calc_p_noclose_given_ends,
                                             _calc_p_mut_given_span_noclose,
-                                            calc_mu_adj_numpy,
+                                            calc_p_mut_p_ends_numpy,
                                             calc_p_noclose_given_ends_numpy,
                                             _clip,
                                             logger as algo_logger)
@@ -495,7 +495,7 @@ def test_inv_calc_mu_adj(self):
             for g in range(max_g + 1):
                 with self.subTest(k=k, g=g):
                     # Compute the adjusted mutation rates.
-                    mus_adj = calc_mu_adj_numpy(mus_obs, g)
+                    mus_adj = calc_p_mut_p_ends_numpy(mus_obs, g)
                     # Recompute the observed mutation rates.
                     mus_reobs = _calc_mu_obs(mus_adj, g)
                     # Compare observed and reobserved mutation rates.
@@ -520,12 +520,12 @@ def test_mu_multiplex(self):
                     # Generate random observed mutation rates.
                     mus_obs = rng.random((n_pos, k)) * max_m
                     # Adjust all rates simultaneously.
-                    mus_adj_sim = calc_mu_adj_numpy(mus_obs, g)
+                    mus_adj_sim = calc_p_mut_p_ends_numpy(mus_obs, g)
                     # Adjust the rates of each cluster (i) separately.
                     mus_adj_sep = np.empty_like(mus_obs)
                     for i in range(k):
                         obs_i = mus_obs[:, i].reshape((n_pos, 1))
-                        adj_i = calc_mu_adj_numpy(obs_i, g).reshape(n_pos)
+                        adj_i = calc_p_mut_p_ends_numpy(obs_i, g).reshape(n_pos)
                         mus_adj_sep[:, i] = adj_i
                     # Compare the results.
                     self.assertTrue(np.allclose(mus_adj_sim, mus_adj_sep))
@@ -546,7 +546,7 @@ def test_inv_calc_mu_obs(self):
                     # Compute the observed mutation rates.
                     mus_obs = _calc_mu_obs(mus, g)
                     # Adjust the observed mutation rates.
-                    mus_adj = calc_mu_adj_numpy(mus_obs, g)
+                    mus_adj = calc_p_mut_p_ends_numpy(mus_obs, g)
                     # Test if adjusted and initial mutation rates match.
                     self.assertTrue(np.allclose(mus_adj, mus))
 

diff --git a/src/seismicrna/core/mu/unbias/tests/frame_test.py b/src/seismicrna/core/mu/unbias/tests/frame_test.py
@@ -4,7 +4,7 @@
 import pandas as pd
 
 from seismicrna.core.mu import (calc_p_noclose_given_ends_numpy,
-                                calc_mu_adj_numpy,
+                                calc_p_mut_p_ends_numpy,
                                 calc_f_obs_frame,
                                 calc_mu_adj_frame)
 from seismicrna.core.seq import DNA, Section, seq_pos_to_index
@@ -49,7 +49,7 @@ def test_equals_numpy(self):
                         # Run calc_mu_adj_df.
                         mus_adj_df = calc_mu_adj_frame(mus_obs_df, section, gap)
                         # Run calc_mu_adj_numpy.
-                        mus_adj_np = calc_mu_adj_numpy(mus_obs_np, gap)
+                        mus_adj_np = calc_p_mut_p_ends_numpy(mus_obs_np, gap)
                         # Compare the results.
                         self.assertIsInstance(mus_adj_df, pd.DataFrame)
                         self.assertTrue(np.allclose(mus_adj_df.values,
@@ -101,7 +101,7 @@ def test_equals_numpy(self):
                                                        section,
                                                        gap)
                     # Run calc_mu_adj_numpy.
-                    mus_adj_np = calc_mu_adj_numpy(mus_obs_np, gap)
+                    mus_adj_np = calc_p_mut_p_ends_numpy(mus_obs_np, gap)
                     # Compare the results.
                     self.assertIsInstance(mus_adj_series, pd.Series)
                     self.assertTrue(np.array_equal(mus_adj_series.values,