elastic · tveasey · Feb 17, 2020 · Feb 10, 2020 · Feb 11, 2020 · Feb 11, 2020
diff --git a/include/maths/CBoostedTree.h b/include/maths/CBoostedTree.h
@@ -35,17 +35,20 @@ class CEncodedDataFrameRowRef;
 namespace boosted_tree_detail {
 class MATHS_EXPORT CArgMinLossImpl {
 public:
-    using TDouble1Vec = core::CSmallVector<double, 1>;
+    using TDoubleVector = CDenseVector<double>;
+    using TMemoryMappedFloatVector = CMemoryMappedDenseVector<CFloatStorage>;
 
 public:
     CArgMinLossImpl(double lambda);
     virtual ~CArgMinLossImpl() = default;
 
     virtual std::unique_ptr<CArgMinLossImpl> clone() const = 0;
     virtual bool nextPass() = 0;
-    virtual void add(TDouble1Vec prediction, double actual, double weight = 1.0) = 0;
+    virtual void add(const TMemoryMappedFloatVector& prediction,
+                     double actual,
+                     double weight = 1.0) = 0;
     virtual void merge(const CArgMinLossImpl& other) = 0;
-    virtual TDouble1Vec value() const = 0;
+    virtual TDoubleVector value() const = 0;
 
 protected:
     double lambda() const;
@@ -61,9 +64,9 @@ class MATHS_EXPORT CArgMinMseImpl final : public CArgMinLossImpl {
     CArgMinMseImpl(double lambda);
     std::unique_ptr<CArgMinLossImpl> clone() const override;
     bool nextPass() override;
-    void add(TDouble1Vec prediction, double actual, double weight = 1.0) override;
+    void add(const TMemoryMappedFloatVector& prediction, double actual, double weight = 1.0) override;
     void merge(const CArgMinLossImpl& other) override;
-    TDouble1Vec value() const override;
+    TDoubleVector value() const override;
 
 private:
     using TMeanAccumulator = CBasicStatistics::SSampleMean<double>::TAccumulator;
@@ -79,14 +82,14 @@ class MATHS_EXPORT CArgMinLogisticImpl final : public CArgMinLossImpl {
     CArgMinLogisticImpl(double lambda);
     std::unique_ptr<CArgMinLossImpl> clone() const override;
     bool nextPass() override;
-    void add(TDouble1Vec prediction, double actual, double weight = 1.0) override;
+    void add(const TMemoryMappedFloatVector& prediction, double actual, double weight = 1.0) override;
     void merge(const CArgMinLossImpl& other) override;
-    TDouble1Vec value() const override;
+    TDoubleVector value() const override;
 
 private:
     using TMinMaxAccumulator = CBasicStatistics::CMinMax<double>;
-    using TVector = CVectorNx1<double, 2>;
-    using TVectorVec = std::vector<TVector>;
+    using TDoubleVector2x1 = CVectorNx1<double, 2>;
+    using TDoubleVector2x1Vec = std::vector<TDoubleVector2x1>;
 
 private:
     std::size_t bucket(double prediction) const {
@@ -108,8 +111,8 @@ class MATHS_EXPORT CArgMinLogisticImpl final : public CArgMinLossImpl {
 private:
     std::size_t m_CurrentPass = 0;
     TMinMaxAccumulator m_PredictionMinMax;
-    TVector m_CategoryCounts;
-    TVectorVec m_BucketCategoryCounts;
+    TDoubleVector2x1 m_CategoryCounts;
+    TDoubleVector2x1Vec m_BucketCategoryCounts;
 };
 }
 
@@ -118,7 +121,8 @@ namespace boosted_tree {
 //! \brief Computes the leaf value which minimizes the loss function.
 class MATHS_EXPORT CArgMinLoss {
 public:
-    using TDouble1Vec = core::CSmallVector<double, 1>;
+    using TDoubleVector = CDenseVector<double>;
+    using TMemoryMappedFloatVector = CMemoryMappedDenseVector<CFloatStorage>;
 
 public:
     CArgMinLoss(const CArgMinLoss& other);
@@ -133,7 +137,7 @@ class MATHS_EXPORT CArgMinLoss {
     bool nextPass() const;
 
     //! Update with a point prediction and actual value.
-    void add(TDouble1Vec prediction, double actual, double weight = 1.0);
+    void add(const TMemoryMappedFloatVector& prediction, double actual, double weight = 1.0);
 
     //! Get the minimiser over the predictions and actual values added to both
     //! this and \p other.
@@ -144,7 +148,7 @@ class MATHS_EXPORT CArgMinLoss {
     //!
     //! Formally, returns \f$x^* = arg\min_x\{\sum_i{L(p_i + x, a_i)}\}\f$
     //! for predictions and actuals \f$p_i\f$ and \f$a_i\f$, respectively.
-    TDouble1Vec value() const;
+    TDoubleVector value() const;
 
 private:
     using TArgMinLossImplUPtr = std::unique_ptr<boosted_tree_detail::CArgMinLossImpl>;
@@ -161,7 +165,9 @@ class MATHS_EXPORT CArgMinLoss {
 //! \brief Defines the loss function for the regression problem.
 class MATHS_EXPORT CLoss {
 public:
-    using TDouble1Vec = core::CSmallVector<double, 1>;
+    using TDoubleVector = CDenseVector<double>;
+    using TMemoryMappedFloatVector = CMemoryMappedDenseVector<CFloatStorage>;
+    using TWriter = std::function<void(std::size_t, double)>;
 
 public:
     virtual ~CLoss() = default;
@@ -170,17 +176,23 @@ class MATHS_EXPORT CLoss {
     //! The number of parameters to the loss function.
     virtual std::size_t numberParameters() const = 0;
     //! The value of the loss function.
-    virtual double value(TDouble1Vec prediction, double actual, double weight = 1.0) const = 0;
+    virtual double value(const TMemoryMappedFloatVector& prediction,
+                         double actual,
+                         double weight = 1.0) const = 0;
     //! The gradient of the loss function.
-    virtual TDouble1Vec
-    gradient(TDouble1Vec prediction, double actual, double weight = 1.0) const = 0;
+    virtual void gradient(const TMemoryMappedFloatVector& prediction,
+                          double actual,
+                          TWriter writer,
+                          double weight = 1.0) const = 0;
     //! The Hessian of the loss function (flattened).
-    virtual TDouble1Vec
-    curvature(TDouble1Vec prediction, double actual, double weight = 1.0) const = 0;
+    virtual void curvature(const TMemoryMappedFloatVector& prediction,
+                           double actual,
+                           TWriter writer,
+                           double weight = 1.0) const = 0;
     //! Returns true if the loss curvature is constant.
     virtual bool isCurvatureConstant() const = 0;
     //! Transforms a prediction from the forest to the target space.
-    virtual TDouble1Vec transform(TDouble1Vec prediction) const = 0;
+    virtual TDoubleVector transform(const TMemoryMappedFloatVector& prediction) const = 0;
     //! Get an object which computes the leaf value that minimises loss.
     virtual CArgMinLoss minimizer(double lambda) const = 0;
     //! Get the name of the loss function
@@ -198,11 +210,19 @@ class MATHS_EXPORT CMse final : public CLoss {
 public:
     std::unique_ptr<CLoss> clone() const override;
     std::size_t numberParameters() const override;
-    double value(TDouble1Vec prediction, double actual, double weight = 1.0) const override;
-    TDouble1Vec gradient(TDouble1Vec prediction, double actual, double weight = 1.0) const override;
-    TDouble1Vec curvature(TDouble1Vec prediction, double actual, double weight = 1.0) const override;
+    double value(const TMemoryMappedFloatVector& prediction,
+                 double actual,
+                 double weight = 1.0) const override;
+    void gradient(const TMemoryMappedFloatVector& prediction,
+                  double actual,
+                  TWriter writer,
+                  double weight = 1.0) const override;
+    void curvature(const TMemoryMappedFloatVector& prediction,
+                   double actual,
+                   TWriter writer,
+                   double weight = 1.0) const override;
     bool isCurvatureConstant() const override;
-    TDouble1Vec transform(TDouble1Vec prediction) const override;
+    TDoubleVector transform(const TMemoryMappedFloatVector& prediction) const override;
     CArgMinLoss minimizer(double lambda) const override;
     const std::string& name() const override;
 };
@@ -223,11 +243,19 @@ class MATHS_EXPORT CBinomialLogistic final : public CLoss {
 public:
     std::unique_ptr<CLoss> clone() const override;
     std::size_t numberParameters() const override;
-    double value(TDouble1Vec prediction, double actual, double weight = 1.0) const override;
-    TDouble1Vec gradient(TDouble1Vec prediction, double actual, double weight = 1.0) const override;
-    TDouble1Vec curvature(TDouble1Vec prediction, double actual, double weight = 1.0) const override;
+    double value(const TMemoryMappedFloatVector& prediction,
+                 double actual,
+                 double weight = 1.0) const override;
+    void gradient(const TMemoryMappedFloatVector& prediction,
+                  double actual,
+                  TWriter writer,
+                  double weight = 1.0) const override;
+    void curvature(const TMemoryMappedFloatVector& prediction,
+                   double actual,
+                   TWriter writer,
+                   double weight = 1.0) const override;
     bool isCurvatureConstant() const override;
-    TDouble1Vec transform(TDouble1Vec prediction) const override;
+    TDoubleVector transform(const TMemoryMappedFloatVector& prediction) const override;
     CArgMinLoss minimizer(double lambda) const override;
     const std::string& name() const override;
 };