Added the bias layer for the LA-SympNet.

JuliaGNI · Dec 12, 2023 · 4ddf149 · 4ddf149
1 parent 8d3424d
commit 4ddf149
Show file tree

Hide file tree

Showing 3 changed files with 33 additions and 3 deletions.
diff --git a/src/GeometricMachineLearning.jl b/src/GeometricMachineLearning.jl
@@ -129,6 +129,7 @@ module GeometricMachineLearning
     include("optimizers/manifold_related/retractions.jl")
 
     include("layers/sympnets.jl")
+    include("layers/bias_layer.jl")
     include("layers/resnet.jl")
     include("layers/manifold_layer.jl")
     include("layers/stiefel_layer.jl")

diff --git a/src/architectures/sympnet.jl b/src/architectures/sympnet.jl
@@ -59,15 +59,15 @@ end
 """
 function Chain(arch::GSympNet{AT, true}) where {AT}
     layers = ()
-    for i in 1:(arch.nhidden+1)
+    for _ in 1:(arch.nhidden+1)
         layers = (layers..., GradientLayerQ(arch.dim, arch.upscaling_dimension, arch.act), GradientLayerP(arch.dim, arch.upscaling_dimension, arch.act))
     end
     Chain(layers...)
 end
 
 function Chain(arch::GSympNet{AT, false}) where {AT}
     layers = ()
-    for i in 1:(arch.nhidden+1)
+    for _ in 1:(arch.nhidden+1)
         layers = (layers..., GradientLayerP(arch.dim, arch.upscaling_dimension, arch.act), GradientLayerQ(arch.dim, arch.upscaling_dimension, arch.act))
     end
     Chain(layers...)
@@ -78,10 +78,11 @@ Build a chain for an LASympnet for which `init_upper_linear` is `true` and `init
 """
 function Chain(arch::LASympNet{AT, true, false}) where {AT}
     layers = ()
-    for i in 1:arch.nhidden
+    for _ in 1:arch.nhidden
         for j in 1:(arch.depth)
             layers = isodd(j) ? (layers..., LinearLayerQ(arch.dim)) : (layers..., LinearLayerP(arch.dim))
         end
+        layers = (layers..., BiasLayer(arch.dim))
         layers = (layers..., ActivationLayerP(arch.dim, arch.activation))
         layers = (layers..., ActivationLayerQ(arch.dim, arch.activation))
     end

diff --git a/src/layers/bias_layer.jl b/src/layers/bias_layer.jl
@@ -0,0 +1,28 @@
+@doc raw"""
+A *bias layer* that does nothing more than add a vector to the input. This is needed for *LA-SympNets*.
+"""
+struct BiasLayer{M, M} <: SympNetLayer{M, M}
+end
+
+function BiasLayer(M::Int)
+    BiasLayer{M, M}()
+end
+
+function initialparameters(backend::Backend, ::Type{T}, ::BiasLayer{M, M}; rng::AbstractRNG = Random.default_rng(), init_bias = GlorotUniform()) where {M, T}
+    q_part = KernelAbstractions.zeros(backend, T, M÷2)
+    p_part = KernelAbstractions.zeros(backend, T, M÷2)
+    init_bias(rng, q_part)
+    init_bias(rng, p_part)
+    return (q = q_part, p = p_part)
+end
+
+function parameterlength(::BiasLayer{M, M}) where M
+    M 
+end
+
+(::BiasLayer{M, M})(z::NT, ps::NT) where {M, AT<:AbstractVector, NT<:NamedTuple{(:q, :p), Tuple{AT, AT}}} =  (q = z.q + ps.q, p = z.p + ps.p)
+(::BiasLayer{M, M})(z::NT1, ps::NT2) where {M, T, AT<:AbstractVector, BT<:Union{AbstractMatrix, AbstractArray{T, 3}}, NT1<:NamedTuple{(:q, :p), Tuple{AT, AT}}, NT2<:NamedTuple{(:q, :p), Tuple{BT, BT}}} =  (q = z.q .+ ps.q, p = z.p .+ ps.p)
+
+function (d::BiasLayer{M, M})(z::AbstractArray, ps) where M
+    apply_layer_to_nt_and_return_array(z, d, ps)
+end