kubernetes-sigs · felipecrs · Oct 10, 2021 · Oct 11, 2021 · Oct 11, 2021 · Oct 11, 2021
diff --git a/images/base/files/usr/local/bin/entrypoint b/images/base/files/usr/local/bin/entrypoint
@@ -24,41 +24,34 @@ set -o pipefail
 userns=""
 if grep -Eqv "0[[:space:]]+0[[:space:]]+4294967295" /proc/self/uid_map; then
   userns="1"
-  echo 'INFO: running in a user namespace (experimental)'
+fi
+
+rootless=""
+if [[ -n "${KIND_ROOTLESS-}" ]]; then
+  rootless=1
 fi
 
 validate_userns() {
   if [[ -z "${userns}" ]]; then
     return
   fi
+  echo 'INFO: running in a user namespace (experimental)'  >&2
 
   local nofile_hard
   nofile_hard="$(ulimit -Hn)"
   local nofile_hard_expected="64000"
   if [[ "${nofile_hard}" -lt "${nofile_hard_expected}" ]]; then
     echo "WARN: UserNS: expected RLIMIT_NOFILE to be at least ${nofile_hard_expected}, got ${nofile_hard}" >&2
   fi
-
-  if [[ ! -f "/sys/fs/cgroup/cgroup.controllers" ]]; then
-    echo "ERROR: UserNS: cgroup v2 needs to be enabled" >&2
-    exit 1
-  fi
-  for f in cpu memory pids; do
-    if ! grep -qw $f /sys/fs/cgroup/cgroup.controllers; then
-      echo "ERROR: UserNS: $f controller needs to be delegated" >&2
-    exit 1
-    fi
-  done
 }
 
 configure_containerd() {
   local snapshotter=${KIND_EXPERIMENTAL_CONTAINERD_SNAPSHOTTER:-}
   if [[ -n "$userns" ]]; then
-    # userns (rootless) configs
-
     # Adjust oomScoreAdj
     sed -i 's/restrict_oom_score_adj = false/restrict_oom_score_adj = true/' /etc/containerd/config.toml
-
+  fi
+  if [[ -n "$rootless" ]]; then
     # Use fuse-overlayfs by default: https://github.com/kubernetes-sigs/kind/issues/2275
     snapshotter="fuse-overlayfs"
   else
@@ -102,15 +95,15 @@ fix_mount() {
     sync
   fi
 
-  if [[ -z "${userns}" ]]; then
-    echo 'INFO: remounting /sys read-only'
-    # systemd-in-a-container should have read only /sys
-    # https://systemd.io/CONTAINER_INTERFACE/
-    # however, we need other things from `docker run --privileged` ...
-    # and this flag also happens to make /sys rw, amongst other things
-    #
-    # This step is skipped when running inside UserNS, because it fails with EACCES.
-    mount -o remount,ro /sys
+  echo 'INFO: remounting /sys read-only'
+  # systemd-in-a-container should have read only /sys
+  # https://systemd.io/CONTAINER_INTERFACE/
+  # however, we need other things from `docker run --privileged` ...
+  # and this flag also happens to make /sys rw, amongst other things
+  #
+  # This step is ignored when running inside UserNS, because it may fail with EACCES.
+  if ! mount -o remount,ro /sys && [[ -n "$userns" ]]; then
+    echo 'INFO: UserNS: ignoring mount fail' >&2
   fi
 
   echo 'INFO: making mounts shared' >&2

diff --git a/pkg/cluster/internal/providers/docker/provision.go b/pkg/cluster/internal/providers/docker/provision.go
@@ -243,6 +243,15 @@ func runArgsForNode(node *config.Node, clusterIPFamily config.ClusterIPFamily, n
 		args...,
 	)
 
+	// let the container know that it's running in rootless mode
+	info, err := info()
+	if err != nil {
+		return nil, err
+	}
+	if info.Rootless {
+		args = append(args, "-e", "KIND_ROOTLESS=1")
+	}
+
 	// convert mounts and port mappings to container run args
 	args = append(args, generateMountBindings(node.ExtraMounts...)...)
 	mappingArgs, err := generatePortMappings(clusterIPFamily, node.ExtraPortMappings...)

diff --git a/pkg/cluster/internal/providers/podman/provider.go b/pkg/cluster/internal/providers/podman/provider.go
@@ -407,7 +407,7 @@ func info(logger log.Logger) (*providers.ProviderInfo, error) {
 		SupportsPidsLimit:   true, // not guaranteed to be correct
 		SupportsCPUShares:   true, // not guaranteed to be correct
 	}
-	if info.Rootless {
+	if logger != nil && info.Rootless {
 		logger.Warn("Cgroup controller detection is not implemented for Podman. " +
 			"If you see cgroup-related errors, you might need to set systemd property \"Delegate=yes\", see https://kind.sigs.k8s.io/docs/user/rootless/")
 	}

diff --git a/pkg/cluster/internal/providers/podman/provision.go b/pkg/cluster/internal/providers/podman/provision.go
@@ -206,6 +206,15 @@ func runArgsForNode(node *config.Node, clusterIPFamily config.ClusterIPFamily, n
 		args...,
 	)
 
+	// let the container know that it's running in rootless mode
+	info, err := info(nil)
+	if err != nil {
+		return nil, err
+	}
+	if info.Rootless {
+		args = append(args, "-e", "KIND_ROOTLESS=1")
+	}
+
 	// convert mounts and port mappings to container run args
 	args = append(args, generateMountBindings(node.ExtraMounts...)...)
 	mappingArgs, err := generatePortMappings(clusterIPFamily, node.ExtraPortMappings...)