fc_layer.py

"""Author: Hyung-Kwon Ko (hyungkwonko@gmail.com)"""
import os
import time
import copy
import logging

import argparse
from tqdm import tqdm
from datetime import datetime

import torch
import torch.nn as nn
from torch.nn.utils import spectral_norm
import torch.optim as optim
from torch.optim.lr_scheduler import ExponentialLR

from datasets.sg2 import StyleGAN2_Data


class MultiSequential(nn.Sequential):
    def forward(self, *inputs):
        for module in self._modules.values():
            if type(inputs) == tuple:
                inputs = module(*inputs)
            else:
                inputs = module(inputs)
        return inputs


class AdaIN(nn.Module):
    def __init__(self, z_dim=512, c_dim=136):
        super().__init__()
        self.affine = spectral_norm(nn.Linear(c_dim, z_dim))
        self.linear = spectral_norm(nn.Linear(z_dim, 2))

    def forward(self, z_in, c):
        z_out = self.norm1d(z_in)
        c_out = self.affine(c)
        c_out = self.linear(c_out)
        gamma, beta = c_out.chunk(2, 1)
        z_out = (1 + gamma) * z_out + beta

        return z_out, c

    def norm1d(self, x, eps=1e-5):
        return (x - torch.mean(x)) / (torch.std(x) + eps)


class FC_Block(nn.Module):
    def __init__(self, z_dim, c_dim):
        super().__init__()

        self.adain = AdaIN(z_dim, c_dim)
        self.fc = MultiSequential(
            nn.LeakyReLU(0.2),
            spectral_norm(nn.Linear(z_dim, z_dim)),
        )

    def forward(self, z_in, c):
        z_out, c = self.adain(z_in, c)
        z_out = self.fc(z_out)
        return z_out, c


class FC_Model(nn.Module):
    def __init__(self, z_dim=512, c_dim=136, n=6):
        super().__init__()

        self.model = MultiSequential(
            *self._make_layer(FC_Block, z_dim, c_dim, n)
        )

    def _make_layer(self, block, z_dim, c_dim, n):
        layers = []
        for _ in range(n):
            layers.append(block(z_dim, c_dim))
        return layers

    def forward(self, z, c):
        out = self.model(z, c)
        return out


def train(args):

    logging.info("Loading Datasets...")
    data = {
        'train': StyleGAN2_Data(root=args.root, split='train'),  # 100k data
        # 'train': StyleGAN2_Data(root=args.root, split='train_all'),  # 200k data
        'val': StyleGAN2_Data(root=args.root, split='val')
        }

    data_loader = {
        'train': torch.utils.data.DataLoader(data['train'], batch_size=args.batch_size, shuffle=False, num_workers=4, drop_last=False),
        'val': torch.utils.data.DataLoader(data['val'], batch_size=args.batch_size, shuffle=False, num_workers=4, drop_last=False)
        }

    logging.info("Loading Complete!")

    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

    model = FC_Model(z_dim=args.z_dim, c_dim=args.c_dim, n=args.num_mlp_layers)

    logging.info(model)

    model = model.to(device)
    
    criterion = nn.MSELoss()
    optimizer = optim.Adam(model.parameters(), lr=args.lr, weight_decay=args.weight_decay)
    scheduler = ExponentialLR(optimizer, gamma=args.lr_gamma)
    # scheduler = CosineAnnealingLR(optimizer, gamma=args.lr_gamma)    

    since = time.time()

    val_loss_history = []

    best_model_wts = copy.deepcopy(model.state_dict())
    best_loss = float('inf')

    for epoch in range(args.num_epochs):

        logging.info('-' * 10)
        logging.info(f'Epoch {epoch}/{args.num_epochs - 1} | Learning rate: {scheduler.get_last_lr()[-1]:.6f}')

        for phase in ['train', 'val']:
            if phase == 'train':
                model.train()
            else:
                model.eval()

            running_loss = 0.0

            for batch in tqdm(data_loader[phase]):

                latents = batch['latent'].to(device)
                labels = batch['label'].to(device)

                optimizer.zero_grad()

                with torch.set_grad_enabled(phase == 'train'):
                    (outputs, _) = model(latents, labels)

                    loss = criterion(outputs, latents)

                    if phase == 'train':
                        loss.backward()
                        optimizer.step()
                    
                running_loss += loss.item() * latents.size(0)

            epoch_loss = running_loss / len(data_loader[phase].dataset)

            logging.info(f'{phase} Loss: {epoch_loss:.4f}')

            if phase == 'val':
                val_loss_history.append(epoch_loss)

                if epoch_loss < best_loss:
                    best_loss = epoch_loss
                    best_model_wts = copy.deepcopy(model.state_dict())
                    torch.save(best_model_wts, os.path.join(args.ckpt_dir, f'model_{args.lr}_{args.batch_size}_{args.num_mlp_layers}_{args.weight_decay}.pth'))
            
        scheduler.step()

    time_elapsed = time.time() - since

    logging.info(f'Training complete in {time_elapsed // 60:.0f}m {time_elapsed % 60:.0f}s')
    logging.info(f'Best val Loss: {best_loss:4f}')

    model.load_state_dict(best_model_wts)

    logging.info(val_loss_history)
    logging.info('Save validation history')
    logging.info('-' * 10)
    logging.info('Successfully finished training!')


def test(args):

    data = StyleGAN2_Data(root=args.root, split='test')
    data_loader = torch.utils.data.DataLoader(data, batch_size=args.batch_size, shuffle=False, num_workers=4, drop_last=False)

    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

    model = FC_Model(z_dim=args.z_dim, c_dim=args.c_dim, n=args.num_mlp_layers)
    model.load_state_dict(torch.load(os.path.join(args.ckpt_dir, args.ckpt_fname)))
    model = model.to(device)

    criterion = nn.MSELoss()

    model.eval()

    running_loss = 0.0

    for batch in tqdm(data_loader):

        latents = batch['latent'].to(device)
        labels = batch['label'].to(device)

        with torch.no_grad():
            (outputs, _) = model(latents, labels)

            loss = criterion(outputs, latents)

        running_loss += loss.item() * latents.size(0)

    epoch_loss = running_loss / len(data_loader.dataset)

    print(f'Loss: {epoch_loss:.4f}')
    print(f"Sample latents {latents[0][:7].cpu()}")
    print(f"Sample output: {outputs[0][:7].cpu()}")


def main():

    parser = argparse.ArgumentParser("MLP layer (auxiliary network) train/test")

    parser.add_argument('--mode', type=str, default='train', choices=['train', 'test'], help='train/test')
    parser.add_argument('--z_dim', type=int, default=512, help='latent_dim')
    parser.add_argument('--c_dim', type=int, default=136, help='class_dim')
    parser.add_argument('--num_mlp_layers', type=int, default=6, help='number of mlp layers')
    parser.add_argument('--batch_size', type=int, default=8, help='batch size')
    parser.add_argument('--num_epochs', type=int, default=25, help='number of epochs to run')

    parser.add_argument('--lr', type=float, default=2e-4, help='learning rate')
    parser.add_argument('--lr_gamma', type=float, default=0.998, help='gamma for learning rate schedule')
    parser.add_argument('--weight_decay', type=float, default=0.0, help='l2 norm')

    parser.add_argument('--root', type=str, default='data', help='training data dir')
    parser.add_argument('--ckpt_dir', type=str, default='ckpt', help='model checkpoint folder path')
    parser.add_argument('--ckpt_fname', type=str, default='model_0.0002_8_6_0.0.pth', help='model checkpoint save filename')
    parser.add_argument('--log_dir', type=str, default='log', help='save directory for log file')

    args = parser.parse_args()

    os.makedirs(args.ckpt_dir, exist_ok=True)
    os.makedirs(args.log_dir, exist_ok=True)

    logging.basicConfig(
        level=logging.INFO,
        format='%(asctime)s [%(levelname)s] %(message)s',
        datefmt='%Y-%m-%d,%H:%M:%S',
        handlers=[
            logging.FileHandler(os.path.join(args.log_dir, f'senet_{datetime.now().strftime("%H:%M:%S")}.log')),
            logging.StreamHandler()
        ]
    )

    logging.info(f"Set Arguments: {args}")

    if args.mode == 'train':
        train(args)
    else:
        test(args)


if __name__ == "__main__":
    main()