logutils.py

import functools
from typing import Dict, List, Optional

import numpy as np

import torch
from torch.utils.tensorboard import SummaryWriter


class ActivationsLogger():
    def __init__(self, model: torch.nn.Module, writer: SummaryWriter, layers: List[str]):
        self.__model = model
        self.__writer = writer
        self.__layers = layers.copy()
        self.__handles = []

        self.activations: Dict[str, List[torch.Tensor]] = {l: [] for l in layers}

    def _forward_hook(self, name, mod, inp, outp):
        activations: torch.Tensor = outp.cpu().detach()
        self.activations[name].append(activations)        


    def _register_hook(self, name):
        m = self.__model.get_submodule(name)
        h = m.register_forward_hook(functools.partial(self._forward_hook, name))
        self.__handles.append(h)

    def enable(self):
        # skip if already enabled
        if len(self.__handles) > 0:
            return

        for layer in self.__layers:
            self._register_hook(layer)
    
    def disable(self):
        for h in self.__handles:
            h.remove()
        
        self.__handles.clear()

    def flush(self, global_step: int, phase: str="train"):
        for layer, act in self.activations.items():
            # concat all tensor in list along the batch dimension, assumed to be dim=0
            aggregate = torch.concat(act, dim=0)

            self.__writer.add_histogram(tag=f"Activations/{layer}/{phase}", values=aggregate, global_step=global_step)
            act.clear()
        
    def clear(self):
        for l in self.activations.values():
            l.clear()


class MetricsWriter():
    def __init__(self, tb_writer: SummaryWriter, max_len: int, scalar_tags: Optional[List[str]]=None):
        self.__tb_writer: SummaryWriter = tb_writer
        self.__max_len: int = max_len

        if scalar_tags is None:
            scalar_tags = list()

        self.__scalar_metrics: Dict[str, np.array] = dict()

        for scalar in scalar_tags:
            self.add_scalar(scalar)
    
        self.__current_step: int = 0
    
    def add_scalar(self, tag: str):
        assert tag not in self.__scalar_metrics.keys(), "Tag has already been added"
        self.__scalar_metrics[tag] = np.empty((self.__max_len,))
    
    def set_step(self, step: int):
        self.__current_step = step

    def add_sample(self, tag: str, value: float):
        self.__scalar_metrics[tag][self.__current_step] = value
    
    def get(self, tag: str):
        return np.nanmean(self.__scalar_metrics[tag])

    def write(self, global_step: int):
        for tag in self.__scalar_metrics.keys():
            metric_value = self.get(tag)
            self.__tb_writer.add_scalar(tag, metric_value, global_step=global_step)

    def clear(self):
        self.__current_step = 0
        for samples in self.__scalar_metrics.values():
            samples.fill(np.nan)

def log_weights(model: torch.nn.Module, writer: SummaryWriter, global_step: int):
    for n, p in model.named_parameters(recurse=True):
        writer.add_histogram(f"Weights/{n}", values=p, global_step=global_step)

def log_metrics_dict(metrics_dict: Dict[str, float], writer, global_step: int, prefix=''):
    for name, value in metrics_dict.items():
        writer.add_scalar(prefix+name, value, global_step=global_step)