Source code for viskit.core

import csv
import itertools
import json
import os

import numpy as np

from viskit.misc import ext


[docs]def unique(_list):
    return list(set(_list))


[docs]def flatten(_list):
    return [item for sublist in _list for item in sublist]


[docs]def load_progress(progress_csv_path):
    print('Reading %s' % progress_csv_path)
    entries = dict()
    with open(progress_csv_path, 'r') as csvfile:
        reader = csv.DictReader(csvfile)
        for row in reader:
            for k, v in row.items():
                if k not in entries:
                    entries[k] = []
                try:
                    entries[k].append(float(v))
                except:  # noqa
                    entries[k].append(0.)
    entries = dict([(k, np.array(v)) for k, v in entries.items()])
    return entries


[docs]def flatten_dict(d):
    flat_params = dict()
    for k, v in d.items():
        if isinstance(v, dict):
            v = flatten_dict(v)
            for subk, subv in flatten_dict(v).items():
                flat_params[k + '.' + subk] = subv
        else:
            flat_params[k] = v
    return flat_params


[docs]def load_params(params_json_path):
    with open(params_json_path, 'r') as f:
        data = json.loads(f.read())
        if 'args_data' in data:
            del data['args_data']
        if 'exp_name' not in data:
            data['exp_name'] = params_json_path.split('/')[-2]
    return data


[docs]def lookup(d, keys):
    if not isinstance(keys, list):
        keys = keys.split('.')
    for k in keys:
        if hasattr(d, '__getitem__'):
            if k in d:
                d = d[k]
            else:
                return None
        else:
            return None
    return d


[docs]def load_exps_data(exp_folder_paths, disable_variant=False):
    exps = []
    for exp_folder_path in exp_folder_paths:
        exps += [x[0] for x in os.walk(exp_folder_path)]
    exps_data = []
    for exp in exps:
        try:
            exp_path = exp
            params_json_path = os.path.join(exp_path, 'params.json')
            variant_json_path = os.path.join(exp_path, 'variant.json')
            progress_csv_path = os.path.join(exp_path, 'progress.csv')
            progress = load_progress(progress_csv_path)
            if disable_variant:
                params = load_params(params_json_path)
            else:
                try:
                    params = load_params(variant_json_path)
                except IOError:
                    params = load_params(params_json_path)
            exps_data.append(
                ext.AttrDict(
                    progress=progress,
                    params=params,
                    flat_params=flatten_dict(params)))
        except IOError as e:
            print(e)
    return exps_data


[docs]def smart_repr(x):
    if isinstance(x, tuple):
        if x:
            return 'tuple()'
        elif len(x) == 1:
            return '(%s,)' % smart_repr(x[0])
        else:
            return '(' + ','.join(map(smart_repr, x)) + ')'
    else:
        if hasattr(x, '__call__'):
            return '__import__("pydoc").locate("%s")' % (
                x.__module__ + '.' + x.__name__)
        else:
            return repr(x)


[docs]def extract_distinct_params(exps_data,
                            excluded_params=('exp_name', 'seed', 'log_dir'),
                            length=1):
    # all_pairs = unique(flatten([d.flat_params.items() for d in exps_data]))
    # if logger:
    #     logger('(Excluding {excluded})'.format(
    #       excluded=', '.join(excluded_params)))
    # def cmp(x,y):
    #     if x < y:
    #         return -1
    #     elif x > y:
    #         return 1
    #     else:
    #         return 0

    try:
        stringified_pairs = sorted(
            map(
                eval,
                unique(
                    flatten([
                        list(map(smart_repr, list(d.flat_params.items())))
                        for d in exps_data
                    ]))),
            key=lambda x: (tuple(0. if it is None else it for it in x), ))
    except Exception as e:
        print(e)
    proposals = [
        (k, [x[1] for x in v])
        for k, v in itertools.groupby(stringified_pairs, lambda x: x[0])
    ]
    filtered = [(k, v) for (k, v) in proposals if len(v) > length and all(
        [k.find(excluded_param) != 0 for excluded_param in excluded_params])]
    return filtered


[docs]class Selector:
    def __init__(self, exps_data, filters=None, custom_filters=None):
        self._exps_data = exps_data
        if filters is None:
            self._filters = tuple()
        else:
            self._filters = tuple(filters)
        if custom_filters is None:
            self._custom_filters = []
        else:
            self._custom_filters = custom_filters

[docs]    def where(self, k, v):
        return Selector(self._exps_data, self._filters + ((k, v), ),
                        self._custom_filters)

[docs]    def custom_filter(self, filter):
        return Selector(self._exps_data, self._filters,
                        self._custom_filters + [filter])

    def _check_exp(self, exp):
        # yapf: disable
        # or exp.flat_params.get(k, None) is None
        return (all(((str(exp.flat_params.get(k, None)) == str(v) or (k not in exp.flat_params)) for k, v in self._filters))  # noqa: E501
                and all(custom_filter(exp) for custom_filter in self._custom_filters))  # noqa: E501

[docs]    def extract(self):
        return list(filter(self._check_exp, self._exps_data))

[docs]    def iextract(self):
        return filter(self._check_exp, self._exps_data)


# Taken from plot.ly
color_defaults = [
    '#1f77b4',  # muted blue
    '#ff7f0e',  # safety orange
    '#2ca02c',  # cooked asparagus green
    '#d62728',  # brick red
    '#9467bd',  # muted purple
    '#8c564b',  # chestnut brown
    '#e377c2',  # raspberry yogurt pink
    '#7f7f7f',  # middle gray
    '#bcbd22',  # curry yellow-green
    '#17becf'  # blue-teal
]


[docs]def hex_to_rgb(hex, opacity=1.0):
    if hex[0] == '#':
        hex = hex[1:]
    assert (len(hex) == 6)
    return 'rgba({0},{1},{2},{3})'.format(
        int(hex[:2], 16), int(hex[2:4], 16), int(hex[4:6], 16), opacity)


# class VisApp:
#
#
#     def __init__(self, exp_folder_path):
#         self._logs = []
#         self._plot_sequence = []
#         self._exps_data = None
#         self._distinct_params = None
#         self._exp_filter = None
#         self._plottable_keys = None
#         self._plot_key = None
#         self._init_data(exp_folder_path)
#         self.redraw()
#
#     def _init_data(self, exp_folder_path):
#         self.log('Loading data...')
#         self._exps_data = load_exps_data(exp_folder_path)
#         self.log('Loaded {nexp} experiments'.format(
#           nexp=len(self._exps_data)))
#         self._distinct_params = extract_distinct_params(
#           self._exps_data, logger=self.log)
#         assert len(self._distinct_params) == 1
#         self._exp_filter = self._distinct_params[0]
#         self.log('******************************************')
#         self.log('Found {nvary} varying parameter{plural}'.format(
#           nvary=len(self._distinct_params), plural='' if len(
#             self._distinct_params) == 1 else 's'))
#         for k, v in self._distinct_params:
#             self.log(k, ':', ', '.join(map(str, v)))
#         self.log('******************************************')
#         self._plottable_keys = self._exps_data[0].progress.keys()
#         assert len(self._plottable_keys) > 0
#         if 'AverageReturn' in self._plottable_keys:
#             self._plot_key = 'AverageReturn'
#         else:
#             self._plot_key = self._plottable_keys[0]
#
#     def log(self, *args, **kwargs):
#         self._logs.append((args, kwargs))
#
#     def _display_dropdown(self, attr_name, options):
#         def f(**kwargs):
#             self.__dict__[attr_name] = kwargs[attr_name]
#         IPython.display.display(ipywidgets.interactive(
#           f, **{attr_name: options}))
#
#     def redraw(self):
#         # print out all the logs
#         for args, kwargs in self._logs:
#             print(*args, **kwargs)
#
#         self._display_dropdown('_plot_key', self._plottable_keys)
#
#         k, vs = self._exp_filter
#         selector = Selector(self._exps_data)
#         to_plot = []
#         for v in vs:
#             filtered_data = selector.where(k, v).extract()
#             returns = [exp.progress[self._plot_key] for exp in filtered_data]
#             sizes = map(len, returns)
#             max_size = max(sizes)
#             for exp, retlen in zip(filtered_data, sizes):
#                 if retlen < max_size:
#                     self.log('Excluding {exp_name} since the
#                       trajectory is shorter: {thislen} vs. {maxlen}'.format(
#                         exp_name=exp.params['exp_name'],
#                           thislen=retlen, maxlen=max_size))
#             returns = [ret for ret in returns if len(ret) == max_size]
#             mean_returns = np.mean(returns, axis=0)
#             std_returns = np.std(returns, axis=0)
#             self._plot_sequence.append((''))
#             to_plot.append(ext.AttrDict(
#               means=mean_returns, stds=std_returns, legend=str(v)))
#         make_plot(to_plot)
Source code for viskit.core

viskit

Navigation

Related Topics