in ppo_ewma/train.py [0:0]
def main():
parser = argparse.ArgumentParser(description='Process PPG training arguments.')
parser.add_argument('--env_name', type=str, default='coinrun')
parser.add_argument('--num_envs', type=int, default=64)
parser.add_argument('--n_epoch_pi', type=int, default=1)
parser.add_argument('--n_epoch_vf', type=int, default=1)
parser.add_argument('--n_aux_epochs', type=int, default=6)
parser.add_argument('--n_pi', type=int, default=32)
parser.add_argument('--clip_param', type=float, default=0.2)
parser.add_argument('--kl_penalty', type=float, default=0.0)
parser.add_argument('--arch', type=str, default='dual') # 'shared', 'detach', or 'dual'
args = parser.parse_args()
comm = MPI.COMM_WORLD
train_fn(
env_name=args.env_name,
num_envs=args.num_envs,
n_epoch_pi=args.n_epoch_pi,
n_epoch_vf=args.n_epoch_vf,
n_aux_epochs=args.n_aux_epochs,
n_pi=args.n_pi,
arch=args.arch,
comm=comm)