Freezing parameters

ebetica · June 14, 2017, 7:32pm

Should just be something like
critic_loss = ((reward+(gamma*critic_new.detach())) - critic_old)**2