Model parameters are becoming nan after some batch backpropagation

Vaijenath_Biradar · September 16, 2017, 7:46pm

my model contains lstm with batch. model is so simple, But after running some batches not even completed one epoch the model parameters are becoming nan. I tried with learning rate as 0.0 even though they are becoming zero. may i know why? My code is at https://bitbucket.org/Vsbiradar/siamese-network/src/b5d6428c045cdcc1900fa216bece08d0012dab9b/siamese-network/siamese.py?at=master&fileviewer=file-view-default

SpandanMadan · September 16, 2017, 7:52pm

One obvious possible reason is because your training rate is too large and gradients blow up.

Look at the gradients of your model layers. Also, try gradient clipping.

Vaijenath_Biradar · September 17, 2017, 10:59am

But my learning rate is 0.And algorithm is SGD. I dont know why the model parameters are even changing with 0 learning rate

QuantScientist · September 17, 2017, 11:19am

Did you try using a different optimizer? Adam for instance?

Vaijenath_Biradar · September 17, 2017, 11:43am

Yes. Adam and Adadelta. any of these are not working

Antlar-lu · April 11, 2018, 7:37am

Did you solve it ? And which version do you apply?

Wenyao_Zhang · November 16, 2022, 5:13pm

Did you solve it? I have the same problem. Can you give me some advice?