Lstm multi layer help

imrankhan_pythonLang · July 1, 2020, 2:33am

Anyone, Please Help how can I use multiple LSTM layer
[NOTE: LSTM 1 and 2 are commented because when I try to add I face dimension problem ]


class LSTMnetwork(nn.Module):
    def __init__(self,input_size=1,hidden_size=100,output_size=1):
        super().__init__()
        self.hidden_size = hidden_size
        
        # Add an LSTM layer:
        self.lstm = nn.LSTM(input_size,hidden_size)
        #self.lstm1 = nn.LSTM(hidden_size,200)
        #self.lstm2 = nn.LSTM(200,300)
        
        self.linear = nn.Linear(hidden_size,output_size)
        
        self.hidden = (torch.zeros(1,1,self.hidden_size),
                       torch.zeros(1,1,self.hidden_size))

    def forward(self,seq):
        lstm_out, self.hidden = self.lstm(seq.view(len(seq),1,-1), self.hidden)
        #lstm_out, self.hidden = self.lstm1(lstm_out, self.hidden)
        #lstm_out, self.hidden = self.lstm2(lstm_out, self.hidden)
        pred = self.linear(lstm_out.view(len(seq),-1))
        return pred[-1]  # we only want the last value

harsha_g · July 1, 2020, 2:35am

Are you aware of the num_layers argument for nn.LSTM? https://pytorch.org/docs/master/generated/torch.nn.LSTM.html

imrankhan_pythonLang · July 1, 2020, 2:44am

num_layers layer just repeat same input and hidden. I want a custom hidden.

vdw · July 1, 2020, 2:50am

Well, you probably need multiple hidden states, one for each LSTM, since the last dimension (i.e., hidden dimension) is different (in your case 100, 200, and 300).

By the way, I also feel that

pred = self.linear(lstm_out.view(len(seq),-1))
return pred[-1]  # we only want the last value

doesn’t make sense.

harsha_g · July 1, 2020, 2:52am

Or you can simply use nn.LSTMCell. Here’s an example.

vdw · July 1, 2020, 8:09am

@harsha_g This example also uses one hidden state for each of the 2 LSTM cells: (h_t, c_t) and (h_t2, c_t2).