Size mismatch, m1: [2048 x 1], m2: [2048 x 1]

ywr461903285 · September 15, 2019, 12:23pm

i am a new hand in this item, met a problem which is hard for me to solve…i need someone to help me
code below.:

class CNN(nn.Module):
def init(self,size):

    super(CNN, self).__init__()
    resnet = models.resnet152(pretrained=False)
    modules = list(resnet.children())[:-1]      # delete the last fc layer.
    self.resnet = nn.Sequential(*modules)
    self.linear = nn.Linear(resnet.fc.in_features, size)
   
            
def forward(self, images):
    """Extract feature vectors from input images."""
    
    with torch.no_grad():
        features = self.resnet(images)

    features = self.linear(features)
    
  
    return features

class NN(nn.Module):
def init(self, in_dim, n_hidden1, n_hidden2, out_dim):
super(NN, self).init()
self.layer1 = nn.Linear(in_dim, n_hidden1)
self.layer2 = nn.Linear(n_hidden1, n_hidden2)
self.layer3 = nn.Linear(n_hidden2, out_dim)

def forward(self, x):
    x = self.layer1(x)
    x = self.layer2(x)
    x = self.layer3(x)

device = torch.device(‘cuda’ if torch.cuda.is_available() else ‘cpu’)

size = 1
in_dim, n_hidden1, n_hidden2, out_dim = 20, 300, 100, 2
learning_rate = 0.001

encoder = CNN(size).cuda()
decoder = NN(in_dim, n_hidden1, n_hidden2, out_dim).cuda()

criterion = nn.MSELoss()
params = list(decoder.parameters()) + list(encoder.parameters())
optimizer = torch.optim.Adam(params, lr=learning_rate)
for epoch in range (10):
for img, rst, character in train_dataloader:

    img=img.to(device)
    rst =torch.Tensor(rst)
    rst = rst.to(device)
    character = torch.Tensor(character)
    character = character.to(device)
    
    
    features = encoder(img)
    
    character = torch.cat((features, character),1)
    outputs = decoder(character)
    loss = criterion(outputs, rst)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

urw7rs · September 15, 2019, 2:00pm

could you post the error message?

ywr461903285 · September 15, 2019, 2:46pm

Traceback (most recent call last):

File “”, line 1, in
runfile(’/home/ywr/.config/spyder-py3/云溪/train.py’, wdir=’/home/ywr/.config/spyder-py3/云溪’)

File “/home/ywr/anaconda3/lib/python3.7/site-packages/spyder_kernels/customize/spydercustomize.py”, line 668, in runfile
execfile(filename, namespace)

File “/home/ywr/anaconda3/lib/python3.7/site-packages/spyder_kernels/customize/spydercustomize.py”, line 108, in execfile
exec(compile(f.read(), filename, ‘exec’), namespace)

File “/home/ywr/.config/spyder-py3/云溪/train.py”, line 32, in
features = encoder(img)

File “/home/ywr/anaconda3/lib/python3.7/site-packages/torch/nn/modules/module.py”, line 489, in call
result = self.forward(*input, **kwargs)

File “/home/ywr/.config/spyder-py3/云溪/model.py”, line 27, in forward
features = self.linear(features)

File “/home/ywr/anaconda3/lib/python3.7/site-packages/torch/nn/modules/module.py”, line 489, in call
result = self.forward(*input, **kwargs)

File “/home/ywr/anaconda3/lib/python3.7/site-packages/torch/nn/modules/linear.py”, line 67, in forward
return F.linear(input, self.weight, self.bias)

File “/home/ywr/anaconda3/lib/python3.7/site-packages/torch/nn/functional.py”, line 1354, in linear
output = input.matmul(weight.t())

RuntimeError: size mismatch, m1: [2048 x 1], m2: [2048 x 1] at /opt/conda/conda-bld/pytorch_1549633347309/work/aten/src/THC/generic/THCTensorMathBlas.cu:266

urw7rs · September 15, 2019, 2:54pm

I think you need to use .view(1, 2048) on the output of the resnet. So it would look like this:

with torch.no_grad():
    features = self.resnet(images)
    features = features.view(1, 2048)

Before the fully connected layer, torch.flatten changes the dimensions to [2048, 1].

ywr461903285 · September 15, 2019, 2:56pm

thanks a lot but occur another problem like this:
Traceback (most recent call last):