pytorch resnet50 How to change the model output to a probability value instead of a determined category

name1ess · October 18, 2022, 6:38am

import os
import glob
import random
import shutil

dataset_dir = ‘数据集2’
train_dir = ‘数据集2/train’
valid_dir = ‘数据集2/val’
test_dir = ‘数据集2/’

train_per = 0.8
valid_per = 0.2
test_per = 0

def makedir(new_dir):
if not os.path.exists(new_dir):
os.makedirs(new_dir)

if name == ‘main’:

for root, dirs, files in os.walk(dataset_dir):
    for sDir in dirs:
        imgs_list = glob.glob(os.path.join(root, sDir) + '/*.jpg')
        random.seed(666)
        random.shuffle(imgs_list)
        imgs_num = len(imgs_list)

        train_point = int(imgs_num * train_per)
        valid_point = int(imgs_num * (train_per + valid_per))

        for i in range(imgs_num):
            if i < train_point:
                out_dir = train_dir + sDir + '/'
            elif i < valid_point:
                out_dir = valid_dir + sDir + '/'
            else:
                out_dir = test_dir + sDir + '/'

            makedir(out_dir)
            out_path = out_dir + os.path.split(imgs_list[i])[-1]
            shutil.copy(imgs_list[i], out_path)

        print('Class:{}, train:{}, valid:{}, test:{}'.format(sDir, train_point, valid_point - train_point,
                                                             imgs_num - valid_point))

import glob
import torch
import torchvision.models
from torch.utils import data
from PIL import Image
import numpy as np
from torchvision import transforms, datasets
import matplotlib.pyplot as plt
import torch.nn.functional as F
import torch.nn as nn
from torch import nn, optim
import torchvision.models as models
import os
from torch.utils.data import DataLoader
import time

image_transforms = {
‘train’: transforms.Compose([
transforms.CenterCrop(size=1024),
transforms.Resize(size=256),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406],
[0.229, 0.224, 0.225])
]),
‘val’: transforms.Compose([
transforms.CenterCrop(size=1024),
transforms.Resize(size=256),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406],
[0.229, 0.224, 0.225])
])
}

dataset = ‘数据集2’
train_directory = os.path.join(dataset, ‘train’)
valid_directory = os.path.join(dataset, ‘val’)

batch_size以及类别数

batch_size = 32
num_classes = 4

data = {
‘train’: datasets.ImageFolder(root=train_directory, transform=image_transforms[‘train’]),
‘val’: datasets.ImageFolder(root=valid_directory, transform=image_transforms[‘val’])

}

train_data_size = len(data[‘train’])
valid_data_size = len(data[‘val’])

train_data = DataLoader(data[‘train’], batch_size=batch_size, shuffle=True)
valid_data = DataLoader(data[‘val’], batch_size=batch_size, shuffle=True)

print(train_data_size, valid_data_size)

device = torch.device(‘cuda:0’ if torch.cuda.is_available() else ‘cpu’)
resnet50 = models.resnet50(pretrained=False)
fc_inputs = resnet50.fc.in_features
resnet50.fc = nn.Sequential(
nn.Linear(fc_inputs, 256),
nn.ReLU(),
nn.Dropout(0.5),
# nn.Linear output layer
nn.Linear(256, 4),
nn.LogSoftmax(dim=1)
)

resnet50 = resnet50.to(device)

loss_func = nn.NLLLoss()
optimizer = optim.Adam(resnet50.parameters())

print(model)

def train_and_valid(model, loss_function, optimizer, epochs=25):
device = torch.device(“cuda:0” if torch.cuda.is_available() else “cpu”)
history = []
best_acc = 0.0
best_epoch = 0

for epoch in range(epochs):
    epoch_start = time.time()
    print("Epoch: {}/{}".format(epoch + 1, epochs))

    model.train()

    train_loss = 0.0
    train_acc = 0.0
    valid_loss = 0.0
    valid_acc = 0.0

    for i, (inputs, labels) in enumerate(train_data):
        inputs = inputs.to(device)
        labels = labels.to(device)

        # 因为这里梯度是累加的，所以每次记得清零
        optimizer.zero_grad()

        outputs = model(inputs)



        loss = loss_function(outputs, labels)

        loss.backward()

        optimizer.step()

        train_loss += loss.item() * inputs.size(0)

        ret, predictions = torch.max(outputs.data, 1)
        correct_counts = predictions.eq(labels.data.view_as(predictions))

        acc = torch.mean(correct_counts.type(torch.FloatTensor))

        train_acc += acc.item() * inputs.size(0)

    with torch.no_grad():
        model.eval()

        for j, (inputs, labels) in enumerate(valid_data):
            inputs = inputs.to(device)
            labels = labels.to(device)

            outputs = model(inputs)

            outputs2 = F.softmax(outputs, dim=1)
            # b_probs = torch.argmax(outputs, 1)

            loss = loss_function(outputs, labels)

            valid_loss += loss.item() * inputs.size(0)

            ret, predictions = torch.max(outputs.data, 1)
            correct_counts = predictions.eq(labels.data.view_as(predictions))

            acc = torch.mean(correct_counts.type(torch.FloatTensor))

            valid_acc += acc.item() * inputs.size(0)

    avg_train_loss = train_loss / train_data_size
    avg_train_acc = train_acc / train_data_size

    avg_valid_loss = valid_loss / valid_data_size
    avg_valid_acc = valid_acc / valid_data_size

    history.append([avg_train_loss, avg_valid_loss, avg_train_acc, avg_valid_acc])

    if best_acc < avg_valid_acc:
        best_acc = avg_valid_acc
        best_epoch = epoch + 1

    epoch_end = time.time()


    print(
        "Epoch: {:03d}, Training: Loss: {:.4f}, Accuracy: {:.4f}%, \n\t\tValidation: Loss: {:.4f}, Accuracy: {:.4f}%, Time: {:.4f}s".format(
            epoch + 1, avg_valid_loss, avg_train_acc * 100, avg_valid_loss, avg_valid_acc * 100,
            epoch_end - epoch_start
        ))
    print("Best Accuracy for validation : {:.4f} at epoch {:03d}".format(best_acc, best_epoch))

    torch.save(model, dataset + '\\models1\\' + '_model_' + str(epoch + 1) + '.pt')
return model, history

迭代次数设置

num_epochs = 3
trained_model, history = train_and_valid(resnet50, loss_func, optimizer, num_epochs)

模型保存的路径

torch.save(history, dataset + ‘\models1\’ + ‘_history.pt’)

history = np.array(history)
plt.plot(history[:, 0:2])
plt.legend([‘Tr Loss’, ‘Val Loss’])
plt.xlabel(‘Epoch Number’)
plt.ylabel(‘Loss’)
plt.ylim(0, 1)
plt.savefig(dataset + ‘_loss_curve.png’)
plt.show()

plt.plot(history[:, 2:4])
plt.legend([‘Tr Accuracy’, ‘Val Accuracy’])
plt.xlabel(‘Epoch Number’)
plt.ylabel(‘Accuracy’)
plt.ylim(0, 1)
plt.savefig(dataset + ‘_accuracy_curve.png’)
plt.show()

ptrblck · October 18, 2022, 6:41am

Based on your posted code it seems you are using nn.LogSoftmax in your model which will output log probabilities. You could apply torch.exp on them to get the probabilities in [0, 1] again.
PS: you can post code snippets by wrapping them into three backticks ``` which makes debugging easier.

name1ess · October 18, 2022, 6:50am

Thank you for your answer.I’m a student at school, and I’m still at the basic learning stage.
I found this method in your other post responses: probs = F.softmax(outputs, dim=1)
and outputs = model(inputs)
probs seems to be the probability of each class I want,Is that right？

srishti-git1110 · October 18, 2022, 6:59am

@name1ess softmax shall not work for your model specification as you are already using a log softmax layer that outputs log(p) - the log probabilities. You can use torch.exp as @ptrblck has suggested.

exp(log(p)) = p

name1ess · October 18, 2022, 7:11am

Oh, I see!
outputs = model(inputs)
output = torch.exp(outputs)

then output is the probability I want?

srishti-git1110 · October 18, 2022, 7:33am

Yes.

See for example:

inp_batch = torch.randn(8, 4) # batch_size=8
layer = nn.LogSoftmax(dim=1)
output = layer(inp_batch)
output = torch.exp(output)

print(output.sum(dim=1))  # tensor([1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000])

name1ess · October 18, 2022, 7:34am

love u