Multi-node, Multi-gpu training

DHARMENDRA_PRAJAPAT · January 24, 2025, 6:50am

I have given the link to some code that does not have any specific dataloader defined, is there any way it can be modified for the multi-node training? Kindly help

github.com/TonyNemo/UBAR-MultiWOZ

train.py

master

from transformers.optimization import AdamW, get_linear_schedule_with_warmup
from transformers import GPT2Tokenizer, GPT2LMHeadModel, GPT2Model
from eval import MultiWozEvaluator
from damd_net import DAMD, cuda_, get_one_hot_input
from reader import MultiWozReader
import utils
from torch.optim import Adam
import torch
import torch.nn as nn

import os
import random
import argparse
import time
import logging
import json
import tqdm
import numpy as np
from torch.utils.tensorboard import SummaryWriter
from tqdm import tqdm

This file has been truncated. show original