How to inference asynchronous

eqy · May 8, 2022, 3:12am

By default cuda kernels are run asynchronously (you need to call torch.cuda.synchronize()) to block until all launched kernels are done.