Latest nlp topics - PyTorch Forums

Topic	Replies	Views	Activity
Masks in transformer	2	254	January 12, 2024
Advice on Transformer Models for EDU Segmentation and Topic/Sentiment Analysis in Hugging Face	0	109	January 12, 2024
Signal data and transformers	0	103	January 11, 2024
Using seperate encoder & decoder for transformer	0	157	January 11, 2024
Is there any methods(or tools) to track(or debug) tensor.size?	7	358	January 10, 2024
Right vs Left Padding	6	4029	January 10, 2024
RNN's and imbalanced data	2	221	January 9, 2024
RNNs with signal data	8	198	January 9, 2024
Input sequence for RNNs	1	239	January 7, 2024
Left padded transformer input with causal mask	0	238	January 5, 2024
How to calculate word and sentence embedding using GPT-2?	0	187	January 3, 2024
Constant Validation Loss and Accuracy	2	187	January 2, 2024
RuntimeError: CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling `cublasCreate(handle)`	5	5021	December 29, 2023
RuntimeError: CUDA error: device-side assert triggered (not solved)	1	374	December 27, 2023
Confusion on Transformer src, tgt and loss calculation	0	179	December 27, 2023
How to calculate F1 Score with PyTorch Lightning - T5 Model	1	478	December 27, 2023
Encountering an Issue while Fine-Tuning BERT for Text Comparasion on Colab	1	172	December 27, 2023
Loss fluctuating	6	307	December 23, 2023
Idiom classification based on cosine similarity	0	165	December 23, 2023
TransformerEncoderLayer produces all nan tensor when src_key_padding_mask is an all-true tensor	0	193	December 21, 2023
Memory usage increases during training	7	2088	December 21, 2023
Windowed attention	0	211	December 19, 2023
Obtain the attention weights within Transformer class	4	2342	December 18, 2023
LSTM Layer producing same outputs for different sequences	3	437	December 18, 2023
PyTorch implementation of TensorFlow model underperforms	3	230	December 18, 2023
Can we overlap compute operation with memory operation without pinned memory on CPU?	1	367	December 17, 2023
Cross entropy shape of input and label	2	213	December 13, 2023
Bidirectional LSTM isn't 2x the size of 2 Unidirectional LSTMs?	7	280	December 13, 2023
Model performance decrease to nearly 1/4 when loading a checkpoint, but works fine for "simpler" data and in-script	4	1133	December 12, 2023
Is Noam scheduling widely used for training transformer-based models?	2	700	December 11, 2023