tr8b-104B-debug / emb-norm /000-module.3.self_attention.scale_mask_softmax
41.4 MB
bigscience-bot's picture
5h
29eff39