xlm-v-base-trimmed-en-30000`

This model is a trimmed version of facebook/xlm-v-base by vocabtrimmer, a tool for trimming vocabulary of language models to compress the model size. Following table shows a summary of the trimming process.

	facebook/xlm-v-base	vocabtrimmer/xlm-v-base-trimmed-en-30000
parameter_size_full	779,396,349	109,115,186
parameter_size_embedding	692,451,072	23,041,536
vocab_size	901,629	30,002
compression_rate_full	100.0	14.0
compression_rate_embedding	100.0	3.33

Following table shows the parameter used to trim vocabulary.

language	dataset	dataset_column	dataset_name	dataset_split	target_vocab_size	min_frequency
en	vocabtrimmer/mc4_validation	text	en	validation	30000	2

Downloads last month: 4

Vocabulary Trimmed facebook/xlm-v-base: vocabtrimmer/xlm-v-base-trimmed-en-30000

Vocabulary Trimmed facebook/xlm-v-base: `vocabtrimmer/xlm-v-base-trimmed-en-30000`