facebookresearch / Mask-Predict

File Size

The distribution of size of files (measured in lines of code).

Intro

File size measurements show the distribution of size of files.
Files are classified in four categories based on their size (lines of code): 1-100 (very small files), 101-200 (small files), 201-500 (medium size files), 501-1000 (long files), 1001+(very long files).
It is a good practice to keep files small. Long files may become "bloaters", code that have increased to such gargantuan proportions that they are hard to work with.

Learn more...

File Size Overall

There are 146 files with 13,466 lines of code.

0 very long files (0 lines of code)
1 long files (565 lines of code)
15 medium size files (4,429 lines of codeclsfd_ftr_w_mp_ins)
34 small files (4,977 lines of code)
96 very small files (3,495 lines of code)

Legend:

1001+

501-1000

201-500

101-200

1-100

explore: zoomable circles | sunburst | 3D view

File Size per Extension

1001+

501-1000

201-500

101-200

1-100

File Size per Logical Decomposition

primary

1001+

501-1000

201-500

101-200

1-100

Longest Files (Top 50)

File	# lines	# units
transformer.py in fairseq/models	565	36
bert_seq2seq.py in fairseq/models	482	28
sequence_generator.py in fairseq	442	14
options.py in fairseq	419	19
indexed_dataset.py in fairseq/data	392	62
trainer.py in fairseq	371	23
checkpoint_utils.py in fairseq	265	11
multihead_attention.py in fairseq/modules	254	13
dictionary.py in fairseq/data	241	28
fp16_optimizer.py in fairseq/optim	233	32
fb_elmo_token_embedder.py in fairseq/modules	231	10
utils.py in fairseq	230	27
train.py in fairseq_cli	222	7
train.py in root	222	7
fairseq_model.py in fairseq/models	215	39
file_utils.py in fairseq	210	12
preprocess.py in root	200	5
preprocess.py in fairseq_cli	200	5
progress_bar.py in fairseq	197	36
downsampled_multihead_attention.py in fairseq/modules	197	8
iterators.py in fairseq/data	193	34
lightweight_convolution.py in fairseq/modules	192	13
dynamic_convolution.py in fairseq/modules	182	11
search.py in fairseq	172	13
adam.py in fairseq/optim	164	9
eval_lm.py in fairseq_cli	163	5
eval_lm.py in root	163	5
generate_cmlm.py in root	158	5
data_utils.py in fairseq/data	155	9
language_pair_self_dataset_mask.py in fairseq/data	148	13
transformer_sentence_encoder.py in fairseq/modules	144	4
interactive.py in fairseq_cli	139	4
interactive.py in root	139	4
generate.py in root	137	2
generate.py in fairseq_cli	137	2
translation.py in fairseq/tasks	134	10
translation_self.py in fairseq/tasks	133	7
bmuf.py in fairseq/optim	133	20
distributed_utils.py in fairseq	133	9
adaptive_softmax.py in fairseq/modules	133	10
adafactor.py in fairseq/optim	131	10
character_token_embedder.py in fairseq/modules	121	7
gpt2_bpe.py in fairseq/data/encoders	120	11
language_pair_dataset.py in fairseq/data	120	11
fairseq_task.py in fairseq/tasks	118	20
rm_pt.py in scripts	109	4
hub_utils.py in fairseq	105	3
fb_bidirectional_multihead_attention.py in fairseq/modules	104	8
average_checkpoints.py in scripts	102	3
legacy_distributed_data_parallel.py in fairseq	101	6

Files With Most Units (Top 20)

File	# lines	# units
indexed_dataset.py in fairseq/data	392	62
fairseq_model.py in fairseq/models	215	39
transformer.py in fairseq/models	565	36
progress_bar.py in fairseq	197	36
iterators.py in fairseq/data	193	34
fp16_optimizer.py in fairseq/optim	233	32
bert_seq2seq.py in fairseq/models	482	28
dictionary.py in fairseq/data	241	28
utils.py in fairseq	230	27
trainer.py in fairseq	371	23
fairseq_task.py in fairseq/tasks	118	20
bmuf.py in fairseq/optim	133	20
options.py in fairseq	419	19
fairseq_optimizer.py in fairseq/optim	57	15
sequence_generator.py in fairseq	442	14
meters.py in fairseq	47	13
search.py in fairseq	172	13
multihead_attention.py in fairseq/modules	254	13
lightweight_convolution.py in fairseq/modules	192	13
language_pair_self_dataset_mask.py in fairseq/data	148	13

Files With Long Lines (Top 14)

There are 14 files with lines longer than 120 characters. In total, there are 27 long lines.

File	# lines	# units	# long lines
generate_cmlm.py in root	158	5	5
average_checkpoints.py in scripts	102	3	4
transformer.py in fairseq/models	565	36	3
mask_predict.py in fairseq/strategies	39	4	2
strategy_utils.py in fairseq/strategies	24	7	2
language_pair_self_dataset_mask.py in fairseq/data	148	13	2
label_smoothed_cross_entropy.py in fairseq/criterions	62	6	2
options.py in fairseq	419	19	1
easy_first.py in fairseq/strategies	57	5	1
left_to_right.py in fairseq/strategies	28	3	1
adam.py in fairseq/optim	164	9	1
bert_seq2seq.py in fairseq/models	482	28	1
dynamic_convolution.py in fairseq/modules	182	11	1
simple_sinusoidal_positional_embedding.py in fairseq/modules	18	2	1