path # lines of code number of updates days since first update days since last update first updated last updated pyproject.toml 20 5 680 456 2020-03-17 2020-10-27 cc_net/mine.py 464 13 819 456 2019-10-30 2020-10-27 cc_net/get_wiki_cirrus.py 74 3 680 456 2020-03-17 2020-10-27 cc_net/jsonql.py 948 15 819 456 2019-10-30 2020-10-27 cc_net/tools/dl_cc_100.py 133 1 456 456 2020-10-27 2020-10-27 cc_net/tools/make_dmoz_corpus.py 55 3 672 456 2020-03-25 2020-10-27 cc_net/tools/expand_corpus.py 230 6 680 456 2020-03-17 2020-10-27 cc_net/execution.py 172 8 672 456 2020-03-25 2020-10-27 cc_net/flat_hash_set.py 160 4 819 456 2019-10-30 2020-10-27 cc_net/minify.py 230 12 819 456 2019-10-30 2020-10-27 cc_net/text_normalizer.py 150 2 629 456 2020-05-07 2020-10-27 cc_net/regroup.py 81 3 680 456 2020-03-17 2020-10-27 cc_net/perplexity.py 284 3 672 456 2020-03-25 2020-10-27 cc_net/__init__.py 1 2 819 456 2019-10-30 2020-10-27 cc_net/tokenizer.py 55 2 672 456 2020-03-25 2020-10-27 cc_net/dedup.py 360 7 819 456 2019-10-30 2020-10-27 cc_net/process_wet_file.py 197 11 819 450 2019-10-30 2020-11-02 cc_net/__main__.py 6 4 819 456 2019-10-30 2020-10-27 cc_net/split_by_lang.py 117 3 672 456 2020-03-25 2020-10-27 setup.py 43 12 819 450 2019-10-30 2020-11-02