path # lines of code number of updates days since first update days since last update first updated last updated setup.py 86 37 787 19 2018-07-18 2020-08-24 examples/mnist/generate_petastorm_mnist.py 63 7 764 449 2018-08-10 2019-06-21 examples/mnist/__init__.py 1 2 764 739 2018-08-10 2018-09-04 examples/mnist/tf_example.py 76 2 705 150 2018-10-08 2020-04-15 examples/mnist/pytorch_example.py 115 5 721 596 2018-09-22 2019-01-25 examples/mnist/schema.py 9 3 764 758 2018-08-10 2018-08-16 examples/spark_dataset_converter/__init__.py 1 1 162 162 2020-04-03 2020-04-03 examples/spark_dataset_converter/pytorch_converter_example.py 109 2 162 64 2020-04-03 2020-07-10 examples/spark_dataset_converter/utils.py 16 2 162 64 2020-04-03 2020-07-10 examples/spark_dataset_converter/tensorflow_converter_example.py 62 3 162 64 2020-04-03 2020-07-10 examples/hello_world/petastorm_dataset/python_hello_world.py 8 1 603 603 2019-01-18 2019-01-18 examples/hello_world/petastorm_dataset/tensorflow_hello_world.py 19 2 603 150 2019-01-18 2020-04-15 examples/hello_world/petastorm_dataset/pyspark_hello_world.py 21 1 603 603 2019-01-18 2019-01-18 examples/hello_world/petastorm_dataset/__init__.py 1 1 603 603 2019-01-18 2019-01-18 examples/hello_world/petastorm_dataset/generate_petastorm_dataset.py 31 1 603 603 2019-01-18 2019-01-18 examples/hello_world/petastorm_dataset/pytorch_hello_world.py 9 1 603 603 2019-01-18 2019-01-18 examples/hello_world/__init__.py 1 1 765 765 2018-08-09 2018-08-09 examples/hello_world/external_dataset/python_hello_world.py 9 1 603 603 2019-01-18 2019-01-18 examples/hello_world/external_dataset/tensorflow_hello_world.py 19 2 603 150 2019-01-18 2020-04-15 examples/hello_world/external_dataset/__init__.py 1 1 603 603 2019-01-18 2019-01-18 examples/hello_world/external_dataset/pytorch_hello_world.py 9 1 603 603 2019-01-18 2019-01-18 examples/hello_world/external_dataset/generate_external_dataset.py 18 2 603 443 2019-01-18 2019-06-27 examples/__init__.py 1 1 775 775 2018-07-30 2018-07-30 examples/imagenet/__init__.py 1 1 775 775 2018-07-30 2018-07-30 examples/imagenet/generate_petastorm_imagenet.py 67 5 775 744 2018-07-30 2018-08-30 examples/imagenet/schema.py 9 2 775 768 2018-07-30 2018-08-06 petastorm/benchmark/dummy_reader.py 56 1 148 148 2020-04-17 2020-04-17 petastorm/benchmark/throughput.py 126 8 723 150 2018-09-20 2020-04-15 petastorm/benchmark/__init__.py 1 1 723 723 2018-09-20 2018-09-20 petastorm/benchmark/cli.py 67 3 723 467 2018-09-20 2019-06-03 petastorm/arrow_reader_worker.py 183 16 648 50 2018-12-04 2020-07-24 petastorm/ngram.py 105 9 757 339 2018-08-17 2019-10-09 petastorm/predicates.py 93 5 781 454 2018-07-24 2019-06-16 petastorm/tools/__init__.py 1 1 718 718 2018-09-25 2018-09-25 petastorm/tools/copy_dataset.py 77 4 718 463 2018-09-25 2019-06-07 petastorm/tools/spark_session_cli.py 28 1 718 718 2018-09-25 2018-09-25 petastorm/compat.py 48 4 338 153 2019-10-10 2020-04-12 petastorm/gcsfs_helpers/gcsfs_wrapper.py 49 3 234 51 2020-01-22 2020-07-23 petastorm/gcsfs_helpers/__init__.py 1 1 234 234 2020-01-22 2020-01-22 petastorm/local_disk_cache.py 26 3 781 759 2018-07-24 2018-08-15 petastorm/weighted_sampling_reader.py 44 7 731 123 2018-09-12 2020-05-12 petastorm/etl/legacy.py 16 2 765 759 2018-08-09 2018-08-15 petastorm/etl/petastorm_generate_metadata.py 98 13 761 463 2018-08-13 2019-06-07 petastorm/etl/__init__.py 21 3 781 657 2018-07-24 2018-11-25 petastorm/etl/dataset_metadata.py 200 31 781 2 2018-07-24 2020-09-10 petastorm/etl/rowgroup_indexing.py 73 13 781 338 2018-07-24 2019-10-10 petastorm/etl/metadata_util.py 45 5 781 604 2018-07-24 2019-01-17 petastorm/etl/rowgroup_indexers.py 73 4 781 757 2018-07-24 2018-08-17 petastorm/codecs.py 154 18 781 2 2018-07-24 2020-09-10 petastorm/cache.py 9 4 781 657 2018-07-24 2018-11-25 petastorm/__init__.py 4 62 781 17 2018-07-24 2020-08-26 petastorm/py_dict_reader_worker.py 147 10 648 50 2018-12-04 2020-07-24 petastorm/reader_impl/pickle_serializer.py 6 1 711 711 2018-10-02 2018-10-02 petastorm/reader_impl/pyarrow_serializer.py 19 1 717 717 2018-09-26 2018-09-26 petastorm/reader_impl/__init__.py 1 1 757 757 2018-08-17 2018-08-17 petastorm/reader_impl/pytorch_shuffling_buffer.py 125 1 148 148 2020-04-17 2020-04-17 petastorm/reader_impl/shuffling_buffer.py 75 6 757 401 2018-08-17 2019-08-08 petastorm/reader_impl/arrow_table_serializer.py 12 1 648 648 2018-12-04 2018-12-04 petastorm/selectors.py 46 3 781 496 2018-07-24 2019-05-05 petastorm/local_disk_arrow_table_cache.py 18 2 648 497 2018-12-04 2019-05-04 petastorm/pyarrow_helpers/__init__.py 1 1 672 672 2018-11-10 2018-11-10 petastorm/pyarrow_helpers/batching_table_queue.py 30 1 672 672 2018-11-10 2018-11-10 petastorm/reader.py 325 59 781 50 2018-07-24 2020-07-24 petastorm/generator.py 15 3 781 744 2018-07-24 2018-08-30 petastorm/pytorch.py 171 16 758 64 2018-08-16 2020-07-10 petastorm/utils.py 62 12 781 153 2018-07-24 2020-04-12 petastorm/fs_utils.py 115 14 781 152 2018-07-24 2020-04-13 petastorm/transform.py 32 8 624 163 2018-12-28 2020-04-02 petastorm/namedtuple_gt_255_fields.py 65 1 535 535 2019-03-27 2019-03-27 petastorm/workers_pool/worker_base.py 11 1 781 781 2018-07-24 2018-07-24 petastorm/workers_pool/dummy_pool.py 38 5 781 707 2018-07-24 2018-10-06 petastorm/workers_pool/thread_pool.py 126 8 781 657 2018-07-24 2018-11-25 petastorm/workers_pool/ventilator.py 81 7 781 529 2018-07-24 2019-04-02 petastorm/workers_pool/__init__.py 3 3 781 657 2018-07-24 2018-11-25 petastorm/workers_pool/exec_in_new_process.py 31 5 781 596 2018-07-24 2019-01-25 petastorm/workers_pool/process_pool.py 213 19 781 225 2018-07-24 2020-01-31 petastorm/hdfs/__init__.py 1 1 781 781 2018-07-24 2018-07-24 petastorm/hdfs/namenode.py 162 11 781 103 2018-07-24 2020-06-01 petastorm/unischema.py 265 32 781 47 2018-07-24 2020-07-27 petastorm/errors.py 1 1 526 526 2019-04-05 2019-04-05 petastorm/spark_utils.py 18 5 781 604 2018-07-24 2019-01-17 petastorm/tf_utils.py 177 16 781 143 2018-07-24 2020-04-22 petastorm/spark/spark_dataset_converter.py 380 23 206 51 2020-02-19 2020-07-23 petastorm/spark/__init__.py 2 3 206 186 2020-02-19 2020-03-10