cdsc_reddit/datasets/submissions_merge.py

#!/usr/bin/env python3
"""Collapse all layers in the submissions final datasets into a single clean layer.

Must be launched from a login node via the Hyak-provided wrapper:
  start_spark_and_run.sh 1 submissions_merge.py

See merge_layers.sh and dumps_helper.merge_layers for details.
"""

from dumps_helper import SUBMISSIONS, merge_layers


if __name__ == "__main__":
    merge_layers(SUBMISSIONS)