def main()

in data_extraction_transformation/scripts/jsonfy-timeseries.py [0:0]
57 lines of code
9 McCabe index (conditional complexity)

def main():
    args = parse_args()
    input_folder = args.input_folder
    output_folder = args.output_folder
    alerts_file = args.alerts_file
    true_alerting_mapping = ['TP', 'FN']
    y_column = 'alert_summary_status_general'

    df_alerts = pd.read_csv(alerts_file, index_col=False)
    projects_folders = [name for name in os.listdir(input_folder) if os.path.isdir(os.path.join(input_folder, name))]
    
    os.makedirs(output_folder, exist_ok=True)


    speedometer3_signatures = df_alerts[df_alerts['single_alert_series_signature_suite'] == 'speedometer3']['signature_id'].unique().tolist()


    desktop_list = ["amazon", "bing-search", "buzzfeed", "cnn", "docomo", "ebay", "espn", "expedia", "facebook", "fandom", "google-docs", "google-mail", "google-search", "google-slides", "imdb", "imgue", "instagram", "linkedin", "microsoft", "netflix", "nytimes", "office", "openai", "outlook", "paypal", "pinterest", "reddit", "samsung", "tiktok", "tumblr", "twitch", "twitter", "weather", "wikia", "wikipedia", "yahoo-mail", "youtube"]
    mobile_list = ["allrecipes", "amazon", "amazon-search", "bild-de", "bing", "bing-search-restaurants", "booking", "cnn", "cnn-ampstories", "dailymail", "ebay-kleinanzeigen", "ebay-kleinanzeigen-search", "espn", "facebook", "facebook-cristiano", "google", "google-maps", "google-search-restaurants", "imdb", "instagram", "microsoft-support", "reddit", "sina", "stackoverflow", "wikipedia", "youtube", "youtube-watch"]
    tp6_suites_list = list(set(desktop_list + mobile_list))
    tp6_signatures = df_alerts[df_alerts['single_alert_series_signature_suite'].isin(tp6_suites_list)]['signature_id'].unique().tolist()

    filtered_signatures = speedometer3_signatures + tp6_signatures
    filtered_signatures = [str(i) for i in filtered_signatures]

    annotations = dict()
    for project in projects_folders:
        for signature_file in os.listdir(input_folder + '/' + project):
            signature_id = signature_file.split("_")[0]
            if (isinstance(filtered_signatures, list) and signature_id in filtered_signatures):
                df = pd.read_csv(input_folder + '/' + project + '/' + signature_file)
                df[y_column] = df[y_column].apply(lambda x: 1 if x in true_alerting_mapping else 0)
                df = df.sort_values(by='push_timestamp', ascending=True)
                indices = df.index[df[y_column] == 1].tolist()
                indices.sort()
                new_entry = {
                    "1": indices
                }
                annotations[signature_id] = new_entry
                n_obs = len(df)
                json_df = {
                    "name": signature_id,
                    "longname": f"{signature_id} timeseries",
                    "n_obs": n_obs,
                    "n_dim": 1,
                    "time": {
                        "type": "string",
                        "format": "%Y-%m-%d %H:%M:%S",
                        "index": list(range(n_obs)),
                        "raw": df['push_timestamp'].tolist()
                    },
                    "series": [
                        {
                            "label": "Timeseries",
                            "type": "float",
                            "raw": df['value'].tolist()
                        }
                    ]
                }
                signature_json_file = signature_id + ".json"
                
                os.makedirs(output_folder + '/' + project, exist_ok=True)
                with open(output_folder + '/' + project + '/' + signature_json_file, 'w') as file:
                    json.dump(json_df, file, indent=4)
                
                
    with open(output_folder + '/annotations.json', 'a') as file:
        json.dump(annotations, file, indent=4)