Skip to content

Pandas

Manipulando planilhas do Excel

A função abaixo compara dois arquivos excel afim de descobrir se a estrutura de colunas (schema) entre os dois arquivos é a mesma.

import pandas as pd

def compare_excel_structure(model_file, new_file):

    df_model = pd.read_excel(model_file)
    df_new = pd.read_excel(new_file)

    if set(df_model.columns) == set(df_new.columns):
        print("A estrutura de arquivos é a mesma.")
    else:
        missing_columns = set(df_model.columns) - set(df_new.columns)
        additional_columns = set(df_new.columns) - set(df_model.columns)

        if missing_columns:
            print(f"As colunas {missing_columns} estão ausentes no arquivo: ", new_file)
        if missing_columns:
            print(f"As colunas {additional_columns} foram adicionadas no novo arquivo: ", new_file)