Pandas
Manipulando planilhas do Excel
A função abaixo compara dois arquivos excel afim de descobrir se a estrutura de colunas (schema) entre os dois arquivos é a mesma.
import pandas as pd
def compare_excel_structure(model_file, new_file):
df_model = pd.read_excel(model_file)
df_new = pd.read_excel(new_file)
if set(df_model.columns) == set(df_new.columns):
print("A estrutura de arquivos é a mesma.")
else:
missing_columns = set(df_model.columns) - set(df_new.columns)
additional_columns = set(df_new.columns) - set(df_model.columns)
if missing_columns:
print(f"As colunas {missing_columns} estão ausentes no arquivo: ", new_file)
if missing_columns:
print(f"As colunas {additional_columns} foram adicionadas no novo arquivo: ", new_file)