diff --git a/server/backend/excel.py b/server/backend/excel.py index 0e5a8e6..26e862a 100644 --- a/server/backend/excel.py +++ b/server/backend/excel.py @@ -1,6 +1,7 @@ import pandas as pd import server.backend.handlers.yandex_handler as yandex_handler import server.backend.handlers.wb_handler as wb_handler +import server.backend.handlers.ozon_handler as ozon_handler # def read_excel(base_dir): # try: # dfs = pd.read_excel(base_dir, sheet_name=None) @@ -30,6 +31,7 @@ class YandexHandler(BaseHandler): if "Получено от потребителей" not in dfs or "Возвращено потребителям" not in dfs: raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") # вызываем функцию evaluating + validated_data = yandex_handler.evaluating(dfs) print("Реализация Яндекс завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") @@ -46,7 +48,9 @@ class OZONHandler(BaseHandler): dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=14, skipfooter=17) #skip the header and the footer if "Отчет о реализации" not in dfs: raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") - print("Реализация OZON") + validated_data = ozon_handler.evaluating(dfs) + print("Реализация OZON завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") + class OZONPurchasesHandler(BaseHandler): def process(self): diff --git a/server/backend/handlers/ozon_handler.py b/server/backend/handlers/ozon_handler.py new file mode 100644 index 0000000..7bc61f1 --- /dev/null +++ b/server/backend/handlers/ozon_handler.py @@ -0,0 +1,28 @@ +from pydantic import ValidationError +from server.backend.pydantic import ExcelInfo +import re +def process_sheet(df, real_arti = '', real_quantity='', real_sum_1='', real_sum_2=''): + pattern = r'[A-ZА-Я]{0,1}\d{4}[A-ZА-Я]{1,2}\d{1}' #regex + df = df[[real_arti, real_quantity, real_sum_1, real_sum_2]].copy().dropna() #copy and drop all NA values + df = df[(df != 0).all(axis=1)] #drop all 0 values + df[real_sum_1]+=df[real_sum_2] + df_validate = df[[real_arti, real_quantity, real_sum_1]].copy() + df_validate.rename(columns={real_arti: 'arti', real_quantity: 'counts', real_sum_1: 'price'}, inplace=True) #переименовываем для pydantic + df_validate['arti'] = df_validate['arti'].astype(str).str.extract(f'({pattern})', flags=re.IGNORECASE) #arti под regex + + df_validate['price'] = df_validate['price'].astype(float) #Float to Int, if exists + df_validate['counts'] = df_validate['counts'].astype(int) #Float to Int, if exists + + validated_rows, errors = [], [] + for i, row in df_validate.iterrows(): #проходит построчно по df, где i - индекс строки, row - данные строки + try: + validated_rows.append(ExcelInfo(**row.to_dict())) #добавляем в список проверенные данные полученные от pydantic, которые туда передаются в виде dict + except ValidationError as e: + errors.append((i, e.errors())) #выводит ошибку и пишет номер строки + if errors: + raise Exception(f"There are some errors with validation in Sheet1, check it ", errors) + return validated_rows +def evaluating(dfs): + validated_rows_1 = process_sheet(dfs["Отчет о реализации"], real_arti='2',real_quantity='8', real_sum_1='5',real_sum_2='6') # номера столбцов от озона + validated_rows_2 = process_sheet(dfs["Отчет о реализации"], real_arti='2',real_quantity='16', real_sum_1='13',real_sum_2='14')# + return validated_rows_1, validated_rows_2 \ No newline at end of file