From 7e9218ce0705f1bf4af8230301c993ac0deb08f0 Mon Sep 17 00:00:00 2001 From: "MH.Dmitrii" Date: Fri, 7 Nov 2025 02:57:46 +0300 Subject: [PATCH] ozon_purchases_handler 1.0 --- server/backend/excel.py | 30 +++++++++---------- .../handlers/ozon_purchases_handler.py | 25 ++++++++++++++++ 2 files changed, 39 insertions(+), 16 deletions(-) create mode 100644 server/backend/handlers/ozon_purchases_handler.py diff --git a/server/backend/excel.py b/server/backend/excel.py index 26e862a..be7bdd9 100644 --- a/server/backend/excel.py +++ b/server/backend/excel.py @@ -2,13 +2,7 @@ import pandas as pd import server.backend.handlers.yandex_handler as yandex_handler import server.backend.handlers.wb_handler as wb_handler import server.backend.handlers.ozon_handler as ozon_handler -# def read_excel(base_dir): -# try: -# dfs = pd.read_excel(base_dir, sheet_name=None) -# return dfs -# except Exception as e: -# raise f"⚠️ Ошибка при чтении {file.name}: {e}" - +import server.backend.handlers.ozon_purchases_handler as ozon_purchases_handler class BaseHandler: def __init__(self, file_path): self.file_path = file_path @@ -26,38 +20,42 @@ class BaseHandler: class YandexHandler(BaseHandler): def process(self): # читаем Excel внутри объекта + #доставать дату dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=[0, 1, 3]) #skip header # проверяем наличие нужных листов if "Получено от потребителей" not in dfs or "Возвращено потребителям" not in dfs: raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") # вызываем функцию evaluating - validated_data = yandex_handler.evaluating(dfs) - print("Реализация Яндекс завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") + #validated_data = yandex_handler.evaluating(dfs) + #print("Реализация Яндекс завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") class WBHandler(BaseHandler): def process(self): dfs = pd.read_excel(self.file_path, sheet_name=None) + #доставать дату по месяцу и просто день ставить последний if "Sheet1" not in dfs : raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") - validated_data = wb_handler.evaluating(dfs) - print("Реализация WB завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") + #validated_data = wb_handler.evaluating(dfs) + #print("Реализация WB завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") class OZONHandler(BaseHandler): def process(self): + #Доставать № документа и дату dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=14, skipfooter=17) #skip the header and the footer if "Отчет о реализации" not in dfs: raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") - validated_data = ozon_handler.evaluating(dfs) - print("Реализация OZON завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") - + #validated_data = ozon_handler.evaluating(dfs) + #print("Реализация OZON завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") class OZONPurchasesHandler(BaseHandler): def process(self): - dfs = pd.read_excel(self.file_path, sheet_name=None) + #доставать дату и номер документа + dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=12, skipfooter=1) if "Отчет о выкупленных товарах" not in dfs: raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") - print("Выкупы озон") + #validated_data = ozon_purchases_handler.evaluating(dfs) + #print("Выкупы OZON завершены, валидированных строк:", len(validated_data), "Реализация") class WBPurchasesHandler(BaseHandler): def process(self): diff --git a/server/backend/handlers/ozon_purchases_handler.py b/server/backend/handlers/ozon_purchases_handler.py new file mode 100644 index 0000000..a5d0112 --- /dev/null +++ b/server/backend/handlers/ozon_purchases_handler.py @@ -0,0 +1,25 @@ +from pydantic import ValidationError +from server.backend.pydantic import ExcelInfo +import re +def process_sheet(df, real_arti = '', real_quantity='', real_sum_1=''): + pattern = r'[A-ZА-Я]{0,1}\d{4}[A-ZА-Я]{1,2}\d{1}' #regex + df = df[[real_arti, real_quantity, real_sum_1]].copy().dropna() #copy and drop all NA values + df = df[(df != 0).all(axis=1)] #drop all 0 values + df_validate = df[[real_arti, real_quantity, real_sum_1]].copy() + df_validate.rename(columns={real_arti: 'arti', real_quantity: 'counts', real_sum_1: 'price'}, inplace=True) #переименовываем для pydantic + df_validate['arti'] = df_validate['arti'].astype(str).str.extract(f'({pattern})', flags=re.IGNORECASE) #arti под regex + + df_validate['price'] = df_validate['price'].astype(float) #Float to Int, if exists + df_validate['counts'] = df_validate['counts'].astype(int) #Float to Int, if exists + validated_rows, errors = [], [] + for i, row in df_validate.iterrows(): #проходит построчно по df, где i - индекс строки, row - данные строки + try: + validated_rows.append(ExcelInfo(**row.to_dict())) #добавляем в список проверенные данные полученные от pydantic, которые туда передаются в виде dict + except ValidationError as e: + errors.append((i, e.errors())) #выводит ошибку и пишет номер строки + if errors: + raise Exception(f"There are some errors with validation in Sheet1, check it ", errors) + return validated_rows +def evaluating(dfs): + validated_rows_1 = process_sheet(dfs["Отчет о выкупленных товарах"], real_arti=3,real_quantity=10, real_sum_1=11) # номера столбцов от озона + return validated_rows_1 \ No newline at end of file