ozon_purchases_handler 1.0

This commit is contained in:
2025-11-07 02:57:46 +03:00
parent fc6c66215e
commit 7e9218ce07
2 changed files with 39 additions and 16 deletions

View File

@@ -2,13 +2,7 @@ import pandas as pd
import server.backend.handlers.yandex_handler as yandex_handler import server.backend.handlers.yandex_handler as yandex_handler
import server.backend.handlers.wb_handler as wb_handler import server.backend.handlers.wb_handler as wb_handler
import server.backend.handlers.ozon_handler as ozon_handler import server.backend.handlers.ozon_handler as ozon_handler
# def read_excel(base_dir): import server.backend.handlers.ozon_purchases_handler as ozon_purchases_handler
# try:
# dfs = pd.read_excel(base_dir, sheet_name=None)
# return dfs
# except Exception as e:
# raise f"⚠️ Ошибка при чтении {file.name}: {e}"
class BaseHandler: class BaseHandler:
def __init__(self, file_path): def __init__(self, file_path):
self.file_path = file_path self.file_path = file_path
@@ -26,38 +20,42 @@ class BaseHandler:
class YandexHandler(BaseHandler): class YandexHandler(BaseHandler):
def process(self): def process(self):
# читаем Excel внутри объекта # читаем Excel внутри объекта
#доставать дату
dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=[0, 1, 3]) #skip header dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=[0, 1, 3]) #skip header
# проверяем наличие нужных листов # проверяем наличие нужных листов
if "Получено от потребителей" not in dfs or "Возвращено потребителям" not in dfs: if "Получено от потребителей" not in dfs or "Возвращено потребителям" not in dfs:
raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы")
# вызываем функцию evaluating # вызываем функцию evaluating
validated_data = yandex_handler.evaluating(dfs) #validated_data = yandex_handler.evaluating(dfs)
print("Реализация Яндекс завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") #print("Реализация Яндекс завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты")
class WBHandler(BaseHandler): class WBHandler(BaseHandler):
def process(self): def process(self):
dfs = pd.read_excel(self.file_path, sheet_name=None) dfs = pd.read_excel(self.file_path, sheet_name=None)
#доставать дату по месяцу и просто день ставить последний
if "Sheet1" not in dfs : if "Sheet1" not in dfs :
raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы")
validated_data = wb_handler.evaluating(dfs) #validated_data = wb_handler.evaluating(dfs)
print("Реализация WB завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") #print("Реализация WB завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты")
class OZONHandler(BaseHandler): class OZONHandler(BaseHandler):
def process(self): def process(self):
#Доставать № документа и дату
dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=14, skipfooter=17) #skip the header and the footer dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=14, skipfooter=17) #skip the header and the footer
if "Отчет о реализации" not in dfs: if "Отчет о реализации" not in dfs:
raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы")
validated_data = ozon_handler.evaluating(dfs) #validated_data = ozon_handler.evaluating(dfs)
print("Реализация OZON завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты") #print("Реализация OZON завершена, валидированных строк:", len(validated_data[0]), "Реализация", len(validated_data[1]), "Возвраты")
class OZONPurchasesHandler(BaseHandler): class OZONPurchasesHandler(BaseHandler):
def process(self): def process(self):
dfs = pd.read_excel(self.file_path, sheet_name=None) #доставать дату и номер документа
dfs = pd.read_excel(self.file_path, sheet_name=None, skiprows=12, skipfooter=1)
if "Отчет о выкупленных товарах" not in dfs: if "Отчет о выкупленных товарах" not in dfs:
raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы") raise Exception(f"В файле {self.file_path.name} отсутствуют необходимые листы")
print("Выкупы озон") #validated_data = ozon_purchases_handler.evaluating(dfs)
#print("Выкупы OZON завершены, валидированных строк:", len(validated_data), "Реализация")
class WBPurchasesHandler(BaseHandler): class WBPurchasesHandler(BaseHandler):
def process(self): def process(self):

View File

@@ -0,0 +1,25 @@
from pydantic import ValidationError
from server.backend.pydantic import ExcelInfo
import re
def process_sheet(df, real_arti = '', real_quantity='', real_sum_1=''):
pattern = r'[A-ZА-Я]{0,1}\d{4}[A-ZА-Я]{1,2}\d{1}' #regex
df = df[[real_arti, real_quantity, real_sum_1]].copy().dropna() #copy and drop all NA values
df = df[(df != 0).all(axis=1)] #drop all 0 values
df_validate = df[[real_arti, real_quantity, real_sum_1]].copy()
df_validate.rename(columns={real_arti: 'arti', real_quantity: 'counts', real_sum_1: 'price'}, inplace=True) #переименовываем для pydantic
df_validate['arti'] = df_validate['arti'].astype(str).str.extract(f'({pattern})', flags=re.IGNORECASE) #arti под regex
df_validate['price'] = df_validate['price'].astype(float) #Float to Int, if exists
df_validate['counts'] = df_validate['counts'].astype(int) #Float to Int, if exists
validated_rows, errors = [], []
for i, row in df_validate.iterrows(): #проходит построчно по df, где i - индекс строки, row - данные строки
try:
validated_rows.append(ExcelInfo(**row.to_dict())) #добавляем в список проверенные данные полученные от pydantic, которые туда передаются в виде dict
except ValidationError as e:
errors.append((i, e.errors())) #выводит ошибку и пишет номер строки
if errors:
raise Exception(f"There are some errors with validation in Sheet1, check it ", errors)
return validated_rows
def evaluating(dfs):
validated_rows_1 = process_sheet(dfs["Отчет о выкупленных товарах"], real_arti=3,real_quantity=10, real_sum_1=11) # номера столбцов от озона
return validated_rows_1