ozon update

This commit is contained in:
2026-05-07 02:08:46 +03:00
parent f925c489f2
commit 8a33674275
3 changed files with 124 additions and 35 deletions

View File

@@ -8,7 +8,11 @@
"Не_выкупы":16,
"Налог_в_руб":115,
"Прибыль":118,
"Все_удержания_магазина": 104
"Все_удержания_магазина": 104,
"Эквайринг":26,
"Логистика":35,
"Себестоимость":22,
"Утилизация":18
},
"wb":{
"Артикул": 0,

View File

@@ -2,74 +2,159 @@ import pandas as pd
from schema.pydantic import settings, Translit
import os
class BaseHandler:
def __init__(self, file_path:str):
self.file_name = file_path
self.file_path = os.path.join(settings.INPUTDIR, file_path)
def struct(self):
try:
return pd.ExcelFile(self.file_path)
except Exception as e:
raise Exception(f"⚠️ Ошибка при получении структуры {self.file_path}: {e}")
def read(self):
try:
return pd.read_excel(self.file_path)
except Exception as e:
raise Exception(f"⚠️ Ошибка при чтении файла {self.file_path}: {e}")
class Handler(BaseHandler):
def get_articles_with_sales(self, columns:dict, sheet_name:str):
xls = self.struct()
if sheet_name not in xls.sheet_names:
raise Exception('⚠️ Лист {sheet_name} не найден')
def __init__(self,file_path:str, columns:dict, sheet_name:str):
df = pd.read_excel(xls, sheet_name=sheet_name)
df = df.iloc[:, list(columns.values())]
df.columns = list(columns.keys())
super().__init__(file_path)
#Нормализация
df['Артикул'] = df['Артикул'].replace(Translit.TRANSLIT, regex=True)
self.xls = self.struct()
if sheet_name not in self.xls.sheet_names:
raise Exception(f'⚠️ Лист {sheet_name} не найден')
self.df = pd.read_excel(self.xls, sheet_name=sheet_name)
self.df = self.df.iloc[:, list(columns.values())]
self.df.columns = list(columns.keys())
def normalization(self): #Нормализация
self.df['Артикул'] = self.df['Артикул'].replace(Translit.TRANSLIT, regex=True)
def grouping(self): #группировка
self.df['Артикул'] = self.df['Артикул'].astype(str).str.upper().str.extract(f'({settings.PATTERN})') # Отбираем Артикула по регексу
self.df.dropna(subset=["Артикул"], inplace=True) # Удаляем пустые строки
agg_dict = {col: "sum" for col in self.df.columns if col != "Артикул" and col != "Наименование"} # По умолчанию суммируем все кроме Артикула и наименования
if "Наименование" in self.df.columns:
agg_dict["Наименование"] = lambda x: "\n".join(sorted(set(x))) # Set и Сортировка по алфавиту
self.df= self.df.groupby("Артикул", as_index=False).agg(agg_dict) # Группировка по артикулу
#группировка
df['Артикул'] = df['Артикул'].astype(str).str.upper().str.extract(f'({settings.PATTERN})')
df.dropna(subset=["Артикул"], inplace=True)
agg_dict = {col: "sum" for col in df.columns if col != "Артикул" and col != "Наименование"} # по умолчанию суммируем все кроме Артикул
if "Наименование" in df.columns:
agg_dict["Наименование"] = lambda x: "\n".join(sorted(set(x)))
df= df.groupby("Артикул", as_index=False).agg(agg_dict)
df["Все_удержания_магазина"] = abs(df["Все_удержания_магазина"])
#Исчисляемые колонки
df["Все удержания в %"] = df.apply(
lambda row: (row["Все_удержания_магазина"] / row["Выручка"] * 100) if row["Выручка"] != 0 else 0, #Возможно все удержания в таком случае 100%
self.df = self.df.sort_values(ascending=False,by="Прибыль")
def cast_types(self):
self.df["Все_удержания_магазина"] = abs(self.df["Все_удержания_магазина"])
if "Логистика" in self.df.columns:
self.df["Логистика"] = abs(self.df["Логистика"])
if "Эквайринг" in self.df.columns:
self.df["Эквайринг"] = abs(self.df["Эквайринг"])
self.df = self.df.convert_dtypes()
def calculations(self): #Исчисляемые колонки
self.df["Все удержания в %"] = self.df.apply(
lambda row: (row["Все_удержания_магазина"] / row["Выручка"] * 100) if row["Выручка"] != 0 else 100, #Возможно все удержания в таком случае 100%
axis=1
)
if "Выкупы" in df.columns and "Не_выкупы" in df.columns:
df["Всего заказано"] = df.apply(
if "Выкупы" in self.df.columns and "Не_выкупы" in self.df.columns:
self.df["Всего заказано"] = self.df.apply(
lambda row: row["Выкупы"]+row["Не_выкупы"],
axis=1
)
df["Процент выкупа"] = df.apply(
self.df["Процент выкупа"] = self.df.apply(
lambda row: ((row["Выкупы"] - row["Возвраты"]) / row["Всего заказано"] * 100)
if row["Всего заказано"] != 0 else 0,
axis=1
)
df["Маржинальность"] = df.apply(
if "Логистика" in self.df.columns:
self.df["Логистикаа_ед"] = self.df.apply(
lambda row: ((row["Логистика"]/(row["Выкупы"]-row["Возвраты"]))) if (row["Выкупы"] - row["Возвраты"]) != 0 else 0,
axis=1
)
self.df["Маржинальность"] = self.df.apply(
lambda row: (row["Прибыль"] / row["Выручка"] * 100) if row["Выручка"] != 0 else 0,
axis=1
)
df["Себестоимость"] = df.apply(
lambda row: ((row["Выручка"] - row["Налог_в_руб"] - row["Прибыль"] - row["Все_удержания_магазина"])/(row["Выкупы"]-row["Возвраты"])) if (row["Выкупы"] - row["Возвраты"]) != 0 else 0,
axis=1
)
df=df.round(2)
df = df.sort_values(ascending=False,by="Прибыль")
if "Себестоимость" in self.df.columns:
if "Утилизация" in self.df.columns:
self.df["Себестоимость"] = self.df.apply(
lambda row: ((row["Себестоимость"])/(row["Выкупы"]-row["Возвраты"]+row["Утилизация"])) if (row["Выкупы"] - row["Возвраты"]) != 0 else 0,
axis=1
)
else:
self.df["Себестоимость"] = self.df.apply(
lambda row: ((row["Себестоимость"])/(row["Выкупы"]-row["Возвраты"])) if (row["Выкупы"] - row["Возвраты"]) != 0 else 0,
axis=1
)
else:
self.df["Себестоимость"] = self.df.apply(
lambda row: ((row["Выручка"] - row["Налог_в_руб"] - row["Прибыль"] - row["Все_удержания_магазина"])/(row["Выкупы"]-row["Возвраты"])) if (row["Выкупы"] - row["Возвраты"]) != 0 else 0,
axis=1
)
self.df=self.df.round(2)
self.df["Себестоимость"]=self.df["Себестоимость"].round()
def styling(self):
def multi_style(val):
if val < 0:
return "background-color: red"
elif val > 0:
return "background-color: green; color: white"
return ""
styled = df.style.map(multi_style, subset=["Маржинальность","Прибыль"])
styled.to_excel(f"output/Товары_поесяцам_{self.file_name}", engine="openpyxl", index=False)
def align_center(val):
return 'text-align: center'
self.df = self.df.style.map(multi_style, subset=["Маржинальность","Прибыль"])
self.df=self.df.map(align_center)
def reorder_columns(self):
if "ozon" in self.file_name:
self.df = self.df[["Артикул","Наименование","Выручка", "Выкупы","Не_выкупы","Процент выкупа","Возвраты", "Всего заказано","Все_удержания_магазина","Все удержания в %",
"Утилизация", "Эквайринг", "Логистика", "Логистикаа_ед", "Налог_в_руб", "Прибыль", "Маржинальность", "Себестоимость"
]]
elif "wb" in self.file_name:
pass
else:
pass
def saving(self):
self.df.to_excel(f"output/Товары_поесяцам_{self.file_name}", engine="openpyxl", index=False)
def get_articles_with_sales(self):
self.normalization()
self.grouping()
self.cast_types()
self.calculations()
self.reorder_columns()
self.styling()
self.saving()

View File

@@ -16,8 +16,8 @@ for file in files:
match file:
case _ if "ozon" in file:
print("Это OZON")
calculate = Handler(file)
calculate.get_articles_with_sales(jsonread.merchant("ozon"), sheet_name="По товарам")
calculate = Handler(file, jsonread.merchant("ozon"), sheet_name="По товарам")
calculate.get_articles_with_sales()
case _ if "yandex" in file:
print("Это Yandex")
calculate = Handler(file)