Условие: выгружены сырые данные, где есть разбивка по дням и конверсиям.

Если нужно посмотреть посмотреть конверсию в конкретный день или день недели — она подходит. Чтобы найти закономерности — не подходит, поскольку слишком много «шума». В данном случае нужно избавиться от лишней информации и укрупнить метрики группировкой. Сгруппировать можно, например, по неделям, месяцам и т.д.
Как правильно посчитать среднюю конверсию?
Вариант 1.
- Добавить в Pandas в Dataframe колонку «неделя»;
- Сгруппировать Dataframe по колонке «неделя»
dt.isocalendar(); - Сложить количество кликов и регистраций для каждой недели;
- Пересчитать конверсию по неделям.
Вариант 2.
- Добавить в Pandas в Dataframe колонку «неделя»;
- Сгруппировать Dataframe по колонке «неделя»
dt.isocalendar(); - Посчитать средние значения конверсий по неделям.
Недельная конверсия рассчитывается отношением числа регистраций за всю неделю к числу кликов за всю неделю.
При использовании Варианта 2, недельная конверсия будет посчитана как .mean() по колонке CR, %. Данные будут усреднены. Но эта конверсия не будет являться усреднением недельного числа кликов и регистраций. Полученная конверсия — усреднение, однако она не никаким образом не связана с недельной конверсией.
Дело в том, что мы получаем одинаковую конверсию в 2021-08-02, когда сайт посетили 9000 человек (0,31%) и такую же конверсию 2021-08-07 при трафике в 2000 человек (0,30%).
И если считать Вариантом 2 — получаем недельную конверсию 0,94%.

А если используем Вариант 1, сначала просуммировав клики, затем регистрации за всю неделю, и только потом рассчитав конверсию — получаем корректный результат в виде конверсии 0,63%.

Важно учитывать данный факт при расчете сгруппированных метрик.







