Коэффициент удержания или Retention Rate (RR) показывает, насколько долго клиент взаимодействует с бизнесом (пользуется услугами, возвращается и совершает повторные покупки и т.д.)
Retention Rate = кол-во пользователей на текущий день / кол-во пользователей на первый день
При анализе Retention Rate нужно контролировать, чтобы участвовали только те пользователи, которые 100% «дожили» до конечной даты анализа. В противном случае результаты будут искажены.
Предположим, стоит задача рассчитать общий Retention Rate для пользователей сервиса электросамокатов, которые зарегистрировались в июне. Необходимо понять, сколько пользователей продолжили пользоваться сервисом на 7-й день после регистрации.
Имеются данные:
| День регистрации/Кол-во дней | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|---|
| 1 июня | 203 | 179 | 156 | 130 | 108 | 87 | 61 |
| 2 июня | 225 | 188 | 171 | 156 | 133 | 112 | 99 |
| 3 июня | 210 | 181 | 162 | 145 | 120 | 109 | |
| 4 июня | 186 | 160 | 153 | 147 | 114 | ||
| 5 июня | 238 | 210 | 195 | 167 | |||
| 6 июня | 190 | 173 | 150 | ||||
| 7 июня | 201 | 188 |
В связи с тем, что срок анализа — 7 дней, можно рассчитать RR в июне только по двум дням (за 1 и 2 июня). Остальные дни не можем брать в связи с недостаточностью данных.
В случае, если дополнительно возникнет необходимость анализа удержания юзеров в июне на следующий день после регистрации, а не на седьмой, тогда срок анализа составит 2 дня (0-й и 1-й дни) но уже по всем когортам (с 1 по 7 июня).
Если пренебречь конечной датой анализа и использовать в анализе остальные когорты, то со второго дня «жизни» пользователя Retention Rate начнёт резко падать из-за нехватки данных. И получится, что участники когорты от 7 июня успели «попользоваться» сервисом всего 2 дня, и в остальные дни количество юзеров этой когорты будет нулевым. Но их «вес» при расчёте будет таким же, как у первой и второй когорты, кто пользовался сервисом целую неделю.
Вот к чему приведет эта ошибка:
Расчет удержания пользователей 7-го дня, которые зарегистрировались в сервисе аренды электросамокатов 1 и 2 июня (правильный способ):
| Кол-во дней | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|---|
| Сумма | 428 | 367 | 327 | 286 | 241 | 199 | 160 |
| RR | 1,00 | 0,86 | 0,76 | 0,67 | 0,56 | 0,46 | 0,37 |
А вот что будет, если мы возьмем выборку за все дни:
| Кол-во дней | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|---|
| Сумма | 1453 | 1279 | 987 | 745 | 475 | 308 | 160 |
| RR | 1,00 | 0,88 | 0,68 | 0,51 | 0,33 | 0,21 | 0,11 |
Сравним оба варианта расчета RR на графике:

По некорректно составленному графику можно принять множество неверных решений: от остановки профитной рекламной кампании, которая может показаться неэффективной до увольнения персонала. Стоит помнить о соответствии конечной даты и достаточности данных за нужный период







