Franquicias analizadas
19
con venta y variables completas
Venta real promedio
2.588
kg/mes por franquicia
Estimación del modelo
3.146
kg/mes promedio (etapa final)
Error medio ciudad
20%
|residuo| promedio (MAPE)
R² modelo (nacional)
0.21
MAE 742 kg/mes
Cómo leer esta hoja. El territorio explica una porción acotada de la
varianza entre franquicias (regla 20/80 de Grido): un modelo territorial honesto explica
~15-20%, el resto lo define la gestión del franquiciado y factores no observables. La
estimación de Etapa 1 es el punto de partida esperable para ese territorio con una
gestión promedio — no es un techo que no se pueda superar: la gestión ajusta esa base para
arriba o para abajo. Hoy, 54.5% de las franquicias
maduras vende por encima de su punto de partida territorial gracias a su gestión, y
45.5% queda por debajo. La estimación final NO es un
pronóstico exacto por local: es el nivel de venta esperable para un territorio así, con esa
gestión y esa antigüedad.
Etapa 1 — Territorio (el punto de partida)
Regresión lineal en log(kilos/mes) con las 5 variables territoriales,
entrenada solo con franquicias maduras (≥24 meses,
n=1.483).
R² validación cruzada: 0.17 (random) /
0.16 (dejando ciudades enteras afuera).
MAE 776 kg/mes.
| Variable | Transf. | Coeficiente | β estand.* | Lectura |
| NSE (0-100) | lineal | +0.0038 | +0.075 | +10 puntos → +3.9% de venta |
| Comercialidad 500m (0-100) | lineal | +0.0019 | +0.036 | +10 puntos → +1.9% de venta |
| Índice familia (0-100) | lineal | +0.0004 | +0.013 | +10 puntos → +0.4% de venta |
| Pob. alcance (pob/gridos 1km) | log | +0.2039 | +0.124 | +10% en la variable → +2.0% de venta |
| Competidores en 1km (conteo) | lineal | -0.0243 | -0.035 | +1 heladería competidora en 1km → -2.4% de venta |
* β estandarizado = efecto en log-venta de mover la
variable un desvío estándar. Es la columna para comparar la importancia relativa entre variables
de escalas distintas; el coeficiente crudo conserva la lectura de negocio.
Etapa 2 — Gestión (la captura)
Regresión de los residuos territoriales contra las 6 variables de
gestión (fuente única: Excel mensuales + kilos SQL, rolling 12m).
R² sobre residuos: 0.07 — señal real pero débil:
la gestión que medimos hoy explica poco del desvío; el resto es franquiciado puro y
factores que aún no capturamos.
| Variable | Coeficiente | β estand.* | Lectura |
| Scoring 12m (1-5) | +0.0051 | +0.004 | +1 punto de scoring → +0.5% |
| Supervisión 12m (0-1) | +0.4315 | +0.051 | +10 p.p. de supervisión → +4.4% |
| % Promo | -1.0427 | -0.084 | +10 p.p. → -9.9% |
| % Sobreventa | -0.4721 | -0.014 | +10 p.p. → -4.6% |
| % Ecommerce | -0.0073 | -0.001 | +10 p.p. → -0.1% |
| % Fidelización Club | +0.0507 | +0.008 | +10 p.p. → +0.5% |
* β estandarizado: importancia relativa
(efecto de 1 desvío estándar), comparable entre variables.
Ojo con la causalidad. El signo negativo de % Promo y % Sobreventa
no significa que promocionar baje la venta: los locales que venden por debajo de su punto
de partida territorial suelen apoyarse más en promos (causalidad inversa). Estos coeficientes
describen asociación, no receta.
Modelo directo de gestión (sin controlar territorio)
Misma población y variables que la Etapa 2, pero regresionando
log(kilos/mes) directo contra gestión — sin pasar primero por el residuo territorial.
R²: 0.11 (n=1.482), más alto que el R² sobre
residuos de la Etapa 2 (0.07).
| Variable | Coeficiente | β estand.* | Lectura |
| Scoring 12m (1-5) | -0.0055 | -0.004 | +1 punto de scoring → -0.6% |
| Supervisión 12m (0-1) | +0.6746 | +0.080 | +10 p.p. de supervisión → +7.0% |
| % Promo | -1.2519 | -0.101 | +10 p.p. → -11.8% |
| % Sobreventa | -0.4114 | -0.012 | +10 p.p. → -4.0% |
| % Ecommerce | +0.5239 | +0.055 | +10 p.p. → +5.4% |
| % Fidelización Club | +0.0833 | +0.013 | +10 p.p. → +0.8% |
* β estandarizado: importancia relativa
(efecto de 1 desvío estándar), comparable entre variables.
Por qué el R² es más alto acá y por qué no reemplaza a la Etapa 2.
Sin controlar territorio, parte de estas variables terminan absorbiendo efecto territorial
correlacionado con gestión — el caso más claro es % Ecommerce, que acá sale positivo (antes
era ~0 sobre el residuo): en realidad viaja pegado al tamaño/tipo de ciudad, no es señal pura
de gestión. % Promo y % Sobreventa, en cambio, se mantienen negativos en las dos
especificaciones — el signo no es un artefacto del enfoque de residuos, es un patrón robusto
(y consistente con causalidad inversa: vende poco → se apoya más en promo/sobreventa).
Etapa 3 — Antigüedad (maduración)
Factor multiplicativo por tramo de antigüedad: mediana del ratio
venta real / estimación de etapa 2. La maduración es gradual, no un salto único: el factor
sube tramo a tramo (0-12, 12-18, 18-24 meses) hasta estabilizarse en 1.0 a partir de los
24 meses. Los tramos por debajo de 6 meses no tienen casos propios en la base (el modelo
exige ≥6 meses de venta para entrar) y heredan el factor del tramo 6-12m como supuesto
conservador.
Factor de maduración por tramo
1.00 = venta esperada de una franquicia consolidada
Métricas por etapa (nacional)
Cada etapa suma señal sobre la anterior
Antigüedad vs. venta (observado)
kg/mes por franquicia según meses desde la apertura — Corrientes resaltada
Resultados — Real vs. Estimado
Cada punto es una franquicia. Sobre la diagonal el modelo acierta;
por encima vende más que su estimación (sobre-performa su territorio), por debajo vende menos.
Los puntos naranjas son las franquicias de Corrientes.
Venta real vs. estimación final
kg/mes — Corrientes resaltada sobre el universo nacional
Distribución del residuo
(real - estimado) / estimado — nacional vs. Corrientes
Franquicias de Corrientes — caso por caso
Variables territoriales, gestión, venta real y estimación de cada
etapa. Est. E1 = modelo solo con variables territoriales. Est. E2 = Est. E1
ajustado por el modelo de gestión (secuencial sobre el residuo, no un único modelo conjunto
con las 11 variables juntas). Est. Final = Est. E2 ajustado por el factor de
antigüedad. Residuo positivo (verde) = vende por encima de lo que su territorio+gestión+antigüedad
explican; está expresado en kg/12 meses para que sea comparable con Venta 12m.
Notas metodológicas
Universo: 1.607 franquicias de Argentina con dataset
territorial auditado, venta > 0 y ≥ 6 meses de ventana. Entrenamiento etapa 1 solo con
maduras.
Población 1km: fuera del modelo por redundancia — si el local está solo,
"Pob. alcance" ES la población 1km; si tiene Gridos cerca, es la población repartida.
Se grafica como referencia. El alcance competitivo ponderado por tier tampoco entra:
el conteo simple de competidores tiene el mismo poder predictivo (validado por CV) y
es más fácil de leer.
Accesibilidad: "sobre avenida" y densidad de calles se probaron y no mejoran el
modelo una vez controlada la comercialidad; "Avenida" queda como dato descriptivo en
la tabla.
Variables multi-país: las variables territoriales existen en los 5 países
(WorldPop + OSM + maestro de competidores). Las de gestión son de fuentes internas.
Índice familia: compuesto auditado de escuelas + jardines + clubes deportivos +
espacios verdes en 500m (OSM). Hospitales disponibles como variable separada, no incluidos
en el compuesto v1.
Pendiente (backlog de feedback): outliers de gestión, variables de ubicación fina
(avenida vs. calle).
Benchmark no lineal: un random forest con las variables territoriales alcanza
R²≈0.19 — el techo de información de estas variables está cerca; mejorar requiere
variables nuevas, no modelos más complejos.