Análisis Estadístico — Corrientes

Modelo de estimación de venta v1 · 3 etapas: territorio → gestión → antigüedad · entrenado con 1.607 franquicias del país
← InicioVer Dashboard
Franquicias analizadas
19
con venta y variables completas
Venta real promedio
2.588
kg/mes por franquicia
Estimación del modelo
3.146
kg/mes promedio (etapa final)
Error medio ciudad
20%
|residuo| promedio (MAPE)
R² modelo (nacional)
0.21
MAE 742 kg/mes
Cómo leer esta hoja. El territorio explica una porción acotada de la varianza entre franquicias (regla 20/80 de Grido): un modelo territorial honesto explica ~15-20%, el resto lo define la gestión del franquiciado y factores no observables. La estimación de Etapa 1 es el punto de partida esperable para ese territorio con una gestión promedio — no es un techo que no se pueda superar: la gestión ajusta esa base para arriba o para abajo. Hoy, 54.5% de las franquicias maduras vende por encima de su punto de partida territorial gracias a su gestión, y 45.5% queda por debajo. La estimación final NO es un pronóstico exacto por local: es el nivel de venta esperable para un territorio así, con esa gestión y esa antigüedad.
Etapa 1 — Territorio (el punto de partida)
Regresión lineal en log(kilos/mes) con las 5 variables territoriales, entrenada solo con franquicias maduras (≥24 meses, n=1.483). R² validación cruzada: 0.17 (random) / 0.16 (dejando ciudades enteras afuera). MAE 776 kg/mes.
VariableTransf.Coeficienteβ estand.*Lectura
NSE (0-100)lineal+0.0038+0.075+10 puntos → +3.9% de venta
Comercialidad 500m (0-100)lineal+0.0019+0.036+10 puntos → +1.9% de venta
Índice familia (0-100)lineal+0.0004+0.013+10 puntos → +0.4% de venta
Pob. alcance (pob/gridos 1km)log+0.2039+0.124+10% en la variable → +2.0% de venta
Competidores en 1km (conteo)lineal-0.0243-0.035+1 heladería competidora en 1km → -2.4% de venta
* β estandarizado = efecto en log-venta de mover la variable un desvío estándar. Es la columna para comparar la importancia relativa entre variables de escalas distintas; el coeficiente crudo conserva la lectura de negocio.
Etapa 2 — Gestión (la captura)
Regresión de los residuos territoriales contra las 6 variables de gestión (fuente única: Excel mensuales + kilos SQL, rolling 12m). R² sobre residuos: 0.07 — señal real pero débil: la gestión que medimos hoy explica poco del desvío; el resto es franquiciado puro y factores que aún no capturamos.
VariableCoeficienteβ estand.*Lectura
Scoring 12m (1-5)+0.0051+0.004+1 punto de scoring → +0.5%
Supervisión 12m (0-1)+0.4315+0.051+10 p.p. de supervisión → +4.4%
% Promo-1.0427-0.084+10 p.p. → -9.9%
% Sobreventa-0.4721-0.014+10 p.p. → -4.6%
% Ecommerce-0.0073-0.001+10 p.p. → -0.1%
% Fidelización Club+0.0507+0.008+10 p.p. → +0.5%
* β estandarizado: importancia relativa (efecto de 1 desvío estándar), comparable entre variables.
Ojo con la causalidad. El signo negativo de % Promo y % Sobreventa no significa que promocionar baje la venta: los locales que venden por debajo de su punto de partida territorial suelen apoyarse más en promos (causalidad inversa). Estos coeficientes describen asociación, no receta.
Modelo directo de gestión (sin controlar territorio)
Misma población y variables que la Etapa 2, pero regresionando log(kilos/mes) directo contra gestión — sin pasar primero por el residuo territorial. R²: 0.11 (n=1.482), más alto que el R² sobre residuos de la Etapa 2 (0.07).
VariableCoeficienteβ estand.*Lectura
Scoring 12m (1-5)-0.0055-0.004+1 punto de scoring → -0.6%
Supervisión 12m (0-1)+0.6746+0.080+10 p.p. de supervisión → +7.0%
% Promo-1.2519-0.101+10 p.p. → -11.8%
% Sobreventa-0.4114-0.012+10 p.p. → -4.0%
% Ecommerce+0.5239+0.055+10 p.p. → +5.4%
% Fidelización Club+0.0833+0.013+10 p.p. → +0.8%
* β estandarizado: importancia relativa (efecto de 1 desvío estándar), comparable entre variables.
Por qué el R² es más alto acá y por qué no reemplaza a la Etapa 2. Sin controlar territorio, parte de estas variables terminan absorbiendo efecto territorial correlacionado con gestión — el caso más claro es % Ecommerce, que acá sale positivo (antes era ~0 sobre el residuo): en realidad viaja pegado al tamaño/tipo de ciudad, no es señal pura de gestión. % Promo y % Sobreventa, en cambio, se mantienen negativos en las dos especificaciones — el signo no es un artefacto del enfoque de residuos, es un patrón robusto (y consistente con causalidad inversa: vende poco → se apoya más en promo/sobreventa).
Etapa 3 — Antigüedad (maduración)
Factor multiplicativo por tramo de antigüedad: mediana del ratio venta real / estimación de etapa 2. La maduración es gradual, no un salto único: el factor sube tramo a tramo (0-12, 12-18, 18-24 meses) hasta estabilizarse en 1.0 a partir de los 24 meses. Los tramos por debajo de 6 meses no tienen casos propios en la base (el modelo exige ≥6 meses de venta para entrar) y heredan el factor del tramo 6-12m como supuesto conservador.

Factor de maduración por tramo

1.00 = venta esperada de una franquicia consolidada

Métricas por etapa (nacional)

Cada etapa suma señal sobre la anterior

Antigüedad vs. venta (observado)

kg/mes por franquicia según meses desde la apertura — Corrientes resaltada
Resultados — Real vs. Estimado
Cada punto es una franquicia. Sobre la diagonal el modelo acierta; por encima vende más que su estimación (sobre-performa su territorio), por debajo vende menos. Los puntos naranjas son las franquicias de Corrientes.

Venta real vs. estimación final

kg/mes — Corrientes resaltada sobre el universo nacional

Distribución del residuo

(real - estimado) / estimado — nacional vs. Corrientes
Franquicias de Corrientes — caso por caso
Variables territoriales, gestión, venta real y estimación de cada etapa. Est. E1 = modelo solo con variables territoriales. Est. E2 = Est. E1 ajustado por el modelo de gestión (secuencial sobre el residuo, no un único modelo conjunto con las 11 variables juntas). Est. Final = Est. E2 ajustado por el factor de antigüedad. Residuo positivo (verde) = vende por encima de lo que su territorio+gestión+antigüedad explican; está expresado en kg/12 meses para que sea comparable con Venta 12m.
Notas metodológicas
Universo: 1.607 franquicias de Argentina con dataset territorial auditado, venta > 0 y ≥ 6 meses de ventana. Entrenamiento etapa 1 solo con maduras.
Población 1km: fuera del modelo por redundancia — si el local está solo, "Pob. alcance" ES la población 1km; si tiene Gridos cerca, es la población repartida. Se grafica como referencia. El alcance competitivo ponderado por tier tampoco entra: el conteo simple de competidores tiene el mismo poder predictivo (validado por CV) y es más fácil de leer.
Accesibilidad: "sobre avenida" y densidad de calles se probaron y no mejoran el modelo una vez controlada la comercialidad; "Avenida" queda como dato descriptivo en la tabla.
Variables multi-país: las variables territoriales existen en los 5 países (WorldPop + OSM + maestro de competidores). Las de gestión son de fuentes internas.
Índice familia: compuesto auditado de escuelas + jardines + clubes deportivos + espacios verdes en 500m (OSM). Hospitales disponibles como variable separada, no incluidos en el compuesto v1.
Pendiente (backlog de feedback): outliers de gestión, variables de ubicación fina (avenida vs. calle).
Benchmark no lineal: un random forest con las variables territoriales alcanza R²≈0.19 — el techo de información de estas variables está cerca; mejorar requiere variables nuevas, no modelos más complejos.