En una empresa de real estate residencial con 5 o más asesores, el problema no es conseguir leads — es saber cuáles valen la pena. Un lead de Inmuebles24 puede ser un comprador serio con preaprobación bancaria o alguien que está mirando propiedades sin intención real de comprar en los próximos 18 meses. La diferencia, para el asesor, es la misma llamada de 20 minutos.
El lead scoring con IA resuelve exactamente eso: antes de que el lead llegue a un asesor, el sistema asigna una puntuación de 0 a 100 que indica su probabilidad de cierre. Los de mayor puntaje van primero, los de menor puntaje entran a una secuencia de nutrición automatizada.
Por qué el scoring manual no funciona a escala
La mayoría de los equipos residenciales tienen alguna versión de scoring manual: una hoja de calificación que el asesor llena en la primera llamada, o un campo de "temperatura" en el CRM que alguien actualiza cuando se acuerda. El problema es doble:
- Subjetividad: Dos asesores califican al mismo perfil de prospecto de forma diferente según su experiencia, estado de ánimo y cuota del mes.
- Tardanza: El scoring manual ocurre después del primer contacto. Un modelo de IA puede calificar el lead antes de que nadie lo haya tocado, basándose solo en los datos del formulario.
Las variables que más predicen el cierre
Después de analizar más de 4,000 leads residenciales en proyectos de Ciudad de México, Monterrey y Guadalajara, estas son las variables con mayor peso predictivo:
| Variable | Peso en el modelo | Por qué importa |
|---|---|---|
| Tiene preaprobación de crédito | Alto | El paso más difícil ya está hecho |
| Hora del formulario (8-11am vs. 11pm) | Medio | Leads en horario laboral cierran más |
| Completitud del formulario | Medio | Quien llena todo está más comprometido |
| Fuente del lead (Google Ads vs. RRSS) | Medio | Intención de búsqueda activa vs. pasiva |
| Plazo declarado de compra | Alto | "Este año" vs. "en algún momento" |
| Zona geográfica de interés | Bajo-medio | Zonas de alta demanda tienen mayor urgencia |
| Número de visitas previas a la web | Medio | Retargeting = mayor intención demostrada |
Nota importante: Las variables con mayor peso son las declaradas por el prospecto, no las inferidas. Un modelo que confía en datos que el prospecto proporcionó voluntariamente es más estable que uno que intenta inferir capacidad económica por código postal.
Cómo se construye el modelo
Fase 1: Preparación de datos históricos
El primer paso es construir el dataset de entrenamiento. Necesitamos al menos 500 leads históricos con su resultado conocido (cerró / no cerró). Si el CRM no tiene este historial limpio, la fase 1 puede tomar 2-3 semanas de limpieza.
Campos mínimos requeridos por lead:
- Fecha y hora de registro
- Fuente de origen
- Campos completados del formulario
- Resultado final (venta, descartado, en proceso)
- Tiempo de ciclo (días desde registro hasta cierre o descarte)
Fase 2: Entrenamiento del modelo
Para este caso de uso usamos clasificadores de gradiente boosting (XGBoost o LightGBM), que funcionan bien con datos tabulares mixtos (numéricos + categóricos) y no requieren grandes volúmenes de datos. Con 500-1,000 leads históricos ya se puede entrenar un modelo útil.
El modelo produce una probabilidad de cierre (0.0 a 1.0) que convertimos a un score de 0-100 para comunicarlo al equipo comercial de forma intuitiva.
Fase 3: Integración con el CRM
El scoring no tiene valor si no llega al asesor en el momento correcto. La integración típica:
- El formulario del portal envía el lead vía webhook al modelo de scoring
- El modelo devuelve el score en menos de 200ms
- El CRM (HubSpot, Salesforce, Pipedrive o cualquier sistema con API) recibe el score como campo adicional
- Las reglas de asignación del CRM se actualizan: leads con score >70 van a asesores senior, <40 van a secuencia de email automatizado
Qué pasa con los leads de puntaje bajo
Un error común es ignorar los leads de score bajo. El modelo les asigna baja probabilidad de cierre ahora, no en 6 meses. Un comprador que hoy tiene plazo de compra de "2 a 3 años" puede convertirse en un prospecto caliente cuando cambie su situación.
La estrategia correcta es una secuencia de nutrición automatizada: correos mensuales con contenido relevante (guías de crédito hipotecario, noticias del mercado, nuevos proyectos), sin involucrar a los asesores hasta que el prospecto muestre señales de mayor intención (abrir correos, volver a visitar el portal, hacer clic en "ver disponibilidad").
Métricas para evaluar el modelo en producción
Una vez en producción, el modelo debe monitorearse con estas métricas:
- Tasa de conversión por quintil de score: El quintil más alto debe cerrar 3-5x más que el más bajo
- Calibración: Un lead con score 70 debe cerrar aproximadamente el 70% de las veces
- Drift mensual: Si el mercado cambia, el modelo necesita reentrenarse con datos recientes
Lo que el modelo no puede hacer
El scoring predice probabilidad, no certeza. Un lead con score 90 puede no cerrar si el asesor da mal seguimiento. El modelo mejora la eficiencia del equipo; no sustituye la calidad del proceso de ventas.
También recomendamos revisar el modelo cada trimestre: el mercado residencial en México es sensible a tasas de interés, tipo de cambio y ciclos políticos, y un modelo entrenado en 2024 puede volverse impreciso en 2026 si no se actualiza.