Lead scoring con IA: califica prospectos residenciales antes de asignarlos

En una empresa de real estate residencial con 5 o más asesores, el problema no es conseguir leads — es saber cuáles valen la pena. Un lead de Inmuebles24 puede ser un comprador serio con preaprobación bancaria o alguien que está mirando propiedades sin intención real de comprar en los próximos 18 meses. La diferencia, para el asesor, es la misma llamada de 20 minutos.

El lead scoring con IA resuelve exactamente eso: antes de que el lead llegue a un asesor, el sistema asigna una puntuación de 0 a 100 que indica su probabilidad de cierre. Los de mayor puntaje van primero, los de menor puntaje entran a una secuencia de nutrición automatizada.

Por qué el scoring manual no funciona a escala

La mayoría de los equipos residenciales tienen alguna versión de scoring manual: una hoja de calificación que el asesor llena en la primera llamada, o un campo de «temperatura» en el CRM que alguien actualiza cuando se acuerda. El problema es doble:

Subjetividad: Dos asesores califican al mismo perfil de prospecto de forma diferente según su experiencia, estado de ánimo y cuota del mes.
Tardanza: El scoring manual ocurre después del primer contacto. Un modelo de IA puede calificar el lead antes de que nadie lo haya tocado, basándose solo en los datos del formulario.

Las variables que más predicen el cierre

Después de analizar más de 4,000 leads residenciales en proyectos de Ciudad de México, Monterrey y Guadalajara, estas son las variables con mayor peso predictivo:

Variable	Peso en el modelo	Por qué importa
Tiene preaprobación de crédito	Alto	El paso más difícil ya está hecho
Hora del formulario (8-11am vs. 11pm)	Medio	Leads en horario laboral cierran más
Completitud del formulario	Medio	Quien llena todo está más comprometido
Fuente del lead (Google Ads vs. RRSS)	Medio	Intención de búsqueda activa vs. pasiva
Plazo declarado de compra	Alto	«Este año» vs. «en algún momento»
Zona geográfica de interés	Bajo-medio	Zonas de alta demanda tienen mayor urgencia
Número de visitas previas a la web	Medio	Retargeting = mayor intención demostrada

Nota importante: Las variables con mayor peso son las declaradas por el prospecto, no las inferidas. Un modelo que confía en datos que el prospecto proporcionó voluntariamente es más estable que uno que intenta inferir capacidad económica por código postal.

Cómo se construye el modelo

Fase 1: Preparación de datos históricos

El primer paso es construir el dataset de entrenamiento. Necesitamos al menos 500 leads históricos con su resultado conocido (cerró / no cerró). Si el CRM no tiene este historial limpio, la fase 1 puede tomar 2-3 semanas de limpieza.

Campos mínimos requeridos por lead:

Fecha y hora de registro
Fuente de origen
Campos completados del formulario
Resultado final (venta, descartado, en proceso)
Tiempo de ciclo (días desde registro hasta cierre o descarte)

Fase 2: Entrenamiento del modelo

Para este caso de uso usamos clasificadores de gradiente boosting (XGBoost o LightGBM), que funcionan bien con datos tabulares mixtos (numéricos + categóricos) y no requieren grandes volúmenes de datos. Con 500-1,000 leads históricos ya se puede entrenar un modelo útil.

El modelo produce una probabilidad de cierre (0.0 a 1.0) que convertimos a un score de 0-100 para comunicarlo al equipo comercial de forma intuitiva.

Fase 3: Integración con el CRM

El scoring no tiene valor si no llega al asesor en el momento correcto. La integración típica:

El formulario del portal envía el lead vía webhook al modelo de scoring
El modelo devuelve el score en menos de 200ms
El CRM (HubSpot, Salesforce, Pipedrive o cualquier sistema con API) recibe el score como campo adicional
Las reglas de asignación del CRM se actualizan: leads con score >70 van a asesores senior, <40 van a secuencia de email automatizado

Qué pasa con los leads de puntaje bajo

Un error común es ignorar los leads de score bajo. El modelo les asigna baja probabilidad de cierre ahora, no en 6 meses. Un comprador que hoy tiene plazo de compra de «2 a 3 años» puede convertirse en un prospecto caliente cuando cambie su situación.

La estrategia correcta es una secuencia de nutrición automatizada: correos mensuales con contenido relevante (guías de crédito hipotecario, noticias del mercado, nuevos proyectos), sin involucrar a los asesores hasta que el prospecto muestre señales de mayor intención (abrir correos, volver a visitar el portal, hacer clic en «ver disponibilidad»).

Métricas para evaluar el modelo en producción

Una vez en producción, el modelo debe monitorearse con estas métricas:

Tasa de conversión por quintil de score: El quintil más alto debe cerrar 3-5x más que el más bajo
Calibración: Un lead con score 70 debe cerrar aproximadamente el 70% de las veces
Drift mensual: Si el mercado cambia, el modelo necesita reentrenarse con datos recientes

Lo que el modelo no puede hacer

El scoring predice probabilidad, no certeza. Un lead con score 90 puede no cerrar si el asesor da mal seguimiento. El modelo mejora la eficiencia del equipo; no sustituye la calidad del proceso de ventas.

También recomendamos revisar el modelo cada trimestre: el mercado residencial en México es sensible a tasas de interés, tipo de cambio y ciclos políticos, y un modelo entrenado en 2024 puede volverse impreciso en 2026 si no se actualiza.

Este es el problema que resuelve Umbral como producto estándar. Si su esquema de comisión o su regla de asignación no cabe en un producto de catálogo, esa es precisamente la señal 04.

Por qué el scoring manual no funciona a escala

Las variables que más predicen el cierre

Cómo se construye el modelo

Fase 1: Preparación de datos históricos

Fase 2: Entrenamiento del modelo

Fase 3: Integración con el CRM

Qué pasa con los leads de puntaje bajo

Métricas para evaluar el modelo en producción

Lo que el modelo no puede hacer

¿Sus asesores trabajan leads sin prioridad?