1️⃣ Introducción
En el presente trabajo se realizó un análisis exploratorio y de segmentación sobre un dataset ficticio de clientes de tarjetas de crédito, utilizado con fines académicos y de práctica.
El objetivo principal fue:
- Analizar patrones de uso financiero.
- Detectar comportamientos similares entre clientes.
- Aplicar técnicas de clustering para segmentación.
- Extraer insights comerciales relevantes.
2️⃣ Descripción del Dataset
El dataset contiene información financiera asociada a clientes. Cada fila representa un cliente
distinto.
Nota: Al tratarse de datos simulados, no representan
información real, sino patrones generados para análisis académico.
Variables incluidas:
3️⃣ Preparación de Datos
Preprocesamiento
- Eliminación de valores nulos
- Conversión de variables a formato numérico
- Selección de variables relevantes para el modelo
Estandarización
Se aplicó normalización y estandarización de las variables. Esto fue clave ya que K-Means es altamente sensible a la escala de los datos (la métrica de distancia euclidiana se distorsiona sin estandarizar).
4️⃣ Metodología Aplicada
🔹 4.1 Método del Codo (Elbow Method)
Se aplicó el método del codo evaluando la inercia para distintos valores de K para determinar el número óptimo de clusters.
Resultado:
Se identificó un punto de inflexión que sugiere un número adecuado de clusters (3 o 4 según el gráfico de dispersión).
🔹 4.2 Aplicación de K-Means
Se implementó el algoritmo K-Means con el número óptimo de clusters. El modelo iterativo permitió segmentar a los clientes según el grado de similitud multivariable de sus patrones financieros.
5️⃣ Análisis de Segmentos
A partir de los clusters obtenidos, se identificaron claramente los siguientes perfiles típicos:
Clientes de Bajo Uso
- Bajo nivel de compras.
- Bajo balance.
- Uso esporádico de la tarjeta.
- Perfil altamente conservador.
Estrategia sugerida:
Ofrecer incentivos puntuales para aumentar la frecuencia de uso.
Activos Moderados
- Compras frecuentes.
- Pagos relativamente regulares.
- Balance intermedio o moderado.
Estrategia sugerida:
Crear programas de fidelización y recompensas por continuidad.
Alto Uso / Riesgo
- Alto nivel de compras y consumo.
- Alto balance pendiente.
- Mayor uso de adelantos en efectivo.
Estrategia sugerida:
Monitoreo de riesgo crediticio extremo y ofertas proactivas de refinanciación.
6️⃣ Visualización
Se utilizaron gráficos de dispersión 2D para:
- Representar clusters
- Visualizar dispersión entre variables seleccionadas
- Analizar separación geométrica entre segmentos
Hallazgo visual:
Existe diferenciación clara entre grupos. Algunos clusters presentan mayor concentración de clientes con alto uso financiero, denotando densidad variable.
8️⃣ Limitaciones
- Dataset simulado (no representa comportamiento orgánico real).
- No se evaluó estabilidad temporal (estático).
- K-Means asume clusters esféricos y de varianza similar.
- No se comparó la robustez con otros algoritmos.
7️⃣ Conclusiones y 9️⃣ Futuro
Conclusiones
- Es posible segmentar clientes según su comportamiento financiero usando K-Means.
- La estandarización es fundamental para evitar sesgos por escala matemática.
- Existen perfiles diferenciados que pueden guiar estrategias comerciales directas.
- El análisis permite identificar eficientemente clientes de alto valor y potencial de riesgo.
Recomendaciones Futuras
- Aplicar PCA (Análisis de Componentes Principales) para reducción de dimensionalidad.
- Evaluar Clustering Jerárquico o DBSCAN frente a la topología de los datos.
- Incorporar métricas de validación matemática interna (Silhouette Score).
- Simular datos temporales para análisis de la evolución del cliente (Lifespan).