Laboratorio 2

Análisis de Criminalidad

Segmentación de estados en EE.UU. según su perfil delictivo utilizando clustering (K-Means).

1️⃣ Introducción

En el presente trabajo se realizó un análisis exploratorio y de segmentación sobre un dataset que contiene información de distintos tipos de delitos en los estados de Estados Unidos.

El dataset incluye las siguientes variables:

Estado Asesinatos Asaltos Población Urbana (%) Violaciones

El objetivo principal fue:

  • Analizar los niveles de criminalidad.
  • Identificar patrones entre estados.
  • Aplicar técnicas de clustering (K-Means) para segmentar los estados según su perfil delictivo.
  • Visualizar geográficamente los resultados.

2️⃣ Descripción del Dataset

Cada fila representa un estado de EE.UU. y contiene métricas relacionadas con delitos violentos. Las variables numéricas representan tasas o cantidades relativas de delitos.

Ejemplo de estructura del dataset:
Estado Asesinatos Asaltos Pob. Urbana Violaciones
Alabama 13.2 236 58 21.2
Alaska 10.0 263 48 44.5
Arizona 8.1 294 80 31.0

3️⃣ Metodología Aplicada

🔹 3.1 Selección de Variables

Para el clustering inicial se utilizaron:

Asesinatos Asaltos

Estas dos variables representan delitos violentos y permiten observar patrones claros de peligrosidad.

🔹 3.2 Determinación del Número Óptimo de Clusters

Se implementó una función para determinar el número ideal de clusters utilizando el método del codo (Elbow Method). Este método evalúa la variación intra-cluster (inercia) a medida que aumenta el número de clusters.

Resultado:

Se determinó que 3 clusters representan una segmentación adecuada del dataset.

🔹 3.3 Aplicación de K-Means

Se aplicó el algoritmo K-Means con:

  • k: 3
  • Variables: Asesinatos y Asaltos

El resultado permitió dividir los estados en tres grupos diferenciados según su nivel de criminalidad violenta.

4️⃣ Análisis de Resultados

Baja Criminalidad

  • Estados con tasas relativamente bajas de asesinatos y asaltos.
  • Representan zonas con menor nivel de violencia.
  • Posible correlación con menor densidad urbana o mejores condiciones socioeconómicas.

Criminalidad Media

  • Estados con valores intermedios.
  • Perfil mixto: algunos delitos más elevados pero no extremos.
  • Grupo de transición entre baja y alta peligrosidad.

Alta Criminalidad

  • Estados con altos niveles de asesinatos y asaltos.
  • Representan las regiones más violentas del dataset.
  • Probablemente asociados a grandes centros urbanos o mayor desigualdad social.

5️⃣ Visualización Geográfica

Se realizó una representación mediante mapa, coloreando los estados según el cluster asignado. Esto permitió:

  • Identificar patrones regionales.
  • Detectar concentraciones geográficas de alta criminalidad.
  • Visualizar cómo se distribuye la peligrosidad en el territorio estadounidense.

Insight importante:

La criminalidad no se distribuye uniformemente; existen zonas claramente más críticas que otras.

6️⃣ Procesamiento Adicional

Durante el análisis también se prepararon los datos de la siguiente manera:

  • Incorporó el código de cada estado.
  • Eliminó columnas irrelevantes para el análisis.
  • Preparó el dataset para visualización geográfica.

7️⃣ Conclusiones y Recomendaciones

Conclusiones

  • Es posible segmentar los estados según su perfil delictivo utilizando técnicas de clustering.
  • Existen tres niveles bien diferenciados de criminalidad.
  • Los delitos de asesinatos y asaltos son suficientes para detectar patrones estructurales.
  • La visualización geográfica mejora significativamente la interpretación de los resultados.
  • La técnica K-Means es adecuada para este tipo de análisis exploratorio.

Próximos Pasos

  • Incluir más variables (por ejemplo, Violaciones y Población Urbana) para un clustering más completo.
  • Normalizar todas las variables si se agregan más dimensiones.
  • Aplicar PCA para reducción de dimensionalidad.
  • Comparar con otros algoritmos (DBSCAN, Clustering Jerárquico).
  • Realizar análisis temporal si se dispone de datos históricos.