MATERIAL DE APOYO CASO PRÁCTICO “SISTEMA INTEGRAL PARA LA ... ?· material de apoyo . caso prÁctico…

  • Published on
    20-Sep-2018

  • View
    212

  • Download
    0

Transcript

MATERIAL DE APOYO CASO PRCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. PRESENTA MTIE. Erik Guerrero Bravo. Tula de Allende Hidalgo Septiembre del 2012. Contenido INTRODUCCIN ............................................................................................................... 7 1. DESCRIPCIN DEL PROYECTO .............................................................................. 8 1.1. Planteamiento del Problema ............................................................................ 8 1.2. Objetivo General ............................................................................................ 10 1.3. Objetivos Especficos ..................................................................................... 10 1.4. Justificacin ................................................................................................... 11 2. MARCO TEORICO ................................................................................................... 12 2.1. Business Intelligence...................................................................................... 12 2.1.1. Caractersticas ............................................... Error! Marcador no definido. 2.1.2. Componentes ................................................ Error! Marcador no definido. 2.2. Sistemas de Informacin ................................... Error! Marcador no definido. 2.2.1. DataWarehouse ............................................. Error! Marcador no definido. 2.2.1.1. Implementacin .......................................... Error! Marcador no definido. 2.2.2. DataMart ........................................................ Error! Marcador no definido. 2.2.2.1. Tipos de DataMarts .................................... Error! Marcador no definido. 2.2.3. OLAP ................................................................ Error! Marcador no definido. 2.2.3.1. Beneficios de OLAP ................................... Error! Marcador no definido. 2.2.3.2. Componentes ............................................. Error! Marcador no definido. 2.3. Descubrimiento de Conocimiento de Bases de Datos (KDD) . Error! Marcador no definido. 2.3.1. Metas ............................................................ Error! Marcador no definido. 2.3.2. Proceso KDD ................................................. Error! Marcador no definido. 2.4. Minera de Datos ............................................... Error! Marcador no definido. 2.4.1. Principales Caractersticas y Objetivos de la Minera de Datos............ Error! Marcador no definido. 2.4.2. Etapas Principales del Proceso de Minera .... Error! Marcador no definido. 2.4.3. Tipologa de Patrones de Minera de Datos ... Error! Marcador no definido. 3. MARCO REFERENCIAL ............................................. Error! Marcador no definido. 3.1. Rasgos Institucionales ...................................... Error! Marcador no definido. 3.1.1. Antecedentes Histricos ................................ Error! Marcador no definido. 3.1.2. Estructura ...................................................... Error! Marcador no definido. 3.1.3. Recursos Humanos ....................................... Error! Marcador no definido. 3.1.4. Equipamiento................................................. Error! Marcador no definido. 3.1.5. Tecnologa e Informacin .............................. Error! Marcador no definido. 3.2. Contexto de la Empresa .................................... Error! Marcador no definido. 3.2.1. Misin ............................................................ Error! Marcador no definido. 3.2.2. Visin ............................................................ Error! Marcador no definido. 3.2.3. Proyecciones a Futuro ................................... Error! Marcador no definido. 4. METODOLOGA PARA LA ADMINISTRACIN DEL PROYECTO ... Error! Marcador no definido. 5. CASO PRCTICO ....................................................... Error! Marcador no definido. 5.1. Documento de definicin ................................... Error! Marcador no definido. 5.1.1. Conceptualizacin del Producto o Servicio .... Error! Marcador no definido. 5.1.2. Administracin de Riesgos ............................ Error! Marcador no definido. 5.2. Descripcin del Sistema Web ............................ Error! Marcador no definido. 5.2.1. Funcionalidad Requerida. .............................. Error! Marcador no definido. 5.3. Inicio Planeacin del Proyecto .......................... Error! Marcador no definido. 5.3.1. Formato de Solicitud del Proyecto ................. Error! Marcador no definido. 5.3.2. Formato de Anlisis para la Integracin y Planeacin del Proyecto. ........ Error! Marcador no definido. 5.3.3. Formato de Evaluacin y Autorizacin de Fases del Proyecto. ............ Error! Marcador no definido. 5.3.4. Formato de Rastreabilidad de Mdulos Construidos ...... Error! Marcador no definido. 5.4. Requerimientos Tcnicos del Proyecto ............. Error! Marcador no definido. 5.4.1. Datos del Proyecto ........................................ Error! Marcador no definido. 5.4.2. Objetivo del Proyecto ..................................... Error! Marcador no definido. 5.4.3. Alcance .......................................................... Error! Marcador no definido. 5.4.4. Descripcin General ...................................... Error! Marcador no definido. 5.4.5. Proceso General ............................................ Error! Marcador no definido. 5.5. Mdulos y Arquitectura del Sistema Web (SICODEC4). .... Error! Marcador no definido. 5.6. Arquitectura del Sistema de Consulta Delictiva (SICODEC4) . Error! Marcador no definido. 5.6.1. Modelos de Arquitecturas Basadas en Tres Capas ....... Error! Marcador no definido. 5.6.2. Patrn de Arquitectura (Model View Controller) ............. Error! Marcador no definido. 5.6.3. Formato de Propuesta de Solucin Arquitectnica del Software. ......... Error! Marcador no definido. 5.6.4. Estructura General de la Arquitectura ........... Error! Marcador no definido. 5.6.5. Visin de la Comunicacin Arquitectnica SICODEC4 de forma global. Error! Marcador no definido. 5.6.6. Descripcin de las Capas y su Implementacin ............. Error! Marcador no definido. 5.6.7. Estructura de Comunicacin entre Capas ...... Error! Marcador no definido. 5.6.8. Procesos de Comunicacin entre Componentes ........... Error! Marcador no definido. 5.7. Descripcin de Subprocesos ............................. Error! Marcador no definido. 5.7.1. Descripcin del Proceso de Captura y Recepcin de Datos ............... Error! Marcador no definido. 5.7.1.1. Formato de Especificacin y Autorizacin del Proceso ... Error! Marcador no definido. 5.7.1.2. Diagrama de Flujo del Proceso .................. Error! Marcador no definido. 5.7.1.3. Interfaz Grfica del Proceso ....................... Error! Marcador no definido. 5.7.2. Diseo e Implementacin del Proceso de Recepcin de Datos .......... Error! Marcador no definido. 5.7.3. Implementacin del Proceso de Consulta Estadstica de los Incidentes Error! Marcador no definido. 5.7.3.1. Formato de Especificacin y Autorizacin del Proceso ... Error! Marcador no definido. 5.7.3.2. Diagrama de Flujo del Proceso .................. Error! Marcador no definido. 5.7.3.3. Interfaz Grfica del Proceso ....................... Error! Marcador no definido. 5.7.4. Diseo e Implementacin del Proceso de Consulta y Anlisis Estadstico. Error! Marcador no definido. 5.7.5. Descripcin del Proceso de Gestin de Usuarios y Seguridad ............ Error! Marcador no definido. 5.7.5.1. Configuracin de la Seguridad en la Sistema ............. Error! Marcador no definido. 5.7.5.2. Identificacin de Escenarios de Ataques Externos ..... Error! Marcador no definido. 5.7.5.3. Formato de Especificacin y Autorizacin del Proceso de Seguridad Error! Marcador no definido. 5.7.6. Descripcin del Proceso de Configuracin del Archivo Web.config ..... Error! Marcador no definido. 5.7.6.1. Configuracin para la Prevencin de Ataques del tipo XSS ............. Error! Marcador no definido. 5.7.6.2. Prevencin de Ataques Eavesdropping. ..... Error! Marcador no definido. 5.7.7. Anlisis del Proceso de Autenticacin de Usuarios y Control de Acceso Error! Marcador no definido. 5.7.7.1. Arquitectura ................................................ Error! Marcador no definido. 5.7.8. Anlisis de Proceso de Autenticacin de Usuarios ........ Error! Marcador no definido. 5.7.8.1. Interfaz Grfica .......................................... Error! Marcador no definido. 5.7.9. Implementacin de la Seguridad Basada en Cookies de Autenticacin. Error! Marcador no definido. 5.7.10. Descripcin del Proceso de Recuperacin de Contraseas.Error! Marcador no definido. 5.7.10.1. Diagrama de Flujo del Proceso .................. Error! Marcador no definido. 5.7.10.2. Interfaz Grfica .......................................... Error! Marcador no definido. 5.7.11. Anlisis Proceso de Creacin de Cuentas de Usuarios . Error! Marcador no definido. 5.7.11.1. Diagrama de Flujo del Proceso .................. Error! Marcador no definido. 5.7.11.2. Interfaz Grfica .......................................... Error! Marcador no definido. 5.7.11.3. Analiss del Proceso Invocacin de la Clase Membership Error! Marcador no definido. 5.7.12. Descripcin del Proceso de Creacin de Roles ............. Error! Marcador no definido. 5.7.12.1. Diagrama de Flujo del Proceso .................. Error! Marcador no definido. 5.7.12.2. Interfaz Grfica .......................................... Error! Marcador no definido. 5.7.13. Analiss del Proceso Invocacin de la Clase Roles. ....... Error! Marcador no definido. 5.7.14. Descripcin del Proceso de Asignacin de Roles .......... Error! Marcador no definido. 5.7.14.1. Diagrama de Flujo del Proceso .................. Error! Marcador no definido. 5.7.14.2. Interfaz Grfica .......................................... Error! Marcador no definido. 5.7.14.3. Analiss del Proceso Invocacin de la Clase Role ...... Error! Marcador no definido. 5.8. DESCRIPCIN DEL MODULO DE MINERA DE DATOS Error! Marcador no definido. 5.9. Funcionalidad requerida .................................... Error! Marcador no definido. 5.10. Descripcin del Proceso de ETL a travs de Proyectos SSIS .............. Error! Marcador no definido. 5.10.1. Requerimientos para la Extraccin y Transformacin de los Datos .... Error! Marcador no definido. 5.11. Formato de Solicitud del Proyecto: MODULO DE MINERA DE DATOS Error! Marcador no definido. 5.12. Descripcin del Proceso de ETL de Incidentes Municipales. ............... Error! Marcador no definido. 5.12.1. Arquitectura ................................................... Error! Marcador no definido. 5.13. Proceso de Transformacin del DW perteneciente a los Incidentes. ... Error! Marcador no definido. 5.13.1. Creacin de Tablas de Dimensin ................. Error! Marcador no definido. 5.13.2. Proceso de Transformacin ........................... Error! Marcador no definido. 5.13.3. Diseo de la Tabla Lnea del Tiempo ........... Error! Marcador no definido. 5.13.4. Creacin de las tablas de Hechos ................. Error! Marcador no definido. 5.14. Anlisis de los Datos Generados a partir del ETL. ......... Error! Marcador no definido. 5.15. Generacin y Procesamiento del Modelo de Minera de Datos ............ Error! Marcador no definido. 5.15.1. Descripcin del Proceso de Creacin del Modelo de Minera de Datos Error! Marcador no definido. 5.15.2. Estructura General del Proyecto SSAS.......... Error! Marcador no definido. 5.15.2.1. Implementacin y Procesamiento del Modelo de Minera de Datos . Error! Marcador no definido. 5.15.2.1.1. Entrenamiento del Modelo ...................... Error! Marcador no definido. 5.16. Resultados Finales ........................................ Error! Marcador no definido. 6. RECOMENDACIONES ................................................ Error! Marcador no definido. 7. RESULTADOS ALCANZADOS Y CONCLUCIONES ... Error! Marcador no definido. 8. REFERENCIAS ........................................................... Error! Marcador no definido. 9. ANEXO ........................................................................ Error! Marcador no definido. INTRODUCCIN A partir del cambio de la estructura poltica del pas en el 2009, se vio afectado por una creciente ola de inseguridad caracterizada por un aumento en los ndices delictivos y los niveles de violencia. Esta situacin fue ms profunda en las principales ciudades del pas y llev a tomar acciones coordinadas a nivel nacional con el objetivo de prevenir el delito. Una de stas medidas fue el impulso de sistemas como plataforma Mxico, por parte de la secretaria de Seguridad Pblica a nivel Federal a travs del Centro de Comunicaciones, Cmputo, Control y Comando (C4). En el plano internacional, los ataques terroristas del 11 de septiembre han aumentado significativamente la preocupacin por la seguridad interna en EEUU. Las agencias de inteligencia como la CIA o el FBI procesan y analizan informacin en busca de actividad terrorista1. El anlisis de los registros delictivos es fundamental en la prevencin del delito. Entre otras cosas, por que permite el diseo de polticas y planes de prevencin ms efectivos. En Mxico este tipo de anlisis se ha realizado histricamente mediante herramientas estadsticas descriptivas bsicas, considerando fundamentalmente variables y relaciones primarias. Sin embargo, muchas veces la estadstica descriptiva clsica no refleja la verdadera interrelacin de las variables y por lo tanto, el problema real. ste contexto requiere un tratamiento ms complejo que obliga a evolucionar en el anlisis de informacin criminal. En general, el tamao de las bases de datos esta basado en aspectos como la capacidad y eficiencia de almacenamiento y no en su posterior uso o anlisis2. Por esta razn, en muchos casos, los registros almacenados son demasiado grandes o complejos como para analizar y superan el alcance de la estadstica. La Minera de Datos (Data Mining) es un proceso iterativo de bsqueda de informacin no trivial en grandes volmenes de datos3. Busca generar informacin similar a la que podra generar un experto humano: patrones, asociaciones, cambios, anomalas y estructuras significativas. En el caso de aplicar inteligencia o anlisis inteligente a grandes volmenes de datos almacenados por los diferentes centros y sub-centros adscritos a la Secretaria Pblica Federal y Estatal conocidos como C4 justifican el uso de herramientas mas potentes que la estadstica convencional que permitan determinar relaciones multivariantes subyacentes. La minera de datos aplicada al 1 Chen, H., W. Chung, J. Xu. Crime Data Mining: A General Framework and Some Examples. IEEE Computer Society, vol. 37, no. 4. Pginas 50-56 2 Kantardzic, M. 2002. Data Mining: Concepts, models, methods and algorithms. Wiley- IEEE Press. ISBN 0-471-22852-4. 3 Han, J., M. Kamber, 2001. Data mining: Concepts and techniques. Morgan Kauffmann Publishers. anlisis de datos delictivos almacenados por el C4 es un campo bastante nuevo y que en los ltimos aos ha tomado gran importancia con la finalidad de otorgar mejores herramientas de anlisis y monitoreo de datos. En ste contexto, el objetivo de ste trabajo es comprobar la implementacin de minera de datos en el anlisis de informacin criminal en Mxico y comprobar su efectividad y valor agregado. 1. DESCRIPCIN DEL PROYECTO 1.1. Planteamiento del Problema El desarrollar sistemas informticos que son capaces de agilizar los diversos procesos administrativos es hoy en da de suma importancia, debido a la tendencia tecnolgica, la convergencia entre diferentes tecnologas y el almacenar los datos dentro de un repositorio central de almacenamiento se ha convertido en una prctica comn dentro de las TICs dejando a un lado la capacidad verdadera del procesamiento de los datos. Dentro de los Centros de Comunicaciones, Cmputo, Control y Comando C4 de las diferentes zonas del Estado de Hidalgo, se encuentran instalados diversos sistemas informticos capaces de realizar el procesamiento de la informacin, los cuales son utilizados para apoyar y servir a las diferentes corporaciones de seguridad pblica tanto a nivel Federal, Estatal como Municipal, para la elaboracin y diseminacin de decisiones de comando, as como la prevencin del delito y acontecimientos de proteccin civil. La funcionalidad principal de estos sistemas consiste primordialmente en coordinar y mantener en operacin el enlace con la red nacional de telecomunicaciones, adems de establecer y mantener la red estatal de radiocomunicacin al servicio de las instituciones de seguridad pblica que prestan sus servicios en el estado, y establecer mecanismos de suministro e intercambio de informacin entre las dependencias estatales de seguridad pblica es uno de los principales objetivos de dicho mecanismo. El flujo y el almacenamiento de informacin no permite realizar proyecciones especificas de los datos, tendencias acerca de las incidencias de los delitos, zonas seguras, zonas rojas, zonas con incremento de delincuencia, tablas porcentuales con incrementos dentro de lneas especificas de tiempo que demuestren las tendencias de incrementos de actos delictivos, grficas con datos proyectando lugares con mayor ndice de accidentes viales, tendencias o estadsticas porcentuales de llamadas telefnicas y registros de accidentes falsos, cantidad de accidentes atendidos o situaciones delictivas esclarecidas, incluyendo tiempos de respuestas basados en das, semanas o meses. Para atender a sta problemtica se requiere de un modelo estadstico-preventivo basado en las tecnologas de la informacin, la lgica de base de datos y minera de datos que permite atender el 80% de llamadas realizadas de manera inapropiada y el 20% de tipo correctivo en donde la ciudadana requiera la intervencin de alguna autoridad. El diseo de este modelo requiere de la implementacin de un algoritmo matemtico y estadstico programable que consiste en determinar de acuerdo a las tcnicas de la minera de datos, los casos con mayor incidencia y sus tendencias para determinar planes y programas preventivos que ayuden a erradicar o evitar el delito en determinadas regiones. Dentro la problemtica interna de la empresa se ha detectado lo siguiente: No se cuenta con una herramienta que sea capaz de analizar grandes volmenes de la informacin almacenada en el C4. Retardo en la consulta de informacin. Datos inconsistentes de informacin adems de poca calidad en los datos. Congestionamiento de informacin y sobresaturacin de los servicios informticos. Procesos de proyecciones y tendencias estadsticas de situaciones de riesgos inexistentes. Los procesos informticos en la toma de decisiones inteligentes, no se encuentran diseados o implementados. No existe un sistema inteligente capaz de procesar informacin almacenada para la toma de decisiones inteligentes. 1.2. Objetivo General Realizar un sistema informtico, que sea capaz de brindar informacin predictiva para la pronta atencin y prevencin de delitos o situaciones de riesgos para la poblacin en general mediante la minera de datos. 1.3. Objetivos Especficos Recopilar e integrar los datos histricos de los delitos ocurridos en el estado. Desarrollo del modelo de minera de datos para la realizacin de predicciones. Realizar la limpieza y transformacin de los datos. Obtener informacin predictiva para la pronta deteccin y prevencin del delito situaciones de riesgo para la poblacin en general. Generar estadsticas acerca de los delitos que ocurren en el Estado y representarlas por medio de grficas. Disear la arquitectura de software necesaria para el anlisis y captura de la informacin de la empresa. Diseo, desarrollo e implementacin de los mdulos de reportes y seguridad de acceso al sistema. 1.4. Justificacin Los sistemas de informacin y comunicacin forman una parte importante dentro del desarrollo tecnolgico de la sociedad moderna. La capacidad de procesamiento de la informacin dentro de una organizacin adquiere importancia cuando es necesario tener una respuesta rpida y eficiente a la hora de realizar una bsqueda, o cuando es necesario mantener actualizados sus datos. Sin embargo, dentro de estas enormes masas de datos almacenados en las organizaciones existe informacin oculta, de gran importancia estratgica, a la que no podemos acceder mediante tcnicas clsicas de recuperacin de informacin. La implementacin de las tcnicas de minera de datos ayuda a generar recomendaciones apropiadas para el diseo de planes de prevencin de delitos capaces de brindar informacin para la pronta atencin a situaciones de riesgo para la poblacin en general. Estas tcnicas aplicadas a los procesos, aportaran un gran beneficio ya que permiten dar respuestas a preguntas tales como: Cul es el delito que ocurre en cierta poca del ao? Cul es la zona con ms incidencia delictiva? Qu es lo que ms se roban? Encontrar respuestas a estas interrogantes permite, entre otras cosas, a mejorar el desempeo del C4 y maximizar la disponibilidad de los activos hacia la persona que lo requiere. 2. MARCO TEORICO 2.1. Business Intelligence Hoy en da una empresa que solo rene y administra sus datos, y que tal vez los revise de manera regular mediante informes bsicos, estn perdiendo casi por completo el valor estratgico. La Inteligencia de Negocios o Business Intelligence (BI), es la solucin a ese problema, pues por medio de dicha informacin puede generar escenarios, pronsticos y reportes que apoyen a la toma de decisiones, lo que se traduce en una ventaja competitiva. La clave para BI es poder transformar los datos en informacin, y la informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. Desde un punto de vista ms pragmtico, y asocindolo directamente con las tecnologas de la informacin, podemos definir Business Intelligence como el conjunto de metodologas, aplicaciones y tecnologas que permiten reunir, depurar y transformar datos de los sistemas transaccionales e informacin desestructurada (interna y externa a la compaa) en informacin estructurada, para su explotacin directa o para su anlisis y conversin en conocimiento, dando as soporte a la toma de decisiones4. 4 Sinnexus > Sinnexus Business Intelligence. Consultado el 02 marzo de 2012 INTRODUCCIN1. DESCRIPCIN DEL PROYECTO1.1. Planteamiento del Problema1.2. Objetivo General1.3. Objetivos Especficos1.4. Justificacin2. MARCO TEORICO2.1. Business Intelligence

Recommended

View more >