WARNING:
JavaScript is turned OFF. None of the links on this concept map will
work until it is reactivated.
If you need help turning JavaScript On, click here.
Este Cmap, tiene información relacionada con: Capítulo 3.- Data warehouse, Patrones secuenciales ???? • Detectan patrones entre transacciones, lo que permite optimizar las ventas a lo largo tiempo. • Permiten especificar el factor de soporte mínimo para las secuencias que deben ser detectadas., 3.3.5 Proyecto de Data Mininng: consideraciones generales 3.3.5.2 Metodologías de desarrollo para los proyectos de Data Mining 1. Sample (muestra), consiste en crear una o tablas de datos tomando muestras 2. Explore explorar estas muestras ya sea visualmente o numéricamente 3. Modify (modificar), se refiere a la creación, transformación y selección de una o más variables 4. Model (modelar), consiste en crear un modelo de datos a través de la utilización 5. Assess (evaluar), como su nombre lo indica evalúa el modelo para determinar que tan bien funcionó, 3.3.3.2.2 Descubrimiento de asociaciones y patrones secuenciales DECUBRIMIENTO DE LAS ASOCIACIONES Análisis de asociaciones, Capítulo 3.- Data warehouse: herramientas de verificación y técnicas de descubrimiento de información 3.4 Aplicaciones de minería de datos Los modelos de predicción de vulnerabilidad se desarrollan empleando un proceso de cinco etapas:, Existen numerosas técnicas que soportan las cuatro operaciones básicas de la minería de datos; Se usa la Técnica de minería de datos Técnicas de inducción supervisada Técnicas de descubrimiento y patrones secuenciales Técnicas de clustering Técnicas estadísticas, Teniendo en cuenta el objetivo de seleccionar clientes con alta propensión de compra de fondos, un sistema de minería de datos no sólo identifica cuál es el segmento más idóneo, sino cuales de los integrantes del mismo son buenos candidatos para cada tipo de campaña promocional que puede ser ejecutada por el banco. 3.3.2.2.1 La minería de datos y los métodos estadísticos • Técnicas de visualización y descriptivas, tales como: promedios y evaluación de variaciones, porcentajes y correlaciones simples • Análisis de clusters, consiste en organizar la información en grupos de datos que sean heterogéneos a los que se los conoce como clusters de datos • Análisis de correlaciones, se encarga de medir las relaciones entre dos variables. • Análisis de factores, es útil para entender las correlaciones entre un grupo de variables • Análisis de regresión, es una herramienta estadística que determina la relación entre dos o más variables cuantitativas, 3.3.3 Operaciones y técnicas de minería de datos 3.3.3.2 Técnicas de minería de datos 3.3.3.2.1 Inducción supervisada, 3.3.5 Proyecto de Data Mininng: consideraciones generales 3.3.5.2.3 Modelo CRISP-DM Es conocido como el modelo estándar de la industria. El modelo inició como un proyecto a mediados de 1997 con el auspicio de la Comisión Europea., Análisis de asociaciones ???? • Detecta elementos en una transacción que implica la presencia de otros elementos en ésta misma. • Expresa las afinidades entre elementos en forma de asociación X FB facilitando una serie de métricas como el soporte, cofianza, tipo de la regla, etc. • Permite especificar los niveles de soporte y confianza mínimas para las reglas que deben ser detectadas así como los elementos que deben o no incluir. • Permite incorporar taxonomías de productos, habilitando la detección de asociaciones a diferentes niveles., Capítulo 3.- Data warehouse: herramientas de verificación y técnicas de descubrimiento de información 3.2 Herramientas de verificación 3.2.2 Herramientas de consulta e informes, 3.2.5 Navegación sobre los datos Navegación • Rotar y Rebanar (slice & dice): Rotar es aventar el cubo como si fuera un dado para obtener una nueva cara del cubo. • Taladrar (drill down & roll up): Consiste en abrir los datos de las dimensiones se con el fin de obtener más detalle, 3.2.5 Navegación sobre los datos Navegación Esta facilidad de navegación nos permite: - La posibilidad de cambiar los ejes de análisis (slice & dice). - La posibilidad de cambiar de forma interactiva los niveles de agregación (drill down & roll up)., 3.3.4 Segmentación Agrupación automática de registros que comparten características similares Segmentación basada en el análisis relacional (particionado), 3.2.6 Arquitecturas OLAP Arquitecturas • M-OLAP (multidimensional on-line analytical processing), en cambio, los datos se encuentran almacenados en ficheros con estructura multidimensional, 3.3.3.2.2 Descubrimiento de asociaciones y patrones secuenciales DECUBRIMIENTO DE LAS ASOCIACIONES Patrones secuenciales, 3.3.3 Operaciones y técnicas de minería de datos 3.3.3.1 Operaciones de minería de datos Durante el desarrollo de un proyecto de Data Mining se presentan diferentes tipos de problemas o tipos de análisis que se deben ejecutar., 3.3.3 Operaciones y técnicas de minería de datos 3.3.3.2 Técnicas de minería de datos 3.3.3.2.2 Descubrimiento de asociaciones y patrones secuenciales, Durante el desarrollo de un proyecto de Data Mining se presentan diferentes tipos de problemas o tipos de análisis que se deben ejecutar. Los análisis de Data Mining permiten también realizar este tipo de análisis a través de diferente tipo de operaciones posible; entre las que encontramos están: - Sumarización de datos. Permiten tener una visión general de la estructura de los datos. Generalmente este es utilizado en las primeras instancias de un proyecto - Modelos de predicción y clasificación. El objetivo de esta operación es emplear el contenido histórico de las bases de datos para generar de forma automática un modelo que pueda predecir el comportamiento futuro la creación de este tipo de modelos ha sido abordada mediante el empleo de técnicas estadísticas - Análisis de asociaciones. el objetivo del análisis de asociaciones es establecer relaciones entre los registros de una base de datos. - Segmentación de base de datos. - Proporcionan mucha información sobre las características de las bases de datos que procesan. - Son un óptimo punto de partida para la aplicación posterior de otras operaciones. - Detección de desviaciones. su objetivo es identificar puntos espurios en un conjunto de datos determinado, y explicar si son debidos a la presencia de ruido u otras impurezas presentes en los datos, o bien a relaciones causales., Fue desarrollado por SPSS y es muy similar a la propuesta SEMMA. Este modelo fue patrocinado hasta finales del primer semestre del 2001 hasta que SPSS decidió patrocinar la metodología CRISP-DM. ???? Asses Access Analyse Act Automate, Capítulo 3.- Data warehouse: herramientas de verificación y técnicas de descubrimiento de información 3.4 Aplicaciones de minería de datos • Telecomunicaciones y compañías de tarjetas de crédito • Medicina • Instituciones Financieras • Vendedores • Firmas farmacéuticas