Curso:

"Análisis y Extracción de Conocimiento en Sistemas de Información:

Datawarehouse y Datamining"

Departamento de Sistemas Informáticos y Computación
Universidad Politécnica de Valencia




DURACIÓN:  30 horas: 12 horas teóricas + 8 prácticas asistidas + 10 de trabajo individual

FECHAS:  Chihuahua (Instituto Tecnológico de Chihuahua), México, 9-11 de octubre de 2003. Similares cursos se han impartido en la Universidad de El Salvador y en la UTFSM de Chile (www.mti.cl).

PROFESOR:  JOSÉ HERNÁNDEZ ORALLO

OBJETIVOS:

El objetivo fundamental de este curso es conocer la necesidad y conceptos generales de la tecnología de almacenes de datos y OLAP y saber aplicar las técnicas de minería de datos apropiadas para problemas concretos de extracción de conocimiento útil para el análisis o la toma de decisiones.
Entre los objetivos más específicos, los alumnos serán capaces, al finalizar el curso, de: Además, y especialmente dirigido a los asistentes del mundo académico:

DESCRIPCIÓN:

En este curso se presentará el problema del análisis de sistemas de información para la toma de decisiones y las herramientas genéricas y las tecnologías más avanzadas para llevarlo a cabo.
En primer lugar, se presentan las técnicas de Almacenes de Datos y OLAP para facilitar el procesamiento analítico de apoyo a la toma de decisiones estratégicas.
En segundo lugar, y con más extensión, se presentá la necesidad del análisis inteligente y automático de la información para el descubrimiento de conocimiento útil.
Para abordarlo, se introducirá el área de la Extracción de Conocimiento a partir de Bases de Datos (KDD), sus fases, en especial la de minería de datos, y se presentarán las técnicas de aprendizaje automático más habituales en minería de datos. Se estudiará la idoneidad de cada una para diferentes problemas.
El seminario intercala la presentación de conocimientos teóricos con la aplicación práctica de los mismos sobre un paquete de minería de datos (SPSS Clementine).


Temario

PARTE I: INTRODUCCIÓN
1.1. Finalidades y Evolución de los Sistemas de Información.
1.2. Herramientas para la Toma de Decisiones: diferencias e interrelación.
1.3. Almacenes de Datos, OLAP y Minería de Datos: definición e interrelación.

PARTE II: ALMACENES DE DATOS
2.1. Introducción a los almacenes de datos: motivación definición y características.
2.2. Arquitectura de un sistema de almacén de datos.
2.3. Explotación de un almacén de datos: herramientas OLAP.
2.4. Sistemas ROLAP y MOLAP.
2.5. Carga y Mantenimiento de un Almacén de Datos.
2.6. Diseño de un almacén de datos.
2.7. Líneas de investigación abiertas.

PARTE III: MINERÍA DE DATOS
3.1. Introducción a la Minería de Datos (DM)
  3.1.1. Motivación
  3.1.2. Problemas tipo y aplicaciones
  3.1.3. Relación de DM con otras disciplinas
3.2. El proceso de KDD
  3.2.1. Las Fases del KDD
  3.2.2. Tipología de Técnicas de Minería de Datos
  3.2.3. Sistemas Comerciales
  3.2.4. Visualización
3.3. Técnicas de Minería de Datos
  3.3.1. El Problema de la Extracción Automática de Conocimiento.
  3.3.2. Evaluación de Hipótesis
  3.3.3. Técnicas no supervisadas y descriptivas.
  3.3.4. Técnicas supervisadas y predictivas.
3.4. Web Mining
  3.4.1. Los Problemas de la Información No Estructurada.
  3.4.2. Extracción de Conocimiento a partir de Documentos HTML y texto.
  3.4.3. Extracción de Información semi-estructurada (XML).
3.5. Líneas de Investigación Abiertas


Transparencias (PDF/PPT)

Presentación (PDF / PPT)

Teoría

PARTE I (PDF / PPT)

PARTE II (PDF / PPT)

PARTE III

Punto 3.1 (PDF / PPT)

Punto 3.2 (PDF / PPT)

Punto 3.3 (PDF / PPT)

Punto 3.4 (PDF / PPT)

Punto 3.5 (PDF / PPT)

Prácticas
Boletín Práctica 1
Boletín Práctica 2
Boletín Práctica 3

(Ejemplos utilizados en prácticas 1 y 2: LabKDD)



Transparencias Relacionadas: curso de doctorado "Extracción de Conocimiento"


Información sobre sistemas, enlaces web, etc.


Libro de Minería de Datos


Volver a la página principal.

© 2003 José Hernández Orallo.