Master
en Dirección y Gestión de Sistemas de Información,
DSIC
Curso (20h):
"Minería de Datos"
HORAS: 20
Curso 2000/2001. FECHAS: Del 19 de Junio al 3 de Julio de
2001. Lunes y
Martes
de 5 a 9 horas (4 horas)
Curso 2001/2002. FECHAS: Del 8 de febrero al 22 de febrero
de 2001.
Viernes
de 17h a 21h y Sábados de 10h a 14h (4 horas)
Curso 2003/2004. FECHAS: Del 17 de noviembre al 1 de
diciembre de 2003. Lunes y Martes 17h a 21h (4 horas)
Curso 2004/2005. FECHAS: Del 10 de enero al 24 de enero de
2005. Lunes y Martes 17h a 21h (4 horas)
Curso 2005/2006. FECHAS: Del 20 de diciembre de 2005 al 17
de enero de
2006. Lunes y Martes 17h a 21h (4 horas)
Curso 2006/2007. FECHAS: Del 4 de diciembre de 2006 al 19
de diciembre de
2006. Lunes y Martes 17h a 21h (4 horas)
PROFESOR: HERNANDEZ
ORALLO,
JOSE
OBJETIVOS:
El objetivo fundamental de este curso es saber aplicar las
técnicas
de minería de datos apropiadas para problemas concretos de
extracción
de conocimiento útil para el análisis o la toma de
decisiones.
Entre los objetivos más específicos, los alumnos
serán
capaces, al finalizar el seminario, de:
- Reconocer la problemática del análisis de grandes
volúmenes
de datos y de los beneficios de su uso sistemático para la
obtención
de modelos y patrones predictivos o descriptivos.
- Conocer las fases del Descubrimiento de Conocimiento de Bases de
Datos
y la importancia de las mismas en el éxito del proceso (en
especial
las de limpieza y selección de datos).
- Conocer las distintas técnicas de aprendizaje
automático
y estadísticas utilizadas en minería de datos, su
potencial,
su coste computacional y sus limitaciones de representación y de
inteligibilidad.
- Elegir, para un problema concreto, qué técnicas de
minería
de datos son más apropiadas.
- Generar los modelos y patrones elegidos utilizando una
herramienta o
paquete
de minería de datos.
- Evaluar la calidad de un modelo, utilizando técnicas
sencillas
de
evaluación (validación cruzada).
- Utilizar métodos de combinación de técnicas
(p.ej.
voting) y de reiteración (p.ej. boosting).
- Conocer la problemática especial de la minería
sobre la
web
(documentos textuales e hipertextuales) y las técnicas
más
usuales.
DESCRIPCION:
En este curso se presentará el problema del análisis
inteligente
y automático de la información para el descubrimiento de
conocimiento útil. Para abordarlo, se introducirá el
área
de la Extracción de Conocimiento a partir de Bases de Datos
(KDD),
sus fases y se presentarán las técnicas de aprendizaje
automático
más habituales en minería de datos. Se estudiará
la
idoneidad de cada una para diferentes problemas.
El seminario intercala la presentación de conocimientos
teóricos
con la aplicación práctica de los mismos sobre un paquete
de minería de datos (SPSS Clementine).
Temario
1. Introducción a la Minería de Datos (DM)
1.1. Motivación
1.2. Problemas tipo y aplicaciones
1.3. Relación de DM con otras disciplinas
2. El proceso de KDD
2.1. Las Fases del KDD
2.2. Tipología de Técnicas de
Minería
de Datos
2.3. Sistemas Comerciales
2.4. Visualización
3. Técnicas de Minería de Datos
3.1. El Problema de la Extracción
Automática
de Conocimiento.
3.2. Evaluación de Hipótesis
3.3. Técnicas no supervisadas y descriptivas.
3.4. Técnicas supervisadas y predictivas.
4. Web Mining
4.1. Los Problemas de la Información No
Estructurada.
4.2. Extracción de Conocimiento a partir
de Documentos HTML y texto.
4.3. Extracción de Información
semi-estructurada
(XML).
5. Otros Aspectos
Transparencias (PDF)
Presentación
Teoría
Tema 1
Tema 2
Tema 3
Tema 4
Tema 5
Prácticas
Boletín Práctica
1a
Boletín Práctica 1b
Boletín
Práctica
2
Boletín Práctica
3
Boletín
Práctica 4
Boletín Práctica 5
(Ejemplos utilizados en prácticas: LabKDD)
(Ejercicios propuestos:: LabKDD2)
Transparencias
Relacionadas: curso de doctorado "Extracción de Conocimiento"
Volver a la página principal.
© 2001-2006 José
Hernández Orallo.