Información del curso¶
30 min | Última modificación: Noviembre 24, 2020.
Sobre este curso¶
Este es el documento de apoyo a la componente presencial del curso Descubrimiento de Conocimiento y Minería de Datos, ofrecido por la Facultad de Minas, Unversidad Nacional de Colombia, Sede Medellín. Este curso provee una base sólida en los aspectos prácticos de la extracción de conocimiento de información almacenada electronicamente. Entre los temas tratados se encuentran: la predicción de series de tiempo con técnicas estadísticas y de inteligencia artificial, el análisis de redes sociales, y la construcción de modelos predictivos para resolver problemas de clasifiación y regresión.
Este curso no pretende enseñar todo sobre cada una de las herramientas y metodologías abordadas, pero busca una comprensión profunda de los conceptos detrás de las tecnologías y su uso en la solución de problemas reales. Al final de este curso, el estudiante puede continuar su formación de forma autónoma.
Programa-Calendario¶
Calendario Académico.– Resolución 1154 de 2017 Rectoría.
Asignatura.– 3009590 Descubrimiento de Conocimiento y Minería de Datos.
Créditos.– Cuatro (4) que corresponden a un total de 196 horas por semestre, o equivalentemente un promedio de 12 horas semanales (3 en el aula de clase más 9 horas de trabajo independiente) durante 16 semanas. El objetivo del trabajo en el aula de clase es explicar y complementar los aspectos más importantes del curso; el estudiante es responsable de estudiar el material sugerido en la bibliografía.
Horario de Atención.– Atención virtual, cita previa por Google Meet.
Descripción y objetivos.– La minería de datos tiene como fin primordial el descubrimiento (automático o semiautomático) de patrónes útiles para la toma de decisiones en grandes conjuntos de datos estructurados, usualmente almacenados en una base de datos.
Conceptos previos necesarios.– Este curso es autocontenido, pero la experiencia previa en programación en los lenguajes Python y Julia son deseables.
Calendario y temas cubiertos.– El curso está dividido en dieciseis (16) bloques temáticos presenciales. Cada bloque está compuesto por una sesión presencial de tres (3) horas y su correspondiente evaluación. La evaluación será realizada usando la plataforma GitHub Classroom. Adicionalmente, durante el semestre se podrá a disposición de los estudiantes material adicional con el fin de que puedan profundizar sobre aspectos puntuales de los temas desarrollados. El calendario y temas cubiertos está disponible en https://jdvelasq.github.io/mineria-de-datos/index.html.
Bibliografía.– La bibliografía recomendada para este curso es la siguiente:
Megan Squire, 2016, Mastering Data Mining with Python - Finding patterns hidden in your data. Packt.
Robert Layton, 2015, Learning Data Mining with Python. Packt.
Max Bramer, 2007, Principles of Data Mining, Springer.
Nong Ye, 2014, Data Mining, theories, algorithms, and examples, CRC Press
Andrea Ahlemeyer-Stubbe, Shirley Coleman, 2014, A practical guide to Data Mining for Business and Industry. John Wiley and sons.
Metodología.– El desarrollo del curso está basado en la aplicación de metodologías de entrenamiento activo. Entre las técnicas se encuentran:
Conferencias magistrales por parte del docente.
Demostraciones.
Tutoriales y demás material de estudio.
Casos de estudio.
Talleres dirigidos.
Grupo de estudio para la solución de problemas, ejercicios y talleres en las sesiones presenciales.
Estudio individual por parte del estudiante.
Las sesiones están diseñadas para que el estudiante desarrolla conceptos fundamentales sólidos sobre los temas tratados. El estudiante debe esforzarse por reforzar dichos conocimientos a partir de la lectura del material sugerido y la elaboración de ejercicios y tareas de programación.
Asistencia y atención a la clase.– El estudiante debe asistir y participar, al menos, a nueve (9) bloques completos durante el semestre para que la asignatura no sea cancelada por inasistencia. Los teléfonos celulares deben ser apagados al entrar a clase. Si usted debe obligatoriamente responder una llamada, deberá retirarse del aula de clase y no retornar hasta que la haya finalizado. El uso de portátiles está permitido en clase con el fin de tomar notas y realizar actividades del curso; el uso persistente del computador en actividades no pertinentes a la clase dará como resultado que la sesión sea considerada como no asistida.
Evaluación.– El curso tiene una calificación numérica entre cero (0.0) y cinco (5.0). La evaluación será realizada usando la plataforma GitHub Classroom. El peso de cada actividad se informará durante el semestre. Las tareas de programación serán evaluadas de forma automática. Todas las tareas deberá ser entregadas a través de los repositorios de GitHub creados para tal fin. Los trabajos entregados por cualquier otro medio serán calificados como no presentados.
Nota
El sistema estará habilitado para la recepción de trabajos y presentación de actividades hasta las 23:00 horas del día de vencimiento de la actividad. El sistema se cierra automáticamente. Realice la subida de archivos y demás tareas con la debida anticipación y verifique que los archivos hayan subido correctamente.
Foro de Discusión.– Se habilitará un foro de discusión para que los estudiantes puedan interactuar de forma colaborativa entre ellos, con el fin de resolver dudas o inquietudes sobre los temas del curso. Esta prohibida cualquier publicación relacionada con los temas de las evaluaciones. Los estudiantes que publiquen las soluciones de exámenes y tareas de programación tendrán una nota de cero punto cero (0.0) en la actividad correspondiente y serán procesados por fraude ante las instancias respectivas. El foro será monitoreado constantemente.
Supletorios.— Solo se harán supletorios a las actividades programadas cuando estas no hayan sido presentadas por caso fortuito o fuerza mayor; el estudiante deberá anexar las pruebas pertinentes al solicitar el supletorio.
Reclamos.— Únicamente se recibirán reclamos debidamente soportados con evidencias.
Fraudes y otras faltas a la ética.– En este curso se sigue estrictamente la política de la Universidad Nacional de Colombia, y en particular el Acuerdo CSU 044 de 2009.
Monitor.– Por definir.