Código: 721202 | Asignatura: Computación Avanzada y sus Aplicaciones a Ingeniería | ||||
Créditos: 6 | Tipo: | Curso: NULL_VALUE | Periodo: 1º S | ||
Departamento: Estadística, Informática y Matemáticas | |||||
Profesorado: | |||||
SANZ DELGADO, JOSÉ ANTONIO [Tutorías ] | GALAR IDOATE, MIKEL (Resp) [Tutorías ] |
En esta asignatura se van a estudiar diferentes técnicas para hacer un cómputo eficiente de los datos. Se presentarán diferentes técnicas para el tratamiento de los datos. A partir de ellas, el alumno debe ser capaz de planear y desarrollar soluciones a diversos problemas de la vida real. También se iniciará a los alumnos en el tratamiento de grandes cantidades de datos (Big Data) y en el paradigma de programación Map-Reduce para el procesamiento en paralelo. Con este objetivo se introducirá al alumno en el uso de Apache Spark para procesar y extraer conocimiento de grandes bases de datos.
R1. Saber adquirir, obtener, formalizar y representar el conocimiento humano en forma computable.
R2. Manejar las herramientas metodológicas y de implementación para la simulación de altas prestaciones en problemas y aplicaciones de ingeniería.
R3. Utilizar entornos y herramientas para medir el rendimiento en problemas de computación aplicados a la ingeniería.
R4. Diseñar sistemas inteligentes adecuados para tratar problemas de la vida real.
R5. Utilizar sistemas expertos avanzados para resolver problemas en ingeniería.
R6. Comprender las técnicas de aprendizaje bayesiano.
Metodología - Actividad | Horas Presenciales | Horas no presenciales |
A-1 Clases expositivas/participativas | 28 | |
A-2 Prácticas | 27 | |
A-3 Realización de proyectos en grupo | 30 | |
A-4 Estudio y trabajo autónomo del estudiante | 60 | |
A-5 Tutorías y pruebas de evaluación | 5 | |
Total | 60 | 90 |
Resultado de aprendizaje | Actividad de evaluación | Peso (%) | Carácter recuperable | Nota mínima requerida |
R1, R4, R5, R6 | Realización de una o más pruebas teórico-prácticas de los conceptos de la materia | 40% | Sí | 4 sobre 10 |
R1, R2, R3, R4, R5, R6 | Trabajos, informes y presentaciones en los que se apliquen, analicen, desarrollen o recojan una o más de las partes de la asignatura | 50% | Sí | 5 sobre 10 |
R1, R4, R5, R6 | Pruebas de duración corta para la evaluación continua | 10% | Sí | - |
La evaluación de recuperación consistirá en un examen teórico-práctico que recuperará los apartados primero y tercero. Para recuperar el apartado segundo, el alumno deberá volver a entregar y presentar aquellos trabajos y memorias con calificación inferior a 5.
Aquellos estudiantes que no lleguen a la nota mínima en los apartados primero o segundo, tendrán como calificación final la mínima de estas dos.
1. Introducción a la computación avanzada y la minería de datos
2. Problemas de clasificación y regresión. Evaluación y medidas de rendimiento
3. Introducción al Big Data
4. Programación de altas prestaciones en Apache-Spark
5. Métodos computacionales avanzados para el aprendizaje
Práctica 1: Clasificación en teledetección
Práctica 2: Evaluación y comparativa de modelos
Práctica 3: Implementación de un modelo de clasificación
Práctica 4: Aprendizaje semi-supervisado
Práctica 5: Clasificación con conjuntos de datos desbalanceados
Práctica 6: Big Data - RDDs
Práctica 7: Big Data - DataFrames
Práctica 8: Big Data - Machine Learning
Trabajo final de la asignatura
Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.
Introducción a la Minería de Datos (2004). Hernández, Ramírez y Ferri. Prentice Hall. Editorial Pearson, ISBN: 8420540919
Pattern Classification (2000). Richard O. Duda, Peter E. Hart, David G. Stork. Wiley-Interscience, ISBN: 978-0471056690
Data mining and knowledge discovery handbook (2010). Odied Maimon y Lior Rokach. Springer. ISBN: 978-0387098234
Big Data: A Revolution That Will Transform How We Live, Work and Think (2013). Victor Mayer-Schonberger. John Murray Publishers Ltd., ISBN: 978-1848547926
Mahout in Action (2011). Sean Owen, Robin Anil, Ted Dunning. Manning Publications, ISBN: 978-1935182689
Hadoop: The Definitive Guide (2015). Tom White. O'Reilly Media, ISBN: 978-1491901632
Mining of Massive Datasets (2014). Jure Lescovec, Anand Rajaraman, Jeffrey D. Ullman. Cambridge University Press, ISBN: 978-1107077232
Advanced Analytics with Spark: Patterns for Learning from Data at Scale (2015). Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills. O'Reilly Media, ISBN: 978-1491912768
High Performance Spark: Best practices for scaling and optimizing Apache Spark (2017), Holden Karau, Rachel Warren. O'Reilly Media, ISBN: 978-1491943205
Spark - The Definitive Guide: Big data processing made simple (2018), Bill Chamers, Matei Zaharia. O'Reilly Media, ISBN: 978-1491912218
Learning Spark, 2nd Edition: Lightning-Fast Data Analytics (2020), Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee. O'Reilly Media, ISBN: 978-1492050049
Spark in Action, Second Edition (2020), Jean-Georges Perrin. Manning Publications, ISBN: 978-1617295522
Large-scale Data Analytics with Python and Spark: A Hands-on Guide to Implementing Machine Learning Solutions (publicación estimada, septiembre 2023). Cambridge University Press, ISBN: Pendiente.
Las clases de teoría y de prácticas se imparten en el aulario y los edificios departamentales del Campus de Arrosadía.