SUBJECT NAME |
PLATAFORMAS PARA PROCESAMIENTO DE DATOS MASIVOS |
CODE |
28070060 |
SESSION |
2023/2024 |
DEGREE IN WHICH IT IS OFFERED |
MÁSTER UNIVERSITARIO EN INDUSTRIA CONECTADA
|
TYPE |
CONTENIDOS |
CREDITS NUMBER |
5 |
HOURS |
125 |
PERIOD |
SEMESTER 1
|
LANGUAGES AVAILABLE |
CASTELLANO |
PRESENTACIÓN
El trabajo con datos masivos exige la utilización de infraestructuras computacionales específicamente diseñadas para ellos. Estas infraestructuras difieren de las infraestructuras tradicionales en varios aspectos. Para empezar, es necesario combinar la potencia de cómputo de muchos ordenadores, construyendo lo que se conoce como un cluster de ordenadores. Por otro lado, es necesario utilizar paradigmas de programación que puedan aprovechar la potencia de cómputo del cluster pero de una forma sencilla para el desarrollador encargado de implementar los programas para el análisis de datos masivos. Ambos aspectos pueden desarrollarse utilizando servicios de proveedores en la nube. En esta asignatura se muestran algunas de las tecnologías más importantes que permiten desplegar infraestructuras para el procesamiento de datos masivos.
Dentro de este Máster es importante adquirir una visión sólida de las herramientas más utilizadas en ese contexto, dado que son esenciales para mover y tratar datos masivos, tanto estructurados como no estructurados.
CONTEXTUALIZACIÓN
La asignatura de "Plataformas para Procesamiento de Datos Másivos" se trata de una asignatura de 5 créditos ECTS, con carácter optativo, impartida en el primer semestre del Máster Universitario en Industria Conectada. Los estudiantes que cursen esta asignatura optativa adquirirán la siguiente competencia específica "Conocer y ser capaz de usar plataformas para el análisis de datos masivos en contextos de industria conectada".
Esta asignatura guarda relación más directa con las siguientes asignaturas también disponibles en el mismo Máster:
- Computación en la Nube para Entorno Industriales
- Visualización y Analítica de Datos Masivos
El Equipo Docente propone una serie de libros disponibles de forma gratuíta dentro de la biblioteca digital de la UNED. Se proporcionan enlaces a los libros que funcionan tras autenticarse en UNED.es:
Título: MapReduce Design Patterns
Autores: Donald Miner; Adam Shook
Editorial: O'Reilly Media, Inc.
Año, 2012
ISBN-13 en papel: 978-1-4493-2717-0
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/mapreduce-design-patterns/9781449341954/
Título: Hadoop: The Definitive Guide, 4th Edition
Autor:Tom White
Editorial: O'Reilly Media, Inc.
Año: 2015
ISBN-13 en papel: 978-1-4919-0163-2
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/hadoop-the-definitive/9781491901687/
Título: Practical Hadoop Ecosystem: A Definitive Guide to Hadoop-Related Frameworks and Tools
Autor: Deepak Vohra
Editorial: Apress
Año: 2016
ISBN-13 en papel: 978-1-4842-2198-3
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/practical-hadoop-ecosystem/9781484221990/
Título: Designing Data-Intensive Applications
Autor: Martin Kleppmann
Editorial: O'Reilly Media, Inc.
Año: 2017
ISBN-13 en papel: 978-1-4493-7332-0
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/designing-data-intensive-applications/9781491903063/
Titulo: Apache Hive Cookbook
Autores: Hanish Bansal; Saurabh Chauhan; Shrey Mehrotra
Editorial: Packt Publishing
Año: 2016.
ISBN-13 en papel: 978-1-78216-108-0
ISBN-13 web: 978-1-78216-109-7
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/apache-hive-cookbook/9781782161080/
Título: Hadoop with Python
Autores: Zachary Radtka, Donald Miner
Editorial: O’Reilly
Año: 2015
ISBN: 978-1-491-94227-7
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/hadoop-with-python/9781492048435/
Título: Fast Data Processing with Spark 2 -Third Edition
Autor: Krishna SankarEditorial: Packt Publishing
Año:2016ISBN-13 en papel:978-1-78588-927-1
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/fast-data-processing/9781785889271/
Título: Sams Teach Yourself Apache Spark™ in 24 Hours
Autor: Jeffrey Aven.
Editorial: SamsAño:2016.
ISBN-13 en papel:978-0-672-33851-9.
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/sams-teach-yourself/9780134445786/
Título: Mastering Apache Spark 2.x -Second Edition
Autor: Romeo Kienzler
Editorial: Packt Publishing
Año:2017
ISBN-13 en papel:978-1-78646-274-9
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/mastering-apache-spark/9781786462749/
Título: Apache Spark 2.x Cookbook
Autor: Rishi Yadav
Editorial: Packt Publishing
Año: 2017
ISBN-13 en papel:978-1-78712-726-5
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/apache-spark-2x/9781787127265/
Título: Spark for Python Developers
Autor: Amit Nandi
Editorial: Packt Publishing
Año: 2015
ISBN-13 en Web: 978-1-78439-737-1
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/spark-for-python/9781784399696/
Título: Machine Learning with Spark -Second Edition
Autor:Rajdeep Dua; Manpreet Singh Ghotra; Nick Pentreath
Editorial: Packt Publishing
Año: 2017
ISBN-13 en papel:978-1-78588-993-6
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/machine-learning-with/9781785889936/
Título: Spark GraphX in Action
Autor:Michael S. Malak and Robin East
Editorial: Manning Publications
Año:2016
ISBN-13: 978-1-61729-252-1
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/spark-graphx-in/9781617292521/
Título: Spark in Action
Autor:Petar Zeevi, Marko Bonai
Editorial: Manning Publications
Año: 2016
ISBN-13: 978-1-61729-260-6
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/spark-in-action/9781617292606/
Título: Streaming Systems
Autor: Reuven Lax, Slava Chernyak, Tyler Akidau
Editorial: O'Reilly Media, Inc.
Año: 2018
ISBN-13: 978-1-49198-387-4
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/streaming-systems/9781491983867/
Título: Kafka: The Definitive Guide
Autor: Gwen Shapira, Neha Narkhede, Todd Palino
Editorial: O'Reilly Media, Inc.
Año: 2017
ISBN-13: 978-1-49193-616-0
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/kafka-the-definitive/9781491936153/
Título: Stream Processing with Apache Spark
Autor: Francois Garillot, Gerard Maas
Editorial: O'Reilly Media, Inc.
Año: 2019
ISBN-13: 978-1-49194-424-0
URL (solamente funciona tras autenticarse en UNED.es):
https://learning.oreilly.com/library/view/stream-processing-with/9781491944233/