Big data es un término que describe el gran volumen de datos – estructurados y no estructurados – que inundan una empresa todos los días. Pero no es la cantidad de datos lo importante. Lo que importa es lo que las organizaciones hacen con los datos. El big data puede ser analizado para obtener insights que conlleven a mejores decisiones y acciones de negocios estratégicas.
El presente curso tiene como objetivo presentar los métodos y técnicas básicas para el procesamiento y análisis de datos en el contexto de Big Data.
No prentende ser un curso exhaustivo sobre Machine Learning ni sobre métodos estadísticos, simplemente se pretenden mostrar las características principales de estas técnicas para que el alumno pueda tener una visión general de las opciones que ofrece el análisis de datos para poder explorar, confirmar indicios y en definitiva, extraer conclusiones.
El curso está dirigido a estudiantes y profesionales que deseen aproximarse al procesamiento y análisis de datos en Big Data.
Aunque no es un requisito indispensable tener experiencia en análisis de datos o en entornos Big Data.
El curso puede resultar especialmente interesante con ciertos conocimientos de análisis de datos que deseen introducirse en el entorno Big Data, por otro lado, también resultará interesante a estudiantes aquellos estudiantes con cierta experiencia en entornos Big Data que deseen adquirir una mayor visión analítica.
En este sentido el curso pretende ofrecer recursos realistas en el contexto Big Data y por este motivo se trabajará de una máquina virtual con la aplicación Jupyter como enlace para desarrollar los modelos y técnicas con PySpark.
El curso está dividido en 4 módulos más o menos independientes aunque se recomienda realizarlos de forma secuencial.
En el Módulo 1 se presentan los diferentes problemas y técnicas más habituales para analizar datos desde una perspectiva general. También se introduce el caso de estudio y las herramientas de trabajo que se emplearán.
El resto de módulo está dedicado a la tarea de Exploración y Pre-Proceso de los datos, incluidas consultas, tareas de gestión, resúmenes numéricos y gráficos. Los siguientes módulos se focalizan en las técnicas de análisis.
El Módulo 2 se centra en técnicas de modelización básica, en particular regresión y regresión logística. Además de repasar las etapas de calibración del modelo, también se incluyen las etapas de validación y simplificación.
El módulo 3 está plenamente dedicado a la técnica de Árboles de Regresión y Clasificación. También se incluyen los bosques aleatorios.
El módulo final contiene la técnica de Redes neuronales para clasificación y también una introducción a las técnicas No supervisadas, en particular, reducción de dimensión a través del análisis de componentes principales y la clasificación automática a través del análisis de clústers.
Los ejercicios y sesiones prácticas pretenden mostrar un caso práctico de procesamiento y análisis de datos en el contexto de Big Data.
En este sentido, será necesario trabajar con una máquina virtual que ya trae configuradas e instaladas una serie de componentes habituales al manejar Big Data.
En este apartado te explicamos cómo descargar e instalar la máquina virtual Cloudera en tu ordenador.
La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco.
Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma
Verás que algunos vídeos llevan un código entre paréntesis que coinciden con el nombre de alguno de estos archivos.
Esto significa que en el vídeo correspondiente se trabaja con dicho fichero.
A continuación te explicamos como incorporarlos en la máquina virtual.
Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.
Desde la perspectiva de Big Data, se incluyen aspectos relacionados con la regularización de los modelos para su simplificación.
Como en el módulo anterior, visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.
Después de cada tema, o de unos pocos temas, encontrarás un cuestionario para comprobar tu nivel de comprensión de los mismos.
Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.
En este módulo, además de los cuestionarios convencionales, tendrás que realizar un trabajo práctico en el que trabajarás las técnicas aprendidas hasta el momento.
Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, realiza los ejercicios prácticos, y accede a los foros para discutir los temas que te parezcan más interesantes.
Este curso es ofrecido desde la plataforma de Coursera, es un curso que puedes obtener de manera gratuita bajo ciertas condiciones.
La primera opción es elegir la opción de “Curso gratuito sin certificado”, de esta manera podrás acceder al contenido del curso y finalizarlo, pero no podrás obtener un certificado de finalización avalado por la plataforma.
La segunda opción es elegir “auditar curso”, con esta opción podrás acceder al contenido de video del curso, pero no podrás realizar los exámenes ni obtener el certificado de finalización. Si no ves la opción de auditar curso, debes verificar en la parte de abajo usando el scroll (en forma de link).
Las opciones varían dependiendo el curso, pero con cualquiera de las dos podrás acceder gratuitamente al contenido. Por si fuera poco, algunos cursos tienen la opción de ayuda económica, con los cuales puedes solicitar dicho apoyo y ser acreedor de un curso de pago.
Para obtener el curso de manera gratuita da clic en el siguiente botón:
Aprende inglés sin gastar un peso. Fundación Carlos Slim lanza plataforma con recursos certificados internacionalmente.…
Curso completo de Python por IBM: desde básico hasta APIs. Certificación gratuita con ejercicios prácticos.…
Universidad abre inscripciones para curso gratuito de Python. Aprende desde cero con respaldo académico y…
Inicia tu carrera en ciberseguridad con CISCO. Curso gratuito con certificación oficial y contenido en…
Fundación Carlos Slim presenta catálogo 2024 de cursos gratuitos. Capacítate en línea y obtén certificación…
Descubre los cursos gratuitos de Google con certificación oficial. Aprende marketing digital, desarrollo web y…