Curso GRATUITO en ESPAÑOL sobre Big Data: procesamiento y análisis

Big data es un término que describe el gran volumen de datos – estructurados y no estructurados – que inundan una empresa todos los días. Pero no es la cantidad de datos lo importante. Lo que importa es lo que las organizaciones hacen con los datos. El big data puede ser analizado para obtener insights que conlleven a mejores decisiones y acciones de negocios estratégicas.

El presente curso tiene como objetivo presentar los métodos y técnicas básicas para el procesamiento y análisis de datos en el contexto de Big Data.

No prentende ser un curso exhaustivo sobre Machine Learning ni sobre métodos estadísticos, simplemente se pretenden mostrar las características principales de estas técnicas para que el alumno pueda tener una visión general de las opciones que ofrece el análisis de datos para poder explorar, confirmar indicios y en definitiva, extraer conclusiones.

El curso está dirigido a estudiantes y profesionales que deseen aproximarse al procesamiento y análisis de datos en Big Data.

Aunque no es un requisito indispensable tener experiencia en análisis de datos o en entornos Big Data.

El curso puede resultar especialmente interesante con ciertos conocimientos de análisis de datos que deseen introducirse en el entorno Big Data, por otro lado, también resultará interesante a estudiantes aquellos estudiantes con cierta experiencia en entornos Big Data que deseen adquirir una mayor visión analítica.

En este sentido el curso pretende ofrecer recursos realistas en el contexto Big Data y por este motivo se trabajará de una máquina virtual con la aplicación Jupyter como enlace para desarrollar los modelos y técnicas con PySpark.

El curso está dividido en 4 módulos más o menos independientes aunque se recomienda realizarlos de forma secuencial.

En el Módulo 1 se presentan los diferentes problemas y técnicas más habituales para analizar datos desde una perspectiva general. También se introduce el caso de estudio y las herramientas de trabajo que se emplearán.

El resto de módulo está dedicado a la tarea de Exploración y Pre-Proceso de los datos, incluidas consultas, tareas de gestión, resúmenes numéricos y gráficos. Los siguientes módulos se focalizan en las técnicas de análisis.

Procesamiento de datos: del Big Data al “DATA” como concepto estratégico y filosófico | ESIC

El Módulo 2 se centra en técnicas de modelización básica, en particular regresión y regresión logística. Además de repasar las etapas de calibración del modelo, también se incluyen las etapas de validación y simplificación.

El módulo 3 está plenamente dedicado a la técnica de Árboles de Regresión y Clasificación. También se incluyen los bosques aleatorios.

El módulo final contiene la técnica de Redes neuronales para clasificación y también una introducción a las técnicas No supervisadas, en particular, reducción de dimensión a través del análisis de componentes principales y la clasificación automática a través del análisis de clústers.

Lo que aprenderás:

INTRODUCCIÓN
LA MÁQUINA VIRTUAL
- ATENCIÓN: Si ya te instalaste la máquina virtual en el curso anterior de la Especialización no es necesario que vuelvas a hacerlo. En caso contrario, sigue leyendo.
  Los ejercicios y sesiones prácticas pretenden mostrar un caso práctico de procesamiento y análisis de datos en el contexto de Big Data.

En este sentido, será necesario trabajar con una máquina virtual que ya trae configuradas e instaladas una serie de componentes habituales al manejar Big Data.

En este apartado te explicamos cómo descargar e instalar la máquina virtual Cloudera en tu ordenador.

La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco.

Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma

MATERIAL DE PRÁCTICAS Y FICHEROS DE TRABAJO
- Para poder seguir la parte aplicada del curso, responder a los cuestionarios y trabajar con las herramientas que te explicamos, necesitarás acceder a una serie de files de código, así como las bases de datos de trabajo, que hemos recopilado y comprimido.

Verás que algunos vídeos llevan un código entre paréntesis que coinciden con el nombre de alguno de estos archivos.

Esto significa que en el vídeo correspondiente se trabaja con dicho fichero.

A continuación te explicamos como incorporarlos en la máquina virtual.

MÓDULO 1 – Análisis Exploratorio de Datos
- Durante la primera semana del curso se introducen el curso y las herramientas que se emplearán. Además también se presentan las tareas relacionadas con el Análisis Exploratorio de Datos.

Analisis Big Data – Indonesia Contact Center Association (ICCA)

Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.

MÓDULO 2 – MODELOS DE REGRESIÓN
- En el módulo 2 del curso se introducen conceptos de modelización general (calibración y validación) y en particular los modelos de regresión lineal y regresión logística.

Desde la perspectiva de Big Data, se incluyen aspectos relacionados con la regularización de los modelos para su simplificación.

Como en el módulo anterior, visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.

MÓDULO 3 – ÁRBOLES DE REGRESIÓN Y CLASIFICACIÓN
- En el módulo 3 del curso se introduce la familia de modelos basados en árboles (clasificación, regresión, bosques) y aspectos generales sobre la incertidumbre y el sobreajuste.

Después de cada tema, o de unos pocos temas, encontrarás un cuestionario para comprobar tu nivel de comprensión de los mismos.

Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.

MÓDULO 4 – REDES NEURONALES Y TÉCNICAS NO SUPERVISADAS
- En el módulo 4 del curso se introduce la familia de modelos basados en redes neuronales así como se introducen las técnicas básicas no supervisadas, tanto de clasificación automática como de reducción de la dimensionalidad.

En este módulo, además de los cuestionarios convencionales, tendrás que realizar un trabajo práctico en el que trabajarás las técnicas aprendidas hasta el momento.

Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, realiza los ejercicios prácticos, y accede a los foros para discutir los temas que te parezcan más interesantes.

¿Cómo obtengo el curso?

Este curso es ofrecido desde la plataforma de Coursera, es un curso que puedes obtener de manera gratuita bajo ciertas condiciones.

La primera opción es elegir la opción de “Curso gratuito sin certificado”, de esta manera podrás acceder al contenido del curso y finalizarlo, pero no podrás obtener un certificado de finalización avalado por la plataforma.

La segunda opción es elegir “auditar curso”, con esta opción podrás acceder al contenido de video del curso, pero no podrás realizar los exámenes ni obtener el certificado de finalización. Si no ves la opción de auditar curso, debes verificar en la parte de abajo usando el scroll (en forma de link).

Las opciones varían dependiendo el curso, pero con cualquiera de las dos podrás acceder gratuitamente al contenido. Por si fuera poco, algunos cursos tienen la opción de ayuda económica, con los cuales puedes solicitar dicho apoyo y ser acreedor de un curso de pago.

Para obtener el curso de manera gratuita da clic en el siguiente botón:

Obtener curso

Lo que aprenderás:

¿Cómo obtengo el curso?

Deja un comentarioCancelar respuesta