Introducción a la ciencia de datos: análisis de datos y algoritmos de predicción con R presenta conceptos y habilidades que pueden ayudarlo a abordar los desafíos del análisis de datos del mundo real. Cubre conceptos de probabilidad, inferencia estadística, regresión lineal y aprendizaje automático. También le ayuda a desarrollar habilidades como programación R, gestión de datos, visualización de datos, creación de algoritmos predictivos, organización de archivos con shell UNIX / Linux, control de versiones con Git y GitHub y preparación de documentos reproducibles.
Este libro es un libro de texto para un primer curso de ciencia de datos. No es necesario tener conocimientos previos de R, aunque puede resultar útil algo de experiencia en programación. El libro está dividido en seis partes: R, visualización de datos, estadísticas con R, disputa de datos, aprendizaje automático y herramientas de productividad. Cada parte tiene varios capítulos destinados a presentarse como una sola conferencia.
El autor utiliza estudios de casos motivadores que imitan de manera realista la experiencia de un científico de datos. Empieza por hacer preguntas específicas y las responde a través del análisis de datos para que los conceptos se aprendan como un medio para responder las preguntas. Ejemplos de los estudios de caso incluidos son: tasas de homicidios en los EE. UU.
Por estado, estatura de estudiantes auto informada, tendencias en la salud y la economía mundiales, el impacto de las vacunas en las tasas de enfermedades infecciosas, la crisis financiera de 2007-2008, pronóstico de elecciones, construcción de equipo, procesamiento de imágenes de dígitos escritos a mano y sistemas de recomendación de películas.
Descargar el libro
Este libro electrónico se encuentra disponible de manera gratuita bajo la licencia Creative Commons, lo que significa que puedes descargarlo, leerlo y compartirlo de manera libre.
Una copia de la licencia la puedes encontrar aquí abajo, al descargar el libro estas aceptando los acuerdos de la licencia.
Este trabajo, tiene la licencia Licencia internacional Creative Commons Attribution 4.0. Para ver una copia de esta licencia, visite https://creativecommons.org/licenses/by/4.0/ o envíe una carta a Creative Commons, PO Box 1866, Mountain View, CA 94042, EE. UU.
Se atribuye a Victor Felder, la Free Ebook Foundation y sus colaboradores.
El archivo pdf Introduction to Data Science dice 0.00 kb corrijanlo por favor está vacio