Cursos

Aprende sobre el raspado web en Python: curso en línea

El “web scraping” es el proceso de extracción automática de información de sitios web mediante programas informáticos.

Python tiene varias bibliotecas que puede usar para el web scraping, como Beautiful Soup, Scrapy, Selenium, etc.

Es importante tener en cuenta que algunos sitios web pueden tener una política de “no raspado” que prohíbe el uso de programas automatizados para extraer información de sus páginas. Es muy importante seguir estas políticas y evitar dañar el sitio.

La capacidad de crear herramientas capaces de recuperar y analizar información almacenada en Internet ha sido y sigue siendo valiosa en muchos aspectos de la ciencia de datos.

Lo que aprenderás:

  • Introducción a HTML
  • XPaths y selectores
  • Localizadores CSS, encadenamiento y respuestas
  • Arañas

En este curso, aprenderá a navegar y analizar código html y crear herramientas para rastrear sitios web automáticamente.

Aunque nuestro scraping se realizará utilizando el versátil scrap de la biblioteca Python, muchas de las técnicas aprendidas en este curso también se pueden usar en otras bibliotecas populares de Python, incluidas BeautifulSoup y Selenium.

Al final de este curso, tendrá un modelo mental sólido de la estructura de html, podrá crear herramientas para analizar el código html y acceder a la información que necesita, y crear arañas simples para rastrear la web a escala.

Este curso se encuentra disponible en la plataforma de Datacamp.

Si quieres acceder al curso puedes usar este enlace.


ANA

Entradas recientes

Aprende a usar la terminal de Linux desde cero con este curso gratis

Aprende Bash desde cero con este curso gratis en Udemy. Ideal para principiantes que quieren…

5 meses hace

Así es como un microcontrolador toma decisiones en milisegundos (y cómo aprenderlo gratis)

Aprende cómo funcionan los microcontroladores por dentro con este curso gratis en Udemy. Ideal si…

5 meses hace

¿Tesis o proyecto de datos? Este curso de R GRATIS te salvará horas de trabajo

Aprende R desde cero con este curso gratis en Udemy. Ideal para estudiantes de ingeniería…

5 meses hace

¿Tienes una idea y no sabes cómo empezar? Este curso gratis te ayuda a prototiparla rápido

Aprende a crear apps sin experiencia con este curso gratis de Vibe Coding en Udemy.…

5 meses hace

Esta es la nueva plataforma gratuita de Carlos Slim para aprender inglés

Aprende inglés sin gastar un peso. Fundación Carlos Slim lanza plataforma con recursos certificados internacionalmente.…

1 año hace

¿Cómo conseguir la Certificación Python de IBM Gratis?

Curso completo de Python por IBM: desde básico hasta APIs. Certificación gratuita con ejercicios prácticos.…

1 año hace