El aprendizaje por refuerzo o aprendizaje reforzado es un área del aprendizaje automático inspirada en la psicología conductista, cuya ocupación es determinar qué acciones debe escoger un agente de software en un entorno dado con el fin de maximizar alguna noción de “recompensa” o premio acumulado.
El aprendizaje por refuerzo es un subcampo del aprendizaje automático, pero también es un formalismo de propósito general para la toma de decisiones automatizada y la inteligencia artificial. Este curso le presenta las técnicas de aprendizaje estadístico en las que un agente actúa e interactúa explícitamente con el mundo. Comprender la importancia y los desafíos de los agentes de aprendizaje que toman decisiones es de vital importancia en la actualidad, con cada vez más empresas interesadas en agentes interactivos y en la toma de decisiones inteligente.
– Formalizar problemas como procesos de decisión de Markov
– Entender los métodos básicos de exploración y la compensación de exploración / explotación
– Comprender las funciones de valor, como una herramienta de propósito general para la óptima toma de decisiones
– Conocer cómo implementar la programación dinámica como un enfoque eficiente solución a un problema de control industrial
Este curso le enseña los conceptos clave de aprendizaje por refuerzo, que subyace a los algoritmos clásicos y modernos en RL. Después de completar este curso, podrá comenzar a usar RL para problemas reales, donde tiene o puede especificar el MDP.
Este es el primer curso de la especialización de aprendizaje reforzado.
En este módulo previo al curso, se le presentará a sus instructores, obtendrá una idea de lo que el curso tiene reservado para usted y se le dará una hoja de ruta detallada para ayudarlo a que su viaje a través de esta especialización sea lo más sencillo posible.
Para la evaluación calificada de esta semana, implementará y probará un agente ávido de épsilon.
Esta semana, aprenderá la definición de MDP, comprenderá el comportamiento dirigido a objetivos y cómo se puede obtener maximizando las recompensas escalares, y también comprenderá la diferencia entre tareas episódicas y continuas.
Para la evaluación calificada de esta semana, creará tres tareas de ejemplo propias que encajen en el marco de MDP.
Esta semana, aprenderá la definición de políticas y funciones de valor, así como las ecuaciones de Bellman, que es la tecnología clave que utilizarán todos nuestros algoritmos.
Además, aprenderá sobre la iteración de políticas generalizadas como una plantilla común para construir algoritmos que maximicen la recompensa. Para la evaluación graduada de esta semana, implementará un agente de programación dinámica eficiente en un problema de control industrial simulado.
Este curso es ofrecido desde la plataforma de Coursera, es un curso que puedes obtener de manera gratuita bajo ciertas condiciones.
La primera opción es elegir la opción de “Curso gratuito sin certificado”, de esta manera podrás acceder al contenido del curso y finalizarlo, pero no podrás obtener un certificado de finalización avalado por la plataforma.
La segunda opción es elegir “auditar curso”, con esta opción podrás acceder al contenido de video del curso, pero no podrás realizar los exámenes ni obtener el certificado de finalización. Si no ves la opción de auditar curso, debes verificar en la parte de abajo usando el scroll (en forma de link).
Las opciones varían dependiendo el curso, pero con cualquiera de las dos podrás acceder gratuitamente al contenido. Por si fuera poco, algunos cursos tienen la opción de ayuda económica, con los cuales puedes solicitar dicho apoyo y ser acreedor de un curso de pago.
Para obtener el curso de manera gratuita da clic en el siguiente botón:
Aprende inglés sin gastar un peso. Fundación Carlos Slim lanza plataforma con recursos certificados internacionalmente.…
Curso completo de Python por IBM: desde básico hasta APIs. Certificación gratuita con ejercicios prácticos.…
Universidad abre inscripciones para curso gratuito de Python. Aprende desde cero con respaldo académico y…
Inicia tu carrera en ciberseguridad con CISCO. Curso gratuito con certificación oficial y contenido en…
Fundación Carlos Slim presenta catálogo 2024 de cursos gratuitos. Capacítate en línea y obtén certificación…
Descubre los cursos gratuitos de Google con certificación oficial. Aprende marketing digital, desarrollo web y…