Pack formation - Udemy - Apprentissage par renforcement avec Python

seeders: 27
leechers: 0
Added 1 year ago by Francese in Other

Download Fast Safe Anonymous
movies, software, shows...

Files

Pack formation - Udemy - Apprentissage par renforcement avec Python (Size: 10.79 GB)
  Partie 01
  01 - Introduction à la problématique de l'apprentissage par renforcement
  01 - Présentation.mkv 79.84 MB
  02 - Concepts et terminologie.mkv 55.47 MB
  03 - Fonctionnement de l'apprentissage par renforcement.mkv 29.75 MB
  04 - Autres concepts.mkv 59.08 MB
  05 - Processus de décision Markovien (MDP) déterministes.mkv 51.35 MB
  06 - MDP stochastiques.mkv 13.59 MB
  07 - Exemple de MDP en 2D sous Python.mkv 28.98 MB
  08 - Table des transitions stochastiques.mkv 66.7 MB
  09 - Formulation mathématique des MDP.mkv 58.58 MB
  10 - Problématique du bandit manchot.mkv 75.94 MB
  11 - Paramétrage des distributions (loi normale).mkv 40.36 MB
  12 - Calcul de la valeur d'une action.mkv 41.14 MB
  13 - Programme Python du bandit manchot.mkv 82.72 MB
  14 - Utiliser les tenseurs en Python avec Numpy.mkv 68.57 MB
  15 - Programme de simulation.mkv 32.19 MB
  16 - Simulation avec la méthode Epsilon-Greedy.mkv 30.37 MB
  17 - Simulation avec la méthode UCB.mkv 30.13 MB
  02 - Approche avec les équations de Bellman
  01 - Fonction valeur d'état.mkv 69.88 MB
  02 - Fonction valeur d'action.mkv 21.77 MB
  03 - Equation de Bellman pour la valeur d'état.mkv 61.13 MB
  04 - Equation de Bellman pour la valeur d'action.mkv 25.45 MB
  05 - Optimalité.mkv 9.44 MB
  06 - Exemple en Python - Présentation du problème.mkv 27.48 MB
  07 - Exemple en Python - Construction de la table de transition.mkv 87.82 MB
  08 - Exemple en Python - Application de l'algorithme.mkv 127.51 MB
  03 - Application sur un projet réel
  01 - Présentation du projet.mkv 92.64 MB
  02 - Instanciation de la classe et table des transitions.mkv 52.38 MB
  03 - Table des valeurs des actions et des états.mkv 9.43 MB
  04 - Application Bellman avec stratégie Greddy.mkv 78.24 MB
  05 - Application Bellman avec stratégie Epsilon-Greedy.mkv 42.25 MB
  04 - Méthodes d'optimisation basées sur la programmation dynamique
  01 - Introduction à la programmation dynamique.mkv 32.97 MB
  02 - Exemple d'algorithme récursif et dynamique.mkv 34.74 MB
  03 - Rappels sur l'optimalité des fonctions de valeurs d'actions et d'états.mkv 29.36 MB
  04 - Algorithme itératif pour l'évaluation des stratégies.mkv 104.65 MB
  05 - Algorithme d'amélioration des stratégies.mkv 75.82 MB
  06 - Algorithme final d'itération des stratégies.mkv 23.13 MB
  07 - Exemple Frozen Lake non déterministe.mkv 127.8 MB
  08 - Exemple Frozen Lake quasi-déterministe.mkv 15.9 MB
  09 - Algorithme par itération des valeurs.mkv 35.87 MB
  10 - Application sur le projet du magasin.mkv 110.72 MB
  05 - Méthodes de Monte Carlo
  01 - Introduction aux méthodes de Monte Carlo.mkv 50.98 MB
  02 - Estimation de la fonction des valeurs des états.mkv 38.23 MB
  03 - Exemple présentation du jeu et création des trajectoires.mkv 90.74 MB
  04 - Estimation des valeurs des états avec les algorithmes FVMC et EVMC.mkv 56.45 MB
  05 - Blackjack - Règles du jeu et avantage de la méthode de Monte Carlo.mkv 90.12 MB
  06 - Blackjack - Création des stratégies initiales et des trajectoires.mkv 98.67 MB
  07 - Blackjack - Estimation de la fonction des valeurs des états.mkv 119.5 MB
  08 - Estimation de la fonction des valeurs des actions.mkv 66.4 MB
  09 - Blackjack - Estimation de la fonction des valeurs des actions.mkv 89.11 MB
  10 - Approximation des stratégies optimales.mkv 52.57 MB
  11 - Blackjack - Approximation des stratégies optimales.mkv 114.34 MB
  12 - Stratégies de type epsilon-soft.mkv 30.51 MB
  13 - Blackjack - Stratégies de type epsilon soft.mkv 81.97 MB
  14 - Prédictions avec échantillonnage préférentiel - On-policy et Off-policy.mkv 68.83 MB
  15 - Ratio d'échantillonnage préférentiel.mkv 58.83 MB
  16 - Méthode de calcul de la prédiction.mkv 55.34 MB
  17 - Algorithme itératif de prédiction.mkv 58.81 MB
  18 - Test de convergence des algorithmes d'échantillonnage préférentiel et ordina.mkv 182.3 MB
  19 - Contrôle Monte Carlo de type Off Policy.mkv 57.28 MB
  06 - Apprentissage par différences temporelles (TD Methods) - Sarsa et Q-learning
  01 - Introduction à l'apprentissage de type TD.mkv 26.72 MB
  02 - Petit retour sur la méthode de Monte-Carlo.mkv 45.29 MB
  03 - Prédiction par différences temporelles.mkv 75.32 MB
  04 - Exemple d'illustration.mkv 91.13 MB
  05 - Avantages des méthodes TD.mkv 23.16 MB
  06 - Explications de l'algorithme TD(0) sur la marche aléatoire.mkv 43.93 MB
  07 - Expérimentations avec les méthodes TD(0) et MC-alpha constant.mkv 90.51 MB
  08 - L'apprentissage par lots.mkv 22.11 MB
  09 - Expériences avec la marche aléatoire.mkv 52.08 MB
  10 - Analyse des résultats.mkv 40.87 MB
  11 - Méthode Sarsa.mkv 64.53 MB
  12 - 12. Exemple d'illustration.mkv 40.71 MB
  13 - Exemple d'application Sarsa avec stratégie epsilon greedy.mkv 85.8 MB
  14 - Méthode Q-learning.mkv 32.99 MB
  15 - 15. Exemple d'illustration.mkv 19.66 MB
  16 - Exemple d'application Q-learning avec stratégie epsilon-soft.mkv 81.69 MB
  17 - Comparaison Sarsa et Q-learning avec stratégie epsilon-soft.mkv 70.03 MB
  18 - Comparaison Sarsa et Q-learning avec stratégie epsilon-greedy.mkv 39.48 MB
  07 - Méthodes par différences temporelles n-Step (n-step TD Methods)
  01 - Introduction aux méthodes n-step.mkv 7.57 MB
  02 - Prédiction avec les méthodes TD n-step.mkv 71.03 MB
  03 - Exemple - Présentation de la problématique.mkv 46.76 MB
  04 - Applicaton de l'algorithme n-step.mkv 47.69 MB
  05 - Avantage des méthodes n-step sur les erreurs d'estimation commises.mkv 40.13 MB
  06 - Contrôle avec la méthode Sarsa n-step.mkv 35.89 MB
  07 - Exemple d'application Sarsa n-step.mkv 94.19 MB
  08 - Apprentissage de type Off-policy avec les méthodes n-step.mkv 51.32 MB
  09 - Exemple d'application Off-policy Sarsa n-step.mkv 109.64 MB
  10 - Apprentissage de type Off-policy sans échantillonnage préférentiel.mkv 46.01 MB
  11 - Mise en équation et construction de l'algorithme n-step à Arbre.mkv 52.57 MB
  12 - Exemple d'application n-step à Arbre.mkv 65.04 MB
  13 - Conclusion.mkv 10.87 MB
  Fichiers source
  01
  1.1 1. Présentation.pdf 815.55 KB
  10.1 6. Problématique du bandit manchot.html 273.43 KB
  11.1 7. Simulations avec Python.ipynb 14.86 KB
  12.1 7. Simulations avec Python.ipynb 14.86 KB
  13.1 7. Simulations avec Python.ipynb 14.86 KB
  14.1 7.4. Les tenseurs avec Numpy.ipynb 7.27 KB
  15.1 7. Simulations avec Python.ipynb 14.86 KB
  16.1 7. Simulations avec Python.ipynb 14.86 KB
  17.1 7. Simulations avec Python.ipynb 14.86 KB
  2.1 2. Problématiques et concepts en RL.html 277.37 KB
  3.1 2. Problématiques et concepts en RL.html 277.37 KB
  4.1 2. Problématiques et concepts en RL.html 277.37 KB
  5.1 3. Processus de décision Markovien.html 272.8 KB
  6.1 3. Processus de décision Markovien.html 272.8 KB
  7.1 4_Exemple_de_MDP_en_2D.ipynb 7.11 KB
  8.1 4_Exemple_de_MDP_en_2D.ipynb 7.11 KB
  9.1 5. Formulation mathématique des MDP.html 269.01 KB
  02
  1.1 1. Fonction de valeur d'état et d'action.html 273.8 KB
  2.1 1. Fonction de valeur d'état et d'action.html 273.8 KB
  3.1 2. Equation de Bellman.html 269.95 KB
  4.1 3. Equation de Bellman pour la valeur d'action.html 269.6 KB
  5.1 4. Optimalité.html 268.13 KB
  6.1 Exemple_Simple_Bellman.ipynb 23.11 KB
  7.1 Exemple_Simple_Bellman.ipynb 23.11 KB
  8.1 Exemple_Simple_Bellman.ipynb 33.11 KB
  03
  1.1 1. Présentation du projet.pdf 2.37 MB
  2.1 2. Exemple application Bellman.ipynb 20.48 KB
  3.1 2. Exemple application Bellman.ipynb 20.48 KB
  4.1 2. Exemple application Bellman.ipynb 20.48 KB
  5.1 2. Exemple application Bellman.ipynb 30.48 KB
  04
  1.1 1. Introduction à la programmation dynamique.html 268.16 KB
  10.1 10. Application sur le projet du magasin.ipynb 11.31 KB
  2.1 2. Exemple d'algorithme récursif et dynamique.ipynb 5.85 KB
  4.1 4. Algorithme itératif pour l'évaluation des stratégies.html 275.56 KB
  5.1 5. Algorithme d'amélioration des stratégies.html 275.05 KB
  6.1 6. Algorithme final d'itération des stratégies.html 269.54 KB
  7.1 7. Exemple Frozen Lake.ipynb 18.18 KB
  8.1 7. Exemple Frozen Lake.ipynb 18.18 KB
  9.1 9. Algorithme par itération des valeurs.html 272.42 KB
  05
  1.1 1. Introduction aux méthodes de Monte Carlo.html 270.26 KB
  10.1 7. Approximation des stratégies optimales.html 272.92 KB
  11.1 8. Blackjack - Approximation des stratégies optimales.ipynb 24.56 KB
  12.1 9. Stratégies de type epsilon-soft.html 268.93 KB
  13.1 10. Blackjack - Stratégies de type epsilon soft.ipynb 22.88 KB
  14.1 11. Prédictions avec échantillonnage préférentiel - On-policy et Off-policy.html 270.81 KB
  15.1 12. Ratio d'échantillonnage préférentiel.html 271.7 KB
  16.1 13. Méthode de calcul de la prédiction.html 274.27 KB
  17.1 14. Algorithme itératif de prédiction.html 274.96 KB
  18.1 15. Test de convergence des algorithmes d'échantillonnage préférentiel et ordinaires.ipynb 29.02 KB
  19.1 16. Contrôle Monte Carlo de type Off Policy.ipynb 20.81 KB
  2.1 2. Estimation de la fonction des valeurs des états.html 269.27 KB
  3.1 3. Exemple avec une marche aléatoire.ipynb 16.19 KB
  4.1 3. Exemple avec une marche aléatoire.ipynb 16.19 KB
  5.1 4. Blackjack - Estimation des valeurs des états.ipynb 24.79 KB
  6.1 4. Blackjack - Estimation des valeurs des états.ipynb 34.79 KB
  7.1 4. Blackjack - Estimation des valeurs des états.ipynb 24.79 KB
  8.1 5. Estimation de la fonction des valeurs des actions.html 270.31 KB
  9.1 6. Blackjack - Estimation de la fonction des valeurs des actions.ipynb 23.39 KB
  06
  1.1 1. Introduction à l'apprentissage de type TD.html 268.31 KB
  10.1 5. Apprentissage par lots.ipynb 19.16 KB
  11.1 6. Méthode Sarsa.html 281.07 KB
  12.1 7. Exemple d'illustration.html 269.57 KB
  13.1 8. Exemple d'application Sarsa avec stratégie epsilon greedy.ipynb 22.88 KB
  14.1 9. Méthode Q-learning.html 271.59 KB
  15.1 10. Exemple d'illustration.html 268.59 KB
  16.1 11. Exemple d'application Q-learning avec stratégie epsilon-soft.ipynb 12.31 KB
  17.1 12. Comparaison Sarsa et Q-learning avec stratégie epsilon-soft.ipynb 14.4 KB
  18.1 13. Comparaison Sarsa et Q-learning avec stratégie epsilon-greedy.ipynb 14.22 KB
  2.1 2. Prédiction par différences temporelles.html 287.93 KB
  3.1 2. Prédiction par différences temporelles.html 277.93 KB
  4.1 3. Exemple d'illustration.html 286.24 KB
  5.1 4. Avantages des méthodes TD pour la prédiction.ipynb 18.07 KB
  6.1 4. Avantages des méthodes TD pour la prédiction.ipynb 18.07 KB
  7.1 4. Avantages des méthodes TD pour la prédiction.ipynb 18.07 KB
  8.1 5. Apprentissage par lots.ipynb 19.16 KB
  9.1 5. Apprentissage par lots.ipynb 19.16 KB
  07
  1.1 1. Introduction aux méthodes n-step.html 267.26 KB
  10.1 8. Apprentissage de type Off-policy sans échantillonnage préférentiel.html 275.17 KB
  11.1 8. Apprentissage de type Off-policy sans échantillonnage préférentiel.html 275.17 KB
  12.1 9. Exemple d'application n-step à Arbre.ipynb 15.17 KB
  13.1 10. Conclusion.pdf 195.35 KB
  2.1 2. Prédiction avec les méthodes TD n-step.html 275.22 KB
  3.1 3. Exemple avec une marche aléatoire.ipynb 13.75 KB
  4.1 3. Exemple avec une marche aléatoire.ipynb 13.75 KB
  5.1 3. Exemple avec une marche aléatoire.ipynb 13.75 KB
  6.1 4. Contrôle avec la méthode Sarsa n-step.html 279.44 KB
  7.1 5. Exemple d'application Sarsa n-step.ipynb 23.91 KB
  8.1 6. Apprentissage de type Off-policy avec les méthodes n-step.html 281.07 KB
  9.1 7. Exemple d'application Off-policy Sarsa n-step.ipynb 17.17 KB
  Partie 02
  01 - Prédiction de type on-policy par approximations
  01 - Introduction.mkv 64.3 MB
  02 - Approximation de la fonction des valeurs des états.mkv 74.29 MB
  03 - Fonction objectif de prédiction.mkv 112.89 MB
  04 - Principe de la méthode SGD.mkv 63.08 MB
  05 - Méthodes du gradient et du semi-gradient.mkv 81.88 MB
  06 - Technique d'agrégation des états.mkv 23.95 MB
  07 - Exemple d'application - Mise en place de l'environnement.mkv 55.84 MB
  08 - Calcul des vraies valeurs des états par programmation dynamique.mkv 47.51 MB
  09 - Application de l'algorithme SGD par agrégation des états.mkv 58.45 MB
  10 - Analyse des résultats.mkv 57.51 MB
  11 - Principe d'approximation par les méthodes linéaires.mkv 24.18 MB
  12 - Convergence des méthodes linéaire et majoration de l'erreur.mkv 81.24 MB
  13 - Algorithme du semi-gradient TD n-step.mkv 20.87 MB
  14 - Exemple d'application semi-gradient TD(0).mkv 42.88 MB
  15 - Analyse des erreurs obtenues pour différentes valeurs de alpha et de n.mkv 18.78 MB
  02 - Construction des fonctions d'approximations linéaires
  01 - Introduction.mkv 46.44 MB
  02 - Bases polynomiales.mkv 64.64 MB
  03 - Exemple avec les bases polynomiales - implantation du modèle.mkv 121.1 MB
  04 - Exécution du modèle et analyse des résultats.mkv 105.92 MB
  05 - Les bases de Fourier en 1D.mkv 46.76 MB
  06 - Exemple de base de Fourier et d'approximation de fonction en 1D.mkv 32.71 MB
  07 - Exemple de base de Fourier et d'approximation de fonction en 2D.mkv 102.14 MB
  08 - Exemple avec les bases de Fourier.mkv 98.91 MB
  09 - Comparaison bases Polynomiales et de Fourier.mkv 27.88 MB
  03 - Approximation des fonctions non linéaires avec les réseaux neuronaux artificiels
  01 - Intelligence artificielle, machine learning et deep learning.mkv 27.97 MB
  02 - Les types d'apprentissages en deep learning.mkv 69.72 MB
  03 - Structure d'un réseau de neurones artificiels.mkv 51.36 MB
  04 - Fonction d'activation de type Sigmoide.mkv 25.18 MB
  05 - Fonction de prédiction, de perte et de coût.mkv 66.3 MB
  06 - Algorithme du gradient.mkv 38.3 MB
  07 - Utiliser un réseau de neurones avec Tensorflow-Keras Introduction.mkv 51.27 MB
  08 - Utiliser un réseau de neurones avec Tensorflow-Keras - Création du modèle.mkv 76.73 MB
  09 - Utiliser un réseau de neurones avec Tensorflow-Keras - Entrainement + prédiction.mkv 48.5 MB
  10 - Exemple d'application avec un réseau de neurones - Création du réseau.mkv 40.85 MB
  11 - Exemple d'application avec un réseau de neurones - Algorithme n-step TD.mkv 143.74 MB
  12 - Exemple d'application avec un réseau de neurones - Configuration de l'optimiseur.mkv 88.47 MB
  13 - Exemple d'application avec un réseau de neurones - Entrainement du modèle.mkv 68.02 MB
  04 - Contrôle de type on-policy par approximations
  01 - Introduction.mkv 30.89 MB
  02 - Contrôle semi-gradient sur des tâches épisodiques.mkv 67.94 MB
  03 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Environnement du jeu.mkv 149.42 MB
  04 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Fnc. d'approximation.mkv 173.39 MB
  05 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Algorithme avec.mkv 162.07 MB
  06 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Résultats.mkv 131.61 MB
  07 - Contrôle semi-gradient sur des tâches continues.mkv 92.65 MB
  08 - Exemple de tâche continue - Présentation de l'environnement.mkv 100.87 MB
  09 - Exemple de tâche continue - Entrainement avec l'algorithme Sarsa différentiel.mkv 102.66 MB
  10 - Exemple de tâche continue - Analyse des résultats.mkv 38.26 MB
  11 - Algorithme différentiel semi gradient Sarsa n-step.mkv 36.87 MB
  12 - Exemple de contrôle différentiel semi gradient Sarsa n-step.mkv 100.63 MB
  05 - Contrôle on-policy Deep-Sarsa (Méthode Sarsa avec les réseaux de neurones)
  01 - Présentation du problème.mkv 68.83 MB
  02 - Construction du réseau de neurones.mkv 91.97 MB
  03 - Algorithme d'apprentissage.mkv 81.68 MB
  04 - Présentation de l'algorithme Python.mkv 85.41 MB
  05 - Explications de l'algorithme Python.mkv 104.62 MB
  06 - Résultats et analyse.mkv 24.25 MB
  06 - Méthodes off-policy avec approximations
  01 - Introduction.mkv 59.9 MB
  02 - Méthodes semi gradient.mkv 52.66 MB
  03 - Exemples d'instabilités.mkv 103.15 MB
  04 - Exemple de Baird.mkv 52.99 MB
  05 - Méthode TD(0) off-policy sur l'exemple de Baird.mkv 103.72 MB
  06 - Méthode Q-learning sur l'exemple de Baird.mkv 46.2 MB
  07 - La triade de la mort.mkv 59.95 MB
  08 - Aspect géométrique des fonctions des valeurs.mkv 53.37 MB
  09 - Aspect géométrique de la méthode de Monte-Carlo.mkv 31.02 MB
  10 - Aspect géométrique de la méthode par programmation dynamique.mkv 50.72 MB
  11 - Aspect géométrique de la méthode par différences temporelles.mkv 41.49 MB
  12 - Méthode SGD sur l'erreur TD(0).mkv 50.34 MB
  13 - Exemple de mauvaise convergence de l'algorithme naïf résiduel du gradient.mkv 49.48 MB
  14 - Méthode SGD sur l'erreur de Bellman.mkv 97.57 MB
  15 - Exemple de mauvaise convergence de l'algorithme résiduel du gradient.mkv 29.08 MB
  16 - Concept d'apprenabilité.mkv 44.63 MB
  17 - La fonction objectif VE n'est pas apprenable.mkv 76.05 MB
  18 - Présentation de l'environnement pour tester l'erreur de Bellman.mkv 52.18 MB
  19 - L'erreur de Bellman n'est pas apprenable.mkv 46.73 MB
  20 - L'erreur de Bellman ne partage pas les paramètres optimaux.mkv 70.4 MB
  21 - Méthodes par gradient TD - Notations matricielles et rappels géométriques.mkv 135.62 MB
  22 - Méthodes par gradient TD - Expression du projecteur orthogonal.mkv 45.84 MB
  23 - Méthodes par gradient TD - Construction de l'algorithme.mkv 84.38 MB
  24 - Méthode Gradient TD - Exemple de Baird.mkv 89.59 MB
  25 - Méthodes Emphatic-TD.mkv 109.47 MB
  26 - Méthode Emphatic TD - Exemple de Baird.mkv 69.55 MB
  07 - Contrôle off-policy Deep Q-learning
  01 - Présentation de l'environnement.mkv 22.58 MB
  02 - Illustration animée de l'environnement.mkv 19.85 MB
  03 - Entrainement du modèle.mkv 104.55 MB
  04 - Animation des résultats.mkv 24.78 MB
  Fichiers source
  01
  1.1 1. Introduction.html 268.84 KB
  10.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb 18.69 KB
  11.1 6. Méthodes linéaires.ipynb 13.48 KB
  12.1 6. Méthodes linéaires.ipynb 13.48 KB
  13.1 6. Méthodes linéaires.ipynb 13.48 KB
  14.1 7. Exemple d'application semi_gradient TD(0) et n-step.ipynb 20.27 KB
  15.1 7. Exemple d'application semi_gradient TD(0) et n-step.ipynb 20.27 KB
  2.1 2. Approximation de la fonction des valeurs des états.html 271.47 KB
  3.1 3. Fonction objectif de prédiction.html 275.01 KB
  4.1 4. Méthodes du gradient stochastique et du semi-gradient.html 281.62 KB
  5.1 4. Méthodes du gradient stochastique et du semi-gradient.html 281.62 KB
  6.1 4. Méthodes du gradient stochastique et du semi-gradient.html 281.62 KB
  7.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb 18.69 KB
  8.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb 18.69 KB
  9.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb 18.69 KB
  02
  1.1 1. Introduction.html 269.85 KB
  2.1 2. Bases polynomiales.html 270.12 KB
  3.1 3. Exemple avec les bases polynomiales.ipynb 20.07 KB
  4.1 3. Exemple avec les bases polynomiales.ipynb 20.07 KB
  5.1 4. Bases de Fourier.ipynb 20.24 KB
  6.1 4. Bases de Fourier.ipynb 20.24 KB
  7.1 4. Bases de Fourier.ipynb 20.24 KB
  8.1 5. Exemple avec les bases de Fourier.ipynb 21.2 KB
  9.1 6. Comparaison bases Polynomes et Fourier.ipynb 22.79 KB
  03
  10.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb 20.44 KB
  11.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb 20.44 KB
  12.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb 20.44 KB
  3.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb 13 KB
  4.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb 13 KB
  5.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb 13 KB
  6.1 3. Concepts liés aux réseaux de neurones artificiels.ipynb 13 KB
  7.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb 10.61 KB
  8.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb 10.61 KB
  9.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb 10.61 KB
  04
  1.1 1. Introduction.html 268.44 KB
  10.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb 29.71 KB
  11.1 7. Algorithme différentiel semi gradient Sarsa n-step.html 270.91 KB
  12.1 8. Exemple de contrôle différentiel semi gradient Sarsa n-step.ipynb 27.94 KB
  3.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb 30.76 KB
  4.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb 30.76 KB
  5.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb 30.76 KB
  6.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb 30.76 KB
  7.1 5. Contrôle semi-gradient sur des tâches continues.html 280.01 KB
  8.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb 29.71 KB
  9.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb 29.71 KB
  05
  1.1 Deep-Sarsa.ipynb 30.28 KB
  2.1 Deep-Sarsa.ipynb 30.28 KB
  3.1 Deep-Sarsa.ipynb 40.28 KB
  4.1 Deep-Sarsa.ipynb 30.28 KB
  5.1 Deep-Sarsa.ipynb 30.28 KB
  6.1 Deep-Sarsa.ipynb 30.28 KB
  06
  1.1 1. Introduction.html 270.12 KB
  10.1 7. Aspect géométrique des fonctions des valeurs.html 288.76 KB
  11.1 7. Aspect géométrique des fonctions des valeurs.html 288.76 KB
  12.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html 294.9 KB
  13.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html 294.9 KB
  14.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html 294.9 KB
  15.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html 294.9 KB
  16.1 9. L'erreur de Bellman n'est pas apprenable.html 297.48 KB
  17.1 9. L'erreur de Bellman n'est pas apprenable.html 297.48 KB
  18.1 9. L'erreur de Bellman n'est pas apprenable.html 297.48 KB
  19.1 9. L'erreur de Bellman n'est pas apprenable.html 297.48 KB
  2.1 2. Méthodes semi gradient.html 275.99 KB
  20.1 9. L'erreur de Bellman n'est pas apprenable.html 297.48 KB
  21.1 10. Méthodes par gradient TD - Introduction des concepts mathématiques.html 286.77 KB
  22.1 10. Méthodes par gradient TD - Introduction des concepts mathématiques.html 286.77 KB
  23.1 11. Méthodes par gradient TD - Construction de l'algorithme.html 289.68 KB
  24.1 12. Méthode Gradient TD - Exemple de Baird.ipynb 16.51 KB
  25.1 13. Méthodes Emphatic-TD.html 281.94 KB
  26.1 14. Méthode Emphatic TD - Exemple de Baird.ipynb 35.36 KB
  3.1 3. Exemples d'instabilités.html 279.46 KB
  4.1 3. Exemples d'instabilités.html 279.46 KB
  5.1 4. Méthode TD(0) off-policy sur l'exemple de Baird.ipynb 12.38 KB
  6.1 5. Méthode Q-learning sur l'exemple de Baird.ipynb 24.4 KB
  7.1 6. La triade de la mort.html 271.51 KB
  8.1 7. Aspect géométrique des fonctions des valeurs.html 288.76 KB
  9.1 7. Aspect géométrique des fonctions des valeurs.html 288.76 KB
  07
  1.1 Deep Q-Learning.ipynb 29.31 KB
  2.1 Deep Q-Learning.ipynb 29.31 KB
  3.1 Deep Q-Learning.ipynb 29.31 KB
  4.1 Deep Q-Learning.ipynb 29.31 KB

Description


Udemy - Apprentissage par renforcement avec Python

Partie 1 : 7 sections • 90 sessions • Durée totale: 9 h 5 min
Partie 2 : 7 sections • 85 sessions • Durée totale: 9 h 57 min

24081012164925286918448833.jpg?042148


Ce que vous apprendrez
Comprendre le fonctionnement de l'apprentissage par renforcement et les concepts généraux associés
Comprendre les différentes approches permettant de résoudre les problèmes d'apprentissage par renforcement et trouver le plus adapter
Comprendre en profondeur le fonctionnement des différents algorithmes utilisés
Comment coder l'ensemble des algorithmes proposés en langage Python sur de nombreux exemples

Prérequis
Connaissances en Python et notions de probabilités en Mathématiques.
Accès à google colab (gratuit, nécessite un compte gmail)

Description
L’intelligence artificielle s’invite dans tous les secteurs. Toutefois, contrairement à ce que l’on peut penser, l’IA n’est pas une technologie unique.

Il existe de nombreuses branches et sous-catégories telles que le Machine Learning et le Deep Learning. Dans cette formation, je vous propose de vous initier à l’apprentissage par renforcement (Reinforcement Learning). Vous utiliserez le langage de programmation Python et des librairies spécialisées dans le traitement des données comme par exemple Numpy.

PARTIE 2:

Ce que vous apprendrez
Apprentissage par renforcement dans les environnement continus
Apprentissage en ligne et hors ligne (on-policy et off-policy)
Construire des réseaux de neurones avec Keras et Tensorflow
Deep reinforment learning (Deep Sarsa, Deep Q-learning)
Coder des algorithmes avancés d'apprentissage par renforcement en Python

Prérequis
Connaissances en Python
Accès à google colab (gratuit, il faut juste un compte gmail)
Mathématiques : Notions sur les probabilités, algèbre linéaire (matrices et espaces vectoriels)

Description
À l’heure actuelle, l’apprentissage par renforcement se révèle comme la façon la plus efficace de faire appel à la créativité des machines. Contrairement à un humain, une intelligence artificielle peut effectuer des milliers de tentatives en simultané. Il suffit pour ce faire de lancer le même algorithme en parallèle sur une puissante infrastructure informatique.

Cette formation fait suite à ma précédente formation d’initiation à l’apprentissage par renforcement (partie 1).

Dans cette nouvelle formation, vous allez étendre toutes les connaissances et les méthodes acquises dans le cadre d’environnements finis sur des environnements infinis, sur des tâches épisodiques et continues.

Vous apprendrez par exemple à coder des approximations de fonctions linéaires et non linéaires à l’aide de réseaux de neurones artificiels sous Keras / Tensorflow, à coder des algorithmes en ligne (on-policy) deep Sarsa et hors ligne (off-policy) deep Q-learning… Et bien plus encore !


Codec vidéo: MPEG /1280 x 720 px / 30 im/s 520 à 3334 kbp:/s
Codec Audio: aac 128 kbp/s à 946 kbp/s
Langues : Français
Sous-titres : oui (fr)
Nombre De Fichiers: 345
Nombre de dossiers: 32
Poids Total: 10.70 GO


Related Torrents

torrent name size uploader age seed leech
0
0
2
0
0