Python fournit plusieurs méthodes pour télécharger des fichiers sur Internet. Cela peut être fait via HTTP en utilisant le paquet urllib ou la bibliothèque de requêtes. Ce didacticiel explique comment utiliser ces bibliothèques pour télécharger des fichiers à partir d’URL à l’aide de Python..
La bibliothèque de requêtes est l'une des bibliothèques les plus populaires en Python. Les demandes vous permettent d'envoyer Requêtes HTTP / 1.1 sans qu'il soit nécessaire d'ajouter manuellement des chaînes de requête à vos URL ou d'encoder des données sous forme de formulaire.
Avec la bibliothèque de requêtes, vous pouvez exécuter de nombreuses fonctions, notamment:
La première chose à faire est d’installer la bibliothèque. C’est aussi simple que:
demandes d'installation de pip
Pour tester si l'installation a réussi, vous pouvez effectuer un test très facile dans votre interpréteur python en tapant simplement:
demandes d'importation
Si l'installation a réussi, il n'y aura pas d'erreur.
Les requêtes HTTP incluent:
Faire des demandes est très facile comme illustré ci-dessous.
demandes d'importation req = requests.get (“http://www.google.com”)
La commande ci-dessus récupère la page Web de Google et stocke les informations dans lereq
variable. Nous pouvons ensuite aller chercher d'autres attributs.
Par exemple, pour savoir si la récupération de la page Web Google a réussi, nous interrogerons le code_état.
demandes d'importation req = requests.get (“http://www.google.com") req.status_code 200 # 200 signifie qu'une demande a été acceptée.
Et si nous voulions connaître le type de codage de la page Web de Google?
req.encodage ISO-8859-1
Vous voudrez peut-être aussi connaître le contenu de la réponse.
req.text
Ceci est juste un contenu tronqué de la réponse.
'