Bonjour !

Nous détaillons dans cet article les packages nécessaires à installer pour réaliser nos bots.

Selenium

Selenium est un package indispensable. Il permet d’exécuter des clics, remplir des formulaires, s’identifier sur un site, etc…

Nous utiliserons souvent ce package, autant être à l’aise avec.

Installation de Selenium

Pour fonctionner, Selenium a besoin d’un webdriver qui nous permettra de lancer Chrome ou bien Firefox par exemple.

Voici les liens des webdrivers:

Il existe également des webdrivers pour IE, Opéra, etc… Mais je n’ai pas pour habitude de les utiliser 🙂

Pour Selenium, voici la page de téléchargement (les consignes d’installation sont dessus).

Un petit exemple ?

from selenium import webdriver

# on charge le navigateur
driver=webdriver.Chrome("Chemin vers Chromedriver.exe") 

# la fonction get permet d'accéder à une URL
driver.get("mon_url")

# on passe en plein écran
driver.maximize_window()

# on ferme le navigateur
driver.close()

Voici le lien vers la documentation complète qui est très bien faite.

Nul besoin de lire toute la doc, on pourra apprendre au fil des articles. 🙂

BeautifulSoup

BeautifulSoup est un parser  très populaire. Un parser  est un outil comprenant l’arborescence d’un langage utilisant des balises et permettant de naviguer dans cette arborescence. Dans notre cas, il s’agit du HTML des pages internet.

Contrairement à Selenium, on ne va pas ouvrir un navigateur et faire des clics dans tous les sens. BeautifulSoup est un outil de scraping, c’est-à-dire qu’on va s’en servir pour récupérer des informations sur certaines pages web. Comme par exemple la météo, les gros titres de l’actualité, le prix de chambre d’hôtel, etc…

Installation de BeautifulSoup

Voici le lien de téléchargement ainsi que la documentation.

Un petit exemple ?

Récupérons la liste des départements Français sur wikipédia !

from bs4 import BeautifulSoup
import requests
#on récupère le code source
code_source = requests.get('https://fr.wikipedia.org/wiki/Liste_des_d%C3%A9partements_fran%C3%A7ais')
#on le parse
soup = BeautifulSoup(code_source.text, "lxml")
#on trouve les balises qui nous interessent
departements=soup.findAll("a", href=lambda x: x and x.endswith('partement)'))
#on les affiche
for departement in departements:
 print(departement.text)

Résultat :

Ain
Aisne
Allier
Ardèche
Ardennes
Ariège
Aube
Aude
Aveyron
Calvados
Cantal
Charente
Cher
Corrèze
Creuse
Dordogne
Doubs
...
...
...

Bien sûr, on fera des exemples dans les prochains articles afin de vous familiariser avec ce packag!

Vous avez sûrement remarquer que j’ai utilisé le package Requests. J’en parle ci-dessous.

Requests

Requests sert à charger des pages internets, se connecter, etc… Tout cela sans rien afficher à l’écran. Combiné à BeautifulSoup, c’est très efficace !

Installation de Requests

Voici la documentation et le lien de téléchargement.

PyAutoGui

PyAutoGui sert à faire des clics, faire des saisies clavier, bref, tout ce que vous pouvez faire avec un ordinateur.

Nous ne l’utiliserons pas vraiment pour les bots internet étant donné que Selenium est déjà fait pour ça.

On note que PyAutoGui possède des fonction de reconnaissance d’image pour repérer toute sorte d’objet sur votre écran. Ce package sera utile lorsqu’on parlera des bots au bureau, notamment pour les applications n’utilisant pas d’interface web.

Installation de PyAutoGui

Voici la documentation et le lien de téléchargement.

Un petit exemple ?

Bien sûr !

import pyautogui
import time

while true:
# on affiche la position
   print(pyautogui.position())
# 1 seconde de pause
   time.sleep(1)

# Pour sortir de la boucle c'est Ctrl + C dans la console !

Le résultat en vidéo

Et voilà comment récupérer la position de son pointeur en temps réel !

Vous imaginez bien qu’avec tout ça, on va avoir du pain sur la planche. Prêt pour votre premier bot ?

Jeff

Categories: Les bots

Leave a Reply

Your email address will not be published. Required fields are marked *