Les Expressions Régulières (bon résumé EN FRANCAIS !)

 

(Par le dictionnaire interactif de l’Académie Française : https://atilf.atilf.fr/dendien/scripts/generic/showp.exe?56;s=4177923825;p=std_help.txt#regular)

Valable et très utilisé en développement informatique !

 

Information rapide

  • Pour trouver un champ qui contient isme taper isme
  • Pour trouver un champ qui commence par isme taper ^isme
  • Pour trouver un champ qui se termine par isme taper isme$
  • Pour des recherches plus fines, lisez ce qui suit !

 

Une expression régulière a pour fonction de donner un "modèle" de chaîne de caractères. Seuls les champs contenant une chaîne de caractères conforme à ce modèle seront sélectionnés.
Une des formes d'expression régulière simple est par exemple tion. Seuls les champs qui contiennent tion seront sélectionnés.
Une expression régulière peut comporter également les éléments suivants :

  • ^ désigne le début de champ.
    Exemple : ^part sélectionne les champs commençant par part
  • $ désigne la fin de champ.
    Exemple : isme$ sélectionne les champs terminés par isme
  • . (le caractère "point") désigne un caractère quelconque.
    Exemple : o.me sélectionne les champs contenant omme, oume, orme, osme etc.
  • [...] désigne un caractère quelconque qui est un des caractères entre les crochets.
    Exemple : o[mu]me sélectionne les champs contenant omme, oume, mais pas orme.
  • [^...] désigne un caractère quelconque qui n'est pas un des caractères entre les crochets.
    Exemple : o[^mu]me sélectionne les champs contenant orme, osme, mais pas omme, oume.
  • (choix1|choix2|...|choixn) désigne une des possibilités choix1 ou choix2 ou ... choixn.
    Exemple : (voul|pers) sélectionne les champs contenant voul ou pers.
  • Caractères de modification
    Placés derrière un caractère quelconque, ou devant un caractère "point" ou devant une expression entre crochets ou devant une expression parenthésée, les caractères " ? ", " + ", " * " ont le rôle suivant :
    • " ? " : rend optionnel le caractère ou l'expression derrière lequel/laquelle il est placé.
      Exemples :
      ismes?$ sélectionne les champs se terminant par isme ou ismes.
      c.?oupe sélectionne les champs contenant coupe, mais aussi par exemple croupe.
    • " * " : signifie que le caractère ou l'expression derrière lequel/laquelle il est placé peuvent se répéter un nombre quelconque de fois, ou être absent.
      Exemples :
      vr[aeiouypqrs]* sélectionne les champs contenant vr suivi d'un nombre quelconque de caractères choisis dans l'ensemble [aeiouypqrs].
      ^c.*oupe$ sélectionne les champs commençant par c et se terminant par oupe (un champ contenant coupe est sélectionné).
    • " + " : a presque la même signification que le caractère * , à ceci près que le caractère ou l'expression derrière lequel/laquelle il est placé doit être présent et peut se répéter un nombre quelconque de fois.
      Exemple : ^c.+oupe$ sélectionne les champs commençant par c et se terminant par oupe (un champ contenant coupe n'est pas sélectionné ).