07/04/2008

Yahoo Pipes : Regex : exemple théorique , épisode III

Il s'agit simplement de la traduction de l'exemple dans la
documentation anglaise sur l'utilisation de regex.
Le but de la manœuvre est d'extraire d'un texte
une année sur 4 chiffres. Voici la commande :

^In\s+(\d{4}),.+


Traduction du hiéroglyphe :

^In signifie "tout texte commençant par In
\s signifie tout caractère espace
+ signifie une ou plusieurs occurrences de ce
qui précède donc 1 ou plusieurs blancs
( signifie que ce qui est entre parenthèses sera stocké
pour usage ultérieur
\d{4} signifie exactement 4 chiffres (d pour digits)
, signifie ... une virgule
. signifie n'importe quel caractère
+ signifie une ou plusieurs occurrences
(donc de n'importe que caractère)

Conclusion :
Nous cherchons 4 chiffres précédés de 1 ou plusieurs espaces,
eux-mêmes précédés de In, ces derniers caractères formant
le début du texte ; les 4 chiffres sont suivis d'une
virgule, puis de n'importe quoi.

Si nous les trouvons, ils seront stockés dans $1
variable 1), un autre parenthésage dans la même
commande donnera $2 etc.

J'ai fabriqué un pipe simple pour illustrer le propos.
Lien vers la documentation originale en anglais: ici

Aucun commentaire:

Enregistrer un commentaire