VB.Net : une fonction StripTags pour nettoyer le HTML

Il n’existe pas de fonction native en VB.Net pour nettoyer un texte des balises HTML qu’il contient, à la manière de la fonction StripTags de PHP. Voici un petit hack pour ce faire, en une ligne de code (ou presque !)

Imports System.Text.RegularExpressions

...

    ''' <summary>
    ''' Supprime les tags HTML du texte passé en paramètre
    ''' </summary>
    ''' <param name="sTexte">Texte à nettoyer</param>
    ''' <returns></returns>
    Function StripTags(ByVal sTexte As String) As String
        Return Regex.Replace(sTexte, "<.*?>", "")
    End Function

Il ne faut pas oublier l’import en début de code, afin d’assurer la prise en charge des expressions régulières 😉

3 commentaires sur VB.Net : une fonction StripTags pour nettoyer le HTML
  1. Miss Répondre

    Concrètement, tu t’en sers pour faire quoi exactement ?

    • Cédric GIRARD Répondre

      Bonjour

      Je m’en sers (par exemple) dans mes petits outils de scrapping / analyse de page web : ça me permet de supprimer d’un coup toutes les balises HTML et d’isoler de ce fait le texte 🙂

  2. clemence Répondre

    ah oui il fallait y penser, j’avoue quand lisant l’article je voyais pas bien non plus comment on pouvait s’en servir.
    On rentre quand même là dans du très technique, c’est pas à la portée du bricoleur html du dimanche.

Laisser un commentaire

Votre adresse email ne sera pas publiée. Merci de saisir votre nom ou pseudo (pas de pseudo SEO merci !), votre email et votre commentaire.