Transformers FME: 2025.0

Categories
Chaînes de caractères
Exécution
Intégrations
Web

Web

Related Transformers
HTTPCaller

HTMLExtractor

Extrait des données structurées depuis une page web ou toute autre source HTML qui est formatée pour être lue par un humain (capture de données d'écran, ou screen scraping) en utilisant les sélecteurs CSS pour extraire des portions de contenu HTML en attributs d'entités.

Aller à la configuration

Cas d'utilisation courants

  • Extraction de contenu d'une page web

Comment fonctionne-t-il ?

Le HTMLExtractor vous permet de définir plusieurs requêtes à exécuter sur le contenu HTML entrant, qui peut être fourni sous forme d'attribut ou de fichier. Les requêtes sont composées d'un nom d'attribut de sortie, d'un sélecteur CSS qui définit le type de balises à extraire, et du choix d'extraire des balises entières, des valeurs, des textes ou des attributs HTML.

Vous pouvez extraire la première balise correspondante ou conserver plusieurs résultats dans un attribut de liste.

HTMLExtractor est plus adapté au traitement de contenu HTML que les Transformers XML ou les expressions régulières en raison d'analyses et de filtres plus indulgents et du support de changements mineurs dans le contenu de la page.

Exemples

Notes

Configuration

Ports d'entrée

Ports de sortie

Paramètres

Éditer les paramètres des Transformers

Les paramètres du Transformer peuvent être définis en saisissant directement des valeurs, en utilisant des expressions ou en faisant référence à d'autres éléments de l'espace de travail tels que des valeurs d'attributs ou des paramètres utilisateur. Divers éditeurs et menus contextuels sont disponibles pour vous aider. Pour voir ce qui est disponible, cliquez sur à côté du paramètre concerné.

Pour plus d'information, consulter la section Options des Transformers.

Références

Comportement

Basé sur des entités

Stockage des entités

Non

Dépendances Aucun
Alias  
Historique Implémenté dans FME 2 017.0

FME Community

FME Community dispose d'une mine de connaissances sur FME, avec plus de 20 000 membres actifs dans le monde entier. Obtenez de l'aide sur FME, partagez vos connaissances et entrez en contact avec des utilisateurs du monde entier.

Voir tous les résultats à propos de ce Transformer sur FME Community.

 

Examples may contain information licensed under the Open Government Licence – Vancouver, Open Government Licence - British Columbia, and/or Open Government Licence – Canada.