ComprehendConnector
Accède au service Amazon AI Comprehend pour un traitement automatique de langage naturel sur du texte.
Utilisations typiques
- Soumettre un texte au service Amazon AWS pour :
- Détecter une langue dominante
- Déterminer une sentiment
- Détecter des phrases-clés
- Détecter des entités
Comment fonctionne-t-il ?
ComprehendConnector utilise votre compte Amazon AWS (soit via une ancienne connexion web FME, soit en définissant une nouvelle connexion via le Transformer) pour accéder au service de traitement automatique du langage naturel.
Il soumet du texte au service et renvoie des entités avec des attributs sur ce texte. Chaque entité de texte en entrée peut donner lieu à plusieurs entités en sortie.
Notes
- Pour une meilleure performance, les demandes au service Comprehend sont faites en parallèle, et sont retournées dès qu'elles sont terminées. Par conséquent, les résultats de la détection ne seront pas renvoyés dans le même ordre que les demandes qui leur sont associées.
- Tous les scores de confiance sont retournés entre 0 et 1. Pour plus de précision sur la précision d'Amazon Comprehend, consulter la FAQ : https://aws.amazon.com/comprehend/faqs/
Configuration
Ports d'entrée
Ce Transformer accepte tous types d'entités.
Ports de sortie
Le résultat dépend de l'analyse choisie.
Détection de la langue
Détecte la langue dominante du texte. Le service peut renvoyer plusieurs langues pour une même demande.
Attributs
_language_code | Le code de langue deviné pour le texte. Une liste des langues disponibles est disponible à l'adresse suivante : https://docs.aws.amazon.com/comprehend/latest/dg/supported-languages.html. |
_confidence | La probabilité que la prédiction donnée est correcte. |
_text | Le texte analysé. |
Détection de sentiment
Détecte le sentiment du texte.
Attributs
_sentiment |
Le sentiment pour le texte. Les valeurs possibles sont :
|
_sentiment_postive | Le score de confiance pour un sentiment positif. |
_sentiment_negative | Le score de confiance pour un sentiment négatif. |
_sentiment_neutral | Le score de confiance pour un sentiment neutre. |
_sentiment_mixed | Le score de confiance pour un sentiment mitigé. |
_text | Le texte analysé. |
Détection de phrase-clé
Détecte les phrases-clés dans le texte.
Attributs
_key_phrases{}.text | Les phrases-clés du texte. |
_key_phrases{}.confidence | Une valeur entre 0 et 1 qui indique le score de confiance pour la phrase-clé. |
_key_phrases{}.begin_offset | Le décalage de début de la phrase-clé dans le texte. |
_key_phrases{}.end_offset | Le décalage de fin de la phrase-clé dans le texte. |
_text | Le texte analysé. |
Détection d'entités
Détecte les entités dans le texte.Le service peut retourner plusieurs entités dans un texte donné.
Attributs
_entities{}.text | L'entité du texte. |
_entities{}.confidence | Une valeur entre 0 et 1 qui indique le score de confiance pour l'entité. |
_entities{}.begin_offset | Le décalage de début de l'entité dans le texte. |
_entities{}.end_offset | Le décalage de fin de l'entité dans le texte. |
_entities{}.type | Le type de l'entité détectée. Les types peuvent être trouvés ici : https://docs.aws.amazon.com/comprehend/latest/dg/how-entities.html |
_text | Le texte analysé. |
L'entité entrante ressort par ce port.
Les entités qui provoquent l'échec de l'opération ressortent par ce port. Un attribut fme_rejection_code, ayant la valeur ERROR_DURING_PROCESSING, sera ajouté, ainsi qu'un attribut fme_rejection_message plus descriptif qui contient des détails plus spécifiques sur la raison de l'échec.
Note: Si une entité entrant dans ComprehendConnector possède déjà une valeur pour fme_rejection_code, cette dernière sera supprimée.
Gestion des entités rejetées : ce paramètre permet d'interrompre la traduction ou de la poursuivre lorsqu'elle rencontre une entité rejetée. Ce paramètre est disponible à la fois comme option par défaut de FME et comme paramètre de traitement.
Paramètres
Source des identifiants |
ComprehendConnector peut utiliser des informations d'identification provenant de différentes sources. L'utilisation d'une connexion web s'intègre mieux avec FME, mais dans certains cas, vous pouvez souhaiter utiliser l'une des autres sources.
|
Compte |
Disponible lorsque la source d'accréditation est une connexion Web. Pour créer une connexion Comprehend, cliquez sur la boîte déroulante "Compte" et sélectionnez "Ajouter une connexion Web...". La connexion pourra ensuite être gérée via Outils -> Options FME... -> Connexions Web. |
Région | La région AWS par laquelle vous souhaitez accéder à Comprehend. Pour optimiser la latence, la meilleure pratique consiste à spécifier la région correcte. |
Clé d'accès et Clé d'accès secrète | Disponible lorsque la source d'accréditation est Intégrée. Un ID de clé d'accès et une clé d'accès secrète peuvent être spécifiés directement dans le Transformer au lieu d'une connexion web. |
Texte | Le texte à analyser sous la requête d'action spécifiée. | ||||||||
Action |
Le type d'opération à effectuer. Les choix possibles sont :
|
Langue |
Ce paramètre est disponible lorsque le paramètre Action est Détection d'entités, Détection de phrases clés ou Détection de sentiments. Ce paramètre spécifie la langue du texte. Tout le texte doit être dans la même langue par Transformer. Si vous utilisez une valeur d'attribut, il doit s'agir du code de la langue (par exemple, "en"). Référence des langues supportées : https://docs.aws.amazon.com/comprehend/latest/dg/supported-languages.html |
Éditer les paramètres des Transformers
À l'aide d'un ensemble d'options de menu, les paramètres du Transformer peuvent être attribués en faisant référence à d'autres éléments du traitement. Des fonctions plus avancées, telles qu'un éditeur avancé et un éditeur arithmétique, sont également disponibles dans certains Transformers. Pour accéder à un menu de ces options, cliquez sur à côté du paramètre applicable. Pour plus d'informations, voir Options de menus et paramètres de Transformer.
Définir les valeurs
Il existe plusieurs façons de définir une valeur à utiliser dans un Transformer. La plus simple est de simplement taper une valeur ou une chaîne de caractères, qui peut inclure des fonctions de différents types comme des références d'attributs, des fonctions mathématiques et de chaînes de caractères, et des paramètres d'espace de travail. Il existe un certain nombre d'outils et de raccourcis qui peuvent aider à construire des valeurs, généralement disponibles dans le menu contextuel déroulant adjacent au champ de valeur.
Utilisation de l'éditeur de texte
L'éditeur de texte fournit un moyen efficace de construire des chaînes de textes (dont les expressions régulières) à partir de données source diverses, telles que des attributs, des paramètres et des constantes, et le résultat est directement utilisé dans le paramètre.
Utilisation de l'éditeur arithmétique
L'éditeur arithmétique fournit un moyen simple de construire des expressions mathématiques à partir de plusieurs données source, telles que des attributs et des fonctions, et le résultat est directement utilisé dans un paramètre.
Valeur conditionnelle
Définit des valeurs selon un ou plusieurs tests.
Fenêtre de définition de conditions
Contenu
Les expressions et chaînes de caractères peuvent inclure des fonctions, caractères, paramètres et plus.
Lors du paramétrage des valeurs - qu'elles soient entrées directement dans un paramètre ou construites en utilisant l'un des éditeurs - les chaînes de caractères et les expressions contenant des fonctions Chaîne de caractères, Math, Date et heure ou Entité FME auront ces fonctions évaluées. Par conséquent, les noms de ces fonctions (sous la forme @<nom_de_fonction>) ne doivent pas être utilisés comme valeurs littérales de chaîne de caractères.
Ces fonctions manipulent les chaînes de caractères. | |
Caractères spéciaux |
Un ensemble de caractères de contrôle est disponible dans l'éditeur de texte. |
Plusieurs fonctions sont disponibles dans les deux éditeurs. | |
Fonctions Date/heure | Les fonctions de dates et heures sont disponibles dans l'Editeur texte. |
Ces opérateur sont disponibles dans l'éditeur arithmétique. | |
Elles retournent des valeurs spécifiques aux entités. | |
Les paramètres FME et spécifiques au projet peuvent être utilisés. | |
Créer et modifier un paramètre publié | Créer ses propres paramètres éditables. |
Options - Tables
Les Transformers avec des paramètres de style table possèdent des outils additionnels pour remplir et manipuler des valeurs.
Réordonner
|
Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :
|
Couper, Copier et Coller
|
Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :
Copier, copier et coller peuvent être utilisés au sein d'un Transformer ou entre Transfromers. |
Filtre
|
Commencez à taper une chaîne de caractères, et la matrice n'affichera que les lignes correspondant à ces caractères. Recherche dans toutes les colonnes. Cela n'affecte que l'affichage des attributs dans le Transformer - cela ne change pas les attributs qui sont sortis. |
Importer
|
Le bouton d'import remplit la table avec un jeu de nouveaux attributs lus depuis un jeu de données. L'application spécifique varie selon les Transformers. |
Réinitialiser/Rafraîchir
|
Réinitialise la table à son état initial, et peut fournir des options additionnelles pour supprimer des entrées invalides. Le comportement varie d'un Transformer à l'autre. |
Note : Tous les outils ne sont pas disponibles dans tous les Transformers.
Références
Comportement |
|
Stockage des entités |
Non |
Dépendances | Compte Amazon AWS avec accès à Comprehend. |
Alias | AmazonAWSComprehendConnector |
Historique | Implémenté dans FME 2019.2 |
FME Community
FME Community iest l'endroit où trouver des démos, des tutoriaux, des articles, des FAQ et bien plus encore. Obtenez des réponses à vos questions, apprenez des autres utilisateurs et suggérez, votez et commentez de nouvelles entités.
Rechercher tous les résultats sur ce Transformer sur FME Community.
Les exemples peuvent contenir des informations sous licence Open Government - Vancouver et/ou Open Government - Canada.