AzureTextAnalyticsConnector
Accède au service de traitement de langage naturel de texte Text Analytics d'Azure.
Utilisations typiques
Soumettre un texte au service Azure Text Analytics pour
- Détecter la langue dominante
- Obtenir des informations sur les sentiments
- Extraire des mots-clés
Comment fonctionne-t-il ?
AzureTextAnalyticsConnector utilise vos identifiants de connexion Azure Cognitive Services (soit via une connexion web FME précédemment définie, soit en en paramétrant une nouvelle directement depuis les paramètres du Transformer) pour accéder au service de traitement de langage naturel.
Il soumet du texte au service et renvoie des entités avec des attributs sur ce texte. Chaque entité d'entrée peut donner lieu à plusieurs entités de sortie.
Notes
- Pour une meilleure performance, les requêtes au service Azure Text Analytics sont effectuées en parallèle et sont retournées dès qu'elles sont terminées. Par conséquent, les résultats de la détection ne seront pas renvoyés dans le même ordre que les demandes qui leur sont associées.
- Tous les scores de confiances sont retournées entre 0 et 1.
- La liste des langages supportés pour chaque type d'analyse est consultable sur : https://docs.microsoft.com/en-us/azure/cognitive-services/text-analytics/language-support
- La liste des limites de données pour le service Azure Text Analytics se trouve à l'adresse suivante : https://docs.microsoft.com/en-us/azure/cognitive-services/text-analytics/overview#data-limits
Configuration
Ports d'entrée
Ce Transformer accepte tous types d'entités.
Ports de sortie
Le résultat dépend de l'analyse choisie.
Détection de la langue
Détecte la langue dominante du texte. Le service peut renvoyer plusieurs langues pour une même demande.
Attributs
_language_code | Le code de la langue présumée pour le texte (par exemple, en). |
_language_name | Le nom de la langue (par exemple, English) |
_confidence | La probabilité que la prédiction donnée est correcte. |
_text | Le texte analysé. |
Détection de sentiment
Détecte le sentiment du texte.
Attributs
_sentiment | Le sentiment pour le texte. Les valeurs possibles sont : POSITIVE, NEGATIVE, NEUTRAL |
_sentiment_value | L'indication du sentiment. Une valeur proche de 0 est négative, une valeur proche de 0,5 est neutre et une valeur proche de 1 est positive. |
_text | Le texte analysé. |
Détection de phrases clés
Détecte les phrases clés pour le texte.
Attributs
_key_phrases{} | Les mots/phrases importants du texte. S'affiche comme un attribut de liste. |
_text | Le texte analysé. |
Détection d'entités
Détecte les entités du texte
_name | Le nom de l'entité |
_type | Le type d'entités (par exemple, Person) |
_sub_type | Le sous-type |
_wikipedia_id | Le titre Wikipedia de l'entité |
_wikipedia_language | La code de langue ISO pour l'article Wikipedia. |
_wikipedia_url | L'URL de la page Wikipedia |
_text | Le texte analysé. |
L'entité entrante ressort par ce port.
Les entités qui provoquent l'échec de l'opération ressortent par ce port. Un attribut fme_rejection_code, ayant la valeur ERROR_DURING_PROCESSING, sera ajouté, ainsi qu'un attribut fme_rejection_message plus descriptif qui contient des détails plus spécifiques sur la raison de l'échec.
Les entités peuvent être rejetées lorsque les limites de données pour le service Azure Text Analytics sont dépassées. Une solution de contournement possible consiste à réduire la taille ou le nombre de caractères de la requête. Le Transformer Decelerator peut être utilisé pour empêcher le dépassement de la limite de débit du service.
La liste des limites de données pour le service Azure Text Analytics se trouve à l'adresse suivante : https://docs.microsoft.com/en-us/azure/cognitive-services/text-analytics/overview#data-limits
Note: Si une entité entrant dans AzureTextAnalycsConnector possède déjà une valeur pour fme_rejection_code, celle-ci est supprimée.
Gestion des entités rejetées : ce paramètre permet d'interrompre la traduction ou de la poursuivre lorsqu'elle rencontre une entité rejetée. Ce paramètre est disponible à la fois comme option par défaut de FME et comme paramètre de traitement.
Paramètres
Pour utiliser AzureTextAnalyticsConnector ou AzureComputerVisionConnector vous aurez besoin d'un compte Cognitive Services, puis de générer un point de terminaison et une clé pour vous authentifier avec les Connectors de FME.
Source des identifiants |
Le connecteur AzureTextAnalyticsConnector peut utiliser des informations d'identification provenant de différentes sources. L'utilisation d'une connexion Web s'intègre mieux à FME, mais dans certains cas, vous pouvez souhaiter utiliser l'une des autres sources.
|
Compte |
Disponible lorsque la source d'accréditation est une connexion web. Pour créer une connexion Azure Cognitive Services, cliquez sur le menu déroulant "Compte" et sélectionnez "Ajouter une connexion Web...". La connexion pourra ensuite être gérée via Outils -> Options FME... -> Connexions Web. |
Point de terminaison et clé secrète | Disponible lorsque la source d'accréditation est Intégré. Un point de terminaison et une clé secrète peuvent être spécifiés directement dans le Transformer plutôt que dans une connexion web. |
Texte |
Le texte sur lequel effectuer la détection. |
Type de détection |
Le type d'opération à effectuer. Les choix possibles sont :
|
Les autres paramètres disponibles dépendent de la valeur du paramètre Requête > Type de détection. Les paramètres de chaque type de détection sont détaillés ci-dessous.
Options de détection d'entités
Langue |
La langue du texte. Tout le texte doit être dans la même langue par Transformer. Le code de langue doit être utilisé pour la valeur de l'attribut (par exemple, "en"). La liste des langages supportés pour chaque type d'analyse est consultable sur https://docs.microsoft.com/en-us/azure/cognitive-services/text-analytics/language-support |
Options de détection de phrases clés
Langue |
La langue du texte. Tout le texte doit être dans la même langue par Transformer. Le code de langue doit être utilisé pour la valeur de l'attribut (par exemple, "en"). La liste des langages supportés pour chaque type d'analyse est consultable sur https://docs.microsoft.com/en-us/azure/cognitive-services/text-analytics/language-support |
Options de détection de langue
La détection de langue ne requiert aucun paramètre additionnel.
Options de détection de sentiment.
Langue |
La langue du texte. Tout le texte doit être dans la même langue par Transformer. Le code de langue doit être utilisé pour la valeur de l'attribut (par exemple, "en"). La liste des langages supportés pour chaque type d'analyse est consultable sur https://docs.microsoft.com/en-us/azure/cognitive-services/text-analytics/language-support |
Éditer les paramètres des Transformers
À l'aide d'un ensemble d'options de menu, les paramètres du Transformer peuvent être attribués en faisant référence à d'autres éléments du traitement. Des fonctions plus avancées, telles qu'un éditeur avancé et un éditeur arithmétique, sont également disponibles dans certains Transformers. Pour accéder à un menu de ces options, cliquez sur à côté du paramètre applicable. Pour plus d'informations, voir Options de menus et paramètres de Transformer.
Définir les valeurs
Il existe plusieurs façons de définir une valeur à utiliser dans un Transformer. La plus simple est de simplement taper une valeur ou une chaîne de caractères, qui peut inclure des fonctions de différents types comme des références d'attributs, des fonctions mathématiques et de chaînes de caractères, et des paramètres d'espace de travail. Il existe un certain nombre d'outils et de raccourcis qui peuvent aider à construire des valeurs, généralement disponibles dans le menu contextuel déroulant adjacent au champ de valeur.
Utilisation de l'éditeur de texte
L'éditeur de texte fournit un moyen efficace de construire des chaînes de textes (dont les expressions régulières) à partir de données source diverses, telles que des attributs, des paramètres et des constantes, et le résultat est directement utilisé dans le paramètre.
Utilisation de l'éditeur arithmétique
L'éditeur arithmétique fournit un moyen simple de construire des expressions mathématiques à partir de plusieurs données source, telles que des attributs et des fonctions, et le résultat est directement utilisé dans un paramètre.
Valeur conditionnelle
Définit des valeurs selon un ou plusieurs tests.
Fenêtre de définition de conditions
Contenu
Les expressions et chaînes de caractères peuvent inclure des fonctions, caractères, paramètres et plus.
Lors du paramétrage des valeurs - qu'elles soient entrées directement dans un paramètre ou construites en utilisant l'un des éditeurs - les chaînes de caractères et les expressions contenant des fonctions Chaîne de caractères, Math, Date et heure ou Entité FME auront ces fonctions évaluées. Par conséquent, les noms de ces fonctions (sous la forme @<nom_de_fonction>) ne doivent pas être utilisés comme valeurs littérales de chaîne de caractères.
Ces fonctions manipulent les chaînes de caractères. | |
Caractères spéciaux |
Un ensemble de caractères de contrôle est disponible dans l'éditeur de texte. |
Plusieurs fonctions sont disponibles dans les deux éditeurs. | |
Fonctions Date/heure | Les fonctions de dates et heures sont disponibles dans l'Editeur texte. |
Ces opérateur sont disponibles dans l'éditeur arithmétique. | |
Elles retournent des valeurs spécifiques aux entités. | |
Les paramètres FME et spécifiques au projet peuvent être utilisés. | |
Créer et modifier un paramètre publié | Créer ses propres paramètres éditables. |
Options - Tables
Les Transformers avec des paramètres de style table possèdent des outils additionnels pour remplir et manipuler des valeurs.
Réordonner
|
Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :
|
Couper, Copier et Coller
|
Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :
Copier, copier et coller peuvent être utilisés au sein d'un Transformer ou entre Transfromers. |
Filtre
|
Commencez à taper une chaîne de caractères, et la matrice n'affichera que les lignes correspondant à ces caractères. Recherche dans toutes les colonnes. Cela n'affecte que l'affichage des attributs dans le Transformer - cela ne change pas les attributs qui sont sortis. |
Importer
|
Le bouton d'import remplit la table avec un jeu de nouveaux attributs lus depuis un jeu de données. L'application spécifique varie selon les Transformers. |
Réinitialiser/Rafraîchir
|
Réinitialise la table à son état initial, et peut fournir des options additionnelles pour supprimer des entrées invalides. Le comportement varie d'un Transformer à l'autre. |
Note : Tous les outils ne sont pas disponibles dans tous les Transformers.
Références
Comportement |
|
Stockage des entités |
Non |
Dépendances | Compte Azure Cognitive Services. |
Alias | |
Historique | Implémenté dans FME 2019.2 |
FME Community
FME Community iest l'endroit où trouver des démos, des tutoriaux, des articles, des FAQ et bien plus encore. Obtenez des réponses à vos questions, apprenez des autres utilisateurs et suggérez, votez et commentez de nouvelles entités.
Rechercher tous les résultats sur ce Transformer sur FME Community.
Les exemples peuvent contenir des informations sous licence Open Government - Vancouver et/ou Open Government - Canada.