GoogleVisionConnector
Accède à l'API de reconnaissance d'image Google Vision AI.
Cas d'utilisation courants
Soumettre une image à la librairie Google Vision pour
- Détecter des étiquettes et objets
- Détecter des visages et émotions
- détecter du texte
Comment fonctionne-t-il ?
GoogleVisionConnector utilise vos identifiants de connexion Google Cloud pour accéder aux services clients Google Vision.
Il soumet une image au service et renvoie des entités avec des attributs sur cette image. Chaque image en entrée peut donner lieu à plusieurs entités en sortie.
Tous les scores de confiances sont retournées entre 0 et 1.
Pour plus d'informations, voir la documentation de Google :
https://cloud.google.com/vision/
Configuration
Ports d'entrée
Ce Transformer accepte n'importe quelle entité. Les géométries raster peuvent être utilisées comme entrée si Géométrie raster est sélectionné comme source d'image.
Ports de sortie
Les résultats dépendront de l'analyse choisie. Chaque entité d'entrée peut donner lieu à plusieurs entités de sortie. Par exemple, une seule image est susceptible de contenir plusieurs objets.
Détection d'objets
Détecte et extrait des informations sur les objets d'une image, dans un large groupe de catégories. Les étiquettes peuvent identifier des objets généraux, des lieux, des activités, des espèces animales, des produits, etc. La géométrie des boîtes englobantes des objets détectés est renvoyée. Les boîtes englobantes sont exprimées en pixels et s'alignent sur les entrées de fichiers raster et locaux. Les boîtes englobantes des entrées URL sont renvoyées sous forme de valeurs normalisées comprises entre 0 et 1.
Attributs
_label |
Les étiquettes qui décrivent les entités détectées dans l'image. |
_confidence |
Le score de confiance, allant de 0 (aucune confiance) à 1 (très grande confiance). |
Détection de visage
Les visages identifiés avec succès donneront lieu à des entités de sortie avec des attributs décrivant le visage. Chaque entité aura une boîte de délimitation pour le visage. En option, les "points de repère" du visage, tels que LEFT_EYE, NOSE_TIP, ou LEFT_EYE_PUPIL seront également ajoutés comme géométries de points supplémentaires sur l'entité.
Lors de l'utilisation de toute image source en entrée, les rectangles englobants sont en unités pixels avec l'entrée;
Les valeurs possibles de probabilité sont les suivantes :
UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY, VERY_LIKELY
Attributs
_confidence |
Le score général de confiance de l'entité, allant de 0 (aucune confiance) à 1 (très grande confiance). |
_landmark_confidence |
Le score de confiance générale de la probabilité de points de repère faciaux, allant de 0 (aucune confiance) à 1 (très grande confiance). |
_joy_likelihood |
Probabilité de joie. |
_sorrow_likelihood |
Probabilité de tristesse. |
_anger_likelihood |
Probabilité de colère. |
_surprise_likelihood |
Probabilité de surprise. |
_under_exposed_likelihood |
Probabilité de sous-exposition. |
_blurred_likelihood |
Probabilité de flou. |
_headwear_likelihood |
Probabilité de couvre-chef. |
Détection de texte
Détecte et extrait le texte de n'importe quelle image. Par exemple, une photographie peut contenir une plaque de rue ou un panneau de signalisation. Les résultats comprennent l'ensemble de la chaîne de caractères extraite, ainsi que des mots individuels et leurs contours.
Lors de l'utilisation de toute image source en entrée, les rectangles englobants sont en unités pixels avec l'entrée;
Attributs
_text |
Un texte détecté dans une image. |
_type |
Type de texte détecté. Les types peuvent être soit PAGE, BLOCK, PARAGRAPH, WORD, ou SYMBOLE. Voici la hiérarchie de structures de texte contenu dans une détection de texte : PAGE -> BLOCK -> PARAGRAPH -> WORD -> SYMBOL. |
_id |
L'identifiant du texte détecté. Déterminé par l'ordre du texte détecté. |
_confidence |
La confiance des résultats de l'OCR du type de structure de texte. Il s'agit d'une valeur comprise entre 0 et 1. |
_break_type |
Le type de rupture trouvé. Les types de rupture possibles sont UNKNOWN, SPACE, SURE_SPACE, EOL_SURE_SPACE, HYPHEN, et LINE_BREAK. Pour plus d'informations sur ces types, consultez le tableau suivant sur les types de rupture. |
_parent_id |
Le parent dans lequel le texte détecté est contenu. Cette valeur est nulle si le texte n'a pas de parent. |
Type de rupture
UNKNOWN |
Rupture inconnue |
SPACE |
Espace régulier |
SURE_SPACE |
Espace certain (très large). |
EOL_SURE_SPACE |
Rupture d'une ligne. |
HYPHEN |
Hyphen de fin de ligne non présent dans le texte, ne doit pas exister avecSPACE ou LINE_BREAK. |
LINE_BREAK |
Rupture de ligne en fin de paragraphe. |
Détection de texte de document
Détecte et extrait le texte d'une image, mais est optimisé pour les textes et documents denses. Par exemple, l'image d'un document manuscrit peut contenir des blocs, des paragraphes, des mots et des symboles. Les résultats comprennent l'ensemble des chaînes extraites pour les blocs et les paragraphes, ainsi que les mots et les symboles individuels.
Attributs
_text |
Un texte détecté dans une image. |
_type |
Type de texte détecté. Les types peuvent être soit PAGE, BLOCK, PARAGRAPH, WORD, ou SYMBOLE. Voici la hiérarchie de structures de texte contenu dans une détection de texte : PAGE -> BLOCK -> PARAGRAPH -> WORD -> SYMBOL. |
_id |
L'identifiant du texte détecté. Déterminé par l'ordre du texte détecté. |
_confidence |
La confiance des résultats de l'OCR du type de structure de texte. Il s'agit d'une valeur comprise entre 0 et 1. |
_break_type |
Le type de rupture trouvé. Les types de rupture possibles sont UNKNOWN, SPACE, SURE_SPACE, EOL_SURE_SPACE, HYPHEN, et LINE_BREAK. Pour plus d'informations sur ces types, consultez le tableau suivant sur les types de rupture. |
_parent_id |
Le parent dans lequel le texte détecté est contenu. Cette valeur est nulle si le texte n'a pas de parent. |
Type de rupture
UNKNOWN |
Rupture inconnue |
SPACE |
Espace régulier |
SURE_SPACE |
Espace certain (très large). |
EOL_SURE_SPACE |
Rupture d'une ligne. |
HYPHEN |
Hyphen de fin de ligne non présent dans le texte, ne doit pas exister avecSPACE ou LINE_BREAK. |
LINE_BREAK |
Rupture de ligne en fin de paragraphe. |
Le résultat dépend de l'analyse choisie.
Détection d'objets
Détecte et extrait des informations sur les entités dans une image. Le service peut renvoyer plusieurs suppositions d'étiquettes pour une demande individuelle. Pour plus d'informations, voir https://cloud.google.com/vision/docs/labels.
Attributs
_labels{}.name |
Une liste des étiquettes qui décrivent les entités dans l'image. |
_labels{}.confidence |
Une liste du score de confiance, allant de 0 (aucune confiance) à 1 (très grande confiance). |
Détection de visage
Une entité de résumé avec la géométrie et les attributs originaux préservés sera toujours produite par le port Résumé. Des attributs seront ajoutés pour indiquer le nombre de faces détectées.
Attributs
_detected_faces |
Le nombre de visages détectés dans l'image. |
Détection de texte
Une entité résumé avec la géométrie originale et les attributs préservés ressort toujours via le port Summary. Des attributs seront ajoutés pour indiquer le nombre de structures textuelles trouvées.
Attributs
_detected_pages |
Le nombre de page détectées dans l'image. |
_detected_blocks |
Le nombre de blocs qui sont détectés dans l'image. |
_detected_paragraphs |
Le nombre de paragraphes détectés dans l'image. |
_detected_words |
Le nombre de mots détectés dans l'image. |
_detected_symbols |
Le nombre de symboles détectés dans l'image. |
Détection de texte de document
Une entité résumé avec la géométrie originale et les attributs préservés ressort toujours via le port Summary. Des attributs seront ajoutés pour indiquer le nombre de structures textuelles trouvées.
Attributs
_detected_pages |
Le nombre de page détectées dans l'image. |
_detected_blocks |
Le nombre de blocs qui sont détectés dans l'image. |
_detected_paragraphs |
Le nombre de paragraphes détectés dans l'image. |
_detected_words |
Le nombre de mots détectés dans l'image. |
_detected_symbols |
Le nombre de symboles détectés dans l'image. |
L'entité entrante ressort par ce port.
Les entités qui provoquent l'échec de l'opération ressortent par ce port. Un attribut fme_rejection_code, ayant la valeur ERROR_DURING_PROCESSING, sera ajouté, ainsi qu'un attribut fme_rejection_message plus descriptif qui contient des détails plus spécifiques sur la raison de l'échec.
Note: Si une entité entrant dans GoogleVisionConnector possède déjà une valeur pour fme_rejection_code, celle-ci est supprimée.
Gestion des entités rejetées : ce paramètre permet d'interrompre la traduction ou de la poursuivre lorsqu'elle rencontre une entité rejetée. Ce paramètre est disponible à la fois comme option par défaut de FME et comme paramètre de traitement.
Paramètres
Source des identifiants |
GoogleVisionConnector peut utiliser des informations d'identification provenant de différentes sources. L'utilisation d'un fichier de compte de service s'intègre le mieux à FME, mais dans certains cas, vous pouvez souhaiter utiliser une connexion Web.
|
Compte |
Available when the credential source is Web Connection. To create a Google Cloud AI connection, click the 'Account' drop-down box and select 'Add Web Connection...'. La connexion pourra ensuite être gérée via Outils -> Options FME... -> Connexions Web. |
Image Source |
La source d'où peuvent provenir les images. Les choix possibles sont :
|
Type de détection |
Le type d'opération à effectuer. Les choix possibles sont :
|
Les autres paramètres disponibles dépendent de la valeur du paramètre Requête > Type de détection. Les paramètres de chaque type de détection sont détaillés ci-dessous.
Fonctionnalités de détection de texte incluses
Pages |
Si les structures de pages doivent être détectées. |
Blocs |
Si les structures de blocs doivent être détectées. |
Paragraphes |
Si les structures de paragraphes doivent être détectées. |
Mots |
Si les structures de mots doivent être détectées. |
Symboles |
Si les structures de mots doivent être détectées. |
Options de détection de visage
La détection des visages ne nécessite pas de paramètres supplémentaires.
Options de détection d'objet
La détection d'objet ne requiert aucun paramètre additionnel.
Fonctionnalités de détection de texte incluses
Pages |
Si les structures de pages doivent être détectées. |
Blocs |
Si les structures de blocs doivent être détectées. |
Paragraphes |
Si les structures de paragraphes doivent être détectées. |
Mots |
Si les structures de mots doivent être détectées. |
Symboles |
Si les structures de mots doivent être détectées. |
Éditer les paramètres des Transformers
À l'aide d'un ensemble d'options de menu, les paramètres du Transformer peuvent être attribués en faisant référence à d'autres éléments de traitement. Des fonctions plus avancées, telles qu'un éditeur avancé et un éditeur arithmétique, sont également disponibles dans certains Transformers. Pour accéder à un menu de ces options, cliquez sur à côté du paramètre applicable. Pour plus d'informations, voir Options de menus et paramètres de Transformer.
Définir les valeurs
Il existe plusieurs façons de définir une valeur à utiliser dans un Transformer. La plus simple est de simplement taper une valeur ou une chaîne de caractères, qui peut inclure des fonctions de différents types comme des références d'attributs, des fonctions mathématiques et de chaînes de caractères, et des paramètres de traitement. Il existe un certain nombre d'outils et de raccourcis qui peuvent aider à construire des valeurs, généralement disponibles dans le menu contextuel déroulant adjacent au champ de valeur.
Utilisation de l'éditeur de texte
L'éditeur de texte fournit un moyen efficace de construire des chaînes de textes (dont les expressions régulières) à partir de données source diverses, telles que des attributs, des paramètres et des constantes, et le résultat est directement utilisé dans le paramètre.
Utilisation de l'éditeur arithmétique
L'éditeur arithmétique fournit un moyen simple de construire des expressions mathématiques à partir de plusieurs données source, telles que des attributs et des fonctions, et le résultat est directement utilisé dans un paramètre.
Valeur conditionnelle
Définit des valeurs selon un ou plusieurs tests.
Fenêtre de définition de conditions
Contenu
Les expressions et chaînes de caractères peuvent inclure des fonctions, caractères, paramètres et plus.
Lors du paramétrage des valeurs - qu'elles soient entrées directement dans un paramètre ou construites en utilisant l'un des éditeurs - les chaînes de caractères et les expressions contenant des fonctions Chaîne de caractères, Math, Date et heure ou Entité FME auront ces fonctions évaluées. Par conséquent, les noms de ces fonctions (sous la forme @<nom_de_fonction>) ne doivent pas être utilisés comme valeurs littérales de chaîne de caractères.
Ces fonctions manipulent les chaînes de caractères. | |
Caractères spéciaux |
Un ensemble de caractères de contrôle est disponible dans l'éditeur de texte. |
Plusieurs fonctions sont disponibles dans les deux éditeurs. | |
Fonctions Date/heure | Les fonctions de dates et heures sont disponibles dans l'Editeur texte. |
Ces opérateur sont disponibles dans l'éditeur arithmétique. | |
Elles retournent des valeurs spécifiques aux entités. | |
Les paramètres FME et spécifiques au traitement peuvent être utilisés. | |
Créer et modifier un paramètre publié | Créer ses propres paramètres éditables. |
Options - Tables
Les Transformers avec des paramètres de style table possèdent des outils additionnels pour remplir et manipuler des valeurs.
Réordonner
|
Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :
|
Couper, Copier et Coller
|
Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :
Copier, copier et coller peuvent être utilisés au sein d'un Transformer ou entre Transfromers. |
Filtre
|
Commencez à taper une chaîne de caractères, et la matrice n'affichera que les lignes correspondant à ces caractères. Recherche dans toutes les colonnes. Cela n'affecte que l'affichage des attributs dans le Transformer - cela ne change pas les attributs qui sont sortis. |
Importer
|
Le bouton d'import remplit la table avec un jeu de nouveaux attributs lus depuis un jeu de données. L'application spécifique varie selon les Transformers. |
Réinitialiser/Rafraîchir
|
Réinitialise la table à son état initial, et peut fournir des options additionnelles pour supprimer des entrées invalides. Le comportement varie d'un Transformer à l'autre. |
Note : Tous les outils ne sont pas disponibles dans tous les Transformers.
Références
Comportement |
|
Stockage des entités |
Non |
Dépendances | Compte Google Cloud avec accès à l'AP ICloud Vision. |
Alias | |
Historique | Implémenté dans FME 2019.2 |
FME Community
FME Community est l'endroit où trouver des démos, des tutoriaux, des articles, des FAQ et bien plus encore. Obtenez des réponses à vos questions, apprenez des autres utilisateurs et suggérez, votez et commentez de nouvelles entités.
Voir tous les résultats à propos de ce Transformer sur FME Community.
Les exemples peuvent contenir des informations sous licence Open Government - Vancouver et/ou Open Government - Canada.