GoogleVisionConnector

Accède à l'API de reconnaissance d'image Google Vision AI.

Cas d'utilisation courants

Soumettre une image à la librairie Google Vision pour

Détecter des étiquettes et objets
Détecter des visages et émotions
détecter du texte

Comment fonctionne-t-il ?

GoogleVisionConnector utilise vos identifiants de connexion Google Cloud pour accéder aux services clients Google Vision.

Il soumet une image au service et renvoie des entités avec des attributs sur cette image. Chaque image en entrée peut donner lieu à plusieurs entités en sortie.

Tous les scores de confiances sont retournées entre 0 et 1.

Pour plus d'informations, voir la documentation de Google :

https://cloud.google.com/vision/

Configuration

Ports d'entrée

Ports de sortie

Output

Les résultats dépendront de l'analyse choisie. Chaque entité d'entrée peut donner lieu à plusieurs entités de sortie. Par exemple, une seule image est susceptible de contenir plusieurs objets.

Détection d'objets

Détecte et extrait des informations sur les objets d'une image, dans un large groupe de catégories. Les étiquettes peuvent identifier des objets généraux, des lieux, des activités, des espèces animales, des produits, etc. La géométrie des boîtes englobantes des objets détectés est renvoyée. Les boîtes englobantes sont exprimées en pixels et s'alignent sur les entrées de fichiers raster et locaux. Les boîtes englobantes des entrées URL sont renvoyées sous forme de valeurs normalisées comprises entre 0 et 1.

Attributs

_label	Les étiquettes qui décrivent les entités détectées dans l'image.
_confidence	Le score de confiance, allant de 0 (aucune confiance) à 1 (très grande confiance).

Détection de visage

Les visages identifiés avec succès donneront lieu à des entités de sortie avec des attributs décrivant le visage. Chaque entité aura une boîte de délimitation pour le visage. En option, les "points de repère" du visage, tels que LEFT_EYE, NOSE_TIP, ou LEFT_EYE_PUPIL seront également ajoutés comme géométries de points supplémentaires sur l'entité.

Lors de l'utilisation de toute image source en entrée, les rectangles englobants sont en unités pixels avec l'entrée;

Les valeurs possibles de probabilité sont les suivantes :

UNKNOWN, VERY_UNLIKELY, UNLIKELY, POSSIBLE, LIKELY, VERY_LIKELY

Attributs

_confidence	Le score général de confiance de l'entité, allant de 0 (aucune confiance) à 1 (très grande confiance).
_landmark_confidence	Le score de confiance générale de la probabilité de points de repère faciaux, allant de 0 (aucune confiance) à 1 (très grande confiance).
_joy_likelihood	Probabilité de joie.
_sorrow_likelihood	Probabilité de tristesse.
_anger_likelihood	Probabilité de colère.
_surprise_likelihood	Probabilité de surprise.
_under_exposed_likelihood	Probabilité de sous-exposition.
_blurred_likelihood	Probabilité de flou.
_headwear_likelihood	Probabilité de couvre-chef.

Détection de texte

Détecte et extrait le texte de n'importe quelle image. Par exemple, une photographie peut contenir une plaque de rue ou un panneau de signalisation. Les résultats comprennent l'ensemble de la chaîne de caractères extraite, ainsi que des mots individuels et leurs contours.

Lors de l'utilisation de toute image source en entrée, les rectangles englobants sont en unités pixels avec l'entrée;

Attributs

_text	Un texte détecté dans une image.
_type	Type de texte détecté. Les types peuvent être soit PAGE, BLOCK, PARAGRAPH, WORD, ou SYMBOLE. Voici la hiérarchie de structures de texte contenu dans une détection de texte : PAGE -> BLOCK -> PARAGRAPH -> WORD -> SYMBOL.
_id	L'identifiant du texte détecté. Déterminé par l'ordre du texte détecté.
_confidence	La confiance des résultats de l'OCR du type de structure de texte. Il s'agit d'une valeur comprise entre 0 et 1.
_break_type	Le type de rupture trouvé. Les types de rupture possibles sont UNKNOWN, SPACE, SURE_SPACE, EOL_SURE_SPACE, HYPHEN, et LINE_BREAK. Pour plus d'informations sur ces types, consultez le tableau suivant sur les types de rupture.
_parent_id	Le parent dans lequel le texte détecté est contenu. Cette valeur est nulle si le texte n'a pas de parent.

Type de rupture

UNKNOWN	Rupture inconnue
SPACE	Espace régulier
SURE_SPACE	Espace certain (très large).
EOL_SURE_SPACE	Rupture d'une ligne.
HYPHEN	Hyphen de fin de ligne non présent dans le texte, ne doit pas exister avecSPACE ou LINE_BREAK.
LINE_BREAK	Rupture de ligne en fin de paragraphe.

Détection de texte de document

Détecte et extrait le texte d'une image, mais est optimisé pour les textes et documents denses. Par exemple, l'image d'un document manuscrit peut contenir des blocs, des paragraphes, des mots et des symboles. Les résultats comprennent l'ensemble des chaînes extraites pour les blocs et les paragraphes, ainsi que les mots et les symboles individuels.

Attributs

_text	Un texte détecté dans une image.
_type	Type de texte détecté. Les types peuvent être soit PAGE, BLOCK, PARAGRAPH, WORD, ou SYMBOLE. Voici la hiérarchie de structures de texte contenu dans une détection de texte : PAGE -> BLOCK -> PARAGRAPH -> WORD -> SYMBOL.
_id	L'identifiant du texte détecté. Déterminé par l'ordre du texte détecté.
_confidence	La confiance des résultats de l'OCR du type de structure de texte. Il s'agit d'une valeur comprise entre 0 et 1.
_break_type	Le type de rupture trouvé. Les types de rupture possibles sont UNKNOWN, SPACE, SURE_SPACE, EOL_SURE_SPACE, HYPHEN, et LINE_BREAK. Pour plus d'informations sur ces types, consultez le tableau suivant sur les types de rupture.
_parent_id	Le parent dans lequel le texte détecté est contenu. Cette valeur est nulle si le texte n'a pas de parent.

Type de rupture

UNKNOWN	Rupture inconnue
SPACE	Espace régulier
SURE_SPACE	Espace certain (très large).
EOL_SURE_SPACE	Rupture d'une ligne.
HYPHEN	Hyphen de fin de ligne non présent dans le texte, ne doit pas exister avecSPACE ou LINE_BREAK.
LINE_BREAK	Rupture de ligne en fin de paragraphe.

Résumé

Le résultat dépend de l'analyse choisie.

Détection d'objets

Détecte et extrait des informations sur les entités dans une image. Le service peut renvoyer plusieurs suppositions d'étiquettes pour une demande individuelle. Pour plus d'informations, voir https://cloud.google.com/vision/docs/labels.

Attributs

_labels{}.name	Une liste des étiquettes qui décrivent les entités dans l'image.
_labels{}.confidence	Une liste du score de confiance, allant de 0 (aucune confiance) à 1 (très grande confiance).

Détection de visage

Une entité de résumé avec la géométrie et les attributs originaux préservés sera toujours produite par le port Résumé. Des attributs seront ajoutés pour indiquer le nombre de faces détectées.

Attributs

_detected_faces

Le nombre de visages détectés dans l'image.

Détection de texte

Une entité résumé avec la géométrie originale et les attributs préservés ressort toujours via le port Summary. Des attributs seront ajoutés pour indiquer le nombre de structures textuelles trouvées.

Attributs

_detected_pages	Le nombre de page détectées dans l'image.
_detected_blocks	Le nombre de blocs qui sont détectés dans l'image.
_detected_paragraphs	Le nombre de paragraphes détectés dans l'image.
_detected_words	Le nombre de mots détectés dans l'image.
_detected_symbols	Le nombre de symboles détectés dans l'image.

Détection de texte de document

Attributs

_detected_pages	Le nombre de page détectées dans l'image.
_detected_blocks	Le nombre de blocs qui sont détectés dans l'image.
_detected_paragraphs	Le nombre de paragraphes détectés dans l'image.
_detected_words	Le nombre de mots détectés dans l'image.
_detected_symbols	Le nombre de symboles détectés dans l'image.

Paramètres

Authentification

Source des identifiants

GoogleVisionConnector peut utiliser des informations d'identification provenant de différentes sources. L'utilisation d'un fichier de compte de service s'intègre le mieux à FME, mais dans certains cas, vous pouvez souhaiter utiliser une connexion Web.

Fichier de clés de compte de service - utilise le fichier de compte de service Google spécifié dans le chemin d'accès du système. Consultez https://cloud.google.com/video-intelligence/docs/common/auth pour plus d'informations.
Connexion web - utilise l'OAUTH de Google pour s'identifier et faire des requêtes.

Compte

Available when the credential source is Web Connection. To create a Google Cloud AI connection, click the 'Account' drop-down box and select 'Add Web Connection...'.

La connexion pourra ensuite être gérée via Outils -> Options FME... -> Connexions Web.

Requête

Image Source

La source d'où peuvent provenir les images. Les choix possibles sont :

URL : Spécifiez l'URL d'une image. Toutes les URL ne sont pas prises en charge. Notez que tous les liens ne fonctionneront pas. Il est recommandé de télécharger l'image localement ou de la charger sur le stockage cloud de Google.
Fichier local : spécifier le chemin vers un fichier local sur le disque.
Géométrie raster : prend un objet image raster.
Objet Google Storage : Prenez un objet image à partir de Google Cloud Storage. Vous devrez spécifier un godet et un chemin d'accès à l'objet.

Type de détection

Le type d'opération à effectuer. Les choix possibles sont :

Détection de texte de document : Détecte les structures de texte dans n'importe quelle image, mais est optimisé pour les textes et documents denses. Des boîtes englobantes seront produites pour chaque structure de texte détectée et sélectionnée.
Détection de visages : Détecter les visages et leurs caractéristiques dans l'image donnée. Des boîtes englobantes seront produites pour chaque visage détecté.
Détection d'objets : détecte les entités puis étiquette et localise les objets dans l'image.
Détection de texte : Détecte les structures de texte dans n'importe quelle image. Des boîtes de délimitation seront produites pour chaque structure de texte détectée et sélectionnée.

Les autres paramètres disponibles dépendent de la valeur du paramètre Requête > Type de détection. Les paramètres de chaque type de détection sont détaillés ci-dessous.

Paramètres - Détection de texte de document

Fonctionnalités de détection de texte incluses

Pages	Si les structures de pages doivent être détectées.
Blocs	Si les structures de blocs doivent être détectées.
Paragraphes	Si les structures de paragraphes doivent être détectées.
Mots	Si les structures de mots doivent être détectées.
Symboles	Si les structures de mots doivent être détectées.

Paramètres - Détection de texte

Fonctionnalités de détection de texte incluses

Pages	Si les structures de pages doivent être détectées.
Blocs	Si les structures de blocs doivent être détectées.
Paragraphes	Si les structures de paragraphes doivent être détectées.
Mots	Si les structures de mots doivent être détectées.
Symboles	Si les structures de mots doivent être détectées.

Éditer les paramètres des Transformers

À l'aide d'un ensemble d'options de menu, les paramètres du Transformer peuvent être attribués en faisant référence à d'autres éléments de traitement. Des fonctions plus avancées, telles qu'un éditeur avancé et un éditeur arithmétique, sont également disponibles dans certains Transformers. Pour accéder à un menu de ces options, cliquez sur à côté du paramètre applicable. Pour plus d'informations, voir Options de menus et paramètres de Transformer.

Définir les valeurs

Il existe plusieurs façons de définir une valeur à utiliser dans un Transformer. La plus simple est de simplement taper une valeur ou une chaîne de caractères, qui peut inclure des fonctions de différents types comme des références d'attributs, des fonctions mathématiques et de chaînes de caractères, et des paramètres de traitement. Il existe un certain nombre d'outils et de raccourcis qui peuvent aider à construire des valeurs, généralement disponibles dans le menu contextuel déroulant adjacent au champ de valeur.

Définir des valeurs de paramètres

Utilisation de l'éditeur de texte

L'éditeur de texte fournit un moyen efficace de construire des chaînes de textes (dont les expressions régulières) à partir de données source diverses, telles que des attributs, des paramètres et des constantes, et le résultat est directement utilisé dans le paramètre.

Editeur de texte

Utilisation de l'éditeur arithmétique

L'éditeur arithmétique fournit un moyen simple de construire des expressions mathématiques à partir de plusieurs données source, telles que des attributs et des fonctions, et le résultat est directement utilisé dans un paramètre.

Éditeur arithmétique

Valeur conditionnelle

Définit des valeurs selon un ou plusieurs tests.

Fenêtre de définition de conditions

Contenu

Les expressions et chaînes de caractères peuvent inclure des fonctions, caractères, paramètres et plus.

Lors du paramétrage des valeurs - qu'elles soient entrées directement dans un paramètre ou construites en utilisant l'un des éditeurs - les chaînes de caractères et les expressions contenant des fonctions Chaîne de caractères, Math, Date et heure ou Entité FME auront ces fonctions évaluées. Par conséquent, les noms de ces fonctions (sous la forme @<nom_de_fonction>) ne doivent pas être utilisés comme valeurs littérales de chaîne de caractères.

Types de contenu

Fonctions chaînes de caractères	Ces fonctions manipulent les chaînes de caractères.
Caractères spéciaux	Un ensemble de caractères de contrôle est disponible dans l'éditeur de texte.
Fonctions mathématiques	Plusieurs fonctions sont disponibles dans les deux éditeurs.
Fonctions Date/heure	Les fonctions de dates et heures sont disponibles dans l'Editeur texte.
Opérateurs mathématiques	Ces opérateur sont disponibles dans l'éditeur arithmétique.
Fonctions d'entités	Elles retournent des valeurs spécifiques aux entités.
Paramètres FME	Les paramètres FME et spécifiques au traitement peuvent être utilisés.
Créer et modifier un paramètre publié	Créer ses propres paramètres éditables.

Options - Tables

Les Transformers avec des paramètres de style table possèdent des outils additionnels pour remplir et manipuler des valeurs.

Outils de tableau

Réordonner

Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :

Ajouter une ligne
Supprimer une ligne
Déplacer la ligne en cours au dessus
Déplacer la ligne en cours en dessous
Déplacer la ligne en cours en haut de liste
Déplacer la ligne en cours en bas de liste

Couper, Copier et Coller

Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :

Couper une ligne - supprime et copie dans le presse-papiers.
Copie une ligne dans le presse-papiers.
Colle une ligne depuis le presse-papiers.

Copier, copier et coller peuvent être utilisés au sein d'un Transformer ou entre Transfromers.

Filtre

Commencez à taper une chaîne de caractères, et la matrice n'affichera que les lignes correspondant à ces caractères. Recherche dans toutes les colonnes. Cela n'affecte que l'affichage des attributs dans le Transformer - cela ne change pas les attributs qui sont sortis.

Importer

Le bouton d'import remplit la table avec un jeu de nouveaux attributs lus depuis un jeu de données. L'application spécifique varie selon les Transformers.

Réinitialiser/Rafraîchir

Réinitialise la table à son état initial, et peut fournir des options additionnelles pour supprimer des entrées invalides. Le comportement varie d'un Transformer à l'autre.

Note : Tous les outils ne sont pas disponibles dans tous les Transformers.

Références

Comportement	Basé sur des entités
Stockage des entités	Non
Dépendances	Compte Google Cloud avec accès à l'AP ICloud Vision.
Alias
Historique	Implémenté dans FME 2019.2

FME Community

FME Community est l'endroit où trouver des démos, des tutoriaux, des articles, des FAQ et bien plus encore. Obtenez des réponses à vos questions, apprenez des autres utilisateurs et suggérez, votez et commentez de nouvelles entités.

Voir tous les résultats à propos de ce Transformer sur FME Community.

Les exemples peuvent contenir des informations sous licence Open Government - Vancouver et/ou Open Government - Canada.

GoogleVisionConnector

Catégories

Transformers liés

Cas d'utilisation courants

Comment fonctionne-t-il ?

Configuration

Ports d'entrée

Ports de sortie

Détection d'objets

Détection de visage

Détection de texte

Détection de texte de document

Détection d'objets

Détection de visage

Détection de texte

Détection de texte de document

Paramètres

Fonctionnalités de détection de texte incluses

Options de détection de visage

Options de détection d'objet

Fonctionnalités de détection de texte incluses

Éditer les paramètres des Transformers

Définir les valeurs

Utilisation de l'éditeur de texte

Utilisation de l'éditeur arithmétique

Valeur conditionnelle

Contenu

Options - Tables

Références

FME Community