RekognitionConnector

Accède au service de vision par ordinateur Amazon Rekognition Service AI pour détecter des objets, visages et textes dans des images et pour décrire le contenu et les visages de l'image.

Aller à la configuration

Cas d'utilisation courants

Soumettre des images au service Amazon AWS Rekognition pour :
- Décrire des objets individuels
- décrire le contenu général
- extraire de petites quantités de texte
- détecter des visages et descriptions faciales dans une image
- détecter un contenu adulte explicite ou suggestif dans une image
- détecter les EPI (Equipements de Protection Individuelle, ou PPE - Personal Protective Equipment) dans une image

Comment fonctionne-t-il ?

RekognitionConnector utilise vos identifiants de compte Amazon AWS (soit via une connexion web précédemment définie soit en paramétrant une nouvelle connexion web directement depuis le Transformer) pour accéder au service de vision par ordinateur.

Il soumet des images au service et renvoie des entités avec des attributs qui décrivent le contenu de l'image. La détection d'objets, la détection de texte et la détection de visages peuvent être effectuées.

Pour la détection d'objet, si le service est capable d'identifier l'emplacement exact de l'objet de l'image, une géométrie de rectangle englobant sera aussi renvoyée.
Les détections de texte et de visage renverront toujours un rectangle englobant autour du texte ou du visage détecté.
La modération d'image renverra l'entité en entrée avec des étiquettes de modération ajoutées lorsqu'un contenu non-sécurisé est détecté.

Chaque image en entrée peut générer plusieurs entités en sortie.

Notes

Pour une meilleure performance, les demandes au service Rekognition sont faites en parallèle, et sont retournées dès qu'elles sont terminées. Par conséquent, les résultats de la détection ne seront pas renvoyés dans le même ordre que les demandes qui leur sont associées.
RekognitionConnector est capable d'extraire jusqu'à 50 mots par image lors de la détection de texte. Il n'est donc pas adapté à la détection de pages entières de texte, comme dans un document numérisé.
Bien que puissante, l'utilisation de l'IA a d'importantes implications juridiques et éthiques. Consultez votre législation locale en matière d'IA et les directives éthiques avant d'appliquer le RekognitionConnector dans un environnement de production.
Pour un aperçu global des capacités et limites de Rekognition, veuillez vous référer à la FAQ d'Amazon : https://aws.amazon.com/rekognition/the-facts-on-facial-recognition-with-artificial-intelligence

Configuration

Ports en entrée

Ports de sortie

Output

Les résultats dépendront de l'analyse choisie. Chaque entité d'entrée peut donner lieu à plusieurs entités de sortie. Par exemple, une seule image est susceptible de contenir plusieurs objets détectables.

Détection d'objets

Les objets identifiés avec succès donneront lieu à des entités de sortie avec des attributs décrivant les objets. Une géométrie de la boîte de délimitation sera également renvoyée, avec une valeur de confiance distincte. Chaque image d'entrée peut donner lieu à plusieurs entités de détection.

Si vous utilisez un fichier local ou une géométrie raster en entrée, la boîte englobante est exprimée en pixels et s'aligne sur l'entrée. Lors de l'utilisation d'un fichier sur S3, la taille de l'image n'étant pas connue, le rectangle de délimitation de sortie sera exprimé en termes de ratio de l'image d'origine. Par exemple, si un objet occupe un quart de l'image, la boîte englobante aura une taille de 0,5 par 0,5.

Attributs

_detection_label	Un mot ou une courte phrase décrivant le contenu de l'image. Les étiquettes peuvent être des descripteurs généraux de l'image ou faire référence à des instances identifiables dans l'image. Par exemple, une étiquette "Végétation" sans boîte englobante indique qu'il y a des plantes quelque part dans l'image. Une étiquette "Abies" avec une boîte englobante peut indiquer qu'il y a un sapin dans le coin supérieur gauche.
_confidence	Un nombre entre 0 et 1 qui indique la probabilité qu'une prédiction donnée soit correcte. Pour plus d'informations sur la confiance, consultez les FAQ d'Amazon Rekognition : https://aws.amazon.com/rekognition/faqs.
_bounding_box_confidence	Une valeur entre 0 et 1 qui indique la probabilité que le rectangle englobant spécifique pour un objet détecté est correct.
_parent_label{}	Une liste d'étiquettes hiérarchiquement supérieures. Par exemple, si "Helicopter" est détecté, les étiquettes parentes peuvent être "Aircraft", "Vehicle" et "Transportation".

Détection de texte

Un texte identifié avec succès donnera lieu à des entités de sortie avec des attributs décrivant le texte. Les entités seront produites pour les lignes de texte, et pour les mots individuels de chaque ligne. Chaque entité aura une boîte de délimitation pour la ligne ou le mot.

Si vous utilisez un fichier local ou une géométrie raster en entrée, la boîte englobante est exprimée en pixels et s'aligne sur l'entrée. Lorsque vous utilisez un fichier sur S3, la taille de l'image n'est pas connue. Le rectangle de délimitation de sortie sera donc exprimé en termes de ratio de l'image d'origine. Par exemple, si une ligne de texte occupe 80 % de la largeur de l'image, la boîte englobante aura une largeur de 0,8.

Attributs

_text	Le texte détecté dans la ligne ou le mot.
_confidence	Un nombre entre 0 et 1 qui indique la probabilité qu'une chaîne de texte donnée soit correcte. Pour plus d'informations sur la confiance, consultez les FAQ d'Amazon Rekognition : https://aws.amazon.com/rekognition/faqs
_type	Le type de texte détecté. Les lignes sont des sections de texte qui sont alignées sur le même axe horizontal. Les phrases peuvent être réparties sur plusieurs lignes. Les mots sont des sections de texte séparées par des espaces, et sont associés à des lignes parentes. Options : LINE, WORD
_id	Le numéro identifiant l'entité. Si l'entité représente une ligne de texte, l'identifiant est unique dans l'image. Si l'entité représente un mot, l'identifiant est unique dans la ligne mère.
_parent_id	La valeur _id de la ligne où est le mot. La valeur est nulle pour les lignes.

Détection de visage

Les visages identifiés avec succès donneront lieu à des entités de sortie avec des attributs décrivant le visage. Chaque entité aura une boîte de délimitation pour le visage. En option, les "points de repère" du visage, tels que le "nez", le "menton" ou la "ligne médiane de la mâchoire" seront également ajoutés en tant que géométries de points supplémentaires sur l'entité.

Attributs

De nombreux attributs pour la détection des visages ont une valeur et une confiance associée. Ceci est indiqué par deux attributs, sous la forme _characteristic.value et _characteristic.confidence. La confiance est comprise entre 0 et 1. Sauf indication contraire, toutes les caractéristiques détectées prennent cette forme.

_age_range	L'âge estimé du sujet. Il n'y a pas de valeur de confiance explicite pour la fourchette d'âge. Une fourchette plus petite indique une plus grande confiance dans l'estimation. low : Le bas de la tranche d'âge estimée high: Le haut de la tranche d'âge estimée
_beard	Si le sujet a ou non une barbe.
_confidence	La confiance globale que l'entité détectée est un visage humain.
_eyeglasses	Si le sujet porte ou non des lunettes.
_eyes_open	Si les yeux du sujet sont ouverts.
_gender	Si le sujet est un homme ou une femme.
_mouth_open	Si la bouche du sujet est ouverte.
_mustache	Si le sujet a une moustache.
_pose	pitch : l'angle d'inclinaison du sujet vers le bas ou le haut roll : l'angle d'inclinaison du sujet latéralement yaw : l'angle d'inclinaison du sujet vers la gauche ou la droite. Il n'y a pas de valeurs de confiance associées avec cette caractéristique.
_quality	brightness : luminosité de l'image sharpness : la netteté de l'image Il n'y a pas de valeurs de confiance associées avec cette caractéristique.
_smile	Si le sujet sourit.
_sunglasses	Si le sujet porte des lunettes de soleil.

Modération d'image

Aucune entité ne sera renvoyé via le port Output lors d'une modération d'image.

Détection des EPI

Attributs

_confidence	Le score de confiance entre 0 et 1 que l'objet EPI est détecté.
_detection_type	Le type d'EPI détecté, tel que FACE_COVER.
_covers_body_part	Une valeur booléenne indiquant si l'EPI couvre une partie du corps.
_covers_body_part_confidence	Le score de confiance entre 0 et 1 que l'objet EPI couvre la partie du corps.
_bouding_box_confidence	Le score de confiance entre 0 et 1 que le rectangle de délimitation de l'EPI est exact.

Résumé

La sortie dépendra de l'analyse choisie. Une seule entité de résumé de sortie sera produite par entité d'entrée.

Détection d'objets

Une entité de résumé avec la géométrie et les attributs d'origine préservés sera toujours produite par le port Résumé. Des attributs seront ajoutés pour indiquer les étiquettes qui s'appliquent à l'image en général, et non à une zone spécifique.

Attributs

_detection_labels{}.confidence	Un nombre entre 0 et 1 qui indique la probabilité qu'une étiquette donnée soit correcte. Pour plus d'informations sur la confiance, consultez les FAQ d'Amazon Rekognition : https://aws.amazon.com/rekognition/faqs.
_detection_labels{}.name	Un mot ou une phrase décrivant le contenu de l'image.
_detection_labels{}.parent	Pour le descripteur dans _labels{n}.name, _labels{n}.parent contiendra une liste de descripteurs parent séparés par des virgules.

Détection de texte

Une entité de résumé avec la géométrie et les attributs originaux préservés sera toujours produite par le port Résumé. Des attributs seront ajoutés pour indiquer le nombre de lignes et de mots détectés.

Attributs

_detected_words	Le nombre de mots qui sont détectés dans l'image.
_detected_lines	Le nombre de lignes de texte qui sont détectées dans l'image.

Détection de visage

Une entité de résumé avec la géométrie et les attributs originaux préservés sera toujours produite par le port Résumé. Des attributs seront ajoutés pour indiquer le nombre de faces détectées.

Attributs

_detected_faces

Le nombre de visages qui sont détectés dans l'image.

Modération d'image

Une entité de résumé avec la géométrie et les attributs originaux préservés sera toujours produite par le port Résumé. Si un contenu dangereux est détecté, des attributs de liste seront ajoutés pour indiquer quel type de contenu à risque a été trouvé.

Attributs

_safe_image	Une valeur booléenne (oui/non) indique si l'image est sûre, dans la valeur de confiance spécifiée. Par exemple, si le niveau de confiance a été fixé à 0,95 et que l'image est jugée sûre, cela signifie qu'aucune étiquette de modération n'a pu être détectée avec un score de confiance d'au moins 0,95.
_moderation_labels{}.confidence	Un nombre entre 0 et 1 qui indique la probabilité qu'une étiquette de modération donnée soit correcte. Pour plus d'informations sur la confiance, consultez les FAQ d'Amazon Rekognition : https://aws.amazon.com/rekognition/faqs.
_moderation_labels{}.name	Une phrase indiquant le type de contenu à risque. Il existe plusieurs catégories de premier niveau que le service détecte. Au sein de chaque catégorie, il existe des sous-catégories qui peuvent également apparaître dans cette liste. Nudité explicite Nudité Nudité masculine graphique Nudité féminine graphique Activité sexuelle Nudité partielle Suggestif Maillot de bain ou sous-vêtement féminin Maillot de bain ou sous-vêtement masculin Vêtements révélateurs Violence
_moderation_labels{}.parent	Si la liste d'objets pour _labels{n}.name est une sous-catégorie, _labels{n}.parent contiendra sa catégorie parente.

Détection des EPI

Attributs

_person_count	Le nombre total de personnes
_ppe_count	Le nombre total d'équipements EPI

Paramètres

Authentification

Source des identifiants	RekognitionConnector peut utiliser des informations d'identification provenant de différentes sources. L'utilisation d'une connexion web s'intègre mieux avec FME, mais dans certains cas, vous pouvez souhaiter utiliser l'une des autres sources. Connexion web: - utiliser une connexion web Amazon Web Services enregistrée dans la base de données de connexions FME. Intégrée: - intégrer un nom de compte et une clé d'accès en tant que paramètres dans le Transformer Système - utiliser les informations d'identification déjà configurées sur le système. Cela permet d'utiliser l'authentification basée sur les rôles IAM. Pour plus d'informations sur la configuration des informations d'identification AWS à l'échelle du système, consultez la page https://docs.aws.amazon.com/cli/latest/userguide/cli-chap-getting-started.html#config-settings-and-precedence.
Compte	Disponible lorsque la source d'accréditation est une connexion Web. Pour créer une connexion Rekognition, cliquez sur le menu déroulant "Compte" et sélectionnez "Ajouter une connexion Web...". La connexion pourra ensuite être gérée via Outils -> Options FME... -> Connexions Web.
Région	La région AWS par laquelle vous souhaitez accéder à Rekognition. Pour optimiser la latence, la meilleure pratique consiste à spécifier la région correcte.
Clé d'accès et Clé d'accès secrète	Disponible lorsque la source d'accréditation est Intégrée. Un ID de clé d'accès et une clé d'accès secrète peuvent être spécifiés directement dans le Transformer au lieu d'une connexion web.

Requête

Image Source	Où obtenir l'image d'entrée pour la détection. Les options sont les suivantes : Fichier : Spécifier un chemin ers un fichier JPEG ou PNG sur le disque. Fichier sur S3 : spécifier un compartiment S3 et une clé. Géométrie raster : utiliser la géométrie raster des entités entrantes.
Nom du fichier en entrée	Si Fichier est sélectionné pour l'image source, le chemin du fichier JPEG ou PNG à utiliser
Compartiment/clé	Si Fichier sur S3 est sélectionné pour l'image source, le chemin sur S3 à utiliser
Action	Le type d'opération à effectuer. Les choix possibles sont : Détection d'objets : Détection d'étiquettes pour l'image donnée. Si possible, les instances de chaque étiquette seront identifiées avec des boîtes de délimitation en sortie. Détection de texte : Détectez du texte (jusqu'à 50 mots) dans l'image donnée. Des boîtes englobantes seront produites pour chaque ligne détectée et pour chaque mot détecté dans la ligne. Détection de visages : Détecter les visages et leurs caractéristiques dans l'image donnée. Des boîtes englobantes seront produites pour chaque visage détecté. Modération d'image : détecte les contenus non-sécurisés dans les images. Détection des EPI : Détectez les équipements de protection individuelle tels que les masques et les gants dans une image. Des boîtes englobantes sont produites pour chaque équipement et la partie du corps à laquelle il s'applique, comme le visage.

Les autres paramètres disponibles dépendent de la valeur du paramètre Requête > Action. Les paramètres de chaque action sont détaillés ci-dessous.

Éditer les paramètres des Transformers

À l'aide d'un ensemble d'options de menu, les paramètres du Transformer peuvent être attribués en faisant référence à d'autres éléments de traitement. Des fonctions plus avancées, telles qu'un éditeur avancé et un éditeur arithmétique, sont également disponibles dans certains Transformers. Pour accéder à un menu de ces options, cliquez sur à côté du paramètre applicable. Pour plus d'informations, voir Options de menus et paramètres de Transformer.

Définir les valeurs

Il existe plusieurs façons de définir une valeur à utiliser dans un Transformer. La plus simple est de simplement taper une valeur ou une chaîne de caractères, qui peut inclure des fonctions de différents types comme des références d'attributs, des fonctions mathématiques et de chaînes de caractères, et des paramètres de traitement. Il existe un certain nombre d'outils et de raccourcis qui peuvent aider à construire des valeurs, généralement disponibles dans le menu contextuel déroulant adjacent au champ de valeur.

Définir des valeurs de paramètres

Utilisation de l'éditeur de texte

L'éditeur de texte fournit un moyen efficace de construire des chaînes de textes (dont les expressions régulières) à partir de données source diverses, telles que des attributs, des paramètres et des constantes, et le résultat est directement utilisé dans le paramètre.

Editeur de texte

Utilisation de l'éditeur arithmétique

L'éditeur arithmétique fournit un moyen simple de construire des expressions mathématiques à partir de plusieurs données source, telles que des attributs et des fonctions, et le résultat est directement utilisé dans un paramètre.

Éditeur arithmétique

Valeur conditionnelle

Définit des valeurs selon un ou plusieurs tests.

Fenêtre de définition de conditions

Contenu

Les expressions et chaînes de caractères peuvent inclure des fonctions, caractères, paramètres et plus.

Lors du paramétrage des valeurs - qu'elles soient entrées directement dans un paramètre ou construites en utilisant l'un des éditeurs - les chaînes de caractères et les expressions contenant des fonctions Chaîne de caractères, Math, Date et heure ou Entité FME auront ces fonctions évaluées. Par conséquent, les noms de ces fonctions (sous la forme @<nom_de_fonction>) ne doivent pas être utilisés comme valeurs littérales de chaîne de caractères.

Types de contenu

Fonctions chaînes de caractères	Ces fonctions manipulent les chaînes de caractères.
Caractères spéciaux	Un ensemble de caractères de contrôle est disponible dans l'éditeur de texte.
Fonctions mathématiques	Plusieurs fonctions sont disponibles dans les deux éditeurs.
Fonctions Date/heure	Les fonctions de dates et heures sont disponibles dans l'Editeur texte.
Opérateurs mathématiques	Ces opérateur sont disponibles dans l'éditeur arithmétique.
Fonctions d'entités	Elles retournent des valeurs spécifiques aux entités.
Paramètres FME	Les paramètres FME et spécifiques au traitement peuvent être utilisés.
Créer et modifier un paramètre publié	Créer ses propres paramètres éditables.

Options - Tables

Les Transformers avec des paramètres de style table possèdent des outils additionnels pour remplir et manipuler des valeurs.

Outils de tableau

Réordonner

Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :

Ajouter une ligne
Supprimer une ligne
Déplacer la ligne en cours au dessus
Déplacer la ligne en cours en dessous
Déplacer la ligne en cours en haut de liste
Déplacer la ligne en cours en bas de liste

Couper, Copier et Coller

Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :

Couper une ligne - supprime et copie dans le presse-papiers.
Copie une ligne dans le presse-papiers.
Colle une ligne depuis le presse-papiers.

Copier, copier et coller peuvent être utilisés au sein d'un Transformer ou entre Transfromers.

Filtre

Commencez à taper une chaîne de caractères, et la matrice n'affichera que les lignes correspondant à ces caractères. Recherche dans toutes les colonnes. Cela n'affecte que l'affichage des attributs dans le Transformer - cela ne change pas les attributs qui sont sortis.

Importer

Le bouton d'import remplit la table avec un jeu de nouveaux attributs lus depuis un jeu de données. L'application spécifique varie selon les Transformers.

Réinitialiser/Rafraîchir

Réinitialise la table à son état initial, et peut fournir des options additionnelles pour supprimer des entrées invalides. Le comportement varie d'un Transformer à l'autre.

Note : Tous les outils ne sont pas disponibles dans tous les Transformers.

Références

Comportement	Basé sur des entités
Stockage des entités	Non
Dépendances	Compte Amazon AWS avec accès à Rekognition
Alias	AmazonAWSRekognitionConnector
Historique	Implémenté dans FME 2019.2

FME Community

FME Community est l'endroit où trouver des démos, des tutoriaux, des articles, des FAQ et bien plus encore. Obtenez des réponses à vos questions, apprenez des autres utilisateurs et suggérez, votez et commentez de nouvelles entités.

Voir tous les résultats à propos de ce Transformer sur FME Community.

Les exemples peuvent contenir des informations sous licence Open Government - Vancouver et/ou Open Government - Canada.

Confiance minimum (0.0-1.0)	Le plus bas niveau de confiance de détection à inclure dans les résultats.
Nombre maximum d'objets	Le nombre maximum d'objets (étiquettes) à détecter par image fournie.

RekognitionConnector

Catégories

Transformers liés

Cas d'utilisation courants

Comment fonctionne-t-il ?

Notes

Configuration

Ports en entrée

Ports de sortie

Détection d'objets

Détection de texte

Détection de visage

Modération d'image

Détection des EPI

Détection d'objets

Détection de texte

Détection de visage

Modération d'image

Détection des EPI

Paramètres

Éditer les paramètres des Transformers

Définir les valeurs

Utilisation de l'éditeur de texte

Utilisation de l'éditeur arithmétique

Valeur conditionnelle

Contenu

Options - Tables

Références

FME Community