StatisticsCalculator

Calcule des statistiques selon un attribut désigné ou un ensemble d'attributs des entités en entrée et ajoute les résultats en tant qu'attributs.

Aller à la configuration

Cas d'utilisations typiques

Inspecter et analyser des entités
Calculer des statistiques pour de futures opérations

Comment fonctionne-t-il ?

Le StatisticsCalculator reçoit des entités et calcule des statistiques sélectionnées sur celles-ci par attribut. Les statistiques peuvent être calculées sur des groupes spécifiques d'entités d'entrée, comme spécifié par l'option d'attribut Regrouper par. Les résultats sont émis pour chaque entité à partir du port Complete. Un résumé des résultats est émis par le port Summary.

Les statistiques disponibles incluent :

Minimum
Maximum
Compte total
Somme
Moyenne
Médiane
Compte numérique
Nombre de valeurs
Distance
Écart-type (échantillon ou population)
Mode
Histogramme

Les statistiques suivantes peuvent également être calculées de manière cumulative sur les attributs à l'aide de paramètres avancés : min, max, plage, moyenne, stdev, somme, nombre total, nombre de valeurs numériques et nombre de valeurs. Lors du calcul des statistiques cumulatives, les résultats actuels sont affichés sur chaque entité à partir du port Cumulative.

Les statistiques sont stockées en tant qu'attributs, nommés <attribut>.<nomdestatistique>, ou<nomdestatistique> est l'une des possibilités suivantes : min, max, range, mean, stdev, stdev_p, sum, median, mode, total_count, numeric_count, value_count, histogram.

Les statistiques d'histogrammes sont stockées en tant qu'attributs de liste qui apparient la valeur d'attribut et le compte pour chaque valeur unique de l'attribut et sont nommées <attribute>.histogram(#).value et <attribute>.histogram(#).count où # est un index débutant par 0 des valeurs d'attributs uniques.

Gestion des données en entrée

Les données invalides, <null> et <manquantes> sont considérées comme non valides et seront ignorées lors du calcul de statistiques autres que le nombre total. Si aucune valeur valide n'est traitée lors du calcul d'une statistique, le résultat sera <manquant>. Essayer de calculer l'écart-type sur une seule valeur entraînera également un résultat <manquant>. Le compte total, le compte numérique et le compte de valeurs ne seront jamais <manquant>. Les valeurs NaN sont explicitement ignorées lors du calcul de Min, Max, Plage, et Nombre de valeurs numériques.

Par exemple, une somme calculée sur toutes les valeurs <manquantes> sera <manquante> plutôt qu'un 0 potentiellement trompeur et moins informatif. Cependant, si seulement certaines valeurs sont <manquantes> ou invalides, la somme résultante sera la même que si ces valeurs étaient 0.

Exemples

Notes

StatisticsCalculator a des suffixes par défaut et préfixe toujours. Les Transformers mis à jour conserveront les paramètres de préfixe lorsque les noms des attributs de sortie n'étaient pas préfixés avant la mise à jour ainsi que les noms des suffixes afin de maintenir la compatibilité ascendante et d'éviter de perturber les traitement existants.

Configuration

Ports d'entrée

Ports de sortie

Paramètres

Traitement par groupe

Regrouper par

Si les attributs Regrouper par sont choisis, les statistiques seront calculées indépendamment dans chaque groupe d'entités. Cela peut être utilisé pour créer une analyse de type tableau croisé dynamique des valeurs dans un flux de données.

Traitement des regroupements

Sélectionnez le moment du traitement où les groupes sont traités :

Quand toutes les entités sont reçues

Comportement par défaut. Le traitement ne se produira dans ce Transformer que lorsque toutes les entrées seront présentes.

Quand le groupe change (avancé)

Ce Transformer traitera les groupes en entrée dans l'ordre. Les changements de la valeur du paramètre Regrouper par sur le flux d'entrée déclencheront le traitement du groupe en cours de regroupement. Cela peut améliorer la vitesse globale (en particulier avec plusieurs groupes de taille égale), mais peut provoquer un comportement indésirable si les groupes en entrée ne sont pas ordonnés.

Statistiques à calculer

Attribut

Sélectionnez les attributs à inclure, un par ligne.

Statistiques

Les statistiques suivantes peuvent être calculées :

Minimum	Le minimum numérique pour les attributs numériques. Le minimum lexical pour les attributs de type chaîne de caractères.
Maximum	Le maximum numérique pour les attributs numériques. Le maximum lexical pour les attributs de type chaîne de caractères.
Compte total	Le nombre d'entités en entrée.
Somme	La somme de toutes les valeurs. Indéfini pour les attributs de type chaîne.
Moyenne	La valeur moyenne, calculée comme la somme des valeurs divisée par le nombre de valeurs. Indéfini pour les attributs de type chaîne.
Médiane	La valeur médiane des valeurs d'attributs ordonnées. Si le nombre d'attributs est pair, Median renvoie la moyenne des deux valeurs centrales. Pour les attributs de type chaîne, la première valeur centrale est toujours utilisée.
Compte numérique	Le nombre de valeurs numériques qui sont entrées dans le Transformer. En particulier, les valeurs manquantes, nulles, et NaN sont ignorées, et ne sont pas incluses dans ce compte.
Nombre de valeurs	Le nombre de valeurs qui sont entrées dans le Transformer, en ignorant <null> et <missing>. Lorsque la Méthode de calcul est Numérique, seules les valeurs qui peuvent être converties en chiffres seront comptées.
Distance	Le maximum moins le minimum. Indéfini pour les attributs de type chaîne.
Écart-type d'échantillon	L'écart-type de l'échantillon. L'écart type de l'échantillon est mesuré par la méthode "non biaisée" ou "n-1". Indéfini pour les attributs de type chaîne.
Écart-type de population	L'écart-type de la population. Indéfini pour les attributs de type chaîne.
Mode	La plus fréquente de toutes les valeurs. Si le jeu de données est bimodal (deux valeurs ou plus apparaissent avec la fréquence la plus élevée), l'une des valeurs sera retournée de manière aléatoire.
Histogramme	Un compte pour chaque valeur unique rencontrée pour l'attribut analysé. Les résultats sont donnés sous la forme d'une liste structurée d'attributs qui représentent des paires (valeur,nombre).

Tout sélectionner

Ce bouton fonctionne en conjonction avec les lignes actuellement sélectionnées dans le tableau des statistiques à calculer et permet d'activer ou de désactiver tous les choix de types de statistiques.

Ajouter des attributs…

Fournit une liste de sélection de tous les attributs actuellement disponibles pour effectuer l'ajout d'attributs multiples à la table des Statistiques à calculer.

Éditer les paramètres des Transformers

À l'aide d'un ensemble d'options de menu, les paramètres du Transformer peuvent être attribués en faisant référence à d'autres éléments de traitement. Des fonctions plus avancées, telles qu'un éditeur avancé et un éditeur arithmétique, sont également disponibles dans certains Transformers. Pour accéder à un menu de ces options, cliquez sur à côté du paramètre applicable. Pour plus d'informations, voir Options de menus et paramètres de Transformer.

Définir les valeurs

Il existe plusieurs façons de définir une valeur à utiliser dans un Transformer. La plus simple est de simplement taper une valeur ou une chaîne de caractères, qui peut inclure des fonctions de différents types comme des références d'attributs, des fonctions mathématiques et de chaînes de caractères, et des paramètres de traitement. Il existe un certain nombre d'outils et de raccourcis qui peuvent aider à construire des valeurs, généralement disponibles dans le menu contextuel déroulant adjacent au champ de valeur.

Définir des valeurs de paramètres

Utilisation de l'éditeur de texte

L'éditeur de texte fournit un moyen efficace de construire des chaînes de textes (dont les expressions régulières) à partir de données source diverses, telles que des attributs, des paramètres et des constantes, et le résultat est directement utilisé dans le paramètre.

Editeur de texte

Utilisation de l'éditeur arithmétique

L'éditeur arithmétique fournit un moyen simple de construire des expressions mathématiques à partir de plusieurs données source, telles que des attributs et des fonctions, et le résultat est directement utilisé dans un paramètre.

Éditeur arithmétique

Valeur conditionnelle

Définit des valeurs selon un ou plusieurs tests.

Fenêtre de définition de conditions

Contenu

Les expressions et chaînes de caractères peuvent inclure des fonctions, caractères, paramètres et plus.

Lors du paramétrage des valeurs - qu'elles soient entrées directement dans un paramètre ou construites en utilisant l'un des éditeurs - les chaînes de caractères et les expressions contenant des fonctions Chaîne de caractères, Math, Date et heure ou Entité FME auront ces fonctions évaluées. Par conséquent, les noms de ces fonctions (sous la forme @<nom_de_fonction>) ne doivent pas être utilisés comme valeurs littérales de chaîne de caractères.

Types de contenu

Fonctions chaînes de caractères	Ces fonctions manipulent les chaînes de caractères.
Caractères spéciaux	Un ensemble de caractères de contrôle est disponible dans l'éditeur de texte.
Fonctions mathématiques	Plusieurs fonctions sont disponibles dans les deux éditeurs.
Fonctions Date/heure	Les fonctions de dates et heures sont disponibles dans l'Editeur texte.
Opérateurs mathématiques	Ces opérateur sont disponibles dans l'éditeur arithmétique.
Fonctions d'entités	Elles retournent des valeurs spécifiques aux entités.
Paramètres FME	Les paramètres FME et spécifiques au traitement peuvent être utilisés.
Créer et modifier un paramètre publié	Créer ses propres paramètres éditables.

Options - Tables

Les Transformers avec des paramètres de style table possèdent des outils additionnels pour remplir et manipuler des valeurs.

Outils de tableau

Réordonner

Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :

Ajouter une ligne
Supprimer une ligne
Déplacer la ligne en cours au dessus
Déplacer la ligne en cours en dessous
Déplacer la ligne en cours en haut de liste
Déplacer la ligne en cours en bas de liste

Couper, Copier et Coller

Activé une fois que vous avez cliqué sur un élément de ligne. Les choix comprennent :

Couper une ligne - supprime et copie dans le presse-papiers.
Copie une ligne dans le presse-papiers.
Colle une ligne depuis le presse-papiers.

Copier, copier et coller peuvent être utilisés au sein d'un Transformer ou entre Transfromers.

Filtre

Commencez à taper une chaîne de caractères, et la matrice n'affichera que les lignes correspondant à ces caractères. Recherche dans toutes les colonnes. Cela n'affecte que l'affichage des attributs dans le Transformer - cela ne change pas les attributs qui sont sortis.

Importer

Le bouton d'import remplit la table avec un jeu de nouveaux attributs lus depuis un jeu de données. L'application spécifique varie selon les Transformers.

Réinitialiser/Rafraîchir

Réinitialise la table à son état initial, et peut fournir des options additionnelles pour supprimer des entrées invalides. Le comportement varie d'un Transformer à l'autre.

Note : Tous les outils ne sont pas disponibles dans tous les Transformers.

FME Community

FME Community est l'endroit où trouver des démos, des tutoriaux, des articles, des FAQ et bien plus encore. Obtenez des réponses à vos questions, apprenez des autres utilisateurs et suggérez, votez et commentez de nouvelles entités.

Voir tous les résultats à propos de ce Transformer sur FME Community.