Transformers FME: 2025.0

Categories
Base de données
Chaînes de caractères

TextEncoder

Encode une chaîne de caractères en utilisant les méthodes URL, Unicode HTML, Base64, HEX, ou Octal.

URL (Encodage par pourcentage)

Ce codage est utilisé pour s'assurer qu'une chaîne de caractères est valide pour être incluse dans une URL. Tous les caractères qui ne sont pas une lettre, un chiffre, un tiret, un point, un trait de soulignement ou un tilde seront encodés. Le TextEncoder convertit une chaîne de texte brut, telle que noir & blanc, en sa forme codée noir%20%26%20blanc .

Unicode

Les caractères non ASCII sont encodés dans une chaîne ASCII. Tous les caractères ayant une représentation ASCII standard ne sont pas encodés. Le TextEncoder encode dans n'importe laquelle de ces représentations :

  • Paires de substituts : Tout point de code compris entre U+0000 et U+FFFF est codé sous la forme \uXXXX . Pour les points de code supérieurs, l'encodage prend la forme d'une paire de substitution \uXXXX\uXXXX selon le schéma d'encodage UTF-16.
  • ECMAScript 6 : Tous les points de code sont codés sous la forme \{XX...X}, où les accolades peuvent contenir de 4 à 6 chiffres hexadécimaux. Il s'agit de la convention de la séquence d'échappement Unicode selon l'ECMAScript 6.
  • ECMAScript 6 (grands points de code uniquement) : Tout point de code compris entre U+0000 et U+FFFF est codé comme \uXXXX . Tous les points de code situés en dehors de cette plage sont codés sous la forme \{XX...X} .
  • Python : Tout point de code compris entre U+0000 et U+FFFF est codé comme \uXXX , et tout point de code supérieur est codé comme \UXXXXXXXX. Il s'agit de la convention Python.

XML

Cet encodage est utilisé pour garantir que les chaînes de caractères peuvent être utilisées dans un document XML. Les caractères qui ont une signification syntaxique dans le XML sont échappés, en utilisant le mappage suivant :

Caractère Valeur encodée
< &lt;
> &gt;
" &quot;
& &amp;
' &apos;

De plus, l'encodage XML permet de représenter tout caractère en utilisant la représentation décimale ou hexadécimale de son point de code Unicode. Le TextEncoder convertira une chaîne de texte, telle que noir & blanc, en sa représentation XML, noir &amp ; blanc .

HTML

Cet encodage est une extension de l'encodage XML. L'encodage HTML comprend de nombreux caractères qui ne peuvent pas être représentés à l'aide d'un simple jeu de caractères latins, tels que ♪, ± ou ∞. Le TextEncoder convertira une chaîne de texte, telle que ceci ± cela en sa représentation HTML, ceci &plusm ; cela.

Base64

L'encodage Base64 est une méthode de stockage de données arbitraires sous forme de chaîne ASCII. Lorsque cette méthode est sélectionnée, le TextEncoder convertit une chaîne de texte UTF-8 en une chaîne de caractères ASCII. Notez que les attributs seront convertis en UTF-8 avant d'être encodés en Base64. Si cela n'est pas souhaitable, envisagez d'utiliser le BinaryEncoder, car il ne modifiera pas le codage des caractères des valeurs d'attributs.

HEX

Le codage HEX est une autre méthode utilisée pour stocker des données arbitraires sous forme de chaîne ASCII. Les données codées HEX ne sont pas aussi compactes que les données codées Base64. Lorsque cette méthode est sélectionnée, le TextEncoder convertit une chaîne de texte UTF-8 en une chaîne de caractères ASCII. Notez que les attributs seront convertis en UTF-8 avant d'être encodés en HEX. Si cela n'est pas souhaitable, envisagez d'utiliser le BinaryEncoder, car il ne modifiera pas le codage des caractères des valeurs d'attributs.

Octal

Le codage octal est une autre méthode utilisée pour stocker des données arbitraires sous forme de chaîne ASCII. Les données codées en octal ne sont pas aussi compactes que les données codées en HEX ou en Base64. Chaque octet de données est représenté par 3 caractères encodés. Lorsque cette méthode est sélectionnée, le TextEncoder convertit une chaîne de texte UTF-8 en une chaîne de caractères ASCII. Notez que les attributs seront convertis en UTF-8 avant d'être encodés en octal. Si cela n'est pas souhaitable, envisagez d'utiliser le BinaryEncoder, car il ne modifiera pas l'encodage des caractères des valeurs d'attributs.

Configuration

Paramètres

Éditer les paramètres des Transformers

Les paramètres du Transformer peuvent être définis en saisissant directement des valeurs, en utilisant des expressions ou en faisant référence à d'autres éléments de l'espace de travail tels que des valeurs d'attributs ou des paramètres utilisateur. Divers éditeurs et menus contextuels sont disponibles pour vous aider. Pour voir ce qui est disponible, cliquez sur à côté du paramètre concerné.

Pour plus d'information, consulter la section Options des Transformers.

FME Community

FME Community dispose d'une mine de connaissances sur FME, avec plus de 20 000 membres actifs dans le monde entier. Obtenez de l'aide sur FME, partagez vos connaissances et entrez en contact avec des utilisateurs du monde entier.

Voir tous les résultats à propos de ce Transformer sur FME Community.

Mots clefs : URLEncoder décoder encoder