RecognizeUtf8Text

RtfLoadOptions.RecognizeUtf8Text property

Lorsqu’il est réglé survrai ,CharsetDetector va essayer de détecter les caractères UTF8, ils seront conservés lors de l’importation.

La valeur par défaut estFAUX .

public bool RecognizeUtf8Text { get; set; }

Exemples

Montre comment détecter les caractères UTF-8 lors du chargement d’un document RTF.

// Crée un objet "RtfLoadOptions" pour modifier la façon dont nous chargeons un document RTF.
RtfLoadOptions loadOptions = new RtfLoadOptions();

// Définissez la propriété "RecognizeUtf8Text" sur "false" pour supposer que le document utilise le jeu de caractères ISO 8859-1
// et charge chaque caractère du document.
// Définissez la propriété "RecognizeUtf8Text" sur "true" pour analyser tous les caractères de longueur variable pouvant apparaître dans le texte.
loadOptions.RecognizeUtf8Text = recognizeUtf8Text;

Document doc = new Document(MyDir + "UTF-8 characters.rtf", loadOptions);

Assert.AreEqual(
    recognizeUtf8Text
        ? "“John Doe´s list of currency symbols”™\r" +
          "€, ¢, £, ¥, ¤"
        : "“John Doe´s list of currency symbolsâ€\u009dâ„¢\r" +
          "€, ¢, £, ¥, ¤",
    doc.FirstSection.Body.GetText().Trim());

Voir également