RecognizeUtf8Text

RtfLoadOptions.RecognizeUtf8Text property

Wenn eingestellt aufWAHR ,CharsetDetector wird versuchen, UTF8-Zeichen zu erkennen, sie bleiben beim Import erhalten.

Der Standardwert istFALSCH .

public bool RecognizeUtf8Text { get; set; }

Beispiele

Zeigt, wie UTF-8-Zeichen beim Laden eines RTF-Dokuments erkannt werden.

// Erstellen Sie ein „RtfLoadOptions“-Objekt, um zu ändern, wie wir ein RTF-Dokument laden.
RtfLoadOptions loadOptions = new RtfLoadOptions();

// Setzen Sie die Eigenschaft „RecognizeUtf8Text“ auf „false“, um anzunehmen, dass das Dokument den ISO 8859-1-Zeichensatz verwendet
// und lädt jedes Zeichen im Dokument.
// Setzen Sie die Eigenschaft „RecognizeUtf8Text“ auf „true“, um alle Zeichen variabler Länge zu analysieren, die im Text vorkommen können.
loadOptions.RecognizeUtf8Text = recognizeUtf8Text;

Document doc = new Document(MyDir + "UTF-8 characters.rtf", loadOptions);

Assert.AreEqual(
    recognizeUtf8Text
        ? "“John Doe´s list of currency symbols”™\r" +
          "€, ¢, £, ¥, ¤"
        : "“John Doe´s list of currency symbolsâ€\u009dâ„¢\r" +
          "€, ¢, £, ¥, ¤",
    doc.FirstSection.Body.GetText().Trim());

Siehe auch