UTF-7 - Google

UTF-7

Z Wikipedii

Skocz do: nawigacji, szukaj

UTF-7 (ang. 7-bit Unicode Transformation Format) sposób zapisu tekstu w formacie Unicode przy użyciu zmiennej ilości znaków ASCII, nadający się na przykład do użycia w wiadomościach MIME.

Listy wysyłane przy użyciu MIME muszą być zapisane wyłącznie przy użyciu ASCII, więc każdy list używający bezpośrednio ośmio- lub szesnastobitowego unikodu (na przykład UTF-16) jest traktowany jako wadliwy. Unikod zapisany przy użyciu UTF-7 może być przesyłany bez użycia nagłówka Content-Transfer-Encoding (który specyfikuje sposób reprezentacji danych binarnych za pomocą tekstu ASCII), ale pod warunkiem, że kodowanie znaków zostanie jawnie określone. Dodatkowo, przy użyciu UTF-7 w nagłówkach (np. Subject:), należy wykorzystać Encoded-Word ze standardu MIME, żeby to ujawnić.

Główną wadą UTF-7 jest jego niewygodne przetwarzanie: większość znaków ASCII może kodować niemal dowolne znaki Unicode a każdy znak Unicode można zakodować na wiele sposobów (w zależności od sąsiednich znaków). Internet Mail Consortium zachęca do niestosowania UTF-7 w poczcie elektronicznej.

Zmodyfikowana postać UTF-7 jest używana przez protokół IMAP.

Spis treści

[edytuj] Opis

Kodowanie UTF-7 zostało po raz pierwszy zdefiniowane w dokumencie RFC 1642 (A Mail-Safe Transformation Format of Unicode), który później został zastąpiony przez RFC 2152.

Znaki o kodach poniżej 0x80 (notacja szesnastkowa), w zakresie ASCII (z wyjątkiem znaku +) są zapisywane bez zmian. Każdy znak o kodzie powyżej 0x80 jest zapisywany przy użyciu następującej sekwencji:

  • znak +
  • reprezentacja UTF-16, zakodowana w zmodyfikowanym Base64
  • znak - (ignorowany) lub znak nowej linii lub powrotu karetki (te nie sÄ… ignorowane).

Znak + jest zapisywany jako +-.

[edytuj] Przykłady

  • "Hello, World!" przechodzi na "Hello, World!"
  • "1 + 1 = 2" przechodzi na "1 +- 1 = 2"
  • "£1" przechodzi na "+AKM-1". Pozycja znaku funta brytyjskiego w UTF-16 to 0x00A3. Zapis w zmodyfikowanym kodzie Base64:
    • 0b000000 = 0 = 'A'
    • 0b001010 = 10 = 'K'
    • 0b0011[00] = 12 = 'M', przy czym ostatnie dwa bity oktetu sÄ… wypeÅ‚nieniem (padding).

[edytuj] Zobacz też

[edytuj] Linki zewnętrzne


Indeks Philadelphia Fed w sierpniu minus 12,7 pkt
Indeks Philadelphia Fed w sierpniu wzrósł do minus 12,7 pkt z minus 16,3 pkt w lipcu - podał Fed z Filadelfii w czwartek w komunikacie.
Ustawa o pomostówkach trafi do Sejmu po 10 września
Ustawa o emeryturach pomostowych zostanie skierowana do Sejmu po 10 września - powiedziała PAP Agnieszka Chłoń-Domińczak, wiceminister pracy i polityki społecznej.
Spadł indeks wyprzedzający koniunktury w USA
Amerykański indeks wyprzedzający koniunktury spadł w lipcu o 0,7 proc., po spadku w czerwcu o 0,1 proc. - podała w czwartek Conference Board.
IBM: centrum operacji biznesowych w Warszawie
Amerykański koncern informatyczny IBM zdecydował o otwarciu w tym roku 13 centrów zapewnienia ciągłości operacji biznesowych kosztem 300 mln USD.
Złoty pod wpływem dolara
Złoty osłabił się po danych z USA o liczbie nowych bezrobotnych, która okazała się niższa od oczekiwań analityków, co wpłynęło na umocnienie się dolara. Rynek długu po porannym umocnieniu znalazł w punkcie równowagi.
Linki: Strona g³ówna