Warning

此文件的目的是爲讓中文讀者更容易閱讀和理解，而不是作爲一個分支。因此，如果您對此文件有任何意見或改動，請先嘗試更新原始英文文件。如果要更改或修正某處翻譯文件，請將意見或補丁發送給維護者（聯繫方式見下）。

Note

如果您發現本文檔與原始文件有任何不同或者有翻譯問題，請聯繫該文件的譯者，或者發送電子郵件給胡皓文以獲取幫助：<src.res@email.cn>。

Original: Unicode support
譯者: 吳想成 Wu XiangCheng <bobwxc@email.cn> 胡皓文 Hu Haowen <src.res@email.cn>

Unicode（統一碼）支持¶

（英文版）上次更新：2005-01-17，版本號 1.4

此文檔由H. Peter Anvin <unicode@lanana.org>管理，是Linux註冊名稱與編號管理局（Linux Assigned Names And Numbers Authority，LANANA）項目的一部分。現行版本請見：

http://www.lanana.org/docs/unicode/admin-guide/unicode.rst

簡介¶

Linux內核代碼已被重寫以使用Unicode來將字符映射到字體。下載一個Unicode到字體（Unicode-to-font）表，八位字符集與UTF-8模式都將改用此字體來顯示。

這微妙地改變了八位字符表的語義。現在的四個字符表是：

映射代號	映射名稱	Escape代碼 (G0)
LAT1_MAP	Latin-1 (ISO 8859-1)	ESC ( B
GRAF_MAP	DEC VT100 pseudographics	ESC ( 0
IBMPC_MAP	IBM code page 437	ESC ( U
USER_MAP	User defined	ESC ( K

特別是 ESC ( U 不再是「直通字體」，因爲字體可能與IBM字符集完全不同。例如，即使加載了一個Latin-1字體，也允許使用塊圖形（block graphics）。

請注意，儘管這些代碼與ISO 2022類似，但這些代碼及其用途都與ISO 2022不匹配； Linux有兩個八位代碼（G0和G1），而ISO 2022有四個七位代碼（G0-G3）。

根據Unicode標準/ISO 10646，U+F000到U+F8FF被保留用於作業系統範圍內的分配（Unicode標準將其稱爲「團體區域（Corporate Zone）」，因爲這對於Linux是不準確的，所以我們稱之爲「Linux區域」）。選擇U+F000作爲起點，因爲它允許直接映射區域以2的大倍數開始（以防需要1024或2048個字符的字體）。這就留下U+E000到 U+EFFF作爲最終用戶區。

[v1.2]：Unicodes範圍從U+F000到U+F7FF已經被硬編碼爲直接映射到加載的字體，繞過了翻譯表。用戶定義的映射現在默認爲U+F000到U+F0FF，模擬前述行爲。實際上，此範圍可能較短；例如，vgacon只能處理256字符（U+F000..U+F0FF）或512字符（U+F000..U+F1FF）字體。

Linux 區域中定義的實際字符¶

此外，還定義了Unicode 1.1.4中不存在的以下字符；這些字符由DEC VT圖形映射使用。 [v1.2]此用法已過時，不應再使用；請參見下文。

U+F800	DEC VT GRAPHICS HORIZONTAL LINE SCAN 1
U+F801	DEC VT GRAPHICS HORIZONTAL LINE SCAN 3
U+F803	DEC VT GRAPHICS HORIZONTAL LINE SCAN 7
U+F804	DEC VT GRAPHICS HORIZONTAL LINE SCAN 9

DEC VT220使用6x10字符矩陣，這些字符在DEC VT圖形字符集中形成一個平滑的過渡。我省略了掃描5行，因爲它也被用作塊圖形字符，因此被編碼爲U+2500 FORMS LIGHT HORIZONTAL。

[v1.3]：這些字符已正式添加到Unicode 3.2.0中；它們在U+23BA、U+23BB、U+23BC、 U+23BD處添加。Linux現在使用新值。

[v1.2]：添加了以下字符來表示常見的鍵盤符號，這些符號不太可能被添加到Unicode 中，因爲它們非常討厭地取決於特定供應商。當然，這是糟糕設計的一個好例子。

U+F810	KEYBOARD SYMBOL FLYING FLAG
U+F811	KEYBOARD SYMBOL PULLDOWN MENU
U+F812	KEYBOARD SYMBOL OPEN APPLE
U+F813	KEYBOARD SYMBOL SOLID APPLE

克林貢（Klingon）語支持¶

1996年，Linux是世界上第一個添加對人工語言克林貢支持的作業系統，克林貢是由 Marc Okrand爲《星際迷航》電視連續劇創造的。這種編碼後來被徵募Unicode註冊表（ConScript Unicode Registry，CSUR）採用，並建議（但最終被拒絕）納入Unicode 平面一。不過，它仍然是Linux區域中的Linux/CSUR私有分配。

這種編碼已經得到克林貢語言研究所（Klingon Language Institute）的認可。有關更多信息，請聯繫他們：

http://www.kli.org/

由於Linux CZ開頭部分的字符大多是dingbats/symbols/forms類型，而且這是一種語言，因此根據標準Unicode慣例，我將它放置在16單元的邊界上。

Note

這個範圍現在由徵募Unicode註冊表正式管理。規範性引用文件爲：

https://www.evertype.com/standards/csur/klingon.html

克林貢語有一個26個字符的字母表，一個10位數的位置數字書寫系統，從左到右，從上到下書寫。

克林貢字母的幾種字形已經被提出。但是由於這組符號看起來始終是一致的，只有實際的形狀不同，因此按照標準Unicode慣例，這些差異被認爲是字體變體。

U+F8D0	KLINGON LETTER A
U+F8D1	KLINGON LETTER B
U+F8D2	KLINGON LETTER CH
U+F8D3	KLINGON LETTER D
U+F8D4	KLINGON LETTER E
U+F8D5	KLINGON LETTER GH
U+F8D6	KLINGON LETTER H
U+F8D7	KLINGON LETTER I
U+F8D8	KLINGON LETTER J
U+F8D9	KLINGON LETTER L
U+F8DA	KLINGON LETTER M
U+F8DB	KLINGON LETTER N
U+F8DC	KLINGON LETTER NG
U+F8DD	KLINGON LETTER O
U+F8DE	KLINGON LETTER P
U+F8DF	KLINGON LETTER Q - Written <q> in standard Okrand Latin transliteration
U+F8E0	KLINGON LETTER QH - Written <Q> in standard Okrand Latin transliteration
U+F8E1	KLINGON LETTER R
U+F8E2	KLINGON LETTER S
U+F8E3	KLINGON LETTER T
U+F8E4	KLINGON LETTER TLH
U+F8E5	KLINGON LETTER U
U+F8E6	KLINGON LETTER V
U+F8E7	KLINGON LETTER W
U+F8E8	KLINGON LETTER Y
U+F8E9	KLINGON LETTER GLOTTAL STOP
U+F8F0	KLINGON DIGIT ZERO
U+F8F1	KLINGON DIGIT ONE
U+F8F2	KLINGON DIGIT TWO
U+F8F3	KLINGON DIGIT THREE
U+F8F4	KLINGON DIGIT FOUR
U+F8F5	KLINGON DIGIT FIVE
U+F8F6	KLINGON DIGIT SIX
U+F8F7	KLINGON DIGIT SEVEN
U+F8F8	KLINGON DIGIT EIGHT
U+F8F9	KLINGON DIGIT NINE
U+F8FD	KLINGON COMMA
U+F8FE	KLINGON FULL STOP
U+F8FF	KLINGON SYMBOL FOR EMPIRE

其他虛構和人工字母¶

自從分配了克林貢Linux Unicode塊之後，John Cowan <jcowan@reutershealth.com> 和 Michael Everson <everson@evertype.com> 建立了一個虛構和人工字母的註冊表。徵募Unicode註冊表請訪問：

https://www.evertype.com/standards/csur/

所使用的範圍位於最終用戶區域的低端，因此無法進行規範化分配，但建議希望對虛構字母進行編碼的人員使用這些代碼，以實現互操作性。對於克林貢語，CSUR採用了Linux 編碼。CSUR的人正在推動將Tengwar和Cirth添加到Unicode平面一；將克林貢添加到 Unicode平面一被拒絕，因此上述編碼仍然是官方的。