題:
iconv中的UTF-8和UTF-8-MAC編碼有什麼區別和用法?
maP1E bluE
2018-12-23 01:55:39 UTC
view on stackexchange narkive permalink

iconv中的UTF-8和UTF-8-MAC編碼有什麼區別和用法?
起初我以為是\ n和\ r(MAC OS 9)之間的區別。
但是我嘗試了 iconv -f UTF-8 -t UTF-8-MAC filename > filename2
在十六進制視圖中,文件內容不會更改。

一 回答:
Tom Gewecke
2018-12-23 02:57:37 UTC
view on stackexchange narkive permalink

此處所述,utf-8-mac是應用Unicode規範化NFD之後的文本的utf 8版本(例如,重音字符由基本字符加組合重音字符表示),分解操作中排除了某些代碼點範圍。

例如,字符é可以用兩種不同的等效有效方式表示為Unicode:

  • “ \ x {00E9}”-單代碼點,帶小號的拉丁文小寫字母E,utf-8 C3 A9,“組成”。
  • “ \ x {0065} \ x {0301}”-兩個代碼點,拉丁文小寫字母E和組合重音,utf-8 65 CC 81,“已分解”

UTF-8-MAC將確保始終使用第二種分解形式。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 4.0許可。
Loading...