在 UNIX 刚被发明出来的那会儿,有一种叫做 ASCII 编码的东西也被发明了出来。大约就是说,用 32-127 这个范围来表示字符。比如说 65 代表了大写字母 A,97 代表了小写字母 a.

ASCII 的初衷是为了表示字符,也就是说,让计算机懂我们人类的言语。

可是,事先那群发明 ASCII 的人太傻太天真了…世界上的言语不只仅只要英语一种。由于 ASCII 仅仅只要一个字节,所以一共只要 2^8 = 256 种 ASCII 可以用来表示字符。这清楚不够啊……

所以后来那群人就又发明了 unicode 和十分盛行的 UTF-8,主要就是为了处置这个「字符危机」。之所以 UTF-8 很盛行,是由于 UTF-8 表示的英文字符和 ASCII 表示的是完全一样的,这样就可以比拟完美地处置掉一局部历史遗留效果。

详细说为什么 U+25609 代表了某个字,那你得问 unicode 协会了。其实非顺序员没必要纠结这些,顺序员一个 UTF-8 就搞定也没必要太纠结。

提供最优质的资源集合

立即查看 了解详情