========================================
五、以Unicode為核心是不錯的想法,如果是Code to Code的情況應沒問題;但若涉及詞語校正的話,要注意字節的計算。
也许先做code to code吧。原来考虑是GBK里面做简体、繁体的互相转换,现在看来以前的想法有点过期了。用GBK的原因是因为它是双字节定长编码,这比较好处理。处理完后再转换成big5。但是从现在的角度看,收录的汉字越来越多,GBK的双字节编码肯定不够用了。所以长远打算,unicode才是正道。
现在的unicode4比unicode1复杂了,原来的unicode编码用双字节就行,从2.0开始unicode扩展了字符集,如果用定长编码就要4位了。当然,和上述问题这个就是技术上的小问题了。
æ Ash æ Latin 1 Most browsers
ɐ upside down a ɐ
(250 Hex) Unicode Recommended browsers only
ɑ open a ɑ
(251 Hex)
Unicode Recommended browsers only. May be rendered as /a/ in Netscape.
ɒ upsode down a (rounded a) ɒ
(252 Hex) Unicode Recommended browsers only
α alpha α
Unicode Many Browsers
NOT Netscape 4.7
Alphabetic Index | Top of Page
B, C and D - Characters
B Characters Symbol Name Code Source Works in...
β Beta β Unicode Many Browsers
NOT Netscape 4.7
ɓ implosive b &595;
(253 Hex) Unicode Recommended browsers only