潛盾機-BIG5編碼難字檢查器
網友NOROI提問有沒有將中文難字變成NCR的程式範例? 換句話說,就是程式要識別出字元是否為中文BIG5編碼所不支援的難字,若是,則轉成犇這種NCR格式。
以下是我想到的範例: (偵測難字我用的方法是試著將文字轉成BIG5編碼,如果變成?就視為難字)
1: string toNCR(string rawString)
2: {
3: StringBuilder sb = new StringBuilder();
4: Encoding big5 = Encoding.GetEncoding("big5");
5: foreach (char c in rawString)
6: {
7: //強迫轉碼成Big5,看會不會變成問號
8: string cInBig5 = big5.GetString(big5.GetBytes(new char[] {c}));
9: //原來不是問號,轉碼後變問號,判定為難字
10: if (c!='?' && cInBig5=="?")
11: sb.AppendFormat("&#{0};", Convert.ToInt32(c));
12: else
13: sb.Append(c);
14: }
15: return sb.ToString();
16: }
寫這段範例的同時,忽然想到它可以解決我一個多年來的困擾。
有時我在VS 2005/VS.NET 2003存檔時,會出現如下的警告:
有時這的確是因為我在Source Code中輸入Big5難字所引起,但更多時候卻是因為中文輸入時打錯字或選字不當引起,例如: 我就常常把"拋"輸入成"抛"。存檔時VS 2005警告檔案有難字,一臉無辜的我就知道糟了,又打錯字了,可是剛才改了幾十個地方,到底是哪一個字打錯?? 明知有錯字卻放著不改,對我來說,就像明知臉上沾著飯粒還要去約會一樣讓人不自在... 可是連哪一個字打錯都不確定,即使VS 2005有強大的Find功能,還是不知從何找起?
有了下面這台潛盾機,把臉擦乾淨就不是什麼困難的事了,YA~~