使用正則表達式處理Unicode中文難字匹配


一般來說,
網路上查到的中文字通常都是教你用[\u4E00-\u9fa5]匹配
原理:Unicode編碼表4E00~9FFF
http://jicheng.tw/hanzi/unicode.html?s=4E00&e=9FFF

但有些難字在別的區段,

解法:

可以改為[\u3400-\u4DBF]|[\u4E00-\u9fa5]匹配

暫時還沒空深入研究,先記下解法

留言