使用正則表達式處理Unicode中文難字匹配 日期: 12月 22, 2017 取得連結 Facebook X Pinterest 以電子郵件傳送 其他應用程式 一般來說, 網路上查到的中文字通常都是教你用[\u4E00-\u9fa5]匹配 原理:Unicode編碼表4E00~9FFF http://jicheng.tw/hanzi/unicode.html?s=4E00&e=9FFF 但有些難字在別的區段, 如:Unicode編碼表3400~4DBF http://jicheng.tw/hanzi/unicode.html?s=3400&e=4DBF 解法: 可以改為[\u3400-\u4DBF]|[\u4E00-\u9fa5]匹配 暫時還沒空深入研究,先記下解法 留言
留言
張貼留言