Introduction To .NET Regular Expression
試想以下的情境:
- 公司最近要研發一套類似Google的網頁搜索引擎,你負責開發網頁擷取器核心,其中最棘手的部分是要具備由一個網頁再延伸至其所超連結出去的其他網頁…
- 行銷人員拿來一份十萬筆客戶地址檔,請你解析出縣市、郵遞區號、地址三個欄位轉入CRM系統,但要命的是原始資料雜亂不已,有的郵遞區號在前,有的在中間…
- 你加入了檢索引擎過濾器(Filter)的開發團隊,目標是將各式資料檔中的純文字部份提取出來,你的第一件任務是簡單的HTML檔案解析,但是,HTML原始碼千變萬化…
以上的挑戰當然不是每位程式開發者都有機會遭遇,但應該沒有人會否認能寫出這等程式的傢伙還真有兩把刷子。
好像還是有些人不太曉得Regular Expression的威力,簡單來說,針對複雜的文字串處理(例如: 將一篇文章中所有出現的URL都挑出來),Regular Express vs 土法鍊鋼,會是 兩行 vs 200行 的強烈對比。
以下這篇文章是我小時候投稿RUN!PC雜誌的作品(即使現在寫RegEx,忘了語法時我也是先查這篇,足見其實用性),介紹.NET中一群好用但常被遺忘的類別--Regular Expression,並展示如何讓文字處理程式的發展工作單純一點、輕鬆一些。Regular Expression的技巧學好了,應用無窮(連UltraEditor、Grep等Command Utility都看到到它的蹤跡),保證值回票值,Check It Out!
文章下載