[Python] 使用 HTMLParser.unescape() 將 HTML entity 字元轉換成 Unicode 字元
最近在處理一個攻擊手法, 網頁的網址中,被摻入了不可見的 Unicode 空白字元 (ZWSP, Zero-Width SPaces)~ (參考 Hackers…
最近在處理一個攻擊手法, 網頁的網址中,被摻入了不可見的 Unicode 空白字元 (ZWSP, Zero-Width SPaces)~ (參考 Hackers…
今天想把 JIRA 上所有的 issue 匯出保存, 一時間找不到要如何操作… 試了半天,原來要到 Search 搜尋頁面這邊, 搜尋…
專案裡用到了 XSLT 來幫忙將 XML 轉成 HTML 和 PDF, 簡單記錄一下用法,免得常常忘記了~ 將 XML 轉成 HTML 轉 HTM…
之前在專案裡是使用 lxml 來解析 HTML 檔案, 速度很快,大部分狀況下也運作的不錯, 不過最近遇到有些比較怪異的 HTML 檔案,在 HTML 裡加入一…