有愈來愈多的網站會鎖住網頁不讓使用者直接複製文字,雖然利用瀏覽器「另存新檔」功能將網頁直接存成文字檔可以解決類似問題,但是這樣存下來的文字檔排版有時會變的很亂,像是文字切不齊、一堆斷行空白間隔等等,反而造成事後編輯的困難。經常遇到類似問題的讀者,不妨把整個HTML網頁原封不動抓下來,再用「Esma HTML Remover」這個免費小工具幫你把HTML檔案中的標籤與多餘空白刪除,給你一個比較整齊好編輯的純文字檔。
STEP
1. 先利用瀏覽器的「另存新檔」功能將網頁HTML檔案存在硬碟中,再到「
http://tinyurl.com/9ycwt 」把Esma HTML Remover抓下來。
2. 執行程式前要上官網「
http://tinyurl.com/an3d2 」取得免費啟動碼輸入程式中才能順利啟動。進入主畫面後按下〔Select Input File〕選擇抓下來的HTML檔案。
※Note:若無法順利執行,請到「
http://tinyurl.com/475a 」下載安裝Microsoft VB6 Runtime到電腦中。
3. 接著按下〔Select Output File〕決定輸出文字檔的檔名。
4. 這時將「Whitespace removal」方塊中最後一項「Remove all lines - extract only words」取消勾選,以免轉出來的文字檔內容全都擠在一起。
5. 最後按下〔Remove HTML〕把HTML檔案中的標籤與過多空白清除掉並轉成純文字檔,之後再用記事本等軟體來編輯就會方便許多。