查看單個文章
舊 2007-05-07, 02:47 AM   #1 (permalink)
tungta 帥哥
長老會員
榮譽勳章
UID - 152
在線等級: 級別:49 | 在線時長:2601小時 | 升級還需:99小時級別:49 | 在線時長:2601小時 | 升級還需:99小時級別:49 | 在線時長:2601小時 | 升級還需:99小時級別:49 | 在線時長:2601小時 | 升級還需:99小時
註冊日期: 2002-12-06
住址: 台北市
文章: 4581
精華: 0
現金: 3 金幣
資產: 12715068 金幣
預設 如何把鎖住的HTML網頁內容轉換成純文字檔案

有愈來愈多的網站會鎖住網頁不讓使用者直接複製文字,雖然利用瀏覽器「另存新檔」功能將網頁直接存成文字檔可以解決類似問題,但是這樣存下來的文字檔排版有時會變的很亂,像是文字切不齊、一堆斷行空白間隔等等,反而造成事後編輯的困難。經常遇到類似問題的讀者,不妨把整個HTML網頁原封不動抓下來,再用「Esma HTML Remover」這個免費小工具幫你把HTML檔案中的標籤與多餘空白刪除,給你一個比較整齊好編輯的純文字檔。

STEP
1. 先利用瀏覽器的「另存新檔」功能將網頁HTML檔案存在硬碟中,再到「 http://tinyurl.com/9ycwt 」把Esma HTML Remover抓下來。
2. 執行程式前要上官網「 http://tinyurl.com/an3d2 」取得免費啟動碼輸入程式中才能順利啟動。進入主畫面後按下〔Select Input File〕選擇抓下來的HTML檔案。
※Note:若無法順利執行,請到「 http://tinyurl.com/475a 」下載安裝Microsoft VB6 Runtime到電腦中。
3. 接著按下〔Select Output File〕決定輸出文字檔的檔名。
4. 這時將「Whitespace removal」方塊中最後一項「Remove all lines - extract only words」取消勾選,以免轉出來的文字檔內容全都擠在一起。
5. 最後按下〔Remove HTML〕把HTML檔案中的標籤與過多空白清除掉並轉成純文字檔,之後再用記事本等軟體來編輯就會方便許多。
tungta 目前離線  
送花文章: 31, 收花文章: 4312 篇, 收花: 48309 次
有 5 位會員向 tungta 送花:
longlie (2007-05-15),moorechou (2007-05-15),pcm0326 (2007-05-12),zazoo (2007-05-13),葉鎮宇 (2007-05-07)
感謝您發表一篇好文章