查看單個文章
舊 2006-08-11, 05:25 PM   #1
mini
管理版主
 
mini 的頭像
榮譽勳章
UID - 4144
在線等級: 級別:96 | 在線時長:9694小時 | 升級還需:103小時級別:96 | 在線時長:9694小時 | 升級還需:103小時級別:96 | 在線時長:9694小時 | 升級還需:103小時級別:96 | 在線時長:9694小時 | 升級還需:103小時級別:96 | 在線時長:9694小時 | 升級還需:103小時級別:96 | 在線時長:9694小時 | 升級還需:103小時
註冊日期: 2002-12-07
文章: 13261
精華: 0
現金: 26261 金幣
資產: 3024071 金幣
預設 下圖機器人 v2.5.6 (更新了一點 + 示範任務檔) [08/16]

http://xs104.xs.to/xs104/06325/v2.5.jpg

http://d.turboupload.com/d/866042/v2.5.7z.html
v2.5.6 載點可在下面帖子找到


這次改版了很久才告一段落 (當然也是加強了許多功能)
使用上同樣只要針對 啟始網址、抓取圖檔 及 存檔位置...等主要欄位 作設定即可


功能:
.支援Unicode的看圖 (檔案命名、檔案夾命名)
.自動更正 URL規則
.(關鍵字讀檔)更名功能
.排除存檔選項: 關鍵字排除、同檔案判別排除、同檔名排除/自動重新命名、小於此像數時排除
.計三.五種半自動作業方式 (+兩種作業模式)
.自動填表
.批次任務
==================================

<<使用說明>>
原則上將滑鼠游標擺在相關欄位上都會有彈出式簡短說明
==================================

<作業方式>
[計數模式]
當只填上 "抓取圖檔" 時並按下開始即會使用此模式 (其使用的是 語法分析作業模式)
比如 已知圖檔URL是 Http://xyz/a01.jpg ~ Http://xyz/a10.jpg 這類
就可以使用此模式
※重試次數下有兩個欄位,右邊那個欄位當為 計數模式 時,是指當嘗試抓取的編號不存在時,續數的次數
,這兩個欄位不同的作業方式會有不同的意義,原則上就是 錯誤嘗試次數的意義

[全部下載模式]
當只填上 "啟始網址" 時並按下開始即會使用此模式 (其使用的是 瀏覽器核心模式)
比如 當想把網址 Http://xyz/index.htm 下的圖片全部下載回來時
就可以使用此模式
※設定 下探[]層 可以指定 向下探測的子網頁階層數

[正常模式]
"抓取圖檔" & "啟始網址" 皆填取 就會使用此模式 (可選擇使用 瀏覽器核心 或 語法分析作業 模式)
此模式的原理是 特定目標性抓取,不會抓取不相關的檔案 可使用 [目標張數]之欄位 來確認是否全部下載到了

最後還有半個作業方式
其只作業於 語法分析作業模式 上
比如網址是 Http://xyz/ABC001-01.htm ~ Http://xyz/ABC005-10.htm
即可啟用 "分割元" 並用滑鼠點一下 區別出 欲計數的數字部分
比如: 使之變成 Http://xyz/ABC|001|-|01|.htm
如此第二回就會嘗試連結 Http://xyz/ABC|002|-|02|.htm ...

※語法分析作業模式 可使用自己編寫的外掛濾鏡 來分析特定 網頁
==================================

<批次任務>
.填好欄位後想把不同任務一次執行 即可按下 [排程]
當有不想要的任務 可按那小小的數字鍵 刪除

.按 排程 旁的"上"、"下"鍵 可選擇瀏覽 已記錄的任務
修改後再按一次 [排程] 即可完成修改

.最後只要按下 [開始] 即可一次執行所有任務
※此作業必須將 [開始]及[排程] 中的 核取方塊打勾,才能使用之 ;當新增 [排程] 時此 核取方塊會自動打勾
==================================

<更名功能>
用 "存檔位置" 旁的各按鈕 或 右鍵貼上 指定 存檔位置後
按下 縮圖 旁邊的[讀] 即可讀入 "存檔位置" 內的 支援圖檔
想更名的話按下 [更名] 即可使用相關欄位 重新循序命名 (此時 [讀] 會變成 [更])
最後只要按下 [更] 即可

※其實更名是針對下載後存成什麼名稱
也就是在按下 [開始前] 不滿意網頁給的名稱
而想要 "另存" 時使用之
只是這個說明之前帖子已說明過,所以這次才以 事後更名之功能作主要解說

==================================

<排除規則>
.關鍵字 "[加入][刪除]"
例: 加入 "-resize." 關鍵字時
如下載圖URL是 http://xyz/a-resize.jpg 可發現符合排除關鍵字
此時就會不以存檔 ;欲刪除其關鍵字之使用 請選定後按下 [刪除]即可

."小於□之圖" 啟用後下方的欄位即可使用,單位是byte ※1MB = 1024KB(等於1024Byte)

."同大小的圖檔" 可使用程式右上角的 []選項 內的 "圖片相似度(%)"
其原理是先比對檔案大小 再比對WxH 最後再抽樣比對(x,y)像素 ※當為100時會作完全比對

."已存在之檔名" 會在下載前檢查該檔名是否已存在(作為是否下載依據)
如果不勾取,又碰上該檔名已存在之事實 新檔會於名稱後加個 (編號)
比如 ABC.jpg 已存在,新檔名即更名成 ABC(1).jpg

."小於[][]" 當兩個輸入欄都有大於1的數字時,會以兩者乘積作為比對依據 (也就是像數比對)
否則會比對單邊長度,比如 [0][400] 是指新圖之高不足 400piexl時不以存檔
==================================

一些較小部分的說明:
.所有的 [R] 都是該欄位的重置功能鈕

.啟始網址輸入欄上的[O] 是抓取該網址 原始檔 進而分析製作 外掛濾鏡用的
※因為其特性其實也可以填上 圖檔URL 當作單獨下取用

.當按下 [離開] 時,會記錄下來大部分的欄位狀態 (如按下視窗右上角的 [X]則不會)

.[排程]左左邊的 [S]是記錄你習慣的 "存檔位置" 啟始點 (因為按下[離開]時不會記錄這個欄位)
當"存檔位置"想恢復這個啟始點時,則按下旁邊的 [R]即可

.預覽 左邊有兩個核取方塊,第一個是當下載後想自動預覽圖片時可勾選之
此時必須配合第二個核取方塊,以打開預覽圖框
再來是 縮圖核取方塊 勾選的話會自動把圖 整個區域放在預覽圖框,否則就是 1:1情況
此時(1:1)可在預覽圖框上按下滑鼠左鍵並移動看圖之

.[更名] 按下後可填旁邊的主名稱(也可空著),另外也可填
[讀]旁邊的 數字欄位,這個欄位其意義是 循序編號的起使值 設定用
※[更名]旁的主名稱欄位有一個向下按鍵,可選擇既定的更名方式,有: 時間、亂數、自訂等取名方式
當已選取 時間、亂數 時又反悔不想使用時,必須選自訂來取消之
再旁邊的 ###是表示循序編號的位數,比如填上 ## 則表示編號範圍可從 00~99
也可使用其他字元,比如 &&&、+++、@@@ 只是意義不大...

.排除規則設定 最下方的 錯誤記錄欄 會記錄 當下載時碰上 逾時、不存在、下載失敗...等等原因時 之URL
可複選 再使用右鍵複製、刪除、添加之
也可點兩下貼到 抓取圖檔 輸入欄位上(再按下[開始]來下載) ※注意當按下[開始]時,會清空此欄位

.功能選單之 "記錄" 啟用後會要求輸入記錄清單之存放地點,如按取消會放在各 任務之檔案夾內
※可選擇記錄 下載成功 與 下載失敗 之
==================================

原本要作一個暨存圖檔之清單呈列功能
只是一時還無法喬好版面
所以 選項內的 "像素值差距" 還無意義
※經試驗 不同寬x高的同一構圖,可比對出是相同的,是一個不錯用的功能,
只是礙於版面與 還需多加試驗,所以此功能之釋出 會於下一版本或視情況才有

比如下面兩構圖是一樣的,但寬x高不同
http://xs304.xs.to/xs304/06325/or1.jpghttp://xs304.xs.to/xs304/06325/sm2.JPG

至於其他說明請看之前貼子


==================================

其他說明:
http://xs104.xs.to/xs104/06326/p1.jpg
(陸續補充中...此後會編寫於下面第三帖中)

啟始網址 與 圖檔位置 如何填寫再介紹一次
http://xs105.xs.to/xs105/06331/p2.jpg

所需的VB運行檔(解到 C:\WINDOWS\system32 下)
http://d.turboupload.com/d/868269/vb_dll.rar.html
※一些運行檔有可能需要註冊到windows註冊表內,已將運行檔解至 system32下後
程式運行還是有錯誤警訊請根據所提到的運行檔下 regsvr32 <運行檔名> 命令來註冊之
比如: regsvr32 scrrun.dll

此帖於 2006-08-16 07:24 PM 被 mini 編輯.
mini 目前線上  
送花文章: 2001, 收花文章: 7962 篇, 收花: 26757 次
回覆時引用此帖
有 4 位會員向 mini 送花:
Admin2 (2006-08-19),luck (2006-08-11),nismo227 (2006-08-15),^Rico^ (2006-08-17)
感謝您發表一篇好文章