查看單個文章
舊 2007-08-29, 02:20 PM   #8 (permalink)
飛鳥
協調管理員
 
飛鳥 的頭像
榮譽勳章
UID - 23073
在線等級: 級別:72 | 在線時長:5513小時 | 升級還需:108小時級別:72 | 在線時長:5513小時 | 升級還需:108小時
註冊日期: 2003-01-07
VIP期限: 無限期
住址: 史萊姆團隊
文章: 7199
精華: 11
現金: 837 金幣
資產: 260029 金幣
預設

引用:
作者: atie 查看文章
這個程式會不會到後來就是變成

像是在收集網友的mail Add

然後賣給行銷公司 廣發廣告郵件的程式啊
當然不會啦,公開的部份只會收集在網址清單裡的資料

要到全自動就要加程式啦

而且要看得懂我的perl天書寫什麼囉

以下是perl程式碼:
PHP 語法:
#!perl

use LWP::Simple;

print 
"輸入要尋找的網址:";

my $url=<> ;

my $file='tmp.html';
my $GoURL='GoURL.txt';
my $mailURL='mailURL.txt';


chomp $url;
my $url1=$url;
$url1 =~ s/[?].*//g;
print "$url1";
my $www get("$url");
getstore($wwwtmp.html);         # 存入檔案
open(html,"> $file")||print "不能寫入$file";
    print 
html "$www";
close(html);

open (html,"< $file")||print "不能開啟$file";
open (mailurl,">>$mailURL")||print "不能開啟$mailURL";
open (url,">>$GoURL")||print "不能開啟$GoURL";
    while(
$line=<html>){
        
chomp $line;
        if(
$line =~ /(href\=\"\S{1,100}\")/is){
            my 
$url2=$1;
            
$url2 =~ s/href\=//ig;
            
$url2 =~ s/"//g;
            
if($url2 =~ /\b(\/.*)/is){
                print 
url "$url1$1\n";
            }
elsif($=~ /\b(h.*)/is){
                print 
url "$url2\n";
            }
elsif($url2 =~ /([\?].*)/is){
                print 
"$1\n";
            }
elsif($url2 =~ /\b(m.*)/is){
                
my $mail=$1;
                
$mail =~ s/mailto\://g;
                
if($mail =~ /(.*\@.*)/ ){
                print 
mailurl "$1\n";
                }
            }
        }
        if(
$line =~ /(\w{1,20}\d\w{1,20}\@\S{1,20}[.]\S{1,20}tw)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(\w{1,20}\d\w{1,20}\@\S{1,20}[.]com)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(\w{1,20}\d\w{1,20}\@\S{1,20}[.]org)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(\w{1,20}\d\w{1,20}\@\S{1,20}[.]hk)/is){
        print 
mailurl "$1\n";
        }
    }
    
close(url);
    
close(mailurl);
close(html); 
windwos下的直接執行exe檔下載測試

會自行產生GoURL.txt來放置收集到的網址
mailURL.txt來放置收集到的e-mail

把pchome貼圖測試網址貼上:http://ejokeimg.pchome.com.tw/see-po...&cat=111&rank=

此帖於 2007-08-29 03:31 PM 被 飛鳥 編輯.
__________________
http://flybird017.googlepages.com/quok.gif http://flybird020.googlepages.com/new321.gif
寶貝你我的地球
, 請 少開電器,減少溫室氣體排放外,多種植植物,減少列印, 多用背面,丟棄時做垃圾分類。

http://netgames123.googlepages.com/tobikeways.jpg

飛鳥 目前離線  
送花文章: 11706, 收花文章: 3363 篇, 收花: 16453 次
回覆時引用此帖
向 飛鳥 送花的會員:
atie (2007-08-30)
感謝您發表一篇好文章