史萊姆論壇

史萊姆論壇 (http://forum.slime.com.tw/)
-   程式語言討論區 (http://forum.slime.com.tw/f76.html)
-   -   最近在寫e-mail收集程式 (http://forum.slime.com.tw/thread214928.html)

飛鳥 2007-08-28 04:19 PM

最近在寫e-mail收集程式
 
最近在想這個東西

給程式一個含有網址的檔案

程式就會把這些網址裡所包括下一層的網址另存到另一個網址去了

(當然也可以另存包括的e-mail囉)

用perl寫不到50行就搞定了

不過還在寫一些重複出現的網址檢查步驟

anotherlevel 2007-08-28 04:22 PM

引用:

作者: 飛鳥 (文章 1796204)
最近在想這個東西
給程式一個含有網址的檔案
程式就會把這些網址裡所包括下一層的網址另存到另一個網址去了
(當然也可以另存包括的e-mail囉)
用perl寫不到50行就搞定了
不過還在寫一些重複出現的網址檢查步驟


這個可以賺錢喔...
賣給行銷公司吧
:on_02:

飛鳥 2007-08-28 04:39 PM

引用:

作者: anotherlevel (文章 1796207)

這個可以賺錢喔...
賣給行銷公司吧
:on_02:

呵,我打算公開原始碼:on_79:

superxboy 2007-08-28 05:30 PM

有趣的東西...其實和圖片收集程式相似

飛鳥 2007-08-28 05:33 PM

引用:

作者: superxboy (文章 1796252)
有趣的東西...其實和圖片收集程式相似

你在想什麼:n7::n7::n7:

superxboy 2007-08-28 07:31 PM

引用:

作者: 飛鳥 (文章 1796256)
你在想什麼:n7::n7::n7:

我可是正人君子...:on_61:

atie 2007-08-28 08:49 PM

這個程式會不會到後來就是變成

像是在收集網友的mail Add

然後賣給行銷公司 廣發廣告郵件的程式啊:on_52::on_52::on_52:

飛鳥 2007-08-29 02:20 PM

引用:

作者: atie (文章 1796367)
這個程式會不會到後來就是變成

像是在收集網友的mail Add

然後賣給行銷公司 廣發廣告郵件的程式啊:on_52::on_52::on_52:

當然不會啦,公開的部份只會收集在網址清單裡的資料

要到全自動就要加程式啦

而且要看得懂我的perl天書寫什麼囉:on_79:

以下是perl程式碼:
PHP 語法:

#!perl

use LWP::Simple;

print 
"輸入要尋找的網址:";

my $url=<> ;

my $file='tmp.html';
my $GoURL='GoURL.txt';
my $mailURL='mailURL.txt';


chomp $url;
my $url1=$url;
$url1 =~ s/[?].*//g;
print "$url1";
my $www get("$url");
getstore($wwwtmp.html);         # 存入檔案
open(html,"> $file")||print "不能寫入$file";
    print 
html "$www";
close(html);

open (html,"< $file")||print "不能開啟$file";
open (mailurl,">>$mailURL")||print "不能開啟$mailURL";
open (url,">>$GoURL")||print "不能開啟$GoURL";
    while(
$line=<html>){
        
chomp $line;
        if(
$line =~ /(href\=\"\S{1,100}\")/is){
            my 
$url2=$1;
            
$url2 =~ s/href\=//ig;
            
$url2 =~ s/"//g;
            
if($url2 =~ /\b(\/.*)/is){
                print 
url "$url1$1\n";
            }
elsif($=~ /\b(h.*)/is){
                print 
url "$url2\n";
            }
elsif($url2 =~ /([\?].*)/is){
                print 
"$1\n";
            }
elsif($url2 =~ /\b(m.*)/is){
                
my $mail=$1;
                
$mail =~ s/mailto\://g;
                
if($mail =~ /(.*\@.*)/ ){
                print 
mailurl "$1\n";
                }
            }
        }
        if(
$line =~ /(\w{1,20}\d\w{1,20}\@\S{1,20}[.]\S{1,20}tw)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(\w{1,20}\d\w{1,20}\@\S{1,20}[.]com)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(\w{1,20}\d\w{1,20}\@\S{1,20}[.]org)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(\w{1,20}\d\w{1,20}\@\S{1,20}[.]hk)/is){
        print 
mailurl "$1\n";
        }
    }
    
close(url);
    
close(mailurl);
close(html); 

windwos下的直接執行exe檔下載測試

會自行產生GoURL.txt來放置收集到的網址
mailURL.txt來放置收集到的e-mail

把pchome貼圖測試網址貼上:http://ejokeimg.pchome.com.tw/see-po...&cat=111&rank=

superxboy 2007-08-29 02:49 PM

執行以後...跳出cmd視窗後...沒幾秒就自動關閉視窗了=.=

飛鳥 2007-08-29 03:29 PM

引用:

作者: superxboy (文章 1796872)
執行以後...跳出cmd視窗後...沒幾秒就自動關閉視窗了=.=

再下一次吧,我重新上傳了
= =a

superxboy 2007-08-29 04:10 PM

程式好像怪怪的...在你給的網址中(http://ejokeimg.pchome.com.tw/see-po...&cat=111&rank=)
沒有bk20403@yahoo.com

但mail清單中卻有...

飛鳥 2007-08-29 05:02 PM

引用:

作者: superxboy (文章 1796931)
程式好像怪怪的...在你給的網址中(http://ejokeimg.pchome.com.tw/see-po...&cat=111&rank=)
沒有bk20403@yahoo.com

但mail清單中卻有...

因為比對兩次的關係,這會比對.com和.tw結尾的

所以都比對成功,所以找到bk20403@yahoo.com和bk20403@yahoo.com.tw

這是試用版,我之前寫的,現在的新版就己改進這個問題了,只比對一次:on_79:

像我程式的這一段也做了限制
PHP 語法:

        if($line =~ /(w{1,20}dw{1,20}@S{1,20}[.]S{1,20}tw)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(w{1,20}dw{1,20}@S{1,20}[.]com)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(w{1,20}dw{1,20}@S{1,20}[.]org)/is){
        print 
mailurl "$1\n";
        }
        if(
$line =~ /(w{1,20}dw{1,20}@S{1,20}[.]hk)/is){
        print 
mailurl "$1\n";
        } 

只找.tw .com .org .hk的e-mail結尾的

superxboy 2007-08-29 05:18 PM

perl的程式...不能用參數餵網址嗎?

ex.
語法:

C:\www2mailaddress.exe "http://tw.yahoo.com"

飛鳥 2007-08-29 05:20 PM

引用:

作者: superxboy (文章 1796960)
perl的程式...不能用參數餵網址嗎?

ex.
語法:

C:\www2mailaddress.exe "http://tw.yahoo.com"

可以呀,不過我沒加進去:on_14:
等第二版吧

因為我知道會有人想寫成.bat批次檔:on_14:

superxboy 2007-08-29 05:31 PM

另一個問題...perl...沒有視窗介面嗎?


所有時間均為台北時間。現在的時間是 06:53 PM

Powered by vBulletin® 版本 3.6.8
版權所有 ©2000 - 2024, Jelsoft Enterprises Ltd.

『服務條款』

* 有問題不知道該怎麼解決嗎?請聯絡本站的系統管理員 *


SEO by vBSEO 3.6.1