不好意思,我又想到一個問題(以字庫為主還是文字檔為主)。。。
例如:
【拿 n 個【單字/片語】來取代一個 10K的文字檔...】
→→通常程式設計師會用程式跑 n 次,然後去找文字檔內的所有文字,再進行取代
→→
→→但是呢,如果 是100萬個【單字/片語】,
→→那麼...每拿一個文字檔來進行取代時,程式都得進行100萬次的取代...(不論文字檔大或小)
→→
→→這時樓主就會直接瘋掉............
→→(樓主將徹底體會到 每秒可以執行上億次運算的 cpu 有多麼無能)
→→(以1秒鐘處理100個單字好了...100萬個單字要跑1萬秒...差不多3個小時了...)
→→(請注意...CPU是100%忙碌哦 XD...樓主的電腦在這段時間幾乎不能做別的事)
→→
→→於是呢....
→→就衍生出反向的問題,也就是得拿文字檔本身來當字庫依據,
→→先從10K的文字檔去讀取整個內容,再以 "空白" 區分,
→→之後再從字庫檔內找出所有符合的部份,視為【實際要用到的字庫數量】,
→→最後再從【實際要用到的字庫數量】一個一個來取代文字檔
→→
→→如果樓主沒有事先提出這個問題...
→→
→→事後要追加的話,極有可能被再開價好幾萬....
|