查看單個文章
舊 2003-12-21, 02:05 AM   #1
psac
榮譽會員
 
psac 的頭像
榮譽勳章
UID - 3662
在線等級: 級別:30 | 在線時長:1048小時 | 升級還需:37小時級別:30 | 在線時長:1048小時 | 升級還需:37小時級別:30 | 在線時長:1048小時 | 升級還需:37小時級別:30 | 在線時長:1048小時 | 升級還需:37小時級別:30 | 在線時長:1048小時 | 升級還需:37小時
註冊日期: 2002-12-07
住址: 木柵市立動物園
文章: 17381
現金: 5253 金幣
資產: 33853 金幣
預設 哪個軟體能把sub字幕可以轉換成srt/ssa 格式?

Q:
製作mkV,軟體不能識別sub字幕,什麼軟體能把sub字幕可以轉換成srt/ssa ?
哪位老兄知道,請告知!

謝了!


A:
subocr這個軟體可以把sub字幕轉換成srt格式,但識別率不是很高,還需要手動校正............雖然識別率還是很高啊,起碼有90%哦~~~稍微修改一下!
這軟體subocr是清華的一位高手做的!

不過!很久都沒有更新了!這個東東原理也很簡單(OCR部分直接使用的一個現成的ocr軟體)。

應該做一個更好的嘛!
SubOCR 0.98 ◎ http://www.shooter.com.cn/?softid=subocr
軟體說明:由kxn@SMTH編寫的超級字幕工具。可以完全自動的將Vobsub字幕中的中文部分OCR成SubRIP格式的srt字幕文件,識別率非常高。支持簡繁體,不過個頭較大,有34M。新加入自動色芯識別和作者編寫的使用說明 PDF文件 !

操作說明.....
VobSub 格式的字幕沒法增加訊息
要轉成 srt
srt 用記事本開啟直接編輯就可以了

英文用 VobSub Resync 另存成 srt 就好了
中文需用 SubOCR 轉(因為*.sub雖是字體就是圖形)
還有友時因體積關係........sub可以winrar壓縮....
播放obsub軟體有支援 ...
需要軟體:

1. SubRip 1.11 下載
http://www.phala.com/soft/nanji/tutorial/SubRip1.11.rar

2. SubToSrt 2.0 下載

http://www.phala.com/soft/nanji/tuto...ubToSrt2.0.rar
3. 2003/9/19最新字庫含166597條記錄 下載

http://www.phala.com/soft/nanji/tuto....Word.Data.rar
4. 09.19.2003昇級修正檔SubToSrt.exe(具體用法參見後文) 下載
http://www.phala.com/soft/nanji/tuto...ubToSrtexe.rar
一. 概念

1. 從DVD中直接製作出來的字幕都是sub格式,由一個sub文件和一個idx文件組成。
2. sub格式的文件比較大,不利於網上傳播,而轉換成srt/ssa格式後,大小只有100K左右,而且可以自由更改錯誤的字幕。
3. 轉換了以後可以自己更改字體,這方面ssa比srt好,事先可以預設字體,格式看起來也非常直觀。
4. sub字幕不能直接轉換,而是要通過一種叫OCR(Optical Character Recognition)的方法,也就是光學字串識別技術。
5. Vobsub內已含有Subresync的效果不是很好,每次都要重新記憶字庫,每次轉換都要花費一個小時以上。
6. 本文采用泰坦巨人開發的SubToSrt 2.0,帶有記憶字庫的功能,這裡對泰坦巨人表示感謝。
7. 有了記憶字庫的功能,每次轉換sub字幕的時間將越來越少,當你轉換了很多字幕以後,每次轉換將只需要10-20分鐘。

二. 具體轉換程序(一) 用SubRip將sub文件轉換為bmp圖片

1. 本文將採用《食神》的sub字幕作為例子。

2. 安裝SubRip 1.11,選項安裝全部插件


3. 開啟SubRip 1.11->File->Open VOB(s)->Open Dir->開啟食神.sub->Language Stream自動設為Chinese->右面Action選Save SubPictures As BMP(預設)


4. Start->提示選項圖片存放位置和檔案名->建立一個叫wordbmp的新資料夾->輸入「食神」(SubRip會自動在名字後加序號)->出現sub圖片的設定視窗->Color標籤->Background(背景)選白色->Font(字色)選黑色->Outline(字框)選白色->Antialiasing(字芯)不要選白色就好了->OK


5. 完成後出現的Subtitle file: NewFile.srt新視窗->Output Format->Set Output Format->選項SubRip(*.srt)->Convert to this Format->File->Save As->食神.srt儲存到相同的目錄下->儲存->關閉SubRip

三. 具體轉換程序(二) SubToSrt 2.0的安裝和使用

1. 執行setup.exe,一直OK就可以了,最好不要安裝在C碟,出問題時就不會影響到你的字庫。

2. 把剛剛新增的wordbmp資料夾複製到「安裝碟:\Program Files\飛翔鳥軟體\SubToSrt」下(預設路徑)

3. 執行SubToSrt->文件->開啟含有圖片名的SRT文件->選項wordbmp目錄下的食神.srt

4. 識別->開始識別->由於字庫裡作者已經識別過食神,立即就轉換好了(如果字庫裡沒有,會自動彈出豐富字庫的視窗,輸入改字以後,就記錄到字庫裡面去了)->文件->結果儲存為SRT格式->提示「要進行檢查校正嗎?」->是->OK->確定

5. 文件->結果儲存為SRT格式->到任意一個資料夾->輸入食神.srt->儲存
轉出*.srt後當然以香港人制作的.... conterZ來簡換繁....
conterz平時可自訂修正表儲存常用代換字串(繁體是多對一....常用語也有問題)
6. 關閉SubToSrt軟體->刪除wordbmp資料夾下的圖片


四. 字幕校對,同時轉成ssa格式

1. 執行SubToSrt->校對->字幕校對->中->食神.srt->開啟

2. 點TIME檢查是否有時間交錯的情況->如果是從英文字幕翻譯過來的右面可以開啟英文字幕對照->可以使用搜尋/替換功能->

3. 點儲存碟的圖示(儲存左邊的字幕)->食神.ssa->儲存

4. 用記事本直接開啟食神.ssa文件進行必要的修改

五. 運用技巧與總結

1. 在豐富字庫的視窗前,將輸入法預設為智能ABC(或者是你習慣的輸入法),這樣就不用每次都按Ctrl+Space了。

2. 如果sub字幕中的字是錯別字,請不要輸入正確的字,以便以後識別該字。錯別字可以在校正程序中修改。

3. 設定->程序設定->儲存設定裡可以選項加入製作者信息

4. 設定->程序設定->檢查校對設定->進階設定可以把經一般到的錯別字加入,以便自動識別修正

5. ssa字幕中的字體請設定最為常用的字體(如:細明體、黑體、楷體),以供大家使用。

6. 合併字庫時,盡量不要開啟其他程序,否則容易導致合併失敗。

7. 其他技巧請參考說明 ->求助文件,作者泰坦巨人寫得十分詳細清楚。

六. 09.19.2003昇級修正檔使用方法和更新內容

1. 從rar壓縮包中把SubToSrt.exe釋放出來,覆蓋原目錄內的SubToSrt.exe即可

2. Bug修復:
 1識別輸入時,如果跳過,有時會出現「不能從一個空行開始識別」的信息。
 2校對時,開啟srt字幕時,在最後一行的句尾會多出一個「\N」符號。

3. 新增/改進的功能


 1在字幕識別視窗中,新加了一隱藏列(原來有4列:序號、字幕、時間、圖片),此列中儲存的信息是每行字幕中每個字對應的BMP圖片名,用處是:如果發現字庫中的字錯誤,但在搜尋時又不知是哪個字圖有問題,就可以通過該列中對應的圖片編號找到該字去修改它。拖出該列時要把滑鼠仔細找準位置。

 2在校對視窗中,新加了一個按鈕,此按鈕的功能是:如果中文字幕是從英文字幕翻譯過來的,且時間沒有修改過,在左右視窗開啟中文字幕和英文字幕,點擊該按鈕,程序會根據英文字幕中分行時加的「-」符號自動在中文字幕中也增加「-」號,當然如果中文字幕已經有「-」號,就不必進行此操作,另外程序還會根據英文字幕中音效說明的位置將中文中的音效翻譯刪除。此功能還不完善。


 3在空格的檢測設定調節上,將調節範圍由原來的0.5-1.25調整為0.25-1.0,使空格的檢測更細,預設值是0.5。
psac 目前離線  
送花文章: 3, 收花文章: 1631 篇, 收花: 3205 次
向 psac 送花的會員:
WCC1212 (2009-10-22)
感謝您發表一篇好文章