查看單個文章
舊 2006-08-08, 10:54 AM   #3 (permalink)
psac
榮譽會員
 
psac 的頭像
榮譽勳章
UID - 3662
在線等級: 級別:30 | 在線時長:1048小時 | 升級還需:37小時級別:30 | 在線時長:1048小時 | 升級還需:37小時級別:30 | 在線時長:1048小時 | 升級還需:37小時級別:30 | 在線時長:1048小時 | 升級還需:37小時級別:30 | 在線時長:1048小時 | 升級還需:37小時
註冊日期: 2002-12-07
住址: 木柵市立動物園
文章: 17381
現金: 5253 金幣
資產: 33853 金幣
預設

PDF轉換Word全攻略

1.pdf轉換為word文檔的必要性:
1.1需要將pdf文檔中的內容進行編輯
1.2需要從pdf文檔中獲取部分內容

2.pdf文檔整篇轉換為word並進行編輯的方法

2.1文字文檔創建的PDF轉換Word的方法:
2.1.1文字文檔創建的PDF:PDF文件中的文字是以電腦字元代碼的形式被包裹在文件中。文字非常清晰銳利。
2.1.2利用軟件
2.1.2.1 SolidConverterPDF:目前我使用過的最好的該類軟件。http://www.downxia.com/downinfo/867.html
2.1.2.2 Adobe Acrobat Pro打開PDF文件後:「文件」另存為(注不是Reader,以下以中文版7.01為藍本進行解釋http://www.i8shop.com/main/net/softd...ownload.htm)

2.2.掃瞄文檔(圖片文件)創建的PDF轉換Word的方法:
2.2.1掃瞄文檔(JPEG)創建的PDF,PDF文件中的文字是一個網頁面圖像中的像素組成的線條,沒有字元代碼訊息。
2.2.2.軟件:Adobe Acrobat Pro
2.2.3方法
2.2.3.1識別軟件(漢王文本王http://jyw.99365.net/downinfo/87.html)進行文字識別
2.2.3.1.1pdf→圖片格式文件(Jpeg)
用Adobe Acrobat Pro打開該PDF文檔
點擊「文件」—「另存為」
在彈出視窗中儲存類型選取「Jpeg」
2.2.3.1.2 文字識別
打開OCR程式,打開剛儲存的Jpeg文檔
點擊「版面分析」
點擊「文字識別」
可在編輯視窗中對照原文進行更正編輯
2.2.3.1.3 點擊「插入Word文檔」轉到Word中,進行稍微的排版
2.2.3.2 Office 2003中自帶的Microsoft Office Document Imaging轉換
2.2.3.2.1首先使用Adobe Reader打開待轉換的PDF文件,接下來選擇「文件→印表」表菜單,在打開的「印表」設置視窗中將「印表機」欄中的「名稱」設置為「Microsoft Office Document Image Writer」,確認後將該PDF文件輸出為MDI格式的虛擬印表文件。
提示:如果你在「名稱」設置的下拉列表中沒有找到「Microsoft Office Document Image Writer」項,那證明你在安裝Office 2003的時候沒有安裝該元件,請使用Office 2003安裝光碟中的「新增/刪除元件」更新安裝該元件
2.2.3.2.2執行Microsoft Office Document Imaging,並利用它來打開剛才儲存的MDI文件,選擇「工具→將文本發送到Word」表菜單,並在彈出的視窗中勾選「在輸出時保持圖片版式不變」,確認後系統提示「必須在執行此操作前重新執行OCR。這可能需要一些時間」,不管它,確認即可。

3.從pdf文檔中截取部分內容到word文檔
3.1截取文字
3.1.1 截取文字文檔創建的PDF中的文字:利用Adobe Acrobat Pro的選擇和快照工具按鍵進行相關操作就行了。
3.1.2截取掃瞄文檔創建的PDF中的文字:
3.1.2.1利用Adobe Acrobat Pro的選擇和快照工具按鍵選擇截取的文字界面,新增一個圖片文件,再用文字識別軟件進行文字識別。
3.1.2.2使用抓圖軟件獲取所需PDF文檔的畫面,再用文字識別軟件進行文字識別。
3.2截取圖片:利用Adobe Acrobat Pro的選擇和快照工具按鍵進行相關操作就行了。
3.3需要注意的是:
有的PDF文檔由於製作的時候設置了某些安全選項,禁止我們拷貝其內容。如果要瞭解這方面的設置,可以通過選擇:「文檔」-「安全性」-「顯示本文檔的安全性設置」檢視。如果其中的「內容複製或提取」一項被設置為No,這時上述拷貝文字和圖像方法就不起作用了。此時,惟一的權宜之計就是使用抓圖軟件獲取某些PDF文檔的畫面,再進行文字識別。


聲明:有關軟件下載連接是臨時搜索出來的,不能保證安全性及可用性,只是為了網友方便,不放心的話請自行上網搜索。我的軟件也是這個辦法得來的,但是已經不記得在哪裡下的了。
__________________
http://bbsimg.qianlong.com/upload/01/08/29/68/1082968_1136014649812.gif
psac 目前離線  
送花文章: 3, 收花文章: 1631 篇, 收花: 3205 次
向 psac 送花的會員:
jen (2006-11-30)
感謝您發表一篇好文章