HTTP
協議是基於請求/響應範式的。一個客戶機與服務器建立連接後,發送一個請求給服務器,請求方式的格式為,統一資源標識符、
協議版本號,後邊是MIME訊息包括請求修飾符、客戶機訊息和可能的內容。服務器接到請求後,給予相應的響應訊息,其格式為一個狀態行包括訊息的
協議版本號、一個成功或錯誤的代碼,後邊是MIME訊息包括服務器訊息、實體訊息和可能的內容。
許多HTTP通訊是由一個用戶代理初始化的並且包括一個申請在源服務器上資源的請求。最簡單的情況可能是在用戶代理(UA)和源服務器(O)之間通過一個單獨的連接來完成(見圖2-1)。
圖2-1
當一個或多個中介出現在請求/響應鏈中時,情況就變得複雜一些。中介由三種:代理(Proxy)、網關(Gateway)和通道(Tunnel)。一個代理根據URI的絕對格式來接受請求,重寫全部或部分消息,通過URI的標識把已格式化過的請求發送到服務器。網關是一個接收代理,作為一些其它服務器的上層,並且如果必須的話,可以把請求翻譯給下層的服務器
協議。一個通道作為不改變消息的兩個連接之間的中繼點。當通訊需要通過一個中介(例如:防火牆等)或者是中介不能識別消息的內容時,通道經常被使用。圖2-2>
上面的圖2-2表明了在用戶代理(UA)和源服務器(O)之間有三個中介(A,B和C)。一個通過整個鏈的請求或響應消息必須經過四個連接段。這個區別是重要的,因為一些HTTP通訊選擇可能應用於最近的連接、沒有通道的鄰居,應用於鏈的終點或應用於沿鏈的所有連接。儘管圖2-2是線性的,每個參與者都可能從事多重的、並發的通訊。例如,B可能從許多客戶機接收請求而不通過A,並且/或者不通過C把請求送到A,在同時它還可能處理A的請求。
任何針對不作為通道的匯聚可能為處理請求啟用一個內部快取記憶體。快取記憶體的效果是請求/響應鏈被縮短,條件是沿鏈的參與者之一具有一個快取記憶體的響應作用於那個請求。下圖說明結果鏈,其條件是針對一個未被UA或A加快取記憶體的請求,B有一個經過C來自O的一個前期響應的快取記憶體拷貝。
圖2-3
在Internet上,HTTP通訊通常發生在
TCP/IP連接之上。預設連接阜是
TCP80,但其它的連接阜也是可用的。但這並不預示著HTTP
協議在Internet或其它網路的其它
協議之上才能完成。HTTP只預示著一個可靠的傳輸。
以上簡要介紹了HTTP
協議的巨集觀運作方式,下面介紹一下HTTP
協議的內部操作過程。
首先,簡單介紹基於HTTP
協議的客戶/服務器模式的訊息交換過程,如圖2-4所示,它分四個過程,建立連接、發送請求訊息、發送響應訊息、關閉連接。
圖2-4
在WWW中,「客戶」與「服務器」是一個相對的概念,只存在於一個特定的連接期間,即在某個連接中的客戶在另一個連接中可能作為服務器。WWW服務器執行時,一直在
TCP80連接阜(WWW的預設連接阜)監聽,等待連接的出現。
下面,討論HTTP
協議下客戶/服務器模式中訊息交換的實現。 1.建立連接 連接的建立是通過申請套接字(Socket)實現的。客戶打開一個套接字並把它約束在一個連接阜上,如果成功,就相當於建立了一個虛擬文件。以後就可以在該虛擬文件上寫資料並通過網路向外傳送。
2.發送請求
打開一個連接後,客戶機把請求消息送到服務器的停留連接阜上,完成提出請求動作。
HTTP/1.0 請求消息的格式為:
請求消息=請求行(通用訊息|請求頭|實體頭)CRLF[實體內容]
請求 行=方法 請求URL HTTP版本號 CRLF
方 法=GET|HEAD|POST|擴展方法
U R L=
協議名稱+宿主名+目錄與文件名
請求行中的方法描述指定資源中應該執行的動作,常用的方法有GET、HEAD和POST。不同的請求對像對應GET的結果是不同的,對應關係如下:
對像 GET的結果
文件 文件的內容
程式 該程式的執行結果
資料庫查詢 查詢結果
HEAD——要求服務器查找某對象的元訊息,而不是對像本身。
POST——從客戶機向服務器傳送資料,在要求服務器和CGI做進一步處理時會用到POST方法。POST主要用於發送HTML文本中FORM的內容,讓CGI程式處理。
一個請求的例子為:
GEThttp://networking.zju.edu.cn/zju/index.htmHTTP/1.0
頭訊息又稱為元訊息,即訊息的訊息,利用元訊息可以實現有條件的請求或應答。
請求頭——告訴服務器怎樣解釋本次請求,主要包括用戶可以接受的資料類型、壓縮方法和語言等。
實體頭——實體訊息類型、長度、壓縮方法、最後一次修改時間、資料有效期等。
實體——請求或應答對像本身。
3.發送響應
服務器在處理完客戶的請求之後,要向客戶機發送響應消息。
HTTP/1.0的響應消息格式如下:
響應消息=狀態行(通用訊息頭|響應頭|實體頭) CRLF 〔實體內容〕
狀態行=HTTP版本號 狀態碼 原因敘述
狀態碼表示響應類型
1×× 保留
2×× 表示請求成功地接收
3×× 為完成請求客戶需進一步細化請求
4×× 客戶錯誤
5×× 服務器錯誤
響應頭的訊息包括:服務程式名,通知客戶請求的URL需要認證,請求的資源何時能使用。
4.關閉連接
客戶和服務器雙方都可以通過關閉套接字來結束
TCP/IP對話