使用curl 能快捷的抓取網頁、模擬POST、GET請求,當然也不僅僅是HTTP協議的一些封裝,還支援FTP、代理、HTTPS、LDAP等應用。就跟隨本站小編一起去了解下吧,想了解更多相關資訊請持續關注我們應屆畢業生考試網!
說明:使用curl 能快捷的抓取網頁、模擬POST、GET請求,當然也不僅僅是HTTP協議的一些封裝,還支援FTP、代理、HTTPS、LDAP等應用。
curl並不是PHP特有的,很多語言中都有,一個東西好用,自然就會被推廣開,就像很多年前的log4j一樣的道理,剛開始是JAVA版本,隨後也出現log4c,log4c++??curl 也是一樣的道理。curl 並非PHP預設支援,需要在配置裡開啟此項的載入extension= php_ 在linux 下就記得編譯PHP的時候./configure 加上引數-with-curl。要檢視curl 擴充套件是否開啟,通過phpinfo(); 應該是可以看到的。
1) 基本用法(呼叫的一般順序)
curl_init : 初始化,
curl_setopt :設定引數選項
curl_exec:執行當前curl物件
curl_close:關閉當前curl物件
示例:訪問下面程式碼另存為的PHP網頁,我們看到了126 郵箱的網頁。
複製程式碼 程式碼如下:
$curl = curl_init();
// 設定你需要抓取的URL
curl_setopt($curl, CURLOPT_URL, '');
// 設定header 是否顯示頭部資訊
//curl_setopt($curl, CURLOPT_HEADER, 1);
// 設定cURL 引數,要求結果儲存到字串中還是輸出到螢幕上。
//curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
// 執行cURL,請求網頁
$data = curl_exec($curl);
// 關閉URL請求
curl_close($curl);
// 顯示獲得的資料
var_dump($data);
2) POST 方式傳送資料
複製程式碼 程式碼如下:
﹤?php
$phoneNumber = '13912345678';
$message = 'This message was generated by curl and php';
$curlPost = 'pNUMBER=' . urlencode($phoneNumber) . '&MESSAGE=' . urlencode($message) . '&SUBMIT=Send';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, '');
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $curlPost);
$data = curl_exec($ch);
curl_close($ch);
?﹥
3) 代理服務器
複製程式碼 程式碼如下:
﹤?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, '');
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HTTPPROXYTUNNEL, 1);
curl_setopt($ch, CURLOPT_PROXY, '');
curl_setopt($ch, CURLOPT_PROXYUSERPWD, 'user:password');
$data = curl_exec($ch);
curl_close($ch);
?﹥
4) 關於SSL和Cookie
關於SSL也就是HTTPS協議,你只需要把CURLOPT_URL連線中的http://變成https://就可以了。當然,還有一個引數叫CURLOPT_SSL_VERIFYHOST可以設定為驗證站點。
關於Cookie,你需要了解下面三個引數:
CURLOPT_COOKIE,在當面的會話中設定一個cookie
CURLOPT_COOKIEJAR,當會話結束的時候儲存一個Cookie
CURLOPT_COOKIEFILE,Cookie的檔案。
5) HTTP伺服器認證
複製程式碼 程式碼如下:
﹤?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, '');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_BASIC);
curl_setopt(CURLOPT_USERPWD, '[username]:[password]')
$data = curl_exec($ch);
curl_close($ch);
?﹥
總結:雖然後面附加了幾個例子,其實順序跟第一個介紹的都一樣,只是會根據不同情況,在 curl_setopt 函式會有所不同。我們也發現這個函式的引數非常多,非常靈活。
以下關於此函式各項使用引數:
bool curl_setopt (int ch, string option, mixed value)
curl_setopt()函式將為一個CURL會話設定選項。option引數是你想要的設定,value是這個選項給定的值。
下列選項的值將被作為長整形使用(在option引數中指定):
* CURLOPT_INFILESIZE: 當你上傳一個檔案到遠端站點,這個選項告訴PHP你上傳檔案的大小。
* CURLOPT_VERBOSE: 如果你想CURL報告每一件意外的事情,設定這個選項為一個非零值。
* CURLOPT_HEADER: 如果你想把一個頭包含在輸出中,設定這個選項為一個非零值。
* CURLOPT_NOPROGRESS: 如果你不會PHP為CURL傳輸顯示一個程序條,設定這個選項為一個非零值。注意:PHP自動設定這個選項為非零值,你應該僅僅為了除錯的目的來改變這個選項。
* CURLOPT_NOBODY: 如果你不想在輸出中包含body部分,設定這個選項為一個非零值。
* CURLOPT_FAILONERROR: 如果你想讓PHP在發生錯誤(HTTP程式碼返回大於等於300)時,不顯示,設定這個選項為一人非零值。預設行為是返回一個正常頁,忽略程式碼。
* CURLOPT_UPLOAD: 如果你想讓PHP為上傳做準備,設定這個選項為一個非零值。
* CURLOPT_POST: 如果你想PHP去做一個正規的HTTP POST,設定這個選項為一個非零值。這個POST是普通的 application/x-www-from-urlencoded 型別,多數被HTML表單使用。
* CURLOPT_FTPLISTONLY: 設定這個選項為非零值,PHP將列出FTP的目錄名列表。
* CURLOPT_FTPAPPEND: 設定這個選項為一個非零值,PHP將應用遠端檔案代替覆蓋它。
* CURLOPT_NETRC: 設定這個選項為一個非零值,PHP將在你的 ~./netrc 檔案中查詢你要建立連線的遠端站點的使用者名稱及密碼。
* CURLOPT_FOLLOWLOCATION: 設定這個選項為一個非零值(象 “Location: “)的頭,伺服器會把它當做HTTP頭的一部分發送(注意這是遞迴的,PHP將傳送形如 “Location: “的頭)。
* CURLOPT_PUT: 設定這個選項為一個非零值去用HTTP上傳一個檔案。要上傳這個檔案必須設定CURLOPT_INFILE和CURLOPT_INFILESIZE選項.
* CURLOPT_MUTE: 設定這個選項為一個非零值,PHP對於CURL函式將完全沉默。
* CURLOPT_TIMEOUT: 設定一個長整形數,作為最大延續多少秒。
* CURLOPT_LOW_SPEED_LIMIT: 設定一個長整形數,控制傳送多少位元組。
* CURLOPT_LOW_SPEED_TIME: 設定一個長整形數,控制多少秒傳送CURLOPT_LOW_SPEED_LIMIT規定的位元組數。
* CURLOPT_RESUME_FROM: 傳遞一個包含位元組偏移地址的長整形引數,(你想轉移到的開始表單)。
* CURLOPT_SSLVERSION: 傳遞一個包含SSL版本的長引數。預設PHP將被它自己努力的確定,在更多的安全中你必須手工設定。
* CURLOPT_TIMECONDITION: 傳遞一個長引數,指定怎麼處理CURLOPT_TIMEVALUE引數。你可以設定這個引數為TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。這僅用於HTTP。
* CURLOPT_TIMEVALUE: 傳遞一個從1970-1-1開始到現在的秒數。這個時間將被CURLOPT_TIMEVALUE選項作為指定值使用,或被預設TIMECOND_IFMODSINCE使用。
下列選項的值將被作為字串:
* CURLOPT_URL: 這是你想用PHP取回的URL地址。你也可以在用curl_init()函式初始化時設定這個選項。
* CURLOPT_USERPWD: 傳遞一個形如[username]:[password]風格的字串,作用PHP去連線。
* CURLOPT_PROXYUSERPWD: 傳遞一個形如[username]:[password] 格式的字串去連線HTTP代理。
* CURLOPT_RANGE: 傳遞一個你想指定的範圍。它應該是”X-Y”格式,X或Y是被除外的。HTTP傳送同樣支援幾個間隔,用逗句來分隔(X-Y,N-M)。
* CURLOPT_POSTFIELDS: 傳遞一個作為HTTP “POST”操作的所有資料的字串。
* CURLOPT_REFERER: 在HTTP請求中包含一個”referer”頭的`字串。
* CURLOPT_USERAGENT: 在HTTP請求中包含一個”user-agent”頭的字串。
* CURLOPT_FTPPORT: 傳遞一個包含被ftp “POST”指令使用的IP地址。這個POST指令告訴遠端伺服器去連線我們指定的IP地址。這個字串可以是一個IP地址,一個主機名,一個網路介面名(在UNIX下),或是‘-’(使用系統預設IP地址)。
* CURLOPT_COOKIE: 傳遞一個包含HTTP cookie的頭連線。
* CURLOPT_SSLCERT: 傳遞一個包含PEM格式證書的字串。
* CURLOPT_SSLCERTPASSWD: 傳遞一個包含使用CURLOPT_SSLCERT證書必需的密碼。
* CURLOPT_COOKIEFILE: 傳遞一個包含cookie資料的檔案的名字的字串。這個cookie檔案可以是Netscape格式,或是堆存在檔案中的HTTP風格的頭。
* CURLOPT_CUSTOMREQUEST: 當進行HTTP請求時,傳遞一個字元被GET或HEAD使用。為進行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request. 注意: 在確認你的伺服器支援命令先不要去這樣做。下列的選項要求一個檔案描述(通過使用fopen()函式獲得):
* CURLOPT_FILE: 這個檔案將是你放置傳送的輸出檔案,預設是STDOUT.
* CURLOPT_INFILE: 這個檔案是你傳送過來的輸入檔案。
* CURLOPT_WRITEHEADER: 這個檔案寫有你輸出的頭部分。
* CURLOPT_STDERR: 這個檔案寫有錯誤而不是stderr。用來獲取需要登入的頁面的例子,當前做法是每次或許都登入一次,有需要的人再做改進了.
常用函式:
curl_close — 關閉一個curl會話
curl_copy_handle — 拷貝一個curl連線資源的所有內容和引數
curl_errno — 返回一個包含當前會話錯誤資訊的數字編號
curl_error — 返回一個包含當前會話錯誤資訊的字串
curl_exec — 執行一個curl會話
curl_getinfo — 獲取一個curl連線資源控制代碼的資訊
curl_init — 初始化一個curl會話
curl_multi_add_handle — 向curl批處理會話中新增單獨的curl控制代碼資源
curl_multi_close — 關閉一個批處理控制代碼資源
curl_multi_exec — 解析一個curl批處理控制代碼
curl_multi_getcontent — 返回獲取的輸出的文字流
curl_multi_info_read — 獲取當前解析的curl的相關傳輸資訊
curl_multi_init — 初始化一個curl批處理控制代碼資源
curl_multi_remove_handle — 移除curl批處理控制代碼資源中的某個控制代碼資源
curl_multi_select — Get all the sockets associated with the cURL extension, which can then be "selected"
curl_setopt_array — 以陣列的形式為一個curl設定會話引數
curl_setopt — 為一個curl設定會話引數
curl_version — 獲取curl相關的版本資訊