當前位置:才華齋>計算機>php語言>

PHP查詢MySQL大量資料的時候記憶體佔用分析

php語言 閱讀(2.25W)

文章主要是從原理, 手冊和原始碼分析在PHP中查詢MySQL返回大量結果時, 記憶體佔用的問題, 同時對使用MySQL C API也有涉及.跟隨小編去看看吧!

PHP查詢MySQL大量資料的時候記憶體佔用分析

昨天, 有同事在PHP討論群裡提到, 他做的一個專案由於MySQL查詢返回的結果太多(達10萬條), 從而導致PHP記憶體不夠用. 所以, 他問, 在執行下面的程式碼遍歷返回的MySQL結果之前, 資料是否已經在記憶體中了? -

  複製程式碼 程式碼如下:

while ($row = mysql_fetch_assoc($result)) {

// ...

}

當然, 這種問題有許多優化的方法. 不過, 就這個問題來講, 我首先想到, MySQL是經典的C/S(Client/Server, 客戶端/服務器)模型, 在遍歷結果集之前, 底層的實現可能已經把所有的資料通過網路(假設使用TCP/IP)讀到了Client的緩衝區, 也有另一種可能, 就是資料還在Server端的傳送緩衝區裡, 並沒有傳給Client.

在檢視PHP和MySQL的原始碼之前, 我注意到PHP手冊裡有兩個功能相近的函式:

  複製程式碼 程式碼如下:

mysql_query()

mysql_unbuffered_query()

兩個函式的字面意思和說明證實了我的想法, 前一個函式執行時, 會把所有的結果集從Server端讀到Client端的緩衝區中, 而後一個則沒有, 這就是”unbuffered(未緩衝)”的意思.

那就是說, 如果用mysql_unbuffered_query()執行了一條返回大量結果集的SQL語句, 在遍歷結果之前, PHP的記憶體是沒有被結果集佔用的. 而用mysql_query()來執行同樣的語句的話, 函式返回時, PHP的記憶體佔用便會急劇增加, 立即耗光記憶體.

如果閱讀PHP的相關程式碼, 可以看到這兩個函式的實現上的異同:

  複製程式碼 程式碼如下:

/* {{{ proto resource mysql_query(string query [, int link_identifier])

Sends an SQL query to MySQL */

PHP_FUNCTION(mysql_query)

{

php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU, MYSQL_STORE_RESULT);

}

/* }}} */

/* {{{ proto resource mysql_unbuffered_query(string query [, int link_identifier])

Sends an SQL query to MySQL, without fetching and buffering the result rows */

PHP_FUNCTION(mysql_unbuffered_query)

{

php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU, MYSQL_USE_RESULT);

}

/* }}} */

兩個函式都呼叫了php_mysql_do_query(), 只差了第2個引數的`不同, MYSQL_STORE_RESULT和MYSQL_USE_RESULT. 再看php_mysql_do_query()的實現:

  複製程式碼 程式碼如下:

if(use_store == MYSQL_USE_RESULT) {

mysql_result=mysql_use_result(&mysql->conn);

} else {

mysql_result=mysql_store_result(&mysql->conn);

}

mysql_use_result()和mysql_store_result()是MySQL的C API函式, 這兩個C API函式的區別就是後者把結果集從MySQL Server端全部讀取到了Client端, 前者只是讀取了結果集的元資訊.

回到PHP, 使用mysql_unbuffered_query(), 可以避免記憶體的立即佔用. 如果在遍歷的過程不對結果進行”PHP快取”(如放到某陣列中), 則整個執行過程雖然操作了十萬條或者百萬條或者更多的資料, 但PHP佔用的記憶體始終是非常小的.