當前位置:才華齋>IT認證>Linux認證>

Linux資料庫:關鍵的MySQL效能優化技巧

Linux認證 閱讀(1.5W)

事實上,許多最常見的錯誤都隱藏在MySQL效能問題的背後。為了確保你的MySQL伺服器能夠一直處於全速執行的狀態,提供持續穩定的效能,杜絕這些錯誤是非常重要的。然而,這些錯誤又往往隱藏在工作負載和配置問題之中。

Linux資料庫:關鍵的MySQL效能優化技巧

幸運的是,許多MySQL效能問題都有著相似的解決方案,這使得排除故障與調整MySQL成為了一項易於管理的任務。以下就是10個讓MySQL發揮最佳效能的技巧。

  1、分析工作負載

通過分析工作負載,你能夠發現進一步調整中最昂貴的查詢。在這種情況下,時間是最重要的東西。因為當你向伺服器發出查詢指令時,除了如何快速完成查詢外,你很少關注其他的東西。分析工作負載的最佳方式是,使用諸如MySQL Enterprise Monitor的查詢分析器,或者Percona Toolkit的pt-query-digest等工具。

這些工具能夠捕捉伺服器所執行的查詢,以降序的方式根據響應時間列出任務列表。它們會將最昂貴的和最耗時的任務置頂,這樣你就能知道自己需要重點關注哪些地方。工作負載分析工具將相似的查詢匯聚在一行中,允許管理者檢視速度慢的查詢,以及檢視速度快但已多次執行的查詢。

  2、理解四個基本資源

功能性方面,一個數據庫伺服器需要四個基本資源:CPU、記憶體、硬碟和網路。如果這四個資源中任何一個性能弱、不穩定或超負載工作,那麼就可能導致整個資料庫伺服器的效能低下。理解基本資源在兩個特定的領域中至關重要:選擇硬體和排除故障。

在為MySQL選擇硬體時,應該確保全部選用效能優異的元件。這些元件相互匹配,彼此間能夠實現合理平衡也很重要。通常情況下,企業會為伺服器選擇速度快的CPU和硬碟,但是記憶體卻嚴重不足。在一些案例中,大幅提升效能的最廉價方式是增加記憶體,尤其是對於那些受制於磁碟讀取速度的工作負載。這似乎看起來有點違背常理,但是在許多案例中,由於沒有充足的記憶體以儲存伺服器正在使用的資料,因此導致了硬碟被過度使用。

關於獲取這種平衡的另一個例子是CPU.在許多案例中,如果CPU速度快,那麼MySQL的效能就非常出色,因為每一個查詢都是單執行緒執行,而無法在CPU間並行執行。在進行故障排除時,應該檢查這四個資源的效能和使用情況,關注它們是否效能低下或是超負荷工作。這方面的知識能夠幫助你快速地解決問題。

  3、不要將MySQL作為佇列使用

佇列以及與佇列相似的訪問方案會在你不知情的情況下悄悄地進入應用之中。例如,你設定了一個專案狀態,以便在執行前,特定的Worker Process(工作程序)能夠對其進行標記,那麼你就等於在無意間建立了一個佇列。例如,將電子郵件標記為未傳送,然後傳送它們,最後再將它們標記為已傳送。

佇列會導致出現一些問題,這裡面有兩大主要原因:它們對工作負載進行了序列化,阻礙任務被並行處理。這導致正在處理中的任務和以前在工作中處理過的歷史資料會被根據序列排列在一個表單中。這樣一來既增加了應用的延時,也增加了MySQL的負載。

  4、以最廉價的方式過濾結果

優化MySQL的最佳方式是首先要做廉價和不精確的工作,然後再小規模地做困難的精確工作,最後再生成資料集。

例如,假設你計算某一個地理座標點給定半徑內的面積。在許多程式設計師的工具箱裡第一個工具就是球面半正矢公式,以計算出球面的長度。這一方法的問題是,該方程式需要許多三角函式運算,需要擁有很強運算能力的CPU.球面半正矢計算不僅執行速度慢,而且會導致機器CPU的使用率飆升。在使用球面半正矢公式前,你可以先分解計算。有些分解計算並不需要使用三角函式。

  5、弄清兩個擴充套件性死亡陷阱

擴充套件性可能並不像你認為的那樣模糊。實際上,擴充套件性有著精確的數學定義,它們以方程式的形式被表示出來。這些方程式既指出了系統無法擴充套件的原因,同時也指出了它們應該進行擴充套件的原因。通用擴充套件定律(Universal Scalability Law)揭示和量化了系統的擴充套件性特徵。其通過兩個基礎性成本解釋了擴充套件問題:即序列化與串擾(Crosstalk)。

並行處理要求必須中止序列化,這就限制了它們的擴充套件性。同樣的,如果並行處理需要始終進行彼此對話以協調工作,那麼它就相互進行了限制。為了避免序列化與串擾,應用進行了更好的擴充套件。這些在MySQL內部被翻譯成了什麼?結果不盡相同。不過,一些案例應該避免鎖定在特定的行之中。就像第3個技巧中所提到的,佇列擴充套件性差的原因就是如此。

  6、不要過分關注配置

資料庫管理員會花費許多時間調整配置。調整的結果通常不會有很大的改善,相反有時候會帶來損害。我發現許多經過"優化的"伺服器,在進行強度稍微高一點的運算時常常出現崩潰、記憶體不足和效能低下等問題。

雖然MySQL在交付時的預設設定嚴重過時,但是你並不需要對每一項都進行配置。最好是根據需要,進行基本糾正與設定調整。有10個選項調整正確,即可讓伺服器發揮95%的最大效能。在許多案例中,我們並不推薦所謂的調整工具,因為它們只是提供一個大概設定,對特定案例沒有任何意義。有些工具甚至包含有危險的和錯誤的裝置程式碼。

  7、注意分頁查詢

分頁查詢應用會使伺服器效能大降。這些應用會在網頁上顯示搜尋結果,然後通過連結跳轉至相應網頁上。通常這些應用無法使用索引進行聚合與分類,而是使用LIMIT和OFFSET語句,這導致伺服器工作負載大幅增加,並放棄行。 在使用者介面上常常會發現優化選項。替代在結果中顯示網頁數量,以及分別與每個網頁相連的`連結。這樣便可以僅顯示至下一頁的連結。你還可以阻止查詢者瀏覽與首頁過遠的網頁。

  8、儲存統計資料,提高報警閥值

監控與報警必不可少,但是監控系統被怎麼處理了呢?當它們釋出假的報警資訊時,系統管理員會設定電子郵件過濾規則,以停止這些噪音。很快你的監控系統就徹底沒用了。個人認為,應該以下面的兩種方式進行監控:捕捉指標與報警。儘可能地捕捉與儲存指標非常重要,因為在你試圖搞明白系統中需要做哪些調整時,你會慶幸之前儲存了它們。如果某一天出現奇怪問題時,你會很高興自己有能力繪製出伺服器工作負載變化的圖形。

  9、瞭解索引的三大規則

索引可能是資料庫中被誤解最多的一項。因為它們的工作方式有許多種,這導致人們常常對索引如何工作,以及伺服器如何使用它們感到困惑。要想徹底搞清楚它們需要花上很大一番功夫。在被正確設計時,索引在資料庫中主要用於實現以下三個重要目的:

1)它們讓伺服器尋找相鄰行群組,而不是單個行。許多人認為,索引的目的是尋找單個行,但是尋找單個行會導致隨時磁碟操作,速度很慢。尋找行群組就要好許多,與一次尋找一個行相比,這更具吸引力。

2)它們讓伺服器避免以期望的讀行順序對檢索結果排序,排序成本十分高昂。以期望的順序讀行速度將更快。

3)它們能夠滿足來自一個索引的所有查詢,從根本上避免了訪問表單的需求。這被稱為覆蓋索引或索引查詢。

如果你能設計出符合這三個規則的索引與查詢,那麼你的查詢速度將大幅提升。

  10、利用同行的專業知識

不要孤軍奮戰。如果你在苦苦思考某個問題,並著手製訂明智的解決方案,那麼這非常不錯。在20次中,有19次問題會被順利解決。但是其中會有一次讓你不知所措,導致耗費大量的資金和時間,準確地說,是因為你正在嘗試的解決方案只是貌似合理。

建立一個MySQL相關資源網的意義遠遠大於工具集與故障排除指南。許多經驗豐富的專業人員就隱藏在論壇、問答網站之中。會議、展覽以及本地使用者集體活動,都會為我們提供獲得新見解的機會和與同行建立聯絡的機會,關鍵時刻這將對你很有幫助。