#101 重新回顧 B-Tree: 資料庫引擎快速搜尋的基石 ~ 大毛電腦科學筆記

B-Tree（Balanced Tree 的縮寫）是計算機科學中最具影響力的資料結構之一，特別是在資料庫系統中。其設計確保了高效的資料儲存、檢索和修改，使資料庫引擎能夠更快速地執行查詢操作。本文將探討 B-Tree 的歷史、構建方法、操作原理及其變體，提供對其在資料庫優化中作用的全面理解。

1. B-Tree 的歷史

B-Tree 由 Rudolf Bayer 和 Ed McCreight 於 1972 年在波音研究實驗室提出。他們的開創性論文《大型有序索引的組織與維護》詳細闡述了 B-Tree 的結構和操作，以及其在高效能管理大型資料集中的應用。Bayer 和 McCreight 的發明解決了計算機科學快速發展中對平衡索引結構的需求，特別是在快速資料存取與更新變得日益重要的時代。

在 B-Tree 出現之前，二元搜尋樹十分常見，但其平衡性問題導致效率低下。B-Tree 的平衡性及其高效管理基於磁碟儲存的能力，徹底改變了資料索引與存取的方式，尤其是在像Postgres 和Oracle 等等這樣的資料庫管理系統中。幾十年來，B-Tree 成為資料庫的基石，使其能夠擴展並滿足日益增長的資料量需求，同時保證穩定的效能。

2. B-Tree 的構建

B-Tree 是一種自平衡的樹狀資料結構，廣泛應用於資料庫系統、檔案系統以及其他需要高效能資料管理的應用中。它以階層式的方式組織資料，確保存取、插入和刪除操作都能在對數時間內完成。B-Tree 的設計是保持平衡並優化性能，即使資料集持續增長。

在 B-Tree 中，節點包含多個鍵值和指向子節點的指標。這種結構最大限度地減少了磁碟讀取次數，非常適合存取外部記憶體成本高昂的系統。

如何構建 B-Tree

構建 B-Tree 從一棵空樹開始，逐一插入鍵值，同時遵循其結構特性。為了確保平衡並維持必要的限制，樹會動態進行調整。這些調整包括分裂節點和提升鍵值等操作。

B-Tree 的關鍵特性：

節點容量：除了根節點外，每個節點必須至少包含 t - 1 個鍵值，且最多可容納 2t - 1 個鍵值，其中 t 是樹的最小度數。
子節點指標：一個擁有 n 個鍵值的節點將有 n + 1 個子節點指標。
平衡結構：所有的葉節點都位於同一層，確保存取時間一致。
高效高度：B-Tree 的高度隨鍵值數量以對數方式增長，即使面對大型資料集，操作仍能保持快速。

範例 1：構建最小度數為 t = 3 的 B-Tree

插入鍵值 10：從一棵空樹開始，插入第一個鍵值（10）：
```
[10]
```
插入鍵值 20 和 5：將 20 和 5 添加到根節點。鍵值以排序順序存儲：
```
[5, 10, 20]
```
插入鍵值 6：插入 6，保持排序：
```
[5, 6, 10, 20]
```
插入鍵值 15：當插入 15 時，根節點變得過滿：
```
[5, 6, 10, 15, 20]
```
此時，根節點分裂。中間鍵值（10）被提升為新的根節點，其餘鍵值分成兩個子節點：
```
    [10]
   /    \
[5, 6] [15, 20]
```
插入鍵值 12：將 12 添加到右子節點，保持排序：
```
    [10]
   /    \
[5, 6] [12, 15, 20]
```

節點可容納多少鍵值？

在度數為 t 的 B-Tree 中：

每個非根節點必須至少包含 t - 1 個鍵值。在刪除過程中，有可能會出現更少鍵值。B-Tree 的靈活性和自調整機制確保了操作的效率，並在特定情況下允許節點出現鍵值少於理論下限的暫時情況。這些情境充分展示了其在動態資料管理中的適應能力。
任何節點最多可包含 2t - 1 個鍵值。

因此，每個節點的容量取決於樹的度數。例如，在 t = 3 的 B-Tree 中，每個節點必須有 2 到 5 個鍵值。

3. B-Tree 的調整

B-Tree 通過在插入和刪除過程中調整結構來保持平衡。這確保了操作的效率並維持樹的定義特性。平衡是通過節點分裂、鍵值提升、鍵值重新分配和節點合併來實現的。

在插入過程中，如果某個節點過滿（即包含超過 2t - 1 個鍵值），則該節點將分裂為兩個節點，中間鍵值提升到父節點。如果父節點也過滿，這一過程可能會向上傳播。

範例 2：將鍵值插入到 t = 3 的 B-Tree

初始樹：
```
    [10]
   /    \
[5, 6] [15, 20]
```
插入鍵值 25：將 25 添加到右子節點。該節點仍在容量範圍內：
```
    [10]
   /    \
[5, 6] [15, 20, 25]
```
插入鍵值 30：當插入 30 後，右子節點變得過滿：
```
    [10]
   /    \
[5, 6] [15, 20, 25, 30]
```
節點分裂，中間鍵值（25）被提升到根節點：
```
      [10, 25]
     /    |    \
[5, 6] [15, 20] [30]
```

插入鍵值 8：將 8 添加到左子節點。樹仍保持平衡：

        [10, 25]
     /       |     \
[5, 6, 8] [15, 20] [30]

刪除過程

當從 B-Tree 中刪除鍵值時，結構會進行調整以維持其特性。調整包括從兄弟節點重新分配鍵值或合併節點。

範例 3：從 t = 3 的 B-Tree 中刪除鍵值

初始樹：

        [10, 25]
     /     |      \
[5, 6, 8] [15, 20] [30]

刪除鍵值 30：從最右側子節點移除 30。該節點仍滿足最小鍵值要求：
```
        [10, 25]
     /     |      \
[5, 6, 8] [15, 20] []
```
刪除鍵值 25：移除 25 後，最右側子節點變為空。為了解決這個問題，鍵值被合併或重新分配。在此例中，中間鍵值（20）被提升：
```
    [10, 20]
   /        \
[5, 6, 8]   [15]
```
刪除鍵值 10：移除 10 後需要進一步調整。剩餘鍵值重新分配：
```
     [15]
   /      \
[5, 6, 8]  [20]
```

4. 為何需要保持 B-Tree 的平衡

B-Tree 是一種廣泛應用於資料庫管理系統、檔案系統以及其他需要高效儲存與檢索的大型資料結構。B-Tree 最重要的特性之一就是能夠自動保持平衡，這也是它能夠提供穩定查詢效能的關鍵。要理解為什麼 B-Tree 會保持平衡，我們需要深入探討其結構、操作方式和設計理念。

B-Tree 的結構

B-Tree 是一種自平衡的搜尋樹，其中的節點可以擁有多個子節點。與二元搜尋樹不同，B-Tree 節點可以有多達個子節點，其中是樹的階數。每個節點包含一個排序好的鍵值陣列和指向子節點的指標。這些鍵值將值域分割成多個區間，有效地引導搜尋操作。

B-Tree 的主要特性包括：

高度平衡： 所有的葉節點都位於相同的深度，確保從根節點到任意葉節點的路徑具有相同的層數。
節點利用率： 每個內部節點至少有一半的空間被使用，確保記憶體的高效利用並減少浪費空間。
動態擴展與縮減： 當鍵值被插入或刪除時，B-Tree 能夠通過定義良好的演算法，動態調整結構並保持平衡。

為什麼平衡很重要

B-Tree 的平衡性直接影響搜尋、插入和刪除操作的效能。在一棵不平衡的樹中，某些路徑可能比其他路徑長得多，導致某些查詢所需時間顯著增加。通過保持平衡，B-Tree 能夠確保對所有資料運作時所需的時間複雜度是一樣的，也就是說每一筆資料對資料庫引擎來說都是平等的。

B-Tree 平衡的優勢

一致的查詢效能： 平衡結構確保了從根節點到葉節點的所有路徑長度相等，為搜尋、插入和刪除操作提供穩定的效能。
高效磁碟存取： 在資料庫中，B-Tree 的設計目的是最小化磁碟 I/O 操作。節點的大小與磁碟區塊大小匹配，平衡結構確保任何操作都需要最少的磁碟讀取次數。
可擴展性： B-Tree 的對數高度讓它能夠高效處理大量數據。隨著數據集的增長，樹仍然保持相對較淺，使其即使在面對數十億個鍵值時也能快速運行。

5. B-Tree 的重建

B-Tree 的重建通常是在結構效能隨時間降低時進行的必要操作。隨著資料的頻繁插入和刪除，雖然 B-Tree 能自動調整以保持平衡，但多次的鍵值分裂、合併與重新分配可能導致節點的使用效率下降。例如，某些節點可能變得過於稀疏，導致空間利用率低下，進而增加磁碟存取成本和查詢時間。此外，若發生大量新資料或刪除大部分資料，B-Tree 原本的結構可能不再適合新的查詢模式。這時，重新構建 B-Tree 可以整理節點分佈，優化空間佔用與存取效能。

適合進行重建的時機包括系統維護時段、大量資料批次操作後，或觀察到查詢效能明顯下降時。透過重建，B-Tree 能恢復較好的效能。

6. B-Tree 的變體

B-Tree 的靈活結構衍生出了許多變化，每種變化都為了解決特定需求或在特定情境下提升性能而設計。了解這些變化，不僅可以加深對 B-Tree 的理解，也能幫助我們看見其在不同資料庫與儲存應用中的彈性與適應力。以下是一些常見的 B-Tree 變化種類、它們的特點以及如何提升效能的方式。

a. B+ Tree

B+ Tree 是最常見的 B-Tree 變化之一，與 B-Tree 的差異如下：

結構特點： 在 B+ Tree 中，內部節點只存儲鍵值（key），而所有實際的數據都存放在葉節點中。每個葉節點還包含指向下一個葉節點的指標，形成一個鏈結串列。
優點：
- 能透過鏈結的葉節點提升順序資料的訪問效率。
- 減少內部節點的大小，使更多鍵值可以存放於記憶體中，降低磁碟 I/O 次數。
應用範例： 常用於資料庫索引和檔案系統（例如 MySQL、NTFS）。

示意圖：

       [10 | 20]
     /     |    \
   [5]    [15]    [25]
    |      |       |
[1,2,3]->[11,12]->[21,22]

b. B* Tree

B* Tree 在 B-Tree 的基礎上進一步提升了空間利用率與平衡性：

結構特點： 對節點分裂引入了更嚴格的限制。當節點溢位時，不會立即分裂，而是將鍵值重新分配給相鄰的兄弟節點。只有當重新分配失敗時才進行分裂。
優點：
- 提升空間利用率，通常高於 66%，相比 B-Tree 的 50%。
- 減少分裂次數，降低運算開銷。
應用範例： 適用於磁碟 I/O 表現極為重要的場景，例如嵌入式系統和大型主機資料庫。

c. Binary B-Tree

Binary B-Tree 調整了 B-Tree 的結構，以適應需要二元比較的環境：

結構特點： 保持階層結構，但確保每個節點只有兩個子節點。
優點：
- 在優化二元操作的系統中，簡化實作。
- 適合具有固定、二元基礎硬體限制的環境。
應用範例： 專門化的資料庫系統或記憶體受限的環境。

d. Cache-Sensitive B-Tree

此變化優化了結構，與現代 CPU 快取階層的特性相匹配：

結構特點： 將節點儲存在連續的記憶體區塊中，減少快取未命中。
優點：
- 記憶體操作速度顯著提升。
- 非常適合需要頻繁且快速查詢的應用。
應用範例： 高效能的記憶體資料庫與分析系統。

e. Bᵀ Tree

Bᵀ Tree 將鍵值的概念擴展，使其不僅代表數值，還可以表示範圍或多維數據：

結構特點： 每個鍵值可以代表複雜的物件，包括區間、空間資料或多維鍵值。
優點：
- 擴展了 B-Tree 的能力至非線性數據結構，例如 R-Tree 或 kd-Tree。
- 高效處理地理空間資料或多屬性查詢。
應用範例： 地理資訊系統（GIS）與多維數據索引。

總結

B-Tree 是一種基礎的資料結構，專門解決高效存取與儲存資料的挑戰。透過保持平衡性，B-Tree 確保搜尋節點、插入節點與刪除節點的操作性能，因此成為資料庫系統中不可或缺的一部分。像 B+ Tree 這樣的變體，更進一步展示了 B-Tree 的靈活性與應用範圍。

隨著資料量的增長與新型態資料的出現，B-Tree 及其變體將繼續演進。結合機器學習技術與傳統 B-Tree 的混合結構，未來可能進一步提升查詢的最佳化能力。B-Tree 的核心原則，對於設計高效能、可擴展且可靠的資料庫系統，依然非常重要。此外，硬體技術的進步與分散式計算的應用，也可能啟發新的適應方式，確保 B-Tree 在未來仍是資料庫引擎的重要基石之一。

大毛電腦科學筆記