Leo Yeh's Blog

Java 基本介紹 (5)

教學目標

初步了解 Java 程式語言中集合框架之資料結構的基本概念。

重點概念

在現實社會中我們永遠不會知道未來有多少相同類型的物件,也無法準確的知道物件的類型,為了解決上述問題,Java 程式語言則提供集合框架,又稱容器。主要常用的集和介面則為 List 、 Set 和 Map,並且根據不同的應用情境選擇適合的資料結構。

資料結構 List Set Map
Array ArrayList
Tree TreeSet TreeMap
Linked List LinkedList
Hash Table HashSet HashMap
Hash Table + Linked List LinkedHashSet LinkedHashMap

首先 List 主要有兩種資料結構進行實作,分別為:

  1. ArrayList: 主要以陣列資料結構為主的序列,任何選取的元素皆可以在常數時間內容完成隨機的存取,此外其具有擴充機制,若沒有初始化長度則預設為 10,並且當增加元素超過原始容量時,則新容量為原始容量×3/2+1。
  2. LinkedList: 主要以串列資料結構為主的序列,任何選取的元素皆需在串列上進行,若元素愈接近串列最後位置,則花費時間愈久。

接著 Set 主要有三種資料結構進行實作,分別為:

  1. HashSet: 主要是將元素儲存至雜湊表中,效能最佳,但是對於迭代的順序無法確保。此外 HashSet 的雜湊值主要是由元素的值計算,且因為雜湊值會碰撞所以兩個物件可能會有相同的雜湊值,此時就會透過 equals() 方法判斷物件是否相等。
  2. LinkedHashSet: 主要是將的元素儲存至鏈接的雜湊表中,效能良好,但是會根據被插入集合的順序確保迭代的順序。
  3. TreeSet: 主要是將元素儲存至紅黑樹中,效能中等,但是對於元素的值會進行排序,若需要使用元素的值進行排序請採用 TreeSet,此外 TreeSet 可以搭配 Comparator 自定義針對值進行排序。

再來 Map 主要有三種資料結構進行實作,分別為:

  1. HashMap: 主要是將元素中的索引 (Key) 和值 (Value) 儲存至雜湊表中,效能最佳,但是對於迭代的順序無法確保。接著 HashMap 基於雜湊的原理使用 put(key, value) 方法儲存物件至 HashMap 中,此時會介面先透過 hashCode() 方法取得雜湊值 ((h = key.hashCode()) ^ (h >>> 16)),以利計算 index 值找到正確 Bucket 位置儲存物件,物件內容包括索引和值,若當不同物件有相同雜湊值時則發生碰撞,此時會以Bucket 接串列的形式進行儲存,以及當串列的數量大於 TREEIFY_THRESHOLD 值 (預設為 8) 時就會將串列轉為紅黑樹,接著使用 get(key) 從 HashMap 中取得物件,但若是因為雜湊值相同則發生碰撞時,則會再透過 keys.equals() 方法從串列中找出正確的節點,因此物件內容必須包括索引和值才能夠進行比對索引。再來在 HashMap 有兩個重要的參數,分別為容量 (預設為 16 ) 和負載因子 (預設為 0.75),所謂容量是指 Bucket 的大小,而負載因子則是 Bucket 允許填滿的最大程度,當 Bucket 中的物件數大於容量×負載因子時就會擴增兩位 Bucket 大小,此時還會執行 resize() 方法重新調整 Map 的大小,並且將原來的物件儲存至新的 Bucket 中的過程會執行 transfer() 方法,主要會將儲存在串列中的元素順序相反,直接將元素放在首位,為了避免 Tail Traversing 導致條件競爭發生造成死結。
  2. LinkedHashMap: 主要是將的元素中的索引 (Key) 和值 (Value) 儲存至鏈接的雜湊表中,效能良好,但是會根據被插入集合的順序確保迭代的順序。
  3. TreeMap: 主要是將元素儲存至紅黑樹中,效能中等,但是對於元素的值會進行排序,若需要使用元素的索引進行排序請採用 TreeMap,此外 TreeMap 可以搭配 Comparator 自定義針對索引進行排序。

最後要如何選擇適當集合介面搭配資料結構呢? 一開始最好的方式則是先以 ArrayList 為主,接著當發現效能問題的原因為在 List 中進行過多的插入和移除動作時,才使用 LinkedList,此外當時常進行隨機存取的方法 get() 和 set() 時則是 ArrayList 優於 LinkedList。接著 HashSet 效能優於 TreeSet ,尤其是插入和搜尋,除非需要維持元素的排序狀態,否則請採用 HashSet 即可。再來 HashMap 被設計應用於快速搜尋,其效能優於 TreeMap,除非需要維持元素索引的排序狀態,否則請採用 HashMap 即可,此外 HashMap 的實作主要使用雜湊表搭配陣列和串列的方式進行實作,若不當 hashCode() 方法不當使用則會被當成 LinkedList 使用。當然我們也可以參考不同資料結構的複雜度針對不同應用情境進行最適當的選擇。

資料結構 時間複雜度(搜尋) 時間複雜度(插入) 時間複雜度(刪除) 空間複雜度
Array Θ(n) Θ(n) Θ(n) O(n)
Tree Θ(log(n)) Θ(log(n)) Θ(log(n)) O(n)
Linked List Θ(n) Θ(1) Θ(1) O(n)
Hash Table Θ(1) Θ(1) Θ(1) O(n)

相關資源

⬅️ Go back