本頁面由 Cloud Translation API 翻譯而成。

Zircon 和 Fuchsia 中的執行階段鎖定驗證

簡介

鎖定驗證是一種檢查鎖定行為一致性的技術計畫中，找出潛在的死結危險。本文件討論針對鎖定驗證和鎖定驗證的靜態和動態方法說明瞭執行階段鎖定驗證程式庫的基礎 Zircon 和 Fuchsia。

背景

鎖定驗證可靜態或動態執行。下列總結了靜態和動態方法之間的重要差異鎖定驗證：

執行驗證時：編譯時間與執行時間。
驗證工具找出潛在問題的成效。
程式設計人員所需的參與程度。
驗證本身的經常性費用。

靜態驗證

靜態驗證通常是透過分析呼叫，以在編譯期間執行編譯器或其他來源層級的處理器產生的圖形。使用這項對程式碼進行檢測和鎖定原始物件時，註解，用於通知驗證工具哪些類型代表鎖定，以及規則，套用至使用鎖定類型的程式碼。

靜態驗證的優點包括在建構時及早發現問題時間、確定性驗證結果，以及零執行階段負擔。這個所以需要一律啟用靜態驗證確保在程式碼傳入而且不會影響建構構件的效能

Static 驗證也有一些缺點。其中一個問題是靜態的必須對各種註解套用正確且一致的套用方式，才能進行驗證進而提供實用的結果這可能會造成維護作業不會產生問題。另一個問題是靜態驗證的能見度有限，且可能會遭到條件式驗證路徑、動態調度、移動語意，以及鎖定編譯單位。

動態驗證

動態驗證會觀察關聯，以在執行階段線上執行並在程式碼執行時切換鎖定。使用這個方法時足以處理上鎖和取得/釋放來提供驗證所需的資訊。

動態驗證的優點包括較簡單的檢測更有機會深入瞭解實際執行階段程式的行為。這樣一來，動態驗證就能用於大型程式碼中但靜態驗證可能就無法透過可能的鎖定互動組合

動態驗證的主要缺點為執行階段負擔和執行作業承保範圍因為動態驗證功能必須追蹤鎖定互動在執行階段中，每次取得和發布版本都會產生非零的更新執行成本追蹤資料及追蹤資料本身的記憶體負荷。執行階段追蹤也會導致程式碼路徑未執行驗證工具無法加以分析這可能會增加開發人員和品質確保，確保若尚未擴大執行作業涵蓋範圍滿足專案需求

鎖定順序不變

鎖定驗證工具的工作是判斷鎖定是否不變持續維護。主要的不變體是指兩個以上的鎖定：在程式中取得兩個以上鎖定的所有路徑時，必須在順序與包含兩個以上相同鎖定的每條路徑一致避免潛在的死結處理硬體的環境中斷點，如嵌入式系統和核心以避免中斷的死結。這張圖呈現了在接下來的幾個子節中

基本反轉

最簡單的反轉形式，當程式具有兩組鎖定兩者順序不一致，且順序不同。

例如，程式具有 A 和 B 鎖定，且程式碼路徑 P₁ 和 P₂，並具有下列行為：可能有死結：

路徑 P₁ 會按照順序取得並釋放鎖定：

開發(A)
開發(B)
版本(B)
版本(A)

路徑 P₂ 會取得並釋放反向序列中的鎖定：

開發(B)
開發(A)
版本(A)
版本(B)

透過合適的交錯，可能原因為兩種路徑同時執行若是不同的執行緒，當路徑 P₁ 保留鎖定時，就會發生死結 A 和等待鎖定 B 的區塊，以及路徑 P₂ 鎖定 B 和等待鎖定 A 的方塊。

循環依附元件

此外，也可能在兩個以上的鎖定和路徑之間發生反轉。這種手動檢查更難以辨識涉及的鎖定組合可能在涉及的每個路徑中正確排序只是組合中存在著潛在死結鎖定順序。

舉例來說，如果程式具備 A、B 和 C 鎖定，路徑 P₁、P₂ 和 P₃；包含下列行為可能有死結：

路徑 P₁ 會按照順序取得並釋放鎖定：

開發(A)
開發(B)
版本(B)
版本(A)

路徑 P₂ 會取得並釋放序列中的鎖定：

開發(B)
開發(C)
版本(C)
版本(B)

路徑 P₃ 會按照順序取得並釋放鎖定：

開發(C)
開發(A)
版本(A)
版本(C)

透過正確的交錯路徑 P₁、P₂、 P₃ 則會在每次路徑取得鎖定時，並在第二個步驟等待鎖定。在這個例子中可能因為有許多不同路徑組合鎖定序列。

IRQ 安全排序

處理硬體的系統中斷了在不影響安全機制的情況下，非安全鎖定是關鍵：執行 irq-safe 鎖定，以防止間接鎖定反轉。符合 Irq 安全鎖在 irq 與非 irq 結構定義之間保留順序；保持一致在 irq 與非 IR 的背景資訊對於非 SSL 安全鎖定的情況也是如此。原因如下非安全鎖定允許 irq 處理常式能有效插入鎖定由處理常式在中斷工作鎖定中的任何時間點取得序列。

舉例來說，假設系統具有不安全的鎖定 A 和 irq-safe 鎖定 B_irq;path P₁、P₂ 和 irq path P_irq；具有以下行為的可能出現死結：

CPU1 上的路徑 P₁ 會依序取得並釋出鎖定：

開發(A)
P_irq 會在 CPU1 中斷
版本(A)

CPU1 上的路徑 P_irq 會依序取得並釋出鎖定：

開發(B_irq)
版本(B_irq)

CPU2 上的路徑 P₂ 會依序取得並釋出鎖定：

開發(B_irq)
開發(A)
版本(A)
版本(B_irq)

採用正確的交錯路徑 P₁、P₂ 和當 P_irq 嘗試獲取死記時，就會發生死結 B_irq，P₂ 會保留 B_irq 和區塊等待 A。這是間接鎖定反轉：P_irq 有效插入 B_irq 的取得/發布序列 A 取得/發布序列在路徑 P₁ 中中間的階段，且與路徑中相同鎖定的鎖定順序不一致 P₂：

執行驗證

您可使用有限數值來驗證前一節中討論的不變體方向圖。有向圖會將鎖定的識別身分和順序視為會掃遍程式碼路徑建立圖表時編譯器或來源層級處理器產生的呼叫圖 (靜態資料) 分析) 或觀察在程式執行期間的鎖定順序 (動態) 分析)。本節透過摘要字詞，說明適用於或其中一種方法，以便準備具體的動態分析策略

在一般情況下，從程式碼路徑建構有向圖需要持續保留鎖定清單，當路徑遭到週遊時每當取得鎖定時，就會新增至清單並就會從清單中移除。除了維護此時，系統會透過代表有效清單的端點加入圖表的斜邊新取得的鎖定分別代表清單中已有鎖定的頂點。

基本反轉範例

本節說明用於偵測基本雙鎖定的有向圖方法反轉。

回顧先前範例，鎖定 A 和 B 鎖定的程式；代碼路徑 P₁ 和 P₂；以及下列行為：

路徑 P₁ 會按照順序取得並釋放鎖定：

開發(A)
開發(B)
版本(B)
版本(A)

路徑 P₂ 會取得並釋放反向序列中的鎖定：

開發(B)
開發(A)
版本(A)
版本(B)

路徑分析 P₁

從路徑 P₁ 開始，我們會定義並更新有向圖。

讓 L₁ 依路徑持有的有效鎖定清單 P₁。

讓 G = (V, E) 為有向圖，且有一組頂點 V 表示觀察到的鎖定和頂點之間的方向邊緣組合 E：

初始狀態：

L₁	V	E 鍵
()	{}	{}

在 P₁ 步驟 1 之後：

L₁	V	E 鍵
(A)。	{A}	{}

這個步驟會將鎖定 A 新增至使用中清單，並引入啟用與導向圖表相同的鎖定模式因為使用中沒有其他鎖定則沒有加入任何邊緣

在 P₁ 步驟 2 之後：

L₁	V	E 鍵
(A、B)	{A、B}	{(B, A)}

這個步驟會將鎖定 B 新增至使用中清單，並引入對應至圖表這次使用中的清單確實包含鎖定，因此新鎖定隨即會加到圖表中。這條邊緣代表鎖定 B，現在一律「依附」鎖定 A，其於其他涉及兩個鎖定的路徑

在 P₁ 步驟 3 之後：

L₁	V	E 鍵
(A)。	{A、B}	{(B, A)}

鎖定 B 已從有效清單中移除。圖表沒有任何更新。

在 P₁ 步驟 4 之後：

L₁	V	E 鍵
()	{A、B}	{(B, A)}

鎖定 A 會從有效清單中移除。圖表沒有任何更新。

路徑分析 P₂

讓 L₂ 成為 P₂ 保留的有效鎖定清單。

初始狀態：

L₂	V	E 鍵
()	{A、B}	{(B, A)}

在這種情況下，初始狀態就是路徑 P₁ 的最終狀態。

P₂ 步驟 1 之後：

L₂	V	E 鍵
(B)。	{A、B}	{(B, A)}

這個步驟會將鎖定 B 新增至使用中清單。由於運作中的清單不會加入任何邊緣。由於 B 已有端點圖表也不會變更為 V。

P₂ 步驟 2 之後：

L₂	V	E 鍵
(B、A)	{A、B}	{(B, A)、(A、B)}

這個步驟會將鎖定 A 新增至有效清單。因為這個門鎖已有 V 沒有任何變更。不過，由於有效清單會加入新鎖定的邊緣圖表。利用這種新的邊緣，圖表現在會在 A 與 B：表示這些鎖定在到目前為止考慮的兩個路徑，以及潛在的死結。

循環依附元件範例

本節說明偵測循環的有向圖方法使用先前討論過的不變體範例進行依附元件反轉專區。這張插圖與上一張圖。

假設程式包含鎖定 A、B 和 C 和路徑 P₁、P₂、P₃ 和下列行為：

路徑 P₁ 會按照順序取得並釋放鎖定：

開發(A)
開發(B)
版本(B)
版本(A)

路徑 P₂ 會取得並釋放序列中的鎖定：

開發(B)
開發(C)
版本(C)
版本(B)

路徑 P₃ 會按照順序取得並釋放鎖定：

開發(C)
開發(A)
版本(A)
版本(C)

路徑分析 P₁

讓 L₁ 依路徑持有的有效鎖定清單 P₁。

讓 G = (V, E) 為有向圖，且有一組頂點 V 表示觀察到的鎖定和頂點之間的方向邊緣組合 E：

初始狀態：

L₁	V	E 鍵
()	{}	{}

在 P₁ 步驟 1 之後：

L₁	V	E 鍵
(A)。	{A}	{}

在 P₁ 步驟 2 之後：

L₁	V	E 鍵
(A、B)	{A、B}	{(B, A)}

在 P₁ 步驟 3 之後：

L₁	V	E 鍵
(A)。	{A、B}	{(B, A)}

在 P₁ 步驟 4 之後：

L₁	V	E 鍵
()	{A、B}	{(B, A)}

路徑分析 P₂

讓 L₂ 依路徑持有的有效鎖定清單 P₂：

初始狀態：

L₂	V	E 鍵
()	{A、B}	{(B, A)}

P₂ 步驟 1 之後：

L₂	V	E 鍵
(B)。	{A、B}	{(B, A)}

P₂ 步驟 2 之後：

L₂	V	E 鍵
(B、C)	{A、B、C}	{(B, A), (C, B)}

這個步驟會將鎖定 C 新增至使用中清單，並引入對應至圖表使用中的清單含有鎖定 B，因此已新增邊緣從 C 到 B。

P₂ 步驟 3 之後：

L₂	V	E 鍵
(B)。	{A、B、C}	{(B, A), (C, B)}

在 P₂ 步驟 4 之後：

L₂	V	E 鍵
()	{A、B、C}	{(B, A), (C, B)}

路徑分析 P₃

讓 L₃ 依路徑保留有效的鎖定清單 P₃：

初始狀態：

L₃	V	E 鍵
()	{A、B、C}	{(B, A), (C, B)}

P₃ 步驟 1 之後：

L₃	V	E 鍵
(C)。	{A、B、C}	{(B, A), (C, B)}

P₃ 步驟 2 之後：

L₃	V	E 鍵
(C、A)	{A、B、C}	{(B, A), (C, B), (A, C)}

這個步驟會將鎖定 A 新增至有效清單。有效清單包含鎖定 C，所以一個邊緣是從 A 增加到 C。有了這個全新的邊緣，現在圖表在頂點形成循環 (A、B、C)，表示圓形依附元件，以及路徑 P₁ 可能出現死結的可能性。 P₂ 和 P₃ 的交錯方式正確。

IRQ-Safe Ordering 範例

本節說明用於偵測不合格順序的引導式圖方法違反先前討論的變化版本範例

使用不安全的鎖定 A 和 irq-safe 鎖頭來回顧範例系統 B_irq;path P₁、P₂ 和 irq path P_irq；包含下列行為：

路徑 P₁ 會依序取得並釋放鎖定：

開發(A)
版本(A)

路徑 P_irq 會依序取得並釋放鎖定：

開發(B_irq)
版本(B_irq)

路徑 P₂ 可依序取得並釋放鎖定：

開發(B_irq)
開發(A)
版本(A)
版本(B_irq)

路徑分析 P₁

讓 L₁ 依路徑持有的有效鎖定清單 P₁。

讓 G = (V, E) 為有向圖，且有一組頂點 V 表示觀察到的鎖定和頂點之間的方向邊緣組合 E：

初始狀態：

L₁	V	E 鍵
()	{}	{}

在 P₁ 步驟 1 之後：

L₁	V	E 鍵
(A)。	{A}	{}

在 P₁ 步驟 2 之後：

L₁	V	E 鍵
()	{A}	{}

路徑分析

讓 L_irq 依路徑保留的「有效」鎖定清單 P_irq：

初始狀態：

L_irq	V	E 鍵
()	{A}	{}

在 P_irq 步驟 1 後：

L_irq	V	E 鍵
(B_irq)。	{A、B_irq}	{}

在 P_irq 步驟 2 後：

L_irq	V	E 鍵
()	{A、B_irq}	{}

路徑分析

讓 L₂ 依路徑持有的有效鎖定清單 P₂：

初始狀態：

L₂	V	E 鍵
()	{A}	{}

P₂ 步驟 1 之後：

L₂	V	E 鍵
(B_irq)。	{A、B_irq}	{}

P₂ 步驟 2 之後：

L₂	V	E 鍵
(B_irq、A)	{A、B_irq}	{(A、B_irq)}

這個步驟會將鎖定 A 新增至有效清單。有效清單包含鎖定功能 B_irq，因此從 A 加入邊緣來從 B_irq 加入。此為邊緣安全鎖的邊緣，而不受 irq-safe 鎖定的特性違反順序不變，而且可能有死結。

從理論到實踐

本節會制定具體策略來實作有向圖驗證工具是以上一節的分析技巧為基礎。

導入策略的目標如下：

請盡可能避免使用動態分配。
將驗證負擔降至最低。
支援管理硬體中斷的環境。

使用鎖定類別移除備援功能

在本文件前述的分析中，鎖定法只視為所追蹤的物件屬於個別鎖定的執行個體。追蹤個別例項會產生正確的結果，但具有多項可能避免的結果：

追蹤結構必須隨鎖定執行個體動態調整且可能就需要動態分配每個執行個體的資料儲存空間
如有多個鎖定例項，圖表中即包含冗餘資訊相同的程式碼路徑
相對來說，如果鎖定功能採行的鎖定方式，可能需要更長的時間才能找出違規行為但尚未在所有 Pod 中個別傳播所需的程式碼路徑

主要觀察是，提供相同函式的鎖定必須遵循排列順序規則相同，無論執行個體數量為何。

請思考以下類型，這些類型包含鎖定成員，以及可變動的作業這兩種語言

struct Foo {
    Mutex lock;
    int data; GUARDED_BY(lock);
};

struct Bar {
    Mutex lock;
    int data; GUARDED_BY(lock);
};

void Swap(Foo* foo, Bar* bar) {
    foo->lock.Acquire();
    bar->lock.Acquire();

    int temp = foo->data;
    foo->data = bar->data;
    bar->data = temp;

    bar->Release();
    foo->Release();
}

因為 Swap 作業可能會在 Foo 和 Bar 它跟隨 Swap 會在所有鎖定區域之間建立順序 Foo 和 Bar 的例項；無法以其他方式程式的某些部分可能會在相同的 Foo 例項時產生死結和 Bar 由不同的訂單同時鎖定。

請注意，如果您有意或無意中將 Foo 和 Bar 的集合，藉此讓執行個體鎖定在不同的順序永遠不會重疊但這仍危險，因為看似無害變更程式的輸入、結構或時間，可能會導致隔離及引入潛在的死結。這個問題可以避免完全以同等的方式處理 Foo 和 Bar 的所有例項並套用相同的排序規則

可以透過追蹤而非鎖定執行個體的類別：每種鎖定成員代表專屬的鎖定類別每個鎖定類別之間的關聯可以採用與個別鎖定。

追蹤鎖定類別具有以下優點：

靜態分配的記憶體：因為編譯時會得知所有鎖定類別時間，追蹤結構可事先以靜態全球資料的形式分配。
消除多餘的圖形節點：同一類別中鎖定使用相同追蹤結構
更快偵測不變化的違規事件：偵測到違規事件時鎖定類別順序不一致，即使涉及的個別執行個體也是如此從未與其他玩家共同使用

其他排序規則

追蹤鎖定類別會在鎖定時造成其他排序注意事項啟用相同類別的多重鎖定因為系統不會追蹤個別執行個體則需要採取額外的步驟來確保必須同時取得相同類別的鎖定。

外部排序鎖定

如果階層式或其他結構排序的資料結構在每個節點中都有鎖定功能，且每個節點都設有多個鎖定不能同時駐留在線中在此情況下，資料結構或存取模式必須提供固定排序，用來保證鎖定的排序。

驗證巢狀鎖定類別時，只需要外部順序記錄在有效鎖定清單中。系統會將相同類別的鎖定加入清單。這樣的設計結果不能讓其他鎖定類別分散在相同類別，只在巢狀鎖定集合之前或之後，完全執行。

例如，非巢狀的鎖定類別 A 和 B，以及巢狀鎖定類別 N 可能的交錯方式如下：

A、N₀、N₁、... N_n、B

但不喜歡：

A、N₀、B、N₁、N_n 或 A、N₀、N₁、B、N_n 或 ... 依此類推

在大部分情況下，這在適當限制範圍內，加入任意深度的巢狀結構中可能會產生反轉因為結構會在執行階段更新另一方面巢狀結構有幾種層級的限制，或許能更快為每個層級鎖定類別，而非使用巢狀類別按照一般鎖定順序排序後，系統可能會允許於特定等級鎖定不過，編寫這類演算法並不容易因為我們無法寫出所有可能的規則

地址排序

相同類別的鎖定之間的鎖定順序很難一般化鎖裝在不同的國家/地區時，且並非提供外部提供的命令次。不過，在向對方尋求支援時，多個鎖定，沒有時間分隔。這種情況可按照地址排序鎖定，確保在取得路徑時，相同的鎖定會產生一致的鎖定順序

舉例來說，請考慮使用運算 F(S_a、S_b) 是在 S 結構的兩個例項上運作，每個執行個體都有一個類別鎖定 L，在執行 F 操作時，必須鎖定這兩個鎖定。

如果在執行個體之前，於記憶體中排序 S0 S₁ 會接著鎖定與 KPI 相同的相對順序包含執行個體我們可以考慮透過鎖定來有子類別 L₀ 和 L₁。

如果針對不同的訂單：

F(S₀、S₁) 和 F(S₁、S₀)

在沒有介入措施的情況下，這些會產生反轉的鎖定序列：

L₀、L₁ 和 L₁、L₀

由於 F 可同時存取這兩種鎖定，因此如此一來，就能依地址排序鎖定，導致鎖定的則無論引數的原始順序為何。

現在，假設序列中還有兩個鎖定類別：已取得 A 類別操作 F 和 B 之後取得 F。結果鎖定序列為：

A、L₀、L₁、B

請注意，這看起來類似請參閱上一節的說明。事實上也是如此，只有鎖定的順序提供地址，而非外部訂單。也就是說這兩種情況下，使用中討論串清單中的簿記皆適用。

鎖定類別追蹤資料結構

本節將探討追蹤鎖定類別及具體的處理技術，偵測潛在的死結。

每個鎖定類別的有向圖都有一個靜態分配的節點代表該類別的所有鎖定。每個節點包含下列資料結構：

免上鎖的雜湊組合

每個鎖定類別節點都有一組雜湊碼，可追蹤從鎖定類別到先依順序排序鎖定類別

待辦事項：新增雜湊集的實作詳細資料。

免上鎖、不等待斷裂組合結構物

每個鎖定類別節點都有一個父項指標，用於追蹤連接的節點。週期範圍。這樣可以確保才會完全逆轉圖形。

待辦：新增不相交組合結構的實作詳細資料。

Thread-本機鎖定清單

每個執行緒都會保留一份目前保留的鎖定的執行緒本機清單。

待辦：新增執行緒本機鎖定清單的實作詳細資料。

環狀偵測執行緒

每當有新邊緣加入有向圖時，迴圈偵測執行緒就會會觸發週遊圖表，找出涉及超過有兩個鎖定。Tarjan 緊密連結集演算法是一個很有效率的選擇最糟的情況是 O(|E| + |V|)。這個演算法的穩定性且即使掃遍了由其他執行緒同時更新的圖表也是如此。

待辦：新增迴圈偵測執行緒的實作詳細資料。

參考資料

Clang 靜態執行緒安全分析。
LLVM 執行階段執行緒清理工具。
Linux 核心的 lockdep 子系統。

Zircon 和 Fuchsia 中的執行階段鎖定驗證

簡介

背景

靜態驗證

動態驗證

鎖定順序不變

基本反轉

循環依附元件

IRQ 安全排序

執行驗證

基本反轉範例

路徑分析 P1

路徑分析 P2

循環依附元件範例

路徑分析 P1

路徑分析 P2

路徑分析 P3

IRQ-Safe Ordering 範例

路徑分析 P1

路徑分析

路徑分析

從理論到實踐

使用鎖定類別移除備援功能

其他排序規則

外部排序鎖定

地址排序

鎖定類別追蹤資料結構

免上鎖的雜湊組合

免上鎖、不等待斷裂組合結構物

Thread-本機鎖定清單

環狀偵測執行緒

參考資料

路徑分析 P₁

路徑分析 P₂

路徑分析 P₁

路徑分析 P₂

路徑分析 P₃

路徑分析 P₁