Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

驅動程式堆疊效能

本文件旨在提供良好和不良做法的總覽，協助您瞭解在 Fuchsia 中編寫新驅動程式或與現有驅動程式互動的效能。

本文件涵蓋下列主題：

API 定義
導入方法

API 定義

為新的驅動程式庫堆疊編寫 API 時，應考量一些關鍵效能深入分析資訊。驅動程式堆疊 API 屬於應用程式或驅動程式庫類別。

應用程式 API 可用來讓一般非驅動程式庫元件存取硬體資源，驅動程式庫 API 則用於讓驅動程式自行通訊。舉例來說，fuchsia.hardware.network 是可用來與網路驅動程式互動的應用程式 API，fuchsia.hardware.network.driver 則會定義網路裝置的較低層級驅動程式庫程式 API。

裝置驅動程式庫 API 通常是 fuchsia.hardware.* banjo 和 fuchsia.hardware.* FIDL API。

避免同步處理作業

屬於快速路徑的工作單位應該避免同步完成的預期，尤其是在作業需要跨越程序邊界的情況下，更應避免 (但不只是) 預期的情況。就 FIDL API 而言，設計時，如果到最後一個工作單元無法啟動，則在安全要求下一個工作單元之前，可能會產生不必要的同步處理，這表示呼叫端必須在安全的情況下要求下一個工作單元。

在緩慢路徑作業 (例如設定、拆解和設定) 中，效能觀點可以接受同步作業。

鼓勵批次處理

當 API 定義明確定義了批次作業，而不是一律傳輸單一單位時，API 使用者應透過其應用程式或驅動程式來擴增批次作業。

批次處理的重要功能，是減少一組工作內需要運動 API 的次數。如果 API 跨越程序邊界，直接轉譯為減少系統呼叫和排程負擔，有助於提高效能。

此外，如果 API 定義本身是提供批次工作單元，裝置驅動程式就可透過硬體加速功能，更輕鬆地將一組工作項目整理成單一單元。許多裝置驅動程式會使用 DMA，例如將工作與驅動的特定硬體排入佇列。如果一次收到一批工作項目，或許可以減少硬體的交易數量。如果沒有妥善的批次界限，裝置驅動程式就會強迫裝置驅動程式與硬體互動的頻率多於所需，或採用經驗法則 (例如輪詢間隔) 來減輕硬體通訊的負擔。

避免複製資料

在高頻寬或低延遲的應用程式 (例如網路、音訊或影片) 中，避免資料複製非常重要。大型酬載應盡可能在 VMO 中跨越 API 邊界。常見的策略是在作業期間，在設定和交換這些 VMO 區域時，交涉有限數量的 VMO。

清楚說明流量控制

如果 API 批次工作可正常運作，且未按照上述方式設定嚴格的同步作業，那麼控管 API 伺服器和用戶端之間的資訊流動過程，對於正確性和效能至關重要。

在一般作業中，API 的流程控制定義必須允許所有部分都能執行作業，而無需等待其等待，方法是確保系統能夠執行的工作總量維持不變 (以定義固定，或在設定時預先議定)。

舉例來說，在設定期間，fuchsia.hardware.network 會定義有限數量的「工作單位」(即網路封包)，藉此強制執行流量控管。雙方隨時都知道有多少封包還是可以透過僅使用本機維護狀態，在 API 邊界上推送。

訂購帳戶

在某些應用程式中，所有工作單元都必須按照既定順序執行，以確保正確性。然而，在其他應用程式中，部分排序限制可能會完全削弱或解除。

如果工作項目串流不必按照確切順序執行，API 可以反映這一點，讓驅動程式和應用程式輕鬆識別可平行處理的工作。

舉例來說，網路封包通常必須維持順序，以免破壞應用程式通訊協定，但通常只有每個應用程式串流執行個體才適用此原則 (稱為「流程」)。網路轉接器中的常見策略是定義一組封包佇列，並透過確定性的方式將每個應用程式「流程」指派給其中一個佇列。網路堆疊即可安全地平行作業佇列，而不需查看封包的內容。觀察這類常見的硬體設施並在 API 中充分運用這些功能，就能打造出實際的效能改善措施。

實作

本節列出在實作提供或使用裝置驅動程式庫程式 API 的程式碼時，可觀察的效能模式和反模式。實作可以是驅動程式庫本身，也可以是與裝置驅動程式所提供服務互動的應用程式。

編寫快速路徑的程式碼時，應一律觀察到以下內容。請注意，就裝置驅動程式庫實作而言，快速路徑的一部分經常在中斷執行緒中運作。

避免分配記憶體或建立 Zircon 物件。在快速路徑上使用的資源一律應預先分配。使用可能引發隱性配置的 FIDL 繫結 (特別是 hlcpp) 或 fit::function 等程式庫時，請特別小心。
留意系統呼叫事件。Syscall 的作業成本可能高昂，因此，請小心不要在攸關效能的作業中呼叫核心。可能無法完全消除系統呼叫，但減少每個工作單元 (例如批次處理) 的呼叫次數可能會大幅降低系統負載。
快速傳回共用資源。如果 API 定義了有限的共用資源集區 (例如共用記憶體區域)，您應盡可能重複使用這些資源或傳回到「可用」集區 (最好是批次處理)。
盡可能將 VMO 對應至唯讀，而非讀寫。將 VMO 對應為唯讀，可以減少《數位市場法》需要執行的快取作業數量。舉例來說，使用 DMA 寫入可能包含快取行的共用 VMO 時，快取必須在 DMA 前後清除並失效。另一方面，透過唯讀對應方式對應快取行已知會永遠乾淨，這表示只有在 DMA 完成後，才會將其清除並失效。