Fuchsia 系統呼叫的生命週期

總覽

應用程式叫用系統呼叫時,執行作業會經過數個階段。為了減少樣板程式碼,系統會使用 zither 工具產生系統呼叫專屬的邏輯。在深入探究上述每個階段的運作方式之前,建議您先瞭解這個程式碼的產生方式。

使用者模式和核心模式區塊的圖表,以及特定程式碼區塊的建立方式。

透過 zither 產生程式碼

Fuchsia syscall 會在 //zircon/vdso 的 FIDL 檔案中宣告。

zx_channel_create 宣告範例:

library zx;

@transport("Syscall")
protocol channel {
    channel_create(struct {
        options uint32;
    }) -> (resource struct {
        status status;
        out0 handle;
        out1 handle;
    });
};

核心建構完成時,fidlc (FIDL 前端) 會擷取這些 FIDL 檔案並產生 FIDL 中繼表示法 (IR) JSON 檔案。IR 檔案是在 //out/default/gen/zircon/vdso/zx.fidl.json 產生。

zither 會讀取這個 IR 檔案,並產生來源檔案,以針對每個系統呼叫的輸入內容和輸出內容叫用 C++ 巨集。這些巨集是按架構定義,有助於輸出通用架構的來源。

角系輸出內容範例:

KERNEL_SYSCALL(channel_create, zx_status_t, /* no attributes */, 3,
    (options, out0, out1), (
    uint32_t options,
    _ZX_SYSCALL_ANNO(acquire_handle("Fuchsia")) zx_handle_t* out0,
    _ZX_SYSCALL_ANNO(acquire_handle("Fuchsia")) zx_handle_t* out1))

x86 導入範例:

#define KERNEL_SYSCALL(name, type, attrs, nargs, arglist, prototype) \
  m_syscall zx_##name, ZX_SYS_##name, nargs, 1

.macro m_syscall name, num, nargs, public
syscall_entry_begin \name
    .cfi_same_value %r12
    .cfi_same_value %r13
.if \nargs <= 3
    zircon_syscall \num, \name, \name
    ret
.endif

.macro zircon_syscall num, name, caller
    mov $\num, %eax
    syscall
// This symbol at the return address identifies this as an approved call site.
    .hidden CODE_SYSRET_\name\()_VIA_\caller
CODE_SYSRET_\name\()_VIA_\caller\():
.endm

系統在整個系統呼叫階段發現,透過 C++ 巨集和組裝處理常式交互產生的這種模式。

程式

如要使用 Sysia,您必須加入 Fuchsia SDK 的 <zircon/syscalls.h> 標頭 (由 zither 產生)。雖然程式在編譯期間可以使用標頭,但這項實作只能在 vDSO 的執行階段期間使用。

vDSO

虛擬動態共用物件 (vDSO) 是 ELF 檔案,其中包含每個系統呼叫的使用者空間實作項目。vDSO 中的組合處理常式主要是由 zither 產生,但全都具有相同的結構:

  1. 將使用者提供的引數儲存至架構專屬註冊項目
  2. 將系統呼叫號碼儲存至架構專屬暫存器 (%eax x86)
  3. 將情境切換為核心 (適用於 x86 的 syscall)

您可以透過以下方式查看 vDSO 中的日常安排:

$ objdump -d `find out/default.zircon -name libzircon.so.debug` | less

zx_channel_create 的 x86 實作:

0000000000007a70 <_zx_channel_create>:
    7a70:       b8 03 00 00 00          mov    $0x3,%eax
    7a75:       0f 05                   syscall

0000000000007a77 <CODE_SYSRET_zx_channel_create_VIA_zx_channel_create>:
    7a77:       c3                      retq

核心建構完成後,vDSO 會以核心中的字元陣列連結,並載入至 vmo。在啟動期間,一些常數會寫入 vDSO,以允許使用者空間程式查詢這些常數,而無須執行躍點至核心。

在呼叫程式的進入點之前,ld.so 會將 vDSO 對應至記憶體。為了防止返回 libc 攻擊,vDSO 會放在程序位址空間中的隨機位置,並將基本位址提供給特定註冊檔中的第一個執行緒。

vDSO 會在 libc 提供的進入點以動態方式連結至使用者的程式

程序載入與 vDSO 的序列圖表

Syscall 處理常式

為了在特殊模式下接收 syscall,核心會在啟動時註冊 syscall 處理常式。呼叫此處理常式時,系統會使用 Syscall 號碼建立分派處理常式地圖索引。

x86 實作://zircon/kernel/arch/x86

write_msr(X86_MSR_IA32_LSTAR, (uint64_t)&x86_syscall);

FUNCTION_LABEL(x86_syscall)
  leaq    .Lcall_wrapper_table(%rip), %r11
  movq    (%r11,%rax,8), %r11
  jmp     *%r11
END_FUNCTION(x86_syscall)

分派處理常式負責將 syscall 引數移至適當的暫存器,以作為 C 函式引數,並呼叫包裝函式函式。處理常式是在建構期間使用 syscall_dispatch 巨集和 Zicther 產生的來源檔案產生。

#define KERNEL_SYSCALL(name, type, attrs, nargs, arglist, prototype) \
  syscall_dispatch nargs, name

KERNEL_SYSCALL(channel_create, zx_status_t, /* no attributes */, 3,
    (options, out0, out1), (
    uint32_t options,
    _ZX_SYSCALL_ANNO(acquire_handle("Fuchsia")) zx_handle_t* out0,
    _ZX_SYSCALL_ANNO(acquire_handle("Fuchsia")) zx_handle_t* out1))

.macro syscall_dispatch nargs, syscall
  LOCAL_FUNCTION(.Lcall_\syscall\())
    // move args around
    pre_\nargs\()_args
    // calls wrapper
    call wrapper_\syscall
    // cleans up
    post_\nargs\()_args
  END_FUNCTION(.Lcall_\syscall\())
.endm

Syscall 包裝函式

系統呼叫包裝函式函式是由 zither 產生,負責呼叫系統呼叫實作,然後將所有控點複製回用戶端。這些包裝函式具有命名慣例 wrapper_<syscall>

syscall_result wrapper_channel_create(uint32_t options, zx_handle_t* out0, zx_handle_t* out1, uint64_t pc) {
    return do_syscall(ZX_SYS_channel_create, pc, &VDso::ValidSyscallPC::channel_create, [&](ProcessDispatcher* current_process) -> uint64_t {
        zx_handle_t out_handle_out0;
        zx_handle_t out_handle_out1;
        auto result = sys_channel_create(options, &out_handle_out0, &out_handle_out1);
        if (result != ZX_OK)
            return result;
        result = make_user_out_ptr(SafeSyscallArgument<zx_handle_t*>::Sanitize(out0))
                                   .copy_to_user(out_handle_out0);
        if (result != ZX_OK) {
            // We should never fail to copy out a handle to userspace. If we do, a
            // handle will be leaked, so throw a SignalPolicyException.
            Thread::Current::SignalPolicyException(ZX_EXCP_POLICY_CODE_HANDLE_LEAK, 0u);
        }
        result = make_user_out_ptr(SafeSyscallArgument<zx_handle_t*>::Sanitize(out1))
                    .copy_to_user(out_handle_out1);
        if (result != ZX_OK) {
            // We should never fail to copy out a handle to userspace. If we do, a
            // handle will be leaked, so throw a SignalPolicyException.
            Thread::Current::SignalPolicyException(ZX_EXCP_POLICY_CODE_HANDLE_LEAK, 0u);
        }
        return result;
    });
}

Syscall 實作

Syscall 實作是採用 sys_<syscall> 命名慣例的手寫函式。這些函式包含系統呼叫的核心邏輯,且不受架構影響。

//zircon/kernel/lib/syscalls/channel.cc

zx_status_t sys_channel_create(...) {
   ...
}

附錄

修訂版本範例,用於建立新的 syscall。