Fuchsia 系统调用的生命周期

概览

当应用调用系统调用时,执行过程会经历几个阶段。 为了减少样板代码,使用 古筝 工具。在深入了解上述各个阶段的工作原理之前,最好先了解 该代码是如何生成的。

用户模式和内核模式块以及特定代码块是如何创建的示意图。

使用古筝生成代码

Fuchsia 系统调用在 //zircon/vdso 的 FIDL 文件中声明。

zx_channel_create 的声明示例:

library zx;

@transport("Syscall")
protocol channel {
    channel_create(struct {
        options uint32;
    }) -> (resource struct {
        status status;
        out0 handle;
        out1 handle;
    });
};

内核构建完毕后 fidlc(FIDL) 前端)获取这些 FIDL 文件并生成 FIDL 中间表示法 (IR) JSON 文件。IR 文件在 //out/default/gen/zircon/vdso/zx.fidl.json 中生成。

zither 会读取此 IR 文件,并生成调用 C++ 宏的源文件 每个系统调用的输入和输出。这些宏的定义 允许 Zether 输出与架构无关的源。

吉特琴输出示例:

KERNEL_SYSCALL(channel_create, zx_status_t, /* no attributes */, 3,
    (options, out0, out1), (
    uint32_t options,
    _ZX_SYSCALL_ANNO(acquire_handle("Fuchsia")) zx_handle_t* out0,
    _ZX_SYSCALL_ANNO(acquire_handle("Fuchsia")) zx_handle_t* out1))

x86 实现示例:

#define KERNEL_SYSCALL(name, type, attrs, nargs, arglist, prototype) \
  m_syscall zx_##name, ZX_SYS_##name, nargs, 1

.macro m_syscall name, num, nargs, public
syscall_entry_begin \name
    .cfi_same_value %r12
    .cfi_same_value %r13
.if \nargs <= 3
    zircon_syscall \num, \name, \name
    ret
.endif

.macro zircon_syscall num, name, caller
    mov $\num, %eax
    syscall
// This symbol at the return address identifies this as an approved call site.
    .hidden CODE_SYSRET_\name\()_VIA_\caller
CODE_SYSRET_\name\()_VIA_\caller\():
.endm

这种模式将 Zither 生成的源代码与 C++ 宏和 汇编例程可在系统调用的各个阶段找到。

计划

要使用系统调用,您应将 Fuchsia SDK 的 <zircon/syscalls.h> 标头,由 zither 生成。 虽然头文件在编译期间对程序可用,但 仅在运行时在 vDSO 内可用。

vDSO

虚拟动态共享对象 (vDSO) 是一个 ELF 文件 包含每个系统调用的用户空间实现。组装例程 基本上都是由 zither 生成的,不过它们都具有相同的结构:

  1. 将用户提供的参数保存到架构专用寄存器中
  2. 将系统调用编号存储到架构专用寄存器(x86 为 %eax)中
  3. 将上下文切换到内核(x86 为 syscall

可通过以下方式查看 vDSO 中的例程:

$ objdump -d `find out/default.zircon -name libzircon.so.debug` | less

zx_channel_create 的 x86 实现:

0000000000007a70 <_zx_channel_create>:
    7a70:       b8 03 00 00 00          mov    $0x3,%eax
    7a75:       0f 05                   syscall

0000000000007a77 <CODE_SYSRET_zx_channel_create_VIA_zx_channel_create>:
    7a77:       c3                      retq

内核构建后,vDSO 会作为 内核中的 char 数组, 然后加载到 vmo。 在启动过程中,一些常量会被写入 vDSO,以允许用户空间 无需跳转到内核即可查询这些常量。

在程序的入口点被调用之前,ld.so 会将 vDSO 映射到内存中。 为了防止 return-to-libc 攻击过程中,vDSO 会被置于地址空间 并且基地址会提供给特定寄存器中的第一个线程。

vDSO 会与所提供的入口点中的用户程序动态关联 由 libc 提供

进程加载和 vDSO 的序列图

Syscall 处理程序

为了在特权模式下接收系统调用,内核会注册 系统调用处理程序。调用此例程时,系统调用 编号用于编入调度例程映射的索引。

x86 实现://zircon/kernel/arch/x86

write_msr(X86_MSR_IA32_LSTAR, (uint64_t)&x86_syscall);

FUNCTION_LABEL(x86_syscall)
  leaq    .Lcall_wrapper_table(%rip), %r11
  movq    (%r11,%rax,8), %r11
  jmp     *%r11
END_FUNCTION(x86_syscall)

调度例程负责将系统调用参数移至相应的 注册为 C 函数参数,并调用封装容器。 函数。例程是在构建时使用 syscall_dispatch 生成的, 宏和 Zither 生成的源文件。

#define KERNEL_SYSCALL(name, type, attrs, nargs, arglist, prototype) \
  syscall_dispatch nargs, name

KERNEL_SYSCALL(channel_create, zx_status_t, /* no attributes */, 3,
    (options, out0, out1), (
    uint32_t options,
    _ZX_SYSCALL_ANNO(acquire_handle("Fuchsia")) zx_handle_t* out0,
    _ZX_SYSCALL_ANNO(acquire_handle("Fuchsia")) zx_handle_t* out1))

.macro syscall_dispatch nargs, syscall
  LOCAL_FUNCTION(.Lcall_\syscall\())
    // move args around
    pre_\nargs\()_args
    // calls wrapper
    call wrapper_\syscall
    // cleans up
    post_\nargs\()_args
  END_FUNCTION(.Lcall_\syscall\())
.endm

系统调用封装容器

系统调用包装函数由 zither 生成,负责 调用系统调用实现,然后将所有句柄复制回客户端。 这些封装容器采用命名惯例 wrapper_<syscall>

syscall_result wrapper_channel_create(uint32_t options, zx_handle_t* out0, zx_handle_t* out1, uint64_t pc) {
    return do_syscall(ZX_SYS_channel_create, pc, &VDso::ValidSyscallPC::channel_create, [&](ProcessDispatcher* current_process) -> uint64_t {
        zx_handle_t out_handle_out0;
        zx_handle_t out_handle_out1;
        auto result = sys_channel_create(options, &out_handle_out0, &out_handle_out1);
        if (result != ZX_OK)
            return result;
        result = make_user_out_ptr(SafeSyscallArgument<zx_handle_t*>::Sanitize(out0))
                                   .copy_to_user(out_handle_out0);
        if (result != ZX_OK) {
            // We should never fail to copy out a handle to userspace. If we do, a
            // handle will be leaked, so throw a SignalPolicyException.
            Thread::Current::SignalPolicyException(ZX_EXCP_POLICY_CODE_HANDLE_LEAK, 0u);
        }
        result = make_user_out_ptr(SafeSyscallArgument<zx_handle_t*>::Sanitize(out1))
                    .copy_to_user(out_handle_out1);
        if (result != ZX_OK) {
            // We should never fail to copy out a handle to userspace. If we do, a
            // handle will be leaked, so throw a SignalPolicyException.
            Thread::Current::SignalPolicyException(ZX_EXCP_POLICY_CODE_HANDLE_LEAK, 0u);
        }
        return result;
    });
}

Syscall 实现

系统调用实现是一个采用命名惯例的手写函数 sys_<syscall>。这些函数包含系统调用的核心逻辑,并且 与架构无关

//zircon/kernel/lib/syscalls/channel.cc

zx_status_t sys_channel_create(...) {
   ...
}

附录

以下应用的提交示例: 创建新的系统调用。