rcore-os Blog

2023年秋季开源操作系统训练营第二阶段总结-xllhxd

Posted on 2023-11-04 Edited on 2025-12-26

前言

不得不承认，自己的代码量在面对这五个实验的时候显得捉襟见肘。由于在此之前我没有进行任何项目的书写，或者说我只写过单独的 code.c 这样的东西，这次实验对我是一个不小的挑战。再加上初次接触 Rust 一些语言特性：闭包、各种集合也让我有点吃力。但万幸最近时间比较充裕，可以花充分的时间来做这件事，整个实验花费了两周的时间，将近五个小时，很少有过的这么快的时间了。

实验总结

由于我对实验的整个框架的了解也不是那么清楚，我只能以写实验时候进行的猜想来对这五个实验进行总结。

lab1

第一个实验让我实现获取进程信息。在基本的操作系统的理解下，我们应该知道进程的信息应该存储在进程控制块（process control block, PCB）中。但 task.rs 并没有向我们暴露什么可以直接访问的接口，而在 mod.rs 中，我们可以发现其实例化了一个 TaskManager，所以我们在这个文件中增加一个函数 get_tcb() 来获取当前进程的进程控制块，然后将信息传递给 TaskInfo 结构体即可。

lab2

第二个实验中向外提供的接口并没有发生变化，仍然是 task/mod.rs 下实例化的 TaskManager。而在进行这个实验之前，我们必须知道我们为什么要重写 sys_get_time 和 sys_task_info。这是因为，我们传给系统调用的指针指向的地址为用户进程的虚拟地址空间中的虚拟地址，这是操作系统无法直接访问的，需要增加一层指针转换的过程。知道了这一点之后，重写的任务就并不困难了。

而 sys_mmap 和 sys_munmap 的实现，可能开始没有思路，但可以首先把书中所有可能出现的错误排除掉，之后我们进行映射时既可以选择虚拟地址也可以选择虚拟页号，我选择了虚拟地址。而我们进行地址空间的映射，必然需要用到 mm 这个 crate 下的内容。不难想到 mm/memeory_set.rs 是这次实验的重点。在其中我们看到了 MemorySet 这个结构体，而我们如何获得这个结构体呢，我们在 TaskManager 中找到了 TaskControlBlock 并且 TaskControlBlockInner 中有 memory_set 这个成员。然后我们寻找 MemorySet 中有哪些我们可以用到的方法。显然 sys_mmap 可以使用 insert_framed_area() 方法完成，之后我们仿照其实现 remove_framed_area() 方法用以实现 sys_munmap。这里我采用了遍历所有的虚拟地址页并释放页表的方法。而在遍历的过程中有两种选择：

直接使用页表号
使用 VPNRange 结构，进而使用迭代器

其中后者比较复杂，因为 VPNRange 没有直接暴露出来，需要改为 pub 属性并在 mod.rs 中导出，但由于后续实验中不再提供 ViruralPageNumber 的 step() 方法，所以有更好的兼容性。

lab3

实验三相较于前两个实验的变化比较大，首先就是我们不再提供 task/mod.rs 中的 TaskManager 结构体，而是将其放到了 task/manager.rs 中。而从这个实验开始如果我们想获取当前的进程使用 current_task() 这个方法（这里说的并不严谨，在实验五中引入线程之后，task 应该表示线程，但在这里还是进程）。同时一个比较偷懒的地方就是这个实验并不测试 sys_task_info 系统调用，我们可以选择不再实现。

sys_mmap 和 sys_munmap 的实现和实验二是一样的，不多说。

sys_spwan 的实现开始让我有点困扰，因为最开始没有注意到 get_app_data_by_name() 这个方法。知道之后我们可以通过这个方法获取 ELF 文件的数据，再通过 TaskControlBlock 的 new() 方法新建进程控制块，之后我们需要设置当前进程的子进程和新创建进程的父进程，二者还是有一定不同的。之后将新建的进程加入队列即可。

而关于 stride 调度算法，整个算法没有什么难度，但我最开始没有想清楚这里的调度是指的就绪态的进程的调度，而纠结到底在 task/task.rs、task/processos.rs、task/manager.rs 中哪里实现。在看了 chapter 5 : 进程管理后发现应在 manager.rs 中实现。这里只需要每次选择 stride 值最小的加入就绪队列即可，这里需要在 TaskControlBlock 中加入相应的内容。

sys_set_priority 比较简单，不多赘述。

lab4

这个实验不再检查 sys_task_info 和调度算法，可以不用实现。

sys_mamp 和 sys_munmap 是一样的，不再赘述。

sys_spwan 变得不太一样了，因为我们有文件系统的出现，所以此时如果想要获取 ELF 的所有数据则要先获得其 inode，之后再进行，而我们调用 open_file() 函数来完成这件事情。

这个实验卡了我很长时间，主要是向外提供的 DiskInode、Inode、OSInode虽然比较清楚，但还是很难确定什么时候用哪个，而且有些时候需要和 block_id 以及 block_offset 打交道还是比较麻烦的。然后有一点就是实例化了一个 ROOT_INODE 来惯例所有的内容，这里我开始很不理解为什么其他的文件需要用根目录的 inode 来进行管理，后来才发现需要在这里完成 DirEntry 的更新。我们首先根据 inode 获得文件的 block_id 和 block_offset，然后获取缓存并加锁，然后更新链接数目，之后再更新 DirEntry。

而 sys_unlinkat 我的实现并不完整，但通过了测试。因为考虑到可能删除最后一个链接之后，我们需要清空 DirEntry，我选择了遍历现在的目录项，并将所有我们不 unlink 的目录项放到一个向量中，之后释放所有的目录项，将向量中的内容写入到目录项。而我所说的不完整，则是我没有实现如果 unlink 之后链接数不为零，需要将其写回目录项，我没有想太清楚如何实现这个事情。

lab5

首先我的实现稍显臃肿，因为 mutex 的思索检测可以不使用银行家算法来完成。而在这里我的整体思路则是通过修改 sync/mutex.rs 和 sync/semaphore.rs 中的结构体的内容，获得可以银行家算法中的三个向量。而在 mutex_lock 和 down 中更新三个向量，之后的思路如下面的代码：

let mut if_finish = vec![false; task_count];

loop {
    let mut task_id: isize = -1;

    for i in 0..task_count {
        let mut task_id_can_run = true;

        for j in 0..mutex_count {
            if if_finish[i] || need[i][j] > available[j] {
                task_id_can_run = false;
                break;
            }
        }

        if task_id_can_run {
            task_id = i as isize;
            break;
        }
    }

    if task_id == -1 as isize {
        break;
    }

    // 释放可以运行的线程的资源
    for i in 0..mutex_count {
        available[i] += allocated[task_id as usize][i];
        if_finish[task_id as usize] = true;
    }
}

for i in 0..task_count {
    if !if_finish[i] {
        return -0xdead;
    } 
}

如果找到不能运行的线程则发生死锁。

后记

这次的实验过程还是比较艰难的，而且最开始得知只有两周的时间，加之自己 Rust 基础并不好，所以最开始写的很是急躁，但后来平复一下，开始慢慢自己猜整体框架的思路，以及找一些自己可以用到 API，有点没想到自己可以完成这五个实验。在这个过程中参考了：

非常感谢大家讲解自己的思路，也感谢上课的老师以及群友。

2023开源操作系统训练营一二阶段总结-TheSayOL

Posted on 2023-11-04 Edited on 2025-12-26 In report

前言

rCore实验参考文档: rCore-Tutorial-Guide-2023A 文档

几年前便久闻Rust大名, 想入门但不得其法.

去年初学操作系统, 阅读的uCore文档, 但因自身水平过低, 看了几章就败下阵来, 抄抄答案草草收场. 当时也听说还有个rCore版本, 但囿于各种事务缠身, 最后不了了之.

今年兜兜转转, 还是捧起操作系统, 参加了老师推荐的训练营, 没想到是rCore, 令人感叹. 时间有限, 未能观看网课, 颇为遗憾. 所幸文档内容足够丰富, 获益匪浅.

从C到Rust, 从X86到RV64, 系统的实现方法大相径庭, 但终归也有不变之处, 或许能看清这部分, 才能明晰操作系统吧. 去年对操作系统一无所知的我没能看清, 今年的我, 但愿能略窥一二.

以下为这两个阶段所遇到的一些问题和记录

Rust

啃书. 阶段一的题目倒也亲民.

ch0 配置环境

按部就班, 参照文档.

工作环境为WSL2-Ubuntu_18.

编译 qemu 的时候出错, 提示can't find ninja

参考这个ISSUE
apt install ninja-build

ch1: 应用程序与基本执行环境

rust-analyzer 报错

使用#![no_std]时候, rust-analyzer提示错误, 但是可以编译, 无伤大雅

提示: can't find crate for 'test'
这个issue给出了解决方法

echo 的用法

打印上一条指令返回给系统的退出信号

1	qemu-riscv64 target/riscv64gc-unknown-none-elf/debug/os; echo $?

QEMU 的使用

两种运行模式

User mode: 即用户态模拟，如qemu-riscv64, 能够模拟不同处理器的用户态指令的执行, 可以直接解析ELF文件
System mode: 即系统态模式, 如qemu-system-riscv64程序, 模拟一个完整的硬件系统, 包括处理器、内存及其他外部设备

参数

qemu-system-riscv64 \
    -machine virt \
    -nographic \
    -bios $(BOOTLOADER) \
    -device loader,file=$(KERNEL_BIN),addr=$(KERNEL_ENTRY_PA)

-machine virt: 预设模拟的机器
bios $(BOOTLOADER): 指定BootLoader程序文件路径
device loader,file=$(KERNEL_BIN),addr=$(KERNEL_ENTRY_PA): 将file指定路径的文件, 加载到模拟的内存中的addr位置

执行上述命令, 将会执行:

机器加电, 此时通用寄存器清零, PC指向0x1000, 即ROM引导代码
很快跳转到0x80000000, 即bootloader处, 完成初始化, 接着跳转到内核位置, rustSBI默认内核在0x80200000处.
跳转到$(KERNEL_BIN), 执行操作系统的第一条指令。

链接器脚本

链接脚本 (Linker Script): 使得最终生成的可执行文件的内存布局符合我们的预期

cargo设置

-Clink-arg=-Tsrc/linker.ld: 设置链接器脚本linker.ld路径
-Cforce-frame-pointers=yes: 强制编译器生成带有帧指针（frame pointer）的代码, 以便进行调试和异常处理等操作

rCORE的linker.ld

架构OUTPUT_ARCH(riscv)
入口ENTRY(_start)
定义全局变量BASE_ADDRESS = 0x80200000;, 这是RustSBI 期望的内核起始地址
定义全局变量skernel = .;和ekernel = .;, 意思是kernel段的起始和结束地址
- 可以在rust里用extern "C" {skernel();}拿到skernel的地址
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  OUTPUT_ARCH(riscv)
  ENTRY(_start)
  BASE_ADDRESS = 0x80200000;
  
  SECTIONS
  {
  . = BASE_ADDRESS;
  skernel = .;
  // ...
  }

ch2: Trap

用户库

用户库里实现_start:

和大多数libc一样, 提供了csu, 完成在用户main()之前的环境设置, 以及main()之后的收尾工作.

#[link_section = ".text.entry"], 在linker.ld里, 将这个段放在了.text的最开始, 即入口

#[no_mangle]
#[link_section = ".text.entry"]
pub extern "C" fn _start(argc: usize, argv: usize) -> ! {
    clear_bss();
    // ...
    exit(main(argc, v.as_slice()));
}

用户库里实现 main:

#[linkage = "weak"]弱链接, 即c里的weak_alias
如果用户没有提供main(), 将会链接这个进去, 这样就不会在链接阶段报错, 而是会在运行时报错(额, 行吧)
1
2
3
4
5
#[no_mangle]
#[linkage = "weak"]
fn main(_argc: usize, _argv: &[&str]) -> i32 {
panic!("Cannot find main!");
}

链接脚本

我们使用链接脚本 user/src/linker.ld 规定用户程序的内存布局：

将程序的起始物理地址调整为 0x80400000 ，三个应用程序都会被加载到这个物理地址上运行；
将 _start 所在的 .text.entry 放在整个程序的开头 0x80400000；批处理系统在加载应用后，跳转到 0x80400000，就进入了用户库的 _start 函数；
提供了最终生成可执行文件的 .bss 段的起始和终止地址，方便 clear_bss 函数使用。

问题: user/src/linker.ld 实际上不是 0x80400000 而是 0x0?

解决: 文档里说是用了 linker.ld, 实际上根本没用, 用的是 build.py

risc-v 通用寄存器, CSR, ABI

参考知乎

RISC-V 寄存器编号从 0~~31 ，表示为 x0~~x31 , 对应 abi 如下

x0: 零寄存器
x1: ra
x2: sp
x3: gp(通用指针)
x4: tp(线程指针)
x5: t0(临时寄存器或备用链接寄存器)
x6~~x7: t1~~t2(临时寄存器)
x8: s0/fp(帧指针)
x9: s1(需要保存的寄存器)
x10~~x11: a0~~a1(参数/返回值)
x12~~x17: a2~~a7(参数)
x18~~x27: s2~~s11(需要保存的寄存器)
x28~~x31: t3~~t6(临时)

对于 syscall:

a0~a6 参数
a0 返回值
a7 用来传递 syscall ID。

仅考虑U特权级触发Trap, 并切换到S特权级, 相关CSR如下

sstatus: 用SPP等字段给出Trap处在哪个特权级
sepc: 记录触发Trap的指令地址
scause: Trap原因
stval: Trap附加信息
stvec: Trap处理代码的入口地址

发生Trap时, 硬件会自动完成如下这些事情

修改sstatus的SPP字段
修改sepc, scause, stval,
跳转到stvec指定的地址, 并修改特权级为S

stvec相关细节

MODE 位于 [1:0], 若为00, 则意味着Direct模式, 无论Trap原因如何, 处理入口都是BASE<<2
BASE 位于 [63:2], 表示处理入口

从Trap返回, 使用S特权级的特权指令: sret, 硬件会完成以下功能：

将当前的特权级设置为 sstatus 的 SPP 字段
跳转到 sepc 寄存器指向的指令

lazy_static

外部库lazy_static提供的宏lazy_static!: 全局变量运行时初始化

默认下, 全局变量必须在编译期设置初始值, 但有些全局变量需要运行时数据才能初始化
lazy_static!声明的全局实例, 只有第一次被使用到的时候才会初始化

riscv 汇编

fence.i: 清理i-cache:

切换应用会修改会被CPU取指的内存区域, 使得i-cache和内存不一致
使用指令手动清空, 让里面所有的内容全部失效

.align 2: 4 字节对齐, 这是 RISC-V 特权级规范的要求

csrrw rd, csr, rs: 将csr写入rd, 再将rs写入csr

宏:

启用宏功能.altmacro
宏开始.macro NAME ARG
宏结束.endm

循环伪指令.rept, 循环结束.endr

如何启动第一个应用

操作系统初始化完成之后, 处于S特权级, 通过sret, 可以切换到U特权级运行应用, 而之前要完成如下这些工作：

跳转到应用程序入口点, 假设是0x80400000
切换到用户栈
在__alltraps时我们要求sscratch指向内核栈, 在这里完成
切换特权级

通过复用__restore的代码来实现上述工作

在内核栈上压入一个伪造的Trap上下文
调用__restore函数, 让这些寄存器到达启动应用程序所需要的上下文状态

ch3: 分时任务管理

任务切换的流程

流程

初始是操作系统在运行
os 把所有任务导入内存, 并为他们初始化了 task 结构(tcb): s0~11, ra, sp, 状态(ready)
- ra 指向 __restore
- sp 指向任务上下文: 即这个任务的所有寄存器内容, 一般在下处理机之前保存, 但是因为是初次运行, 所以初始由 os 虚构.
os 启动第一个任务 task0: 将其设置为 running, 调用 __switch(_unused, task0)
__switch 把当前的 s0~11, ra, sp 保存到 _unused 指向的 task 结构里, 再把 task0 指向的 task 结构里的内容恢复到对应寄存器, ret
此时会返回到 ra 指向的, 也就是 __restore 里, 她根据 sp 指向的上下文, 把里面的东西恢复到寄存器里
- 先恢复 sstatus, sepc, sscratch ; 再到通用寄存器x0~x31(x0(零), x2(sp), x4(tp)不需要恢复) ; 最后 sp ; sret
sret 发生降级, 根据 ra(x1) 返回执行, 而这个 ra 由 os 虚构, 指向 task 的第一行代码
此时运行 task0 …
…
…
该是任务切换的时候了! 下面是理由, 无论是哪个理由, 都会进入系统调用.
- 理由1: 时钟中断, 发现时片用尽, 直接帮你切换
- 理由2: 该任务主动放弃, sys_yield
进入内核态, 开始系统调用, 第一件事就是保存当前上下文, 即 __restore 的反操作, 把所有关键寄存器入栈, 然后将 sp 设置为内核栈
此时看看系统调用想干嘛: 原来是切换任务, 于是开始切换任务
首先遍历任务数组, 找到一个 ready, 比如 task1, 设为 running, 再把当前任务设置为 ready, 然后进入 __switch(task0, task1)
__switch 一样的操作: 把 task0 的东西保存, 把 task1 的东西写入寄存器, 然后 ret
ret 又回到了 os 事先设计好的 __restore, 然后重复, task1 正式开始运行
…
…
…
该是任务切换的时候了! 首先进入系统调用
首先给 task1 保存当前上下文, 然后进入内核栈, 开始切换任务
遍历任务数组, 找到一个 ready, 假设是 task0 吧, 设为 running, 把 task1 改为 ready, 然后 __switch(task1, task0)
__switch 把 task1 的东西保存, 把 task0 的东西写入寄存器: s0~s11, ra, sp, 然后 ret.
有意思的来了: 这时候的 s0~11, ra, sp 是什么呢?
- 回忆下 task0 当时在干嘛: 首先是 task0 进入内核态保存了用户态的上下文, 然后把 ready 和 running 互换, 然后 __switch
- 所以 ra 应该是 __switch 的下一行, 因为调用完了要返回嘛, sp 就是此时的内核栈, s0~11 就是正在用的寄存器, 因为是被调用者保存的, 所以 __switch 得帮你保持原样.
总之, __switch ret 了, 根据 ra, 回到 task0 在内核态里调用 __switch 的下一行, 回忆一下, 为什么进入内核态了?
- 因为时钟中断/sys_yield
所以 __switch 的下一行应该是系统调用返回, 怎么返回来着? 回一下系统调用的过程:
- 首先是程序调用相关函数, 发生了 Trap
- Trap 的入口是 all_trap
- all_trap 进行用户态寄存器的保存, 然后修改 sp 指向内核栈, 然后调用 trap_handler, 参数是上下文
- trap_handler 读取 scause, 发现是系统调用, 先修改上下文里的 pc(sepc)(让他+4), 然后根据系统调用号进行调用, 返回值存在上下文的 x10 里, 返回
- all_trap 继续, 进行 __restore
所以 __switch 的下一行应该是 __restore: 这不是完美对上了吗!
- __restore 先恢复 sstatus, sepc, sscratch ; 再到通用寄存器x0~x31(x0(零), x2(sp), x4(tp)不需要恢复) ; 最后 sp ; sret
这回回到了 task0 的上次停住的地方了, 一样的寄存器, 一点没变, 对于 task0 来说, 毫无感知
继续运行!

为什么要 drop(inner):

因为调用 __switch 之后这个 task 的状态就停滞在那里了, 转而运行别的 task 了
但是任务切换本质只是 pc 和上下文改变, 所以这个 inner 实际上还处于被借用状态, 得等到 task0 恢复了, 并且从该函数返回了, 才能 drop, 在这之前没人可以再次借用

RISC-V 架构中的嵌套中断: 不会发生

默认情况下，当 Trap 进入某个特权级之后，在 Trap 处理的过程中同特权级的中断都会被屏蔽。

当 Trap 发生时，sstatus.sie 会被保存在 sstatus.spie 字段中，同时 sstatus.sie 置零，这也就在 Trap 处理的过程中屏蔽了所有 S 特权级的中断；
当 Trap 处理完毕 sret 的时候， sstatus.sie 会恢复到 sstatus.spie 内的值。
也就是说，如果不去手动设置 sstatus CSR ，在只考虑 S 特权级中断的情况下，是不会出现嵌套中断 (Nested Interrupt) 的。

实验任务: 获取任务信息

任务介绍

引入一个新的系统调用 sys_task_info 以获取当前任务的信息，定义如下：

fn sys_task_info(ti: *mut TaskInfo) -> isize {  // ti: 待查询任务信息
  // syscall ID: 410
  // 返回值：执行成功返回 0，错误返回 -1
}

struct TaskInfo {  
    status: TaskStatus,  // 任务控制块相关信息（任务状态）,  一定是 Running
    syscall_times: [u32; MAX_SYSCALL_NUM],  // 任务使用的系统调用及调用次数,  MAX_SYSCALL_NUM=500 。调用 `sys_task_info` 也会对本次调用计数。
    time: usize  // 系统调用时刻距离任务第一次被调度时刻的时长（单位ms）
}

实现思路

sys_task_info

这也是个系统调用, 调用号为 410, 所以应该修改 syscall/mod.rs的…已经帮我改好了那没事了

status

在 task/mod.rs 里暴露一个接口 get_current_status()
当然返回值肯定是 running

syscall_times

存在哪里: 这是个程序本身强相关的数组, 所以要放入 tcb 里, 并且一开始就初始化
如何记录: 每次 syscall 的时候, 进入 trap_handler, 如果是系统调用, 就拿到系统调用号index
- 在 task/mod.rs 里暴露一个接口 set_current_syscall_times(index), 修改数组里对应的地方 + 1
在 task/mod.rs 里暴露一个接口 get_current_syscall_times(), 返回这个数组

time

存在哪里: 和程序本身强相关, 在 tcb 里记录第一次启动的时间first_start_time, 并且一开始就初始化
如何记录: 当这个程序第一次被调用的时候, 修改first_start_time为当前时间.
- 选择在task/mod.rs的run_next_task()里, 新增: 如果next的first_start_time为0, 就设置为当前时间
在 task/mod.rs 里暴露一个接口 get_current_first_start_time()

思考题: 虽然系统调用接口采用桶计数，但是内核采用相同的方法进行维护会遇到什么问题？是不是可以用其他结构计数？

内核统计本身系统调用次数? 内核本身还需要系统调用?

ch4: 分页

后期补充: 本章内容繁多信息量大, 开头埋下的跳板伏笔迟迟不能回收, 增加了理解和记忆压力, 导致当时阅读得颇为吃力, 辛辛苦苦看了大半只觉头昏脑胀不知所云. 快结束时, 终有一段注解点明要义

目前我们的设计是有一个唯一的内核地址空间存放内核的代码、数据，同时对于每个应用维护一个它们自己的地址空间，因此在 Trap 的时候就需要进行地址空间切换，而在任务切换的时候无需进行（因为这个过程全程在内核内完成）。而教程前两版以及 ucore 中的设计是每个应用都有一个地址空间，可以将其中的逻辑段分为内核和用户两部分，分别映射到内核和用户的数据和代码，且分别在 CPU 处于 S/U 特权级时访问。此设计中并不存在一个单独的内核地址空间。

颇有推理小说的风味, 开头倒叙留下悬念, 结尾反转推翻读者前面的一切推理, 不禁令人拍案叫绝.

此前只见过 ucore 的实现, 即内核和用户空间不隔离, 这次也先入为主了, 只能感叹所学甚微.

遂将内容倒着梳理一遍.

跳板

在 ucore 里, 每个用户内存空间里的高 1G 都是内核代码

用户态无法读写高1G的空间
如果Trap, 进入内核态, 就可以跳转到高1G的空间里执行内核代码

在rcore, 内核空间和用户空间是隔离的, 也就是说

用户哪怕Trap进入内核态, 也需要切换页表才能访问内核空间
众所周知, Trap后, 会进入内核态, 并跳转到 __alltraps, 这期间是没机会切换页表的
所以__alltraps需要在用户空间里的某个地方, 而且在所有用户空间里都要有相同的虚拟地址
在__alltraps执行过程中, 需要执行切换页表的指令
执行之后PC + 1, 指向了: 内核空间里的一块地方! 这下尴尬了
显然, __alltraps也要在内核空间里也有一份, 而且虚拟地址必须和用户空间里一样.

这就是跳板: 内核和用户空间里, 相同的虚拟地址, 都有__alltraps和__restore这两个函数.

rcore里, 让这个虚拟地址为, 虚拟空间最高的一页.
本质上, 这个和ucore里高1G都映射到内核空间是一样的, 只不过映射得更少, 仅两个函数, 这样更安全(也更麻烦).

考虑一次简单的Trap:

用户进入内核态, 调用__alltraps, 切换页表, 保存上下文, 执行处理例程 … 且慢! 切换页表何时发生为好?
- 首先执行处理例程肯定要在最后, 那么先切换页表还是先保存上下文?
- 如果先切换页表
  - 此时进入内核空间里, 将上下文保存到内核栈里, 一切照旧
  - 执行__restore, 将上下文弹出, 再切换页表, 再sret, 完美 … 吗?
  - 很遗憾: 修改页表寄存器的指令, 需要另一个寄存器, 但是, 将上下文弹出之后, 所有通用寄存器都无法使用了, 根本不能切换页表
  - 你或许会说: 有没有另一个寄存器, 如同修改sp的sscratch一样 – 答案就是, 还真没
因此只能先保存上下文, 再切换页表
- 上下文存在哪里?
  - 为了不影响到用户, 选择在跳板的下方, 虚拟空间的次高页, 申请一页, 写入上下文
  - 这样需要多申请一页, 而不能优雅的写到内核栈里, 很遗憾, 但是没办法, 谁让RV不给多一个寄存器呢
- 上下文保存了什么? – 之前的上下文是所有通用寄存器, 以及几个关键 CSR, 现在只存这些, 够了吗?
  - 每个进程都有自己的内核栈, 都有自己的页表, 都需要找个地方存起来
  - rcore: 就和上下文保存在一起了(反正那一页很空)
继续: 执行处理例程trap_handler … 且慢! 怎么执行? 还是call trap_handler?
- RV小知识: call其实是伪指令, call trap_handler会被编译成相对跳转, 即linker.ld里, 这条call指令, 到trap_handler的距离
- 然而, 在我们特意设计之下, __alltraps执行的时候, pc并不在.text里, 而是在次高页里, 使用call会跳到错误的地方
因此我们只能手动跳转到trap_handler – 额, 先思考, 跳转地址从哪里来?
- 显然, 我们需要定一个地方, 提前保存好trap_handler的地址, 可以存在哪里呢?
- rcore: 就和上下文保存在一起了(反正那一页很空)
处理例程执行结束之后, 调用一个新函数, trap_return, 其负责手动跳转到__restore, 并提供两个参数, 页表和上下文的地址
- 此处如何手动跳转: 因为这是Rust函数, 只要获得提前标记好跳板的地址, 就能跳过去了.
终于到了__restore
- 因为把上下文保存到用户空间了, 所以这里要先切换页表, 所以需要一个参数, 页表
- 因为上下文不再保存到栈里, 所以需要一个参数, 上下文
- 然后把上下文弹出, 用sscratch切换sp, sret, 完美!

考虑第一次执行用户程序, 也就是直接__restore的情况:

首先, 在__restore之前, 内核要为这个进程申请几页, 作为内核栈
接着, 内核还得先为这个进程, 生成用户空间:
- 首先为用户生成一个页表
- 然后申请很多页, 把用户程序的各个段读入内存里
- 还要申请几页, 作为用户栈
- 还要申请一页, 映射到跳板
- 最后申请一页, 构造一个上下文存进去
别忘了, 内核还要生成一个TCB, 上面这些信息, 就一起存到TCB里吧!
- 还记得构造的TCB里, 还有什么吗? 没错就是任务上下文s0~11, ra, sp, 以及状态(ready)
准备完全, 运行应用: 将s0~11, ra, sp恢复, ret, 跳转到ra, 也就是上文提到的新函数trap_return
- trap_return负责给__restore送参数: 这就是为什么需要新函数, 因为有足足两个地方都要用到!
- sp就是这个进程的内核栈, 毕竟恢复任务上下文之后, 就算是正式恢复到这个进程了, 接下来的操作应该用该进程的内核栈来操作.
trap_return之后, 终于跳转到__restore了, 看看__restore做了什么, 实际上和从Trap返回是一样的
- 先切换页表到用户空间
- 然后把上下文倒腾出来, 切换sp和sscratch, sret

虚拟内存管理

所谓虚拟内存管理, 实际上就是实现两个东西

物理页管理器

虚拟映射物理地址的方法
什么? 虚拟内存管理器? 完全不需要!

能用的虚拟地址, 都存在页表里了

虚拟地址告诉进程了, 他应该自己保存好

物理页管理器

实际上就是有一个数据结构, 他负责

管理空闲物理页
有人来要一页, 怎么分配
有人来还一页, 怎么回收
只要实现一页一页的就行了, 很多页的分配和回收, 循环调用就好了
因为物理页不会有连续一块的借用的说法, 那是虚拟页的说法.

rcore的极简栈式的物理页管理器

有两个数组, 记录没分配过的物理页号, 和已回收的物理页号
总共可用的物理页: 从ekernel(内核数据的结束)开始, 到0x80800000(硬编码)结束

仅暴露接口frame_alloc

返回一个FrameTracker, 内容其实就是物理页号
为什么没有回收接口? – RAII思想
- FrameTracker实现了Drop Trait: 将该物理页号push到数组里
- 也就是说, 等到这个程序自然消亡之后, FrameTracker也会自动Drop, 即自动回收内存

注意, 现在还没有实现动态内存分配

注意, 现在还没有实现动态内存分配

注意, 现在还没有实现动态内存分配

硬件MMU, 清空快表的指令

rv64 的分页机制, 通过修改satp来开启

satp: 一个CSR, 指示了页表位置和分页模式
- mode: 4位, 分页模式, bare(0000), sv39(1000)
- ASID: 16位
- PPN: 44位, 一级页表的物理页号

sv39只使用虚拟地址的低39位, 转换为56位的物理地址

其他位必须和有效地址的最高位一致, 即虚拟地址只有高256G和低256G是有效的
为什么是39:
- 一页4KB, 一个页表项64位, 一页可以存512个页表项, 也就是9位索引
- 而sv39使用三级页表, 总共需要27位索引, 再加上页偏移12位, 所以只需要39位有效

页表项

保留: 10位
PPN: 44位, 物理页号
RSW: 2位(9:8)
标志位: 8 位(7:0), DAGUXWRV – dirty, access, G(粒度?), user(用户可访问), XWR(执行,写,读), V(有效)
- RWX若不全为0, 则意味着这是最后一级页表.

sfence.vma清空快表

内核和应用的内存视图

rcore 采用了 ucore 设计的改进版, 即

内核空间不再是用户空间的高 1G, 而是独立出来, 和用户空间隔离

当然, 没法做到完全隔离, 内核和用户的高一页, 还是得映射到一起, 充当 ‘跳板’

内核的内存视图

此处是虚拟内存最高处, 往下256GB是有效地址
跳板页
各个进程的内核栈从此处分配, 注意各个栈之间要有保护页
- 保护页: 这一页直接被跳过, 也就是说, 其虚拟地址永远不会写入页表里, 对其访问会直接异常, 这样可以防止栈溢出, 覆盖其他数据
…
…
…
此处是虚拟内存0x80800000(硬编码), 即可用物理页的结束
可用的物理页框
.bss
.data
.rodata
.text
此处是虚拟内存0x80200000(硬编码), 即内核数据的起始处
注意到内核数据, 虚拟地址和物理地址一样, 都是0x80200000开始, 这是故意的
在内核的页表里, 将内核数据的虚拟地址和物理地址, 进行了恒等映射
这样做, 方便内核直接用物理地址访问内存.
- 注意, 虽然这是内核虚拟空间视图, 但是物理空间里, 可以使用的物理空间是真真切切的0x80200000~0x80800000
- 使用恒等映射, 内核访问用户空间就可以少走一步
  - 内核得到一个用户地址 va, 如何访问
  - 先获取当前进程的页表, 查表得到 pa
  - 这时候, 内核需要通过 pa 反推出内核空间的 va
  - 恒等映射: va 就是 pa!

有点抽象, 虽然这里是内核虚拟空间, 但是其中有一部分是物理空间. 既是虚幻也是现实.

不如说用户空间也是? 凡是保存了数据的, 实际上都是物理空间.

应用的内存视图

此处是虚拟内存最高处, 往下256GB是有效地址
跳板页
上下文页: ~~越想越气, 每个进程要多申请一页, 浪费~~
…
…
…
…
申请X页作为用户栈
保护页
.bss
.data
.rodata
.text
此处是虚拟内存最低处(0), 往上256GB是有效地址

虚拟地址到物理地址的映射

再次声明: 此时并没有实现动态内存分配, 记录内存使用情况仅仅是加载程序的时候记录分配的页

rcore采用段页式设计, 但是分段仅仅为了区分不同的访问权限rwxu

rcore给每个进程生成一个MemorySet, 记录内存使用情况, 保存在TCB里

RAII: MemorySet保存了所有这个程序申请的FrameTracker, 程序消失的时候, 系统会释放TCB, 从而自动回收所有页框

MemorySet有两个成员: 页表和段数组(vec[MemoryArea])

页表很简单: 维护了一级页表的物理页号, 以及为了新建二三级页表, 所申请的FrameTracker
段数组:
- 为每个段生成一个MemoryArea, 根据视图决定虚拟地址
- 每个MemoryArea生成的时候, 都会判断要不要为了这个段, 申请页框
  - 比如内核数据就不需要申请
  - 如果申请了页框, 就要把这段映射关系先记录下来, 尤其是FrameTracker得存下来
- 随后就要把MemoryArea插入段数组里, 插入的时候, 就把其记录的映射关系给写到页表里.
MemorySet还负责设置跳板: 其实就是给页表写入, 把高一页映射到那两个函数所在的, 物理页

重写 sys_get_time 和 sys_task_info

参数是一个指针, 需要往里面填数据.

指针的值是个地址, 是个虚拟地址, 是个用户给的虚拟地址, 所以当然是用户的页表上的虚拟地址
内核使用的是自己的页表, 所以无法直接使用这个指针写数据, 因为自己的页表映射的物理地址和用户页表映射的物理地址不一样.
但是内核可以查用户的页表, 得到这个指针实际的物理地址, 内核需要向这个物理地址里写数据, 此时有两种实现
- 实现1: 因为内核使用恒等映射, 所以把这个物理地址当成虚拟地址访问, 就等于访问这个物理地址.
- 实现2: 朝内核的页表里, 随便用一个虚拟地址映射这个物理地址, 访问完毕后将这个页表项改回原样.
  - 我使用了0x0, 因为内核起点是0x800000, 代码里也没用到, 所以用完后直接清零这个页表项即可.

实现简易的动态分配内存: mmap 和 munmap

此处正式开始涉及到动态分配

rCore本身已经给出了极其丰富的 api, 直接调用即可.

mmap: 将 _start 开始的虚拟地址, _len 个字节, 映射到某个物理内存, 内存属性为 _port.

找到用户的 mem_set, 插入一个 map_area, 这将会自动申请物理页框, 自动修改页表.

munmap: 将 _start 开始的虚拟地址, _len 个字节, 解除映射

找到用户的 mem_set, 找到 _start 开头的 map_area, 将 _start + _len 作为新的开头, 对之前的部分调用 unmap
- 这将会自动释放物理页框, 自动修改页表.

ch5: 进程管理

和 ch3 所设计的分时管理系统类似, 只是更为细致, 更多数据结构.

阅读即可, 思考部分不多, 难点都已经帮忙实现好了.

实现: spawn

TaskControlBlock::new(elf_data)

根据 elf_data 建立 mem_set
- 新建一个空白 mem_set
- 设置跳板
- 解析elf_data
- 遍历所有Load类型的段, 新建对应mem_area
- 将mem_area推入mem_set, 此时会申请对应页框, 并写入数据
- 为用户栈新建一个mem_area, 推入mem_set
- 在用户栈上方, 新建一个mem_area, 大小为0, (用于sbrk? 啥)
- 为trap上下文, 新建一个mem_area, 占地一页
- 返回mem_set, 用户栈顶, 入口点
拿到 trap 上下文的物理页号
申请一个pid, 和一个内核栈
新建一个tcb
- 填入刚刚申请的pid和内核栈
- 填入trap上下文物理页号
- 基础大小: 用户栈顶
- 任务上下文: goto_trap_return: ra(trap_return), sp(内核栈), s0~11
- 状态: ready
- mem_set
- 父亲: none
- 孩子: vec::new
- 退出码: 0
- 堆底: 用户栈顶
- brk: 用户栈顶
- sys_call_times, first_run_time
修改新的tcb的trap上下文:
- 入口点
- 用户sp
- 内核页表token
- 内核栈顶
- trap_handler
返回tcb

如果不用fork, exec来新建进程:

建立tcb: TaskControlBlock::new(elf_data), 这将会自动建立用户空间
还需要对tcb修改
- 设置其父亲为当前进程(也要修改当前进程的孩子数组)
加入准备队列: add_task

实现: stride 调度

算法描述如下:

为每个进程设置一个当前 stride, 表示已经运行的“长度”, 以及对应的pass值, 表示调度后 stride 需要进行的累加值
每次调度时, 选择 stride 最小的调度, 将对应的 stride 加上其对应的步长 pass
一个时间片后，回到上一步骤

可以证明:

如果令 P.pass = BigStride / P.priority, 则该调度方案为每个进程分配的时间将与其优先级成正比
其中 P.priority 表示进程的优先权(大于1)，而 BigStride 表示一个预先定义的大常数,

其他实验细节：

stride 调度要求进程优先级 >= 2, 所以设定进程优先级 <= 1 会导致错误
进程初始 stride 设置为 0 即可
进程初始优先级设置为 16

实现 tips:

为了实现该调度算法，内核还要增加 set_prio 系统调用
你可以在 TCB 加入新的字段来支持优先级等。
为了减少整数除的误差 BIG_STRIDE 一般需要很大, 但可能溢出, 或许选择一个适中的数即可, 当然能进行溢出处理就更好了
如何找到 stride 最小的进程: 优先级队列是不错的办法, 但是我们的实验测例很简单, 很推荐使用暴力
注意设置进程的初始优先级。

stride溢出

考虑进程A和B, 优先级为9和90, BIG_STRIDE = 900, 所以步长为100和10, 假设数字范围0~999.
A运行1次, B运行10次
某次调度: 当A和B都是900时, A先运行, A变成 900+100 = 0
下次调度: 0 < 900, 所以仍是 A 运行, 不合理

解决思路

已知: 最大的和最小的stride之差, 不会大于最大的pass, 证明如下
- 初始所有stride均为零, 假设最大pass先行动, 此时之差恰为最大的pass, 符合
- 接下来她永远无法行动, 直到成为最小的stride, 情况还不如初始情况, 初始好歹是同一起跑线, 证毕
而因为prio >= 2, 且pass = BIG_STRIDE / prio, 所以最大的和最小的stride之差, 不会大于BIG_STRIDE / 2
因此哪怕溢出也能比较大小
- 考虑: 数字范围 0~999, 那我们令BIG_STRIDE = 900, 那么A和B, 优先级为9和90, 步长为100和10
- 同样运行到900, A先动, A变成0
- 此时, B - A = 900 > 最大的pass, -> 发生溢出, 实际上是 A > B
- B会连续运行, 直到B=990, 再次运行, 变成0, 之后回到最开始

考虑真实情况

进程A,B, 优先级为 100 和 16, BIG_STRIDE = 65535, 所以步长为655和4095
A运行 100 次到 65500, B运行 16 次到 65520.
此时到B, B变成 4079
进行 A - B = 61471 > 最大步长 4095, 说明溢出, 所以 A < B
B - A = 4065 <= 最大步长 4095, 说明没问题, 所以 B > A
无论如何都是 A 运行, A变成 669, 显然 A < B, 而且不需要思考溢出问题, ok

解决算法

已知: 最大的和最小的stride之差, 不会大于最大的pass
所以进行判断, 对于 A - B, 如果结果
- 大于max_pass: A < B
- 其他: A >= B

多进程情况

数组V, stride 各不相同
遍历 V, 得到最大步长 P
假设 min_stride = V[0] , for i in V:
- 若 i.stride - min_stride <= 最大步长: i 大, 不操作
- 若 i.stride == min_stride: 步长一样, 判断优先级高者(数值大), 成为新的 min_stride
- 其他情况: i 小, i 成为新的 min

2023开源操作系统训练营第二阶段总结报告-lighkLife

Posted on 2023-11-04 Edited on 2025-12-26 In report

整体收获

学下到软件是如何与硬件进行交互的
学习到 RISC-V 的基础知识, 包括特权等级、汇编指令、特殊寄存器等
了解了操作系统对内存地址空间的管理方式
能够自己实现简单的进程调度算法，并真正的进行进程调度
回顾了操作系统对磁盘等块设备的交互方式，并基本掌握了 easy-fs 的实现思路
能够更加熟练的使用 rust 进行编程

学习过程的资料那里来？

实验指导书是最好的学习资料，其次就是 RISC 的官方网站提供的文档资料

如何阅读实验代码

根据实验指导书，向自己画出整个操作系统的结构图，各个模块的组合结构，和交互流程，结合实验指导书，
实验代码中的代码命名和注释，来整体向理解代码结构与组合逻辑。遇到不明白的方法或代码块，可以先跳过，
阅读此段代码的程序上下文，来大胆假设代码块的作用，如还是猜测不到其作用，找到这段代码在整体架构中的位置，
根据逻辑推理，进行猜测，还可以打印日志，追踪程序执行过程等方式来验证；

如何实现 lab

一定现先认真读懂题目要求，理清需求，再动手实现
根据题目定位自己的实现在整个操作系统的结构图的位置，属于哪个模块, 然后推测自己的实现可能需要与其他那些模块交互
大胆为已经存在的 struct、trait 的新建方法与变量
“大方”的打印日志（不用白不用），使用日志可以很好的辅助自己进行问题的调试与解决

1000oaks的rCore前二阶段小结

Posted on 2023-11-04 Edited on 2025-12-26

1000oaks的rCore前二阶段小结

写小结一刻, 却不知写些什么.

这已经是我第二次报名了rCore训练营了. 第一次报名于2022年夏季, 然而那个暑假我去研究托福的备考了, 所以第一次报名之后什么也没有做(虽然托福倒是速成成功, 但是这导致我下学期没有修读校内开设的操作系统研讨课). 要不是D同学督促我, 怕不是第二次报名也只停留于一阶段了.
过分杞人忧天, 不如在rCore上静心研究.

2023秋冬OS训练营第二阶段总结-watchpoints

Posted on 2023-11-04 Edited on 2025-12-26 In report

写在前面

作为上班族，每天下班很晚了，本来没有多余时间，并且之前没有接触过Rust

看到从零开始用 Rust 语言写一个基于 RISC-V 架构的类 Unix 内核这样标题

直接打退堂鼓。

转你一想这就是自己本来期望形式，参与开源方向，操作系统作为软件工程师基本功，不管结果如何必须参与。

一阶段总结

选择看什么资料，根据看c++经验，一定选择英文原版代替看中文翻译，很多翻译遗漏很多信息。我直接选择 rustlings-100exercises README.md
因为时间有限，没有采取全部看完book，然后做题，

采取看一章节，做题顺序

https://github.com/LearningOS/rustlings-100exercises-template/blob/main/exercises/README.md

rustlings 设计很合理提供 README和章节练习。为我节省大量时间
选择在线开发环境

群里分享了：rustlings流程web版.pdf 然后5分钟搭建好了环境，更适合上班环境和家里环境随时切换。
遇到不懂怎么办？

学习Rust出现新名词：借用让你莫不这头脑，我没有从概念理解这些概念，

并按照文字提示翻译

用c++设计进行类比：常量指针，指针常量，类深度拷贝移动构造，move语义

拷贝构造，还有STL

小结：

为了节省时间，我采用云环境（5分钟搭建完成）

做题顺序按照README.md 推荐方式 README对我帮助很大

二阶段总结

ch1 & ch2

存在问题：

一个hello，world 例子是怎么运行的,代码从编译到产生可执行程序，然后加载到内存，程序入口是哪里尤其是linker.ld entry.asm这2个文件。

尤其汇报指令。需要加强。之前看程序自我修养，

还有csapp 感觉看懂到，现在看来根本不懂，用了不少时间。

尤其看到别人满分了，担心着急，我还没真正投入开始呢。

解决方式：

为了方便反复运行程序我搭建vmare+本地环境。

rcore提供框架，让这些知识变成例子，

最后不依赖系统库运行在起来。这个演示例子非常好。

小结：hello，world 例子

项目中每个模块都个mod.rs文件，这一般是模块提供对提供功能。
程序入口地址

chapter3 练习

题目要求：

ch3 中，我们的系统已经能够支持多个任务分时轮流运行，我们希望引入一个新的系统调用 sys_task_info 以获取当前任务的信息，定义如下：

1	fn sys_task_info(ti: *mut TaskInfo) -> isize

思路

从单元测试 ch3_taskinfo.rs 了解到，直接创建了task，该task 可能执行很多系统调用系统调用最终都是通过 sys_call 进行，在该函数增加 add_syscall_count。
数据结构：TaskManagerInner 记录了正在运行的任务 current_task 和任务列表tasks，全局变量只有一个。
main.rs 函数启动时候加载任务并且运行第一任务

loader::load_apps();

task::run_first_task();

小结：系统调用

ch1 和ch2 是ch3 基础，下面这段代码需要后面花费更多时间学习

pub fn rust_main() -> ! {
    clear_bss();
    kernel_log_info();
    heap_alloc::init_heap();
    trap::init();
    loader::load_apps();
    trap::enable_timer_interrupt();
    timer::set_next_trigger();
    task::run_first_task();
    panic!("Unreachable in rust_main!");
}

chapter4练习

实验要求

重写 sys_get_time 和 sys_task_info

引入虚存机制后，原来内核的 sys_get_time 和 sys_task_info 函数实现就无效了。请你重写这个函数，恢复其正常功能。

mmap 和 munmap 匿名映射

mmap 在 Linux 中主要用于在内存中映射文件，本次实验简化它的功能，仅用于申请内存。

请实现 mmap 和 munmap 系统调用，mmap 定义如下：

思路：地址空间

为什么重写 sys_get_time 和 sys_task_info ？这从地址空间说起，原文：

内核如何访问应用的数据？

应用应该不能直接访问内核的数据，但内核可以访问应用的数据，这是如何做的？由于内核要管理应用，所以它负责构建自身和其他应用的多级页表。如果内核获得了一个应用数据的虚地址，内核就可以通过查询应用的页表来把应用的虚地址转换为物理地址，内核直接访问这个地址

1
2
3

 let info = TaskInfo::new();  //info 这用户空间地址
 assert_eq!(0, task_info(&info));//经过系统调用后，用户空间地址
//传递到内核空间，用户空间虚拟地址 对内核来说无法直接使用，需要转化

疑惑地方：我看懂这个数据结构页表项 (PTE, Page Table Entry) 是一个整数）

里面包含了一个物理页号 + 标志位

/// 一个物理页号 PhysPageNum 和一个页表项标志位 PTEFlags 生成一个页表项 
    pub fn new(ppn: PhysPageNum, flags: PTEFlags) -> Self {
        PageTableEntry {
            bits: ppn.0 << 10 | flags.bits as usize,
            // 最低的 8 位 [7:0] 则是标志位。
            //其中 [53:10] 这 44 位是物理页号
            // SV39 分页模式下的页表项，其中 这 位是物理页号，最低的 位 则是标志位
        }
    }

虚拟页号同样也是整数，虚拟页号和物理页号对应起来？

经过群里讨论和看资料，初步理解虚拟页号当作索引，页表项是数组内容建立关系，这句话初步帮助理解。不代表真实现。

另外一个结构：PageTable

a 通过虚拟页号找到页表项(里面又物理页号)

/// Find PageTableEntry by VirtPageNum
/// 通过虚拟页号找到页表项(里面又物理页号)
fn find_pte(&self, vpn: VirtPageNum) -> Option<&mut PageTableEntry> 
let idxs = vpn.indexes();
https://rcore-os.cn/rCore-Tutorial-Book-v3/chapter4/4sv39-implementation-2.html
VirtPageNum 的 indexes 可以取出虚拟页号的三级页索引，并按照从高到低的顺序返回

b 函数：translated_byte_buffer 为参考例子实现了

实现来了从虚拟地址转化成物理地址

3 map 和 unmap 虚拟地址是一个连续内存，其中一个虚拟地址转化成物理地址，

多个虚拟地址转转化思路很清楚了，具体实现：MemorySet 新增map_range函数

这里对map封装

pub fn map(&mut self, page_table: &mut PageTable) {
        for vpn in self.vpn_range {
            self.map_one(page_table, vpn);
        }
    }

小结

最后通过下面函数封装完成ch4。

PageTable find_pte
MemorySet map_one unmap_one

不然无法实现，里面细节不少。

chapter5 练习

实现分支：ch5-lab

实验目录要求不变

通过所有测例

思路

为什么重新实现 sys_task_info sys_mmap函数？

引入处理器管理结构 Processor 负责从任务管理器 TaskManager 中分出去的维护 CPU 状态的职责

这里注意语法细节

///Get current task in moving semanteme
 pub fn take_current(&mut self) -> Option<Arc<TaskControlBlock>> {
        self.current.take()
 }
///Get current task in cloning semanteme
 pub fn current(&self) -> Option<Arc<TaskControlBlock>> {
        self.current.as_ref().map(Arc::clone)
}

sys_spawn

1
2
3

//功能：新建子进程，使其执行目标程序。
// "ch5b_user_shell\0"
pub fn sys_spawn(_path: *const u8) -> isize

细节：参考初始进程initproc的创建【里面有很多知识点】

1 2	TaskControlBlock::new(get_app_data_by_name("initproc").unwrap()) https://rcore-os.cn/rCore-Tutorial-Book-v3/chapter5/3implement-process-mechanism.html

细节：参考 fn sys_exec(path: *const u8) 对_path处理需要地址转化。
细节：父子进程关系设定。 parent: Option<Weak>

weak指针类型

进程优先级

每次需要调度时，从当前 runnable 态的进程中选择 stride 最小的进程调度

改写fetch函数，修改当前任务的stride 使用take 还是as_ref。

小总:进程

这一章节完全是Rust语法细节引用，借用，weak智能指针（避免循环引用）
例如 “ch5b_user_shell\0” 后面执行过程不很清楚，我更加深入学习load实现。

未完待续

2023开源操作系统训练营一二阶段总结

Posted on 2023-11-04 Edited on 2025-12-26 In report

感谢老师和主教们提供的精彩课程，让我作为一个已经工作的工程师，在业余时间也能够深刻学习操作系统这门课程。课程内容丰富，技术前沿，把RUST， RISCV 和OS结合在一起，并且提供了完整的实验。经过学习我对操作系统有了很清楚的认识，虽然目前才做完lab3，但是后续会接着把两个实验也给完成。

Ywinh's Blog

Posted on 2023-11-04 Edited on 2025-12-26

实验总结

lab1

目的就是实现三个信息的统计

status: TaskStatus

按照提示直接设置为running

[syscall_times: [u32; MAX_SYSCALL_NUM]

第一次尝试直接在sys_task_info来加载，发现好像不行，因为不知道传入的ti: *mut TaskInfo，这个参数到底在哪里被初始化的，而且每个任务都需要有一个syscall_times数组
由此我在TaskControBlock中维护一个pub task_syscall_times: [u32; MAX_SYSCALL_NUM]数组，这样通过全局遍历TASK_MANAGER可以很好的在每次系统调用时更新
更新位置在trap_handler进入syscall之前，读取x17寄存器为syscall id

time: usize

需要得到的是从第一次运行到现在的时间，现在的时间可以通过get_time_ms直接获得
第一次运行开始的时间，需要在应用第一次变成Running态的时候记载，因此我们为每个
1
TaskControBlock
中维护
- pub task_start: usize, 记录任务第一次开始的时间
- pub task_flag: bool, 标志是否为第一次，如果是就是false，然后我们更新task_start，并且将该变量置为false，保证只记录一次start time

lab2

直接<<12直接这样会报错overflow，但是那个函数确实就是干了这个事情，只是我帮他弄了一把，很奇怪，还是最后用函数了

taskInfo报错，按照群里大佬这样修改，但不知道为什么这样修改

//原
pub fn get_time_us() -> usize {
    time::read() / (CLOCK_FREQ / MICRO_PER_SEC)
}
//修改为
pub fn get_time_us() -> usize {
    time::read() * MICRO_PER_SEC / CLOCK_FREQ
}

疑问

vpn_end计算有问题，len需要/8吗：不需要，因为VA就是取最低39位，不会左移右移啥的
上取整，如果已经对齐的情况下还会上取整吗：回答，不会的

bug与问题

对于判断是否mapped过，只考虑了find_pte不能为None，没有考虑find_pte存在，但是pte.is_valid()不合法这件事，卡了很久，也不好调试
MapPermission不好进行零初始化，那么就用match，但是match要解决穷尽匹配，我们先把不合法的删去，然后最后一个_只代表6的情况
对题意理解有问题，在mmap中，我以为如果start和end之间有已经被映射的页，我们还是需要分配len这么长，也就是不error，映射一段不连续的虚拟内存，写了比较复杂，后面才知道直接error
这章很难debug，看样子甚至是多线程跑测试，所以花费很多时间

lab3

继承上一章修改

今天上下午一直在移植代码，尝试了git cherry-pick试了很久，重置过去重置过来，问了gpt，看了b站，csdn都无果，就是没有合并，只显示reports文件夹有冲突，主要的os没有，遂还是采用git diff打patch的笨方法，冲突太多了，合并了小一个小时。

修理waitpid

移植好之后，make run确实能跑了，但是随便输一个就报错，说waitpid清除僵尸进程的引用计数有错，本来应该是1，结果是2，多了一个，debug找不出来，println也没看出来在哪里。仔细想想，找了跟Arc有关的所有代码，可以肯定一件事，模板代码一定没问题，那问题就出在我自己移植过来的代码，最后一个个注释排除法，找到了原来是我自己用了一个Arc没有drop，我以为drop了inner的RefMut就可以了，没想到这个也要drop。为啥这个不会自动drop呢？

目前还有usertest卡住的问题，再看看。

spawn

通过注释发现卡住的原因是spawn的实现有问题，重点在维护父子关系，注意drop的位置

spawn就是新建一个进程而已，不要想着用fork+exec，之前直接调用fork()和exec()会出问题，也不好调试，于是自己仿照fork内容与exec自己实现

stride

stride感觉倒是很简单，根据提示BIG_STRIDE需要大一点，于是把BIG_STRIDE设置为了0x100000，然后每次调度的时候，都要fetch_task，于是在这里找出最小的stride返回，pass的维护在set_piro里面实现，因为prio只会在这里修改

lab4

这章我真的心累了，调试了两天，目前还是有一个神奇的bug，我觉得不是我代码的问题

在ch6_file2里面：我做了如下修改，//后的就是新加入的

   let test_str = "Hello, world!";
   let fname = "fname2\0";
   let (lname0, lname1, lname2) = ("linkname0\0", "linkname1\0", "linkname2\0");
   let fd = open(fname, OpenFlags::CREATE | OpenFlags::WRONLY) as usize;
//
   let fd1 = open(lname0, OpenFlags::CREATE | OpenFlags::WRONLY) as usize;
//
   println!("ok1");
   //此处传入的lname0是0x0，为什么
   link(fname, lname0);
//
   println!("ok2");
...

发现在 link(fname, lname0); //此处传入的lname0是0x0，为什么，看运行结果(在open系统调用和link加入了println!打印传入str的地址)，部分结果如下

open:path  is 0x42cd
open:path  is 0x42d4
ok1
link:old name addr is 0x42cd
link:new name addr is0x0
old_name is6 ,new_name is45 
[kernel] Panicked at /root/2023a-rcore-Ywinh/easy-fs/src/layout.rs:419 range end index 45 out of range for slice of length 28

可以看到lname对应的new name在open里面的地址是0x42d4,但是在link里面是0x0，就是这个bug让我以为我的link出错了，改了一整天，后面copy别人的代码也不行，真的心累了。。请教了群里的一位大佬，还没回我，希望能解决…

自己对于rust的理解还是不够，还是要在实践中多用，但很感谢能通过这个机会锻炼自己~~

2023开源操作系统训练营第二阶段总结报告-ToniXWD

Posted on 2023-11-04 Edited on 2025-12-26

1 整体总结

在完成Rustlings后，终于能亲自上手把玩操作系统了。rCore的每一个branch实际上可以看做是对一个初具框架项目的不断更新和迭代。ch1是在裸机上部署一个hello world, ch2是引入了特权级, ch3实现分时多任务系统, ch4引入了虚拟内存和页表, ch5引入了进程的概念并提供了相关系统调用和调度算法支持, ch6添加了简易文件系统, ch7添加了管道这一古老的ipc方法, ch8引入了线程的概念并加入了与线程同步相关的资源:锁, 信号量和条件变量。

这样的渐进式布置, 有助于理解操作系统设计的思路，对于我个人而言，前2章将用户程序链接到内核反而是最困难的，也是平时学习中不容易注意到的知识点。

lab的难度整体上不算太高, 但需要注意细节, 另外兼容前一个章节的代码确实会带来一些压力, 比如lab5时, 我卡住了很久, 最后才发现需要重新实现sys_get_time, 希望老师们能在以后的课程中考虑到这个问题

2 lab 通关记录

2.1 ch0-环境配置

按照指导书进行环境配置对于基础的代码运行是没有问题，但我发现自己按照指导书操作后无法进行gdb调试, 经过总结后在此处给出我的2种解决方案:

方案1: 安装完整的 `riscv-gnu-toolchain`

安装完整的riscv-gnu-toolchain流程如下, 次方法费时较长, 且占据空间较大, 更推荐第二种方法。

安装依赖

1	$ sudo apt-get install autoconf automake autotools-dev curl libmpc-dev libmpfr-dev libgmp-dev gawk build-essential bison flex texinfo gperf libtool patchutils bc zlib1g-dev libexpat-dev

克隆riscv-gnu-toolchain

1	$ git clone --recursive https://github.com/riscv/riscv-gnu-toolchain

编译安装

1
2
3

$ cd riscv-gnu-toolchain
$ ./configure --prefix=/usr/local
$ sudo make

方案2: 编译安装 `riscv64-unknown-elf-gdb`

安装依赖

1	$ sudo apt-get install libncurses5-dev python2 python2-dev texinfo libreadline-dev

下载gdb源码
此处我选择gdb-13.1, 该版本在wsl2 Ubuntu22.04上使用正常。

# 推荐清华源下载
wget https://mirrors.tuna.tsinghua.edu.cn/gnu/gdb/gdb-13.1.tar.xz
# 解压
tar -xvf gdb-13.1.tar.x

编译安装
只需要指定编译安装riscv64-unknown-elf并配置相关参数。

$ cd gdb-13.1
$ mkdir build && cd build
$ ../configure --prefix=/your_path --target=riscv64-unknown-elf --enable-tui=yes
$ make -j$(nproc)
$ sudo make install

2.2 ch3-lab1

本次作业需要实现sys_task_info这一系统调用以统计task信息。

总体思路

在task.rs中的TaskControlBlock结构体增加了sys_call_times数组, 用于记录当前task中各个系统调用的次数, 以及sys_call_begin,记录任务创建的起始时间

pub struct TaskControlBlockInner {
    ...
    /// syscall time count
    pub sys_call_times: [u32; MAX_SYSCALL_NUM],
    /// begen time
    pub sys_call_begin: usize,
    ...
}

每次执行系统调用时, 将全局变量TASK_MANAGER中当前任务current_task对应的TaskControlBlock结构体的系统调用记录自增
如果调度任务时发现sys_call_begin = 0, 说明这个task是第一次被调用, 需要将sys_call_begin设置为当前时间
为TaskManager实现get_sys_call_times方法, 获取当前任务current_task对应的TaskControlBlock结构体的系统调用数组的拷贝
完成process.rs的sys_task_info, 调用get_sys_call_times和get_time_ms获取TaskInfo结构体的syscall_times和time部分, status部分设为Running

2.3 ch4-lab2

2.3.1 重新实现 `sys_get_time` 和 `sys_task_info`

相比于之前的实现, 唯一的变化就是系统调用函数中传递的指针不能直接使用, 因为内核页表与用户页表是不同的。

思路

通过软件的实现来转换地址

> 参考`translated_byte_buffer`实现`translated_struct_ptr`
`translated_byte_buffer`将一个指向`u8`数组的指针按照指定的页表获取其物理地址, 我们不需要获取数组的长度, 只需要通过指定的泛型告知`PhysAddr`的`get_mut`方法需要转化的类型即可。

2.3.2 `mmap` 和 `munmap` 匿名映射

本项目中, 这两个系统调用仅用于申请内存。在实际上, mmap 系统调用是用来将一个文件或者其他对象映射进调用进程的地址空间的。它通常映射到进程的用户空间，使得进程能够像访问普通内存一样访问文件的内容, 减少IO次数。

`mmap` 实现思路：

选择一个地址空间进行映射, 由前文介绍可知, 需要映射到当前task的内存地址空间
可以用TaskManagerInner的current_task找到当前的task序号, 再在tasks中找到对应的memory_set
在找到的memory_set上申请内存
需要注意的是, 分配内存页需要调用frame_alloc, 为了内存页的自动回收, 还需要将其加入一个集合类型中, 这里我为MemorySet新增了成员map_tree: BTreeMap<VirtPageNum, FrameTracker>用以接受mmap新分配的FrameTracker:
1
2
3
4
5
pub struct MemorySet {
page_table: PageTable,
areas: Vec<MapArea>,
map_tree: BTreeMap<VirtPageNum, FrameTracker>,
}

`munmap` 实现思路

思路和mmap类似

调用page_table的unmap方法删除映射
调用map_tree的remove方法移除FrameTracker使其能被FRAME_ALLOCATOR回收

易错点

需要通过PageTableEntry的is_valid方法判断转换后页表项的有效性
mmap使要判断地址是否对齐
判断权限

2.4 ch5-lab3

2.4.1 实现`sys_spawn`系统调用

sys_spawn系统调用从效果上就是fork+exec, 区别在于既然马上要exec, 就没有必要负责父进程的地址空间了, 毕竟马上就要被覆盖掉, 因此, 思路如下:

和exec一样, 将地址通过task处获取的页表进行转化得到有效的字符串
调用get_app_data_by_name直接获取文件的u8数组表示的elf数据
将得到的elf数据传入TaskControlBlock::new获取一个新的任务控制块
设置新的任务控制块和当前任务控制块的父子关系
将心的task加入任务列表
2.4.2 实现stride 调度算法
stride本质上就是综合了任务优先级程序后的任务运行时间的反映, 每次选择stride值最低的任务运行,一定程度上实现了公平的调度。
实现思路
在config.rs中添加常量BigStride

在TaskControlBlockInner中新增如下成员:

pub struct TaskControlBlockInner {
    ...
    /// 当前 stride
    pub cur_stride: usize,
    /// 优先级等级
    pub pro_lev: usize,
    ...
}

每次切换任务时, 选择stride值最低的任务运行
阅读代码可知, run_tasks方法每次都是调用TaskManager::fetch方法来获取下一个运行任务, 因此只需要修改fetch方法来实现我们的调度算法。
由于TaskManager使用ready_queue: VecDeque<Arc<TaskControlBlock>>来存放TaskControlBlock, 每次调用fetch时，对ready_queue按照stride进行排序, 然后pop_front即可
更新锁选择任务的其stride
使其cur_stride变量自增BIG_STRIDE / var.pro_lev即可

2.5 ch6-lab4

2.5.1 硬链接简介

实现硬链接的系统调用: linkat和unlinkat
硬链接: 本质上就是不同的目录项指向了同一个innode, 因此实现linkat和unlinkat的流程如下:

linkat

查找要指定的目录项, 失败返回, 找到则返回其指向的innode号
在目录下新创建一个目录项, 指向这个innode号
将指向的innode的引用计数自增1

unlinkat

查找要指定的目录项, 失败返回, 找到则返回其指向的innode号
在目录下删除找到的目录项
将指向的innode的引用计数自减1
如果指向的innode的引用计数变成0, 将其以及指向的数据块释放

2.5.2 实现思路

可以看到, 尽管思路清晰, 但实际的视线还是较为繁琐, 主要体现在各个数据块的查找, 判断其有效性等, 以下是具体的视线思路

linkat

修改DiskInode结构体, 添加引用计数成员refcont
1
2
3
4
5
6
pub struct DiskInode {
...
pub direct: [u32; INODE_DIRECT_COUNT],
pub refcont: u32, // 新增这个变量后需要将 INODE_DIRECT_COUNT - 1
...
}
需要注意的是, DiskInode需要匹配其在block中的大小, 因此我们添加了一个变量refcont, 需要将将 INODE_DIRECT_COUNT - 1以保证其在block中的大小不变
通过translated_str获取实际的_old_name和_new_name
在ROOT_INODE中调用read_disk_inode查询old_name的inode序号inode_id
调用在ROOT_INODE中调用modify_disk_inode写入新的目录项
需要注意计算新的size并调用increase_size分盘空间
通过inode_id调用get_disk_inode_pos得到具体的inode位置, 将其引用计数自增
调用block_cache_sync_all同步更新

unlinkat

通过translated_str获取实际的_name和
在ROOT_INODE中调用read_disk_inode查询_name的inode序号inode_id, 注意需要判断其是否存在
调用在ROOT_INODE中调用modify_disk_inode删除找到的目录项
注意此处的删除, 我的实现思路是
- 找到改目录项在根目录中的序号
- 如果这个序号是最后一位, 只需要将size自减
- 否则需要将最后一个目录项移动到这个位置进行覆盖, 然后再将size自减
通过inode_id调用get_disk_inode_pos得到具体的inode位置, 将其引用计数自减
如果硬链接对应的innode引用计数达到了0, 需要释放其空间
调用clear_size获取其的每一个数据block, 并调用EasyFileSystem::dealloc_data进行清理

2.6 ch8-lab5

2.6.1 死锁检测算法进一步介绍

此处对任务书中的算法进行进一步补充

Available[m]: 其下标对应的资源是最具体的资源, 比如具体是哪一把锁, 哪一个信号量
可知, 进程是最基础的资源管理单位, 因此这一统计资源应该放在ProcessControlBlockInner中
Allocation[n][m]: 每个具体资源已分配给每个线程的资源数, 具体而言就是lock了但还没unlock时需要记录资源的使用数量
这个资源仍然可通过ProcessControlBlockInner来管理, 但是这样的话每个线程创建和操作相应资源时, 还需要在访问一次进程控制块, 因此可以将其托管给线程控制块TaskControlBlockInner
Need[n][m]: 表示每个线程还需要的各类资源数量, 具体而言, 在lock前需要先登记需求, 将对应的资源自增, 在lock后则需要撤销这次登记
同Allocation[n][m]类似, 托管给线程控制块TaskControlBlockInner管理是更容易的实现
2.6.2 实现思路

修改ProcessControlBlockInner结构体, 添加Available[m]

pub struct ProcessControlBlockInner {
    ...
    /// mutex的Available[m]
    pub m_available: Vec<usize>,
    /// 信号量的Available[m]
    pub s_available: Vec<usize>,
    /// 是否使用死锁检测
    pub use_dead_lock: bool,
}

注意这里我使用2个Available[m]变量s_available和m_available, 分别控制信号量和锁

修改TaskControlBlockInner结构体, 添加Allocation[m]和Need[m]

pub struct TaskControlBlockInner {
    /// mutex的Allocation[m]
    pub m_allocation: Vec<usize>,
    /// 信号量的Allocation[m]
    pub s_allocation: Vec<usize>,
    /// mutex的Need[m]
    pub m_need: Vec<usize>,
    /// 信号量的Need[m]
    pub s_need: Vec<usize>,
}

由于是将其托管到TaskControlBlockInner管理, 因此Allocation[m]和Need[m]退化为了一维数组, 同时将信号量和锁分开管理

修改创建sys_mutex_create和sys_semaphore_create
拿到对应资源的序号id后, 需要更新m_available和s_available, 注意的是m_available只需要自增1, 而s_available需要自增信号量分配的具体值
修改sys_mutex_lock和sys_semaphore_down
- 这2个方法是申请对资源的使用, 因此在使用前需要进行登记: 将s_need或m_need进行自增
- 按照任务书中的算法进行死锁检测, 此处不详细说明代码实现
- 死锁检测通过后, 将s_need或m_need进行自减以撤销登记, 同时将m_available或s_available自减以标识资源被占用, 将m_allocation或s_allocation自增以标识自身对资源的占用
修改sys_mutex_unlock和sys_semaphore_up
- 这2个方法是归还资源, 相对简单, 只需要s_available或m_available自增以归还资源, 将m_allocation或s_allocation自减以标识自身对资源的释放

2.6.3 易错点

每次对m_available统计资源进行访问时, 要同步更新所有TaskControlBlockInner中的m_allocation和m_need的数组长度以防止后续数组访问越界, 访问s_available时同理
通过inner_exclusive_access方法获取process_inner或task_inner时, 要注意此前是否已经获取过相应资源, 尤其是在多层函数调用时, 需要手动drop掉以上变量
测试依赖sys_get_time,一定要实现sys_get_time!!!

2023开源操作系统训练营一二阶段总结报告-代永宣.md

Posted on 2023-11-04 Edited on 2025-12-26

学习报告

经历了一个月的学习，2023开源操作系统训练营的一二阶段算是接近尾声。对于进度，十分惭愧只完全完成了一阶段100道rustlings习题，以及二阶段的前五章，对应前三个实验。这已经是我第三次接触这一开源项目。第一次接触此项目是在2022年秋，当时我正好学习操作系统及其研讨课的课内内容。当时并没有报名该项目，而是作为课内的补充学习。不过由于该学期的事情太多，所以并没有深入探究。第二次接触该项目就是2023年夏，这个夏天我正好参加另一个开源项目，该项目使用rust编程语言进行编写，并且我报名参加了我们学校操作系统助教，为了加深对于操作系统概念的理解，并且学习rust，当时只是简单看了该项目，并没有深入理解。十分幸运的是，今年秋，此项目再次启动，因此我决定将此项目完成。并且本人对于虚拟化比较感兴趣，十分想参加后续的项目实习。

2023开源操作系统训练营第二阶段总结报告-tianpingan.md

Posted on 2023-11-04 Edited on 2025-12-26

2023rCore 训练营第二阶段总结

参加本次rcore训练营的原因是希望找人和我一起写课程来督促我成长，因为本人做事很容易烂尾。

之前做过类似的操作系统lab，并且也用过rust，所以前三个实验还是比较顺利完成了，这次报名也是希望能进一步参与后面的项目。

下面简单总结一下在第二阶段我完成的各个实验情况。

ch3

rcore 的前几个实验难度不是很大，读懂代码结构，按照需求去实现就行了。

本次实验在要实现一个当前任务信息查询调用。

而这个系统调用sys_task_info调用的实现建立在对TaskManager的修改的基础上。

我们只需要在TaskManagerInner中的TaskControlBlock里添加syscall_times来统计该任务的各个系统调用次数的统计，并在系统调用时，以及任务切换时进行相应数据的修改就行了。

ch4

本次实验是在有了分页机制的前提下，重写了ch3中的sys_write和sys_task_info。

由于我们引入了虚拟存储机制，所以要把数据写到任务地址空间需要根据我们的页表得到其实际物理地址再写入。mmp与munmap都已在memroy_set中帮我们实现，我们只需要简单封装一下即可，同时我们要注意访问权限的管理。

ch5

本次实验任务简单，spawn一个新任务就是创建一个空白子进程然后加载对应程序即可，

总结

通过这个阶段的学习，我巩固和掌握了很多操作系统的知识，并且在实践中得到了很大的收益。

实验的逐步进行让我能够在已经写好的代码基础上增加对系统的理解并进行修改，从而使我的思维得到不断蜕变。此外，采用增加功能的实验方式让我感觉像在编写自己的操作系统，因此更加认真地学习，从中获取更多知识，并得到积极的反馈。

此外，第二阶段的实践使我的 Rust 编程技能得到了进一步提升。

前言

实验总结

lab1

lab2

lab3

lab4

lab5

后记

前言

Rust

ch0 配置环境

ch1: 应用程序与基本执行环境

rust-analyzer 报错

echo 的用法

QEMU 的使用

链接器脚本

ch2: Trap

用户库

链接脚本

risc-v 通用寄存器, CSR, ABI

lazy_static

riscv 汇编

如何启动第一个应用

ch3: 分时任务管理

任务切换的流程

RISC-V 架构中的嵌套中断: 不会发生

实验任务: 获取任务信息

任务介绍

实现思路

ch4: 分页

跳板

虚拟内存管理

物理页管理器

硬件MMU, 清空快表的指令

内核和应用的内存视图

虚拟地址到物理地址的映射

重写 sys_get_time 和 sys_task_info

实现简易的动态分配内存: mmap 和 munmap

ch5: 进程管理

实现: spawn

实现: stride 调度

整体收获

学习过程的资料那里来？

如何阅读实验代码

如何实现 lab

1000oaks的rCore前二阶段小结

写在前面

一阶段总结

小结：

二阶段总结

ch1 & ch2

小结 ：hello，world 例子

chapter3 练习

思路

小结：系统调用

chapter4练习

实验要求

重写 sys_get_time 和 sys_task_info

mmap 和 munmap 匿名映射

思路：地址空间

小结

chapter5 练习

思路

小总:进程

未完待续

实验总结

lab1

status: TaskStatus

[syscall_times: [u32; MAX_SYSCALL_NUM]

time: usize

lab2

疑问

bug与问题

lab3

继承上一章修改

修理waitpid

spawn

stride

lab4

1 整体总结

小结：hello，world 例子

方案1: 安装完整的 `riscv-gnu-toolchain`

方案2: 编译安装 `riscv64-unknown-elf-gdb`

2.3.1 重新实现 `sys_get_time` 和 `sys_task_info`

2.3.2 `mmap` 和 `munmap` 匿名映射

`mmap` 实现思路：

`munmap` 实现思路

2.4.1 实现`sys_spawn`系统调用

2.4.2 实现`stride` 调度算法