<王炼学习记录>

Posted on 2024-01-07 Edited on 2025-08-04

学习流程

第一天的接触就是修改CI/CD的错误，我的认知里面是写构建的yml文件，实际上是需要解决starry跑在x86的问题，第一天就大概看了starry的设计文档了解了它和arceos的承接关系和相关的模块图，于是在和杨金博同学沟通后对编译选项和copy.S的代码进行了x86的改造之后发现pci等还有问题，于是问题交到金博哥手里，这时候进行了unikernel的学习，石磊老师ppt讲解和训练营的录课大概看过之后对unikernel有了大概的认识，之后就边处理strace那边的数据边学习和做lab。

进展

目前在做第三周的实验的lab1，将c程序的镜像打包到文件系统实现了，目前对hello的报错进行修改，目前的思考是hello的命令行参数处理有问题，需要内核提供支持，目前定位到的代码如下

if let Some(app_inode) = open_file(path.as_str(), OpenFlags::WRONLY) {
        let all_data = app_inode.read_all();
        let process = current_process();
        let argc = args_vec.len();
        process.exec(all_data.as_slice(), args_vec);
        // return argc because cx.x[10] will be covered with it later
        println!("exec argc is {}", argc as isize);
        argc as isize
    } else {
        -1
    }

执行后可在shell中看到初始为0执行hello程序后为1但是此时的参数处理是输出了argc为0的错误输出，目前在继续看代码准备把后续都尽快跑通。

<2023秋冬季开源操作系统训练营总结报告-Shl>

Posted on 2024-01-07 Edited on 2025-08-04

#Unikernel 总结报告

经过若干天关于unikernel的学习，对于单一特权级的操作系统有了全新认识完成了练习1-5，练习分别为：支持彩色打印、支持HashMap、修改内存分配算法、增加一个axdtb的模块组件、修改fifo算法通过ex5测试应用

练习心得

练习了修改代码、不断检错纠错能力和熟悉了unikernel启动流程、单一特权级、单一应用、单一地址空间的操作系统的工作流程、练习一完成了axstd::println的修改、练习二；通过阅读标准库HashMap加以修改、连续三实现earlyallocator的内存分配方法、修改协作式调度为抢占式调度运行ex5程序、

##实验心得

实验一和二，将程序数据按照一定格式保存到app.bin文件中修改汇编指令，加载外部应用，实现app loader的外部应用加载器；实验三为公国ABI调用ArceOS功能，两个医用一个是nop、一个是wfi;实验四、实现sys_hello和sys_putchar、sys_terminate功能调用，通过std::process::exit退出ArceOS；实验五为改造应用hello_app，建立独立页表，把系统调用包装成函数，通过初始化和切换函数实现程序

2023秋冬季开源操作系统训练营第三阶段最终报告-刘逸珑

Posted on 2023-12-02 Edited on 2025-08-04 In oscamp 2023fall arceos unikernel

本次主要采用是通过类似于在GNU/LD链接器的方式来完成整个任务。主要的参照依据是csapp中有关链接的相关说明。
目前的实际完成进度在于完成了符号的解析。但是后面的重定包括段重定位以及符号的重定位，目前还没有完成。

目前操作上来说，对于后续任务影响最大的内容在于之前任务的不正确完成，包括但不限于之前任务中埋藏的坑，比如说文件不能正确识别，将 1B 认定成为一个16进制数而导致对于加载的文件中的align的错误判断，甚至还将用于解释rust内部结构体的自动align用于解释这里所出现的人为导致的align。

由于其他因素的影响，我在前半段时间其实没有过多的参与到其中来，近几天才加入到课题中。在参加课题之前其实对于libc，musl，甚至是elf文件没有什么过多的了解。简单的了解了下整个过程，本来看了下还想先直接用ld将对应的库链接好之后再放到arceos上读取（这是郝淼同学的实现思路），但是想到在 ld 将各种对象文件链接起来之后，实际上最后在使用的时候还是需要调用链接器 [–dynamic-linker可以指定对应链接器的地址] （当时实际上没想到可以直接实现链接器最后被调用的功能）。后面就按照实现一个链接器的想法继续实验。

目前主要使用 elf crates 实现了如下效果：

能够对于脚本中的符号进行重定位
目前对于重定位的操作实现尚未完成，根据要求，每一步实现实际上都需要遍历多次，更别提最原始的实现中由于对象文件的顺序引起的问题可能也需要往复遍历，正在尝试优化算法以及修改elf crates使之有着更好的体验。

未来工作可能没有特别大的必要开展，原因如下，在相同情况下，就算最终能够实现了一个能够在arceos上运行的链接器也是没有必要的。

现有的基于GNU/LD的链接器可以比较好的行使其职能，重复实现一个实际上没有必要实现的链接器会丢失原先所实现的优化，同时因为测试相对于前者而言更少，反而可能会导致更多错误，然而在这种实现的链接器面前，除非同时支持大量的编译工具，否则意义实际上不太大，只能算是个展示玩具。

/// BLUE PRINT
///
/// 1. LOAD APPLICATION
/// 2. SYMBOL RESOLUTION: make sure all symbol has been meet.
/// 3. RELOCATION:
/// [1] RELOCATION SECTION:
/// merges all sections of the same type into a new aggregate section of the same typecombine
/// BC we only need SHT_PROGBITS thus not care about others (copy).
/// [2] RELOCATE SYMBOL REFERENCES IN SECTIONS:
/// Modify references to each symbol in code and data sections so that they point to the correct run-time address

下面的伪代码实际完成了符号加载工作，重定向部分的代码还没有开始实际测试，就算未来有按照这个方法实现的必要，类似郝淼同学重新实现 elf crates 甚至在原先基础上进行修改的行为是必要的，现有的调用过程太长，使用起来不太舒服。

直接通过 shdr.e_type 实现对于符号的定位，根据CSAPP的说明，使用多个集合对于符号进行处理，实现符号匹配效果

match ehdr.e_type {
    ET_REL => { // 
        foreach symtabs {
            if sym.is_undefined() {
                // 加入 U 未定义符号组
            } else {|
                // 加入 D 已解析符号组 
            }
        }
        // 加入总管辖 elf 文件组 TODO 目前只实现了添加，并没有实现基于往复判断的剪枝
    },
    ET_DYN => {
        foreach symbol in U {
            if contains undefined symbols {
                // 从 U 未定义符号组删除本符号
                // 加入 D 已解析符号组
                // 加入总管辖 elf 文件组 TODO 目前只实现了添加，并没有实现基于往复判断的剪枝
            }
        }
    }

}

2023开源操作系统训练营第三阶段项目一总结报告-ybbybbybbybb

Posted on 2023-12-02 Edited on 2025-08-04 In oscamp 2023fall arceos unikernel

2023开源操作系统训练营第三阶段项目一总结报告

练习1,2:

该练习实现了一个 app 名为 loader 的外部应用加载器,然后实现了两个外部应用,熟悉了编译生成和封装二进制文件的流程.

该练习的重点在于头结构的构造与实现,我将应用的头结构大致分为三部分,第一部分为应用数量,第二部分为各应用长度,第三部分为应用数据.

大致实现如下

type BinNumType = u32;
const BIN_NUM_TYPE_BYTES: usize = 4;
type BinSizeType = u32;
const BIN_SIZE_TYPE_BYTES: usize = 4;
let apps_num = unsafe {
    (*(PLASH_START as *const BinNumType)).to_be()
};
let mut size_offset = PLASH_START + BIN_NUM_TYPE_BYTES;
let mut start_offset = size_offset + BIN_SIZE_TYPE_BYTES * apps_num as usize;
for i in 0 .. apps_num {
    let load_size = unsafe {
        (*(size_offset as *const BinSizeType)).to_be() as usize
    };
    let load_code = unsafe {
        core::slice::from_raw_parts(start_offset as *const u8, load_size)
    };
    println!("load code {:?}; address [{:?}]", load_code, load_code.as_ptr());
    let run_code = unsafe {
        core::slice::from_raw_parts_mut(RUN_START as *mut u8, load_size)
    };
    run_code.copy_from_slice(load_code);
    println!("run code {:?}; address [{:?}] size [{}]", run_code, run_code.as_ptr(), load_size);
    size_offset += BIN_SIZE_TYPE_BYTES;
    start_offset += load_size;
}

下面是构造image文件的大致代码

#!/bin/bash
# 获取当前目录下所有的 .bin 文件
apps=(hello_app.bin putd_app.bin)
# 计算应用数量
num_apps=${#apps[@]}
# 创建临时文件用于存储应用大小
size_file="temp_sizes.bin"
> "$size_file"
# 创建一个新的文件用于存储合并后的应用内容
content_file="temp_content.bin"
> "$content_file"
# 写入应用数量（4 字节）
printf "%08x" $num_apps | xxd -r -p > "$size_file"
# 循环遍历每个应用并写入其大小到临时文件
for app in "${apps[@]}"; do
    # 获取并写入当前应用大小（4 字节）
    app_size=$(stat -c%s "$app")
    printf "%08x" $app_size | xxd -r -p >> "$size_file"
    # 追加应用内容到另一个临时文件
    cat "$app" >> "$content_file"
done
combined_file="combined.bin"
# 合并大小信息和应用内容
cat "$size_file" "$content_file" > "$combined_file"
output_file="apps.bin"
dd if=/dev/zero of="$output_file" bs=1M count=32
dd if="$combined_file" of="$output_file" conv=notrunc
mkdir -p ../arceos/payload
mv "$output_file" ../arceos/payload/apps.bin
# 清理临时文件
rm "$size_file" "$content_file" "$combined_file"
echo "合并完成,输出文件：$output_file"

练习3

本实验较为简单,在原来的基础上修改外部应用的汇编指令以及然后在遍历程序时将其执行即可.

练习4

本实验也比较简单,仿照前面的系统调用写一个即可,关机方法:std::process::exit.

练习5

因为多次系统调用a7寄存器的值会被修改,导致报错,所以我们需要将其存入变量中防止abi_table被修改,而且还要声明clobber_abi(“C”)保持Rust代码与内联汇编之间的一致性.然后在我写的过程中,出现了冒用 in(reg) 和 out(reg) 的错误,导致传入的 ABI 接口的地址导致调用函数的时候接口地址丢失,在第二次调用的访问未映射的地址导致错误发生.

练习6

在练习5的基础上,初始化地址空间以后,对于每一个外部应用调用 RUN_START 前切换地址空间即可.但此时应用并无法正确返回,是因为外部引用主动阻塞导致的,外部应用不能进行阻塞,我们需要修改 _start 函数的返回值为 ();

2023开源操作系统训练营第三阶段ArceOS总结报告-ftq

Posted on 2023-12-02 Edited on 2025-08-04 In oscamp 2023fall arceos unikernel

ArceOS Unikernel 总结报告

回顾学习ArceOS Unikernel的这两周，我学到了很多相关知识。通过石磊老师的教导，我先是从第一个星期的组件化教程开始，实现了彩色输出，然后完成了对HashMap的移植，在用early算法实现了内存分配器后又完成了 dtb 文件的解析和输出，最后修改原有的协作式调度算法fifo为抢占式调度。这一步步的任务让我逐渐掌握了 Unikernel 的用法，对 ArceOS 的整体架构、内存分配及调度算法有了更深入的了解。
然后是第二周的基础任务，分别是：从外部加载应用、将应用拷贝到执行区域并执行、通过 ABI 调用 ArceOS 功能、在 App 中正式调用 ABI 以及支持内核和应用分离的地址空间及切换，基本都是更着做就可以了，通过这些练习，我们也更加深入地了解 ArceOS 系统的运行机制和应用开发技巧。下面本别讲解以下各练习的具体做法及思路。

练习题思路总结

练习 1 和 2

本实验实现加载器 loader ，从外部加载 bin 应用到 ArceOS 地址空间，对头结构的设计要让loader可以读取应用信息。
头结构的设计：
App总数 App1大小 App1 内容 App2 大小 App2 内容 … AppN 大小 AppN 内容
这样就可以很好地管理各个应用程序，从而实现应用程序的加载。

练习 3

在之前实验的基础上修改汇编指令以及 loader 改用批处理的方式加载外部应用即可。

练习 4

本实验只需要添加 SYS_TERMINATE 系统调用，然后让 SYS_TERMINATE 直接调用 axstd::process::exit 即可。

练习 5

这个练习的前两个要求都不难，难的是第三个要求，每一次ABI调用返回到loader的时候都需要返回到应用上一条指令的状态，所以ABI调用的时候需要保存上下文。但在实现时发现a7会一直变化，所以需要使用clobber_abi(“C”) 并额外用临时寄存器存放和加载 abi_table 。最终实现上下文的保存。

练习 6

基于之前的 hello_app 应用，仅保留 putchar 函数。先将 _start 函数的返回值为 ()，为 APP 建立独立的页表，实现初始化和切换函数，然后将练习5中等待中断的wfi指令去除再加上独立的页表就可以了。

2023开源操作系统训练营第三阶段实习任务总结报告-郝淼

Posted on 2023-12-02 Edited on 2025-08-04 In oscamp 2023fall arceos unikernel

几个核心问题

目前 ArceOS 已经实现了“线程”组件 axtask，如何利用它转变为进程？
- 独立的地址空间
如何保持 unikernel 的特性？
- 仅保留单一特权级

ArceOS 作为动态链接库

目前成果

在保持 ArceOS 单特权级的情况下，支持一些简单的动态链接程序的二进制兼容：

编写加载器 loader 支持加载动态链接的 ELF
为每个应用创建虚拟地址空间（页表），将其绑定在任务控制块上
每个进程通过任务控制块参与调度，在 switch_to() 时切换地址空间

需要实现的功能

动态链接的原理：
- plt 和 got 如何配合工作：
  1. .rela.plt：存储了加载器在动态链接时需要填写的 .got 表项，以及动态链接函数的符号信息，用于索引 .dynsym中的一项：
    1
    2
    #define ELF64_R_SYM(i) ((i) >> 32)
    ELF64_R_SYM(Elf64_Rela.r_info)
  2. .dynsym：可以查找到和动态链接符号的相关属性，以及符号名称（位于 .dynstr）
- ABI 是如何保持的：函数签名保持一致即可
ArceOS 需要能加载 ELF
加载时如何填写 .got
ArceOS 的编译脚本需要修改，
- 编译 axlibc，导出符号表
- 自身能够读取 libc 的符号表
- 最好能直接将 libc 映射到一个地址段，所有进程共享

实现路径

mmap()：难度较大，因为目前没有进程，也就没有其对应的地址空间
ELF 解析
动态链接

日志记录

11 月 23 日

ArceOS 的 axstd 和 axlibc 不能同时链接
- 如果强制链接的话会出现重复的符号

解决方法：将 rust_libc 和 app 链接在一起，c_libc 再和 rust 代码链接

rust loader 可以调用 libc 的函数
ArceOS 需要实现 mmap()

11 月 27 日

KISS 原则实现了加载时的动态链接：先不实现 mmap 和 ELF 解析，采用硬编码的方式加载 hello

ELF 解析加载过程：

读取 Program Headers（在 host 上用 readelf），将其中类型为 LOAD 的 segment 从文件中加载到内存。

11 月 28 日

实现了根据 ELF 头获取需要进行动态链接函数的填充地址和填充值，并进行动态链接。

ELF 解析加载过程：

获取 ELF 头，找到 section header table
根据 .shstrtab 找到：
- .rela.plt：找到外部链接符号
- .rela.dyn：链接内部符号
- .dynsym：动态链接符号表
- .dynstr：动态链接符号名的字符串表
外部动态链接
- 用 rela.r_sym() 索引 .dynsym，获取符号项 dynsym
- 根据 dynsym 判断符号属性，符合动态链接的用 dynsym.st_name 索引 dynstr 获取符号名 func_name
- 根据符号名查找 loader 初始化时填写的链接表，获取链接虚地址 link_vaddr
- 将虚地址 rela.r_offset 处的 8 字节填写为 link_vaddr
内部动态链接
- rela.r_addend 的值即为链接虚地址 link_vaddr
- 将虚地址 rela.r_offset 处的 8 字节填写为 link_vaddr

11 月 29 日

根据 ELF 头读取 segment 信息，将其中属性为 LOAD 的段加载到内存。此时对 kernel 而言，hello app 不具有单独的进程（或者线程）属性，而是与 loader 为一体。

在 loader 的 Cargo.toml 开启 axstd 的 multitask 属性，可以正常编译，但内核 panic 退出，信息为 current task is uninitialized，定位到 axtask::task::CurrentTask::get() 函数。显然，在初始化时，已经设置了 current task，这里为何报错？

经过进一步阅读源码，发现 current task 的指针通过 axhal::cpu::current_task_ptr() 获取，而 axtask/multitask 开启了 percpu 功能，也就是说此时的 current task 指针是一个 percpu 变量。目前，ArceOS 中通过 gp 实现 percpu，这与 riscv 的 ABI 是不符的。具体体现为 hello app 一开始就重新加载了 gp，把内核里维护 percpu 的值冲掉了。

因此，为了保持 ABI，我将 percpu 改回了使用 tp 维护（前一个修改的 commit 将 tp 改为 gp）。此时在打开 axstd/multitask 后可以正常退出。

11 月 30 日

实现 axtask::spawn_from_ptr()，专门用于创建从 ELF 加载任务的 TCB
在 riscv 的任务上下文中加入 satp，context_switch() 时同时切换页表
目前实现了动态分配的页表，但未实现进程退出后页的释放

12 月 1 日

通过复用 axhal::paging::PageTable 的接口，实现了完整的页表分配、回收功能，并且修改 TaskInner 结构体，将页表绑定到上面。这样就实现了类似于 rCore 中的 RAII 风格页表。

总结

目前的实现充分利用了 ArceOS 中已经存在的 axlibc 和页表，不足之处：

loader 对于 ArceOS 而言也是一个应用程序，但是其中跨层级调用了很多底层接口，不符合 ArceOS 的设计原则
不支持静态链接的 app，即程序中的系统调用指令目前 ArceOS 无法处理
修改了一些 ArceOS 中的现有模块，使得原有模块的实现发生改变，如利用 gp 保存 percpu 变量，为了验证思路的可行性，将其改为了 tp

OS-Camp-2023-ArceOS-unikernel-Summary-LiuZhetan

Posted on 2023-12-02 Edited on 2025-08-04 In oscamp 2023fall arceos unikernel

第三阶段总结报告

基本任务体验

第三阶段从十一月出开始到12月2号结束，历时1个月。就个人情况来说，由于杂事比较多，从第一周周六（11.11）开始学习Arceos到第三周周三（11.22）完成了ArceOS unikernel项目的基本任务，后面的一周半没能抽出时间探索一下最终任务还是有些遗憾（不过我希望在本次训练营结束后再花点时间实现一下最终任务的若干个Idea）。

就难度来说，个人认为ArceOS比rCore更为复杂，刚打开ArceOS工作目录就感受到了很强的压迫感，但是得益于ArceOS优秀的组件化设计思路（点赞）将内核开发的难度局限再一个模块之内大大降低了实验过程的复杂度。

第一周的early内存分配器和dtb解析比较麻烦，首先实现early内存分配器时没有考虑到需要对分配指针的地址和分配的内存块大小对齐，这个造成了许多bug，对于dtb解析需要额外学习dtb的数据格式和解析库。

第二周的主要工作量在于设计img的头部用于加载多个应用，然后在练习5遇到了一些问题卡了一段时间，主要是内联汇编的某些写法有问题导致编译器直接没有生成这部分代码（一步一步调试找到了相对靠谱的写法）。

总得来说，由于ArceOS的模块化设计，对其其中一个修改造成的影响也尽量地限制在模块内，对于其他的模块可以不用了解其实现细节而使用其暴露的api接口（通过在Cargo.toml中指定依赖路径），这样简化了开发难度。

最后感谢全体rCore开发者的努力，创造了我认为最棒的OS入门教程╰(°▽°)╯。

2023秋冬季开源操作系统训练营第三阶段总结报告_邱沛中

Posted on 2023-12-02 Edited on 2025-08-04 In oscamp 2023fall arceos unikernel

第三阶段主要分成四周的学习。

第一周

第一周的学习主要围绕 arceos 的架构。在这基础上进行一些小实验。

第一个小实验比较简单，需要有彩色的输出。这只需要在 println 宏的字符串前后添加神秘代码即可。

第二个小实验是要实现一个 hashmap。这个的实现比较复杂，但是由于不是所有的方法都需要实现，而且网上相关的代码有许多，所以只需要从网上找一个 no-std 的实现，然后将其删改即可。另外，还需要实现随机函数，这里主要是根据时间来生成一个伪随机数。

第三个小实验是要实现 early 算法。这个算法的内容和实现比较简单。就是内存的两边一边分配字节，一边分配页，两者相遇即内存满。但是这个算法的回收操作不是很方便。

第四个小实验是解析 dtb。这个原本是一个复杂的工作，但是已经有相关库实现了。所以可以直接拿来使用。大大减少了工作量。

第五个小实验是把 fifo 改成抢占式的操作。这个实验要根据源代码 cfs 和 rr 的相关声明和实现来帮助理解。

总的来说，第一周的实验还是比较简单的，而且帮助我理解了 arceos 的相关架构。

第二周

第二周主要有六个练习，为最终的实习项目做准备。

练习 1 和练习 2 需要为 image 设计一个头结构，包含应用的长度信息，在加载时就能获取应用的实际长度。为了解决这个问题，我使用 python 将多个应用合并为一个 bin 文件，并在 bin 文件首部添加每个应用的长度和偏移地址。这样在读取应用时就能够按需读取。

练习 3 是要批处理方式执行两个单行代码应用，第一个应用的单行代码是 nop ，第二个的是 wfi。这个在前面练习 2 的基础上，循环读取每个 app 的代码，执行结束后就返回即可。

练习 4 是要实现 3 号调用 - SYS_TERMINATE 功能调用，作用是让 ArceOS 退出，相当于 OS 关机。这个的实现跟相对应的 SYS_HELLO 等调用方法一样。依葫芦画瓢即可。

练习 5 把三个功能调用的汇编实现封装为函数, 基于 putchar 实现 puts 输出字符串。这个我认为是整个第二周坑最多的一个练习。这个练习由于 puts 要输出字符串，所以需要一个链接文件将其放到指定的位置。另外，在內联汇编中，每次执行出来寄存器的值就变的不可预知，所以需要加上 clobber_abi(“C”), 来保护寄存器内容。

练习 6 实现一个应用，唯一功能是打印字符 ‘D’。现在有两个应用，让它们分别有自己的地址空间。让 loader 顺序加载、执行这两个应用。这个在练习 3 的基础上修改即可。需要修改的就是给每个应用都加一个页表即可。

第三周和第四周

最后的实验是要完成 linux app 的移植。这个我采用的方法是变更 elf 动态链接库，使其连接到自己写的函数中。我自己完成的部分是 elf 的解析，代码能够在没有开启分页的情况下运行 c 代码。由于我对 arceos 的分页有一定的误解，导致当分页开启时，原来的代码就不能正确访问和运行。后面当我看到郝同学的代码时，我发现他的方法跟我具有相似性，都是解析 elf，并将动态链接部分修改为自己的函数地址。所以后面我就跟着他的代码写了一遍，最终实现了功能。其中遇到的坑和解决方法如下：

分页开启时，内核虚拟地址和物理地址之间是线性映射，但是中间有个偏差 axconfig::PHYS_VIRT_OFFSET，所以，之前所有的地址，比如 PLASH_START 就要加上 axconfig::PHYS_VIRT_OFFSET 才能正确访问到。
每个物理地址除了内核的虚拟地址外，还可以根据三级页表建立映射。每个应用都建立一个三级页表，这样每个应用就都会有自己的地址空间，内存分配也会更加灵活。
在 loader 的 Cargo.toml 开启 axstd 的 multitask 属性，可以正常编译，但内核 panic 退出，信息为 current task is uninitialized，定位到 axtask::task::CurrentTask::get() 函数。显然，在初始化时，已经设置了 current task，这里为何报错？经过进一步阅读源码，发现 current task 的指针通过 axhal::cpu::current_task_ptr() 获取，而 axtask/multitask 开启了 percpu 功能，也就是说此时的 current task 指针是一个 percpu 变量。目前，ArceOS 中通过 gp 实现 percpu，这与 riscv 的 ABI 是不符的。具体体现为 hello app 一开始就重新加载了 gp，把内核里维护 percpu 的值冲掉了。因此，为了保持 ABI，我将 percpu 改回了使用 tp 维护（前一个修改的 commit 将 tp 改为 gp）。此时在打开 axstd/multitask 后可以正常退出。（本段来自郝淼大佬的 github 文档）

总结

这一个月的生活还是非常充实的。没有独立完成最后的实习任务有点遗憾。通过这次的学习，让我对 unikernel 有了较为深刻的理解。也跟老师同学们学到了很多。希望这个活动以后越办越好。

Posted on 2023-12-01 Edited on 2025-08-04

2023秋冬季开源操作系统训练营第三阶段总结报告_庄广

Posted on 2023-12-01 Edited on 2025-08-04 In oscamp 2023fall arceos unikernel

前言

发了三周完成第二阶段的前三个实验，并进入到第三阶段，第三阶段一开始一周，在接下来的三周里奋起追赶进度，花了两周半完成了第一周的5个实验。

从接触arceos的unikernel整体架构设计，有以下感悟：

组件化设计，内核的所有依赖根据需要引入，包括组件内部的依赖，这个控制是到代码块级，粒度非常小，rust包管理和语法提供很好的支持

平台相关和平台无关的模块相互隔离，这一块解耦合有助于写平台无关模块的代码，提升代码的复用性

练习1和2

需要给应用设计一个头部，包含应用大小，根据大小来加载应用，而不是固定加载32字节。在实验过程中，单纯的添加头部，会导致qemu读取pflash读取失败，经过一番

尝试后发现，pflash一定要32M大小，大一点小一点都不行，然后就是修改应用端构建的命令。先添加头部，然后添加数据段，再加上32M空数据，

最后通过dd命令将整个文件的前32M拷贝到另一个文件，这个文件即为我们的最终文件。

头部设计：
应用数量|第一个应用大小|第二应用大小|….\n
第一个应用数据+第二个应用数据

头部通过\n和数据端区分，两个应用的数据无间隔，因为已经从头部得知应用大小了

练习3

练习3的难点在于如何执行玩应用程序，再返回到内核，这里有个细节，就是无返回即 -> !,生成的汇编是没有ret的，我们需要ret指令会到内核，只需要改下

用户代码即可。

练习4

实现terminate,通过查看arceos的代码发现，arceos_api中有这块代码，问题就在于引入arceos_api，并调用对应的ax_terminate方法

练习5

比较难，发现只会输出hello world并报load page fault的错误或其他错误，通过排查发现连续调用两次hello world也会报错。通过qemu.log的汇编，

将a7寄存器保存到一个全局变量后，依旧存在错误。第二步，发现连hello_world也没有输出，怀疑应用内存布局的原因，导致start并没有放置在程序开头

位置，通过静态链接文件ld固定内存布局，解决问题。第三步，通过禁止内联消除寄存器被覆盖的现象，发现依旧报错。第四步，发现和编译器生成的调用函数汇编

有差异，无保存恢复寄存器的操作，仿照这部分代码，保存了ra寄存器。实验成功了！

实验6

实验6比较简单，两个用户根页表切换一下，可以一模一样，反正是顺序执行。把会陷入无限等待的代码改一下即可

总结

第三阶段更多的是实验，相比于阶段二，需要更多的探索和debugger的能力。通过第三阶段，我发现了前面学习中遗漏的知识，比如函数调用规范，外设的dbt文件和

cargo的包管理的细节等等。

发时间最多的是第一周的实验2，在不停的开启注释代码修改代码中，了解到看似无比复杂的依赖，其实可以被梳理清楚，到能运行时，依赖并不是很多，也就实现了

最小化原则。和arceos的设计有异曲同工的感觉，如果只用其中一部分功能，很多方法及依赖都不是必须的，且是可以替代的。