0%

初始rcore

第一次知道rcore来源于一篇知乎的帖子,当时沉迷于操作系统的学习,希望能写出一个自己的操作系统。但当时网络上更多的是对xv6的赞赏,rcore的仅仅是一句简单的提及。受限于当时初学计算机,只知语言C,不识Rust,不希望投入太多精力到语言的学习,因此并未细探rcore究竟。(当然,三分钟热度的我最后也没写完一个操作系统,希望这次能够完善地学完!)

直到去年了解到这个开源操作系统训练营,加上自学了rust的基础语法,对其很有兴趣。可惜秋冬季已经结营,加上网站上模糊的教学视频实在难以学习,便又戛然而止。直至今年四月初至,又闻开营之事(别问,问就是大数据推送),喜从心中来,急急忙忙地就上了船。

第一阶段总结

第一阶段主要是熟悉rust语法,前三十道题进展迅速,仅涉及简单语法;中间几十道题中,所有权和生命周期单列出来较为简单,但是复杂场景中的所有权问题令人头疼;最后几道算法题,除去算法本身的难度,rust对于所有权和借用的限制才是最大的难点,以至于最后纯粹是与编译器斗智斗勇,几乎快忘了实现逻辑和复杂度。

除此之外,有多道题目在完成过程中总是不解其意,仅仅是让其通过检测。知道提交通过之后,看到群友们的讨论才恍然大悟,但又懒于修改,还是默默学习的新的内容去吧。

个人介绍

本人就读于新加坡南洋理工大学,参加这个夏令营的目的是为了弥补本科时候的遗憾。在本科期间,听说了AI多么高大上,挣钱多么多,于是把目标放在了AI方向,任何的课程和科研都是围绕着AI方向。但是后面大四发现实在是卷论文卷不动了,而且其实干的很多事情都是调参,找一组好的参数发论文,这并不是我想要的生活,也不是想干的方向。于是我开始想试试开发,因为传统开发上面我毫无经验和优势,于是便去学习小众的区块链开发,发现了Rust这门宝藏语言。顺利的学习这门语言,好好读书背八股找到了大厂的工作(今年入职),但是其实操作系统等底层的知识,在本科上课的时候都是糊弄过去的,所以一直有这个遗憾。借着这个夏令营的机会,我的目标是一阶段巩固一下Rust细节知识,为后面转向区块链开发做铺垫(参加过Solana链相关的黑客松),第二个是真正的非纸上谈兵地去用喜欢的Rust语言做一下操作系统相关的开发,希望可以坚持到最后。

一阶段学习感悟——对Rust的一些感想

Rust 是一种安全的系统编程语言,它为程序员提供了实现安全的途径,而无需担心所有的实现细节。所以这里的动机是,基本上C++是不安全的。这也是 Rust 出现的原因。
这里的安全性指的是,如果你用Rust编写了一个程序,并且它满足了某些条件,那么当你将该程序编译成汇编程序时,就可以保证汇编程序不会出错。编译器和类型系统保证了这一点。与此同时,它还实现了控制,因为它支持编程中所需的所有底层功能,例如操作系统的构建,目前Linux和Windows中的系统内核中很多部分都用Rust进行了重构。尤其是C和C++在编写并发程序的时候,无法自动检测到内存的不安全性,而Rust的所有权和生命周期抓住了并发的本质,其本质上关于安全的共享资源。
下面讨论一下系统编程里面的内存模型。我认为一个编程语言,尤其是系统编程语言,或者说比较低级别的编程语言中间最重要的实际上有两件事儿,一个就是它的内存模型,或者说你的变量在内存中是如何交互的和如何表示的。另一个就是多线程的事情,就是多个线程如何操作这些内存。
首先在系统编程领域唯三的编程语言,就是C,C++和Rust。因为Rust它实际上是有很多比较新的理念,可以视为它从C++中间去抽取了很多比较精华的部分,并且它又长出来自己独有的一些东西。
因为C++里面的特性非常多,而且有很多很复杂很融坠,很多还是由于历史原因造成的。因为 C++非常强调兼容性,所以他以前的一些设计的问题,它是没有办法在未来改变的,它只能把它保留或者是把它遮蔽起来。就像你有堆垃圾,你没有办法倒到外面,你只能拿被子先盖起来,然后在这个垃圾上面去建立一些新的东西,所以很多人都觉得C++不如C语言使用起来那样舒服。那么从Rust角度来讲的话,它就没有这个历史负担,它出现的比较晚,所以他从不管从C还是从C++,还是从 Python等等其他的语言中去抽取了很多好的东西集成起来。从整体上来看的话,共性化的部分肯定是各个语言都比较重要的部分,个性化的部分的话,Rust的部分的好处多于坏,它的坏处主要是它的带来的额外的编程和编译的复杂性。

给第一周做一个总结

  • 参加这个lab的起初目的有两个:一是有可能会有实习机会,但是现在看到这么多大佬估计也挺难了哈,二是想考研408,加深自己对于操作系统的理解。另外可以丰富自己的项目知识的积累,过去一个星期了,发现自己的这个选择真是无比的正确,在学校待的两年发现什么实操都不会,学到了很多工具的使用(非常感激群里的大佬们的帮助),并且在学习的过程中也对rust产生了浓厚的兴趣,非常想去学习。
  • 第一周在学习rust的语法,主要是跟着B站的一个up主(软件工艺师)在学习,讲解的非常的好,而且没有废话,很细节,结合rust中文圣经补充一些知识。
  • 不过没学多久就准备蓝桥杯了,刚好学到生命周期那个部分,在第一周做rustlings写到48题,刷到现在感到收获很大,深刻体会到要学会一门语言是要多加练习的。
  • 接触到rust的语言之后,我对它产生了浓厚的兴趣,虽然这门语言很难,但是也很有趣,思想也很先进,不同于初学python时不用敲代码就可以掌握,学习rust经常一个语法要写好几遍才堪堪掌握。
  • 比较开心的是,学完了trait和生命周期,这两个点大家都说难,但是我认为比较好理解,看来我果然还是很有天赋的吧哈哈哈哈哈哈哈哈!!!
  • 好吧,这也没什么要记录的了,群里很多大佬在第一二天就已经将rustlings写完,而我连github还没整明白,在第二周补补知识,把rustlings写完(话说这个博客提交又要研究一个晚上了wuwuwu)。
  • 参考的rust语言圣经:https://course.rs/basic/compound-type/string-slice.html
  • 讲解的超棒的B站视频:【Rust编程语言入门教程(Rust语言/Rust权威指南配套)【已完结】-哔哩哔哩】 https://b23.tv/AaXsgZd

第二周

  • 这一周一开始把rust剩下的智能指针,多线程,闭包等全部学完了,但是直到开始写剩下的rustlings时,才发现实际写起来困难重重,经过反复的查阅官方文档以及GPT的帮助之下,才弄懂了接下来的题。
  • 但是到了algorithm的十道题,每啃一道都会花费不少的时间,需要反复检查所有权和trait的使用,
  • 建议还是反复多练习才能更好的掌握,这次新增的这十道算法题也确实帮助我更好的打好了基础。
  • 最后,非常感谢能有机会参加这次活动,希望在第二阶段可以有更多收获,同时也为社区回馈更多。

code-debug是一个支持跨特权级调试的VSCode插件。在这篇文章中,我将介绍利用这个调试插件在VSCode上对ArceOS进行源代码级调试的过程。

首先我们需要下载 gdb-multiarch :

1
sudo apt install gdb-multiarch

接着我们运行一下 ArceOS,从而生成 bin 和 elf 文件. 这里以RISC-V上的单核arceos-helloworld为例:

1
make A=apps/helloworld/ ARCH=riscv64 LOG=info SMP=1 run

在 ArceOS 的输出中,我们发现了 QEMU的启动参数:

1
qemu-system-riscv64 -m 128M -smp 1 -machine virt -bios default -kernel apps/helloworld//helloworld_riscv64-qemu-virt.bin -nographic

我们将这些启动参数转移到配置文件 launch.json 中:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
   //launch.json
{
"version": "0.2.0",
"configurations": [
{
"type": "gdb",
"request": "launch",
"name": "Attach to Qemu",
"executable": "${userHome}/arceos/apps/helloworld/helloworld_riscv64-qemu-virt.elf",
"target": ":1234",
"remote": true,
"cwd": "${workspaceRoot}",
"valuesFormatting": "parseText",
"gdbpath": "gdb-multiarch",
"showDevDebugOutput":true,
"internalConsoleOptions": "openOnSessionStart",
"printCalls": true,
"stopAtConnect": true,
"qemuPath": "qemu-system-riscv64",
"qemuArgs": [
"-M",
"128m",
"-smp",
"1",
"-machine",
"virt",
"-bios",
"default",
"-kernel",
"apps/helloworld/helloworld_riscv64-qemu-virt.bin",
"-nographic",
"-s",
"-S"
],

"KERNEL_IN_BREAKPOINTS_LINE":65, // src/trap/mod.rs中内核入口行号。可能要修改
"KERNEL_OUT_BREAKPOINTS_LINE":124, // src/trap/mod.rs中内核出口行号。可能要修改
"GO_TO_KERNEL_LINE":30, // src/trap/mod.rs中,用于从用户态返回内核的断点行号。在rCore-Tutorial-v3中,这是set_user_trap_entry函数中的stvec::write(TRAMPOLINE as usize, TrapMode::Direct);语句。
},
]
}

我们在qemuArgs中添加了 -s -S 参数,这样qemu在启动的时候会打开gdb调试功能并且停在第一条指令处,方便我们设置断点.

此外,应当注意executable参数指向包含符号表的elf文件,而不是去除符号表后的bin文件。

由于ArceOS是unikernel,没有用到用户态,因此以下这三个参数不需要填写:

1
2
3
"KERNEL_IN_BREAKPOINTS_LINE":65, // src/trap/mod.rs中内核入口行号。可能要修改
"KERNEL_OUT_BREAKPOINTS_LINE":124, // src/trap/mod.rs中内核出口行号。可能要修改
"GO_TO_KERNEL_LINE":30, // src/trap/mod.rs中,用于从用户态返回内核的断点行号。在rCore-Tutorial-v3中,这是set_user_trap_entry函数中的stvec::write(TRAMPOLINE as usize, TrapMode::Direct);语句。

最后我们再次按f5开始调试ArceOS. 我们发现Qemu虚拟机启动,ArceOS停在了第一条指令

1
oslab@oslab:~/arceos$  qemu-system-riscv64 -M 128m -smp 1 -machine virt -bios default -kernel apps/helloworld/helloworld_riscv64-qemu-virt.bin -nographic -s -S

接下来我们设置断点。比如我们在Hello, World输出语句打一个断点,然后按”▶️”.我们会发现断点触发了:

以上,通过一些简单的设置,我们就得以用code-debug调试器插件调试一个新OS.

Unikernel 学习心得

近期学习了一些关于Unikernel的知识,以下是一些心得体会:

  • Unikernel是基于组件化的思想设计的,由各种模块构成组件,再由各种组件构成最终的操作系统。
  • 而对于各种模块是如何被选择的,则是采用feature机制,指定最终所需要的模块

ArceOS实验

  • 这周进行了ArceOS的三个实验,在练习一中学习了用println!进行彩色打印。练习二主要学会了对ArceOS进行扩展开发,在axstd中加入了Hashmap,在axhal模块中加入rng生成器,初步了解了ArceOS的调用结构。
  • 练习三修改了axalloc模块中allocator的算法,改为early算法,同时用lock()和unimplemented!()禁用其他算法

学习流程

第一天的接触就是修改CI/CD的错误,我的认知里面是写构建的yml文件,实际上是需要解决starry跑在x86的问题,第一天就大概看了starry的设计文档了解了它和arceos的承接关系和相关的模块图,于是在和杨金博同学沟通后对编译选项和copy.S的代码进行了x86的改造之后发现pci等还有问题,于是问题交到金博哥手里,这时候进行了unikernel的学习,石磊老师ppt讲解和训练营的录课大概看过之后对unikernel有了大概的认识,之后就边处理strace那边的数据边学习和做lab。

进展

目前在做第三周的实验的lab1,将c程序的镜像打包到文件系统实现了,目前对hello的报错进行修改,目前的思考是hello的命令行参数处理有问题,需要内核提供支持,目前定位到的代码如下

1
2
3
4
5
6
7
8
9
10
11
if let Some(app_inode) = open_file(path.as_str(), OpenFlags::WRONLY) {
let all_data = app_inode.read_all();
let process = current_process();
let argc = args_vec.len();
process.exec(all_data.as_slice(), args_vec);
// return argc because cx.x[10] will be covered with it later
println!("exec argc is {}", argc as isize);
argc as isize
} else {
-1
}

执行后可在shell中看到初始为0执行hello程序后为1但是此时的参数处理是输出了argc为0的错误输出,目前在继续看代码准备把后续都尽快跑通。

#Unikernel 总结报告

经过若干天关于unikernel的学习,对于单一特权级的操作系统有了全新认识完成了练习1-5,练习分别为:支持彩色打印、支持HashMap、修改内存分配算法、增加一个axdtb的模块组件、修改fifo算法通过ex5测试应用

练习心得

练习了修改代码、不断检错纠错能力和熟悉了unikernel启动流程、单一特权级、单一应用、单一地址空间的操作系统的工作流程、练习一完成了axstd::println的修改、练习二;通过阅读标准库HashMap加以修改、连续三实现earlyallocator的内存分配方法、修改协作式调度为抢占式调度运行ex5程序、

##实验心得

实验一和二,将程序数据按照一定格式保存到app.bin文件中修改汇编指令,加载外部应用,实现app loader的外部应用加载器;实验三为公国ABI调用ArceOS功能,两个医用一个是nop、一个是wfi;实验四、实现sys_hellosys_putcharsys_terminate功能调用,通过std::process::exit退出ArceOS;实验五为改造应用hello_app,建立独立页表,把系统调用包装成函数,通过初始化和切换函数实现程序

本次主要采用是通过类似于在GNU/LD链接器的方式来完成整个任务。主要的参照依据是csapp中有关链接的相关说明。
目前的实际完成进度在于完成了符号的解析。但是后面的重定包括段重定位以及符号的重定位,目前还没有完成。

目前操作上来说,对于后续任务影响最大的内容在于之前任务的不正确完成,包括但不限于之前任务中埋藏的坑,比如说文件不能正确识别,将 1B 认定成为 一个16进制数而导致对于加载的文件中的align的错误判断,甚至还将用于解释rust内部结构体的自动align用于解释这里所出现的人为导致的align。

由于其他因素的影响,我在前半段时间其实没有过多的参与到其中来,近几天才加入到课题中。在参加课题之前其实对于libc,musl,甚至是elf文件没有什么过多的了解。简单的了解了下整个过程,本来看了下还想先直接用ld将对应的库链接好之后再放到arceos上读取(这是郝淼同学的实现思路),但是想到在 ld 将各种对象文件链接起来之后,实际上最后在使用的时候还是需要调用链接器 [–dynamic-linker可以指定对应链接器的地址] (当时实际上没想到可以直接实现链接器最后被调用的功能)。后面就按照实现一个链接器的想法继续实验。

目前主要使用 elf crates 实现了如下效果:

  1. 能够对于脚本中的符号进行重定位
    目前对于重定位的操作实现尚未完成,根据要求,每一步实现实际上都需要遍历多次,更别提最原始的实现中由于对象文件的顺序引起的问题可能也需要往复遍历,正在尝试优化算法以及修改elf crates使之有着更好的体验。

未来工作可能没有特别大的必要开展,原因如下,在相同情况下,就算最终能够实现了一个能够在arceos上运行的链接器也是没有必要的。

  1. 现有的基于GNU/LD的链接器可以比较好的行使其职能,重复实现一个实际上没有必要实现的链接器会丢失原先所实现的优化,同时因为测试相对于前者而言更少,反而可能会导致更多错误,然而在这种实现的链接器面前,除非同时支持大量的编译工具,否则意义实际上不太大,只能算是个展示玩具。

/// BLUE PRINT
///
/// 1. LOAD APPLICATION
/// 2. SYMBOL RESOLUTION: make sure all symbol has been meet.
/// 3. RELOCATION:
/// [1] RELOCATION SECTION:
/// merges all sections of the same type into a new aggregate section of the same typecombine
/// BC we only need SHT_PROGBITS thus not care about others (copy).
/// [2] RELOCATE SYMBOL REFERENCES IN SECTIONS:
/// Modify references to each symbol in code and data sections so that they point to the correct run-time address

下面的伪代码实际完成了符号加载工作,重定向部分的代码还没有开始实际测试,就算未来有按照这个方法实现的必要,类似郝淼同学重新实现 elf crates 甚至在原先基础上进行修改的行为是必要的,现有的调用过程太长,使用起来不太舒服。

直接通过 shdr.e_type 实现对于符号的定位,根据CSAPP的说明,使用多个集合对于符号进行处理,实现符号匹配效果

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
match ehdr.e_type {
ET_REL => { //
foreach symtabs {
if sym.is_undefined() {
// 加入 U 未定义符号组
} else {|
// 加入 D 已解析符号组
}
}
// 加入总管辖 elf 文件组 TODO 目前只实现了添加,并没有实现基于往复判断的剪枝
},
ET_DYN => {
foreach symbol in U {
if contains undefined symbols {
// 从 U 未定义符号组删除本符号
// 加入 D 已解析符号组
// 加入总管辖 elf 文件组 TODO 目前只实现了添加,并没有实现基于往复判断的剪枝
}
}
}

}

2023开源操作系统训练营第三阶段项目一总结报告

练习1,2:

该练习实现了一个 app 名为 loader 的外部应用加载器,然后实现了两个外部应用,熟悉了编译生成和封装二进制文件的流程.

该练习的重点在于头结构的构造与实现,我将应用的头结构大致分为三部分,第一部分为应用数量,第二部分为各应用长度,第三部分为应用数据.

大致实现如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
type BinNumType = u32;
const BIN_NUM_TYPE_BYTES: usize = 4;
type BinSizeType = u32;
const BIN_SIZE_TYPE_BYTES: usize = 4;
let apps_num = unsafe {
(*(PLASH_START as *const BinNumType)).to_be()
};
let mut size_offset = PLASH_START + BIN_NUM_TYPE_BYTES;
let mut start_offset = size_offset + BIN_SIZE_TYPE_BYTES * apps_num as usize;
for i in 0 .. apps_num {
let load_size = unsafe {
(*(size_offset as *const BinSizeType)).to_be() as usize
};
let load_code = unsafe {
core::slice::from_raw_parts(start_offset as *const u8, load_size)
};
println!("load code {:?}; address [{:?}]", load_code, load_code.as_ptr());
let run_code = unsafe {
core::slice::from_raw_parts_mut(RUN_START as *mut u8, load_size)
};
run_code.copy_from_slice(load_code);
println!("run code {:?}; address [{:?}] size [{}]", run_code, run_code.as_ptr(), load_size);
size_offset += BIN_SIZE_TYPE_BYTES;
start_offset += load_size;
}

下面是构造image文件的大致代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
#!/bin/bash
# 获取当前目录下所有的 .bin 文件
apps=(hello_app.bin putd_app.bin)
# 计算应用数量
num_apps=${#apps[@]}
# 创建临时文件用于存储应用大小
size_file="temp_sizes.bin"
> "$size_file"
# 创建一个新的文件用于存储合并后的应用内容
content_file="temp_content.bin"
> "$content_file"
# 写入应用数量(4 字节)
printf "%08x" $num_apps | xxd -r -p > "$size_file"
# 循环遍历每个应用并写入其大小到临时文件
for app in "${apps[@]}"; do
# 获取并写入当前应用大小(4 字节)
app_size=$(stat -c%s "$app")
printf "%08x" $app_size | xxd -r -p >> "$size_file"
# 追加应用内容到另一个临时文件
cat "$app" >> "$content_file"
done
combined_file="combined.bin"
# 合并大小信息和应用内容
cat "$size_file" "$content_file" > "$combined_file"
output_file="apps.bin"
dd if=/dev/zero of="$output_file" bs=1M count=32
dd if="$combined_file" of="$output_file" conv=notrunc
mkdir -p ../arceos/payload
mv "$output_file" ../arceos/payload/apps.bin
# 清理临时文件
rm "$size_file" "$content_file" "$combined_file"
echo "合并完成,输出文件:$output_file"

练习3

本实验较为简单,在原来的基础上修改外部应用的汇编指令以及然后在遍历程序时将其执行即可.

练习4

本实验也比较简单,仿照前面的系统调用写一个即可,关机方法:std::process::exit.

练习5

因为多次系统调用a7寄存器的值会被修改,导致报错,所以我们需要将其存入变量中防止abi_table被修改,而且还要声明clobber_abi(“C”)保持Rust代码与内联汇编之间的一致性.然后在我写的过程中,出现了冒用 in(reg) 和 out(reg) 的错误,导致传入的 ABI 接口的地址导致调用函数的时候接口地址丢失,在第二次调用的访问未映射的地址导致错误发生.

练习6

在练习5的基础上,初始化地址空间以后,对于每一个外部应用调用 RUN_START 前切换地址空间即可.但此时应用并无法正确返回,是因为外部引用主动阻塞导致的,外部应用不能进行阻塞,我们需要修改 _start 函数的返回值为 ();

ArceOS Unikernel 总结报告

回顾学习ArceOS Unikernel的这两周,我学到了很多相关知识。通过石磊老师的教导,我先是从第一个星期的组件化教程开始,实现了彩色输出,然后完成了对HashMap的移植,在用early算法实现了内存分配器后又完成了 dtb 文件的解析和输出,最后修改原有的协作式调度算法fifo为抢占式调度。这一步步的任务让我逐渐掌握了 Unikernel 的用法,对 ArceOS 的整体架构、内存分配及调度算法有了更深入的了解。
然后是第二周的基础任务,分别是:从外部加载应用、将应用拷贝到执行区域并执行、通过 ABI 调用 ArceOS 功能、在 App 中正式调用 ABI 以及支持内核和应用分离的地址空间及切换,基本都是更着做就可以了,通过这些练习,我们也更加深入地了解 ArceOS 系统的运行机制和应用开发技巧。下面本别讲解以下各练习的具体做法及思路。

练习题思路总结

练习 1 和 2

本实验实现加载器 loader ,从外部加载 bin 应用到 ArceOS 地址空间,对头结构的设计要让loader可以读取应用信息。
头结构的设计:
App总数 App1大小 App1 内容 App2 大小 App2 内容 … AppN 大小 AppN 内容
这样就可以很好地管理各个应用程序,从而实现应用程序的加载。

练习 3

在之前实验的基础上修改汇编指令以及 loader 改用批处理的方式加载外部应用即可。

练习 4

本实验只需要添加 SYS_TERMINATE 系统调用,然后让 SYS_TERMINATE 直接调用 axstd::process::exit 即可。

练习 5

这个练习的前两个要求都不难,难的是第三个要求,每一次ABI调用返回到loader的时候都需要返回到应用上一条指令的状态,所以ABI调用的时候需要保存上下文。但在实现时发现a7会一直变化,所以需要使用clobber_abi(“C”) 并额外用临时寄存器存放和加载 abi_table 。最终实现上下文的保存。

练习 6

基于之前的 hello_app 应用,仅保留 putchar 函数。先将 _start 函数的返回值为 (),为 APP 建立独立的页表,实现初始化和切换函数,然后将练习5中等待中断的wfi指令去除再加上独立的页表就可以了。