0%

2024-秋冬季开源操作系统训练营第三阶段总结-yck

Areos引导机制

  • 首先进入axhal中平台架构的boot程序的_start函数,参数为OpenSBI传入的两个参数,一个是hartid用于识别CPU,一个是dtb_ptr传入DTB的指针。
  • 然后会建立栈用于函数调用,准备页表启动MMU分页机制,后即可进入Rust。

然后进入axruntime初始化应用运行时的环境,即根据feature条件编译各组件框架

启用页表机制

SBI配置FW_TEXT_START,BIOS负责把SBI加载到内存的起始位置

0x8000 0000存放SBI,SBI会跳转到以0x8020 0000起始的内核代码,存放.bss、.data、.rodata、.text段。

axhal中的linker_riscv64-qemu-virt.lds指导rust的链接器来实现段布局

一阶段:即上面提到_start函数中的初始化MMU,将物理地址空间恒等映射,再添偏移量。

二阶段:重建映射,一阶段的映射并没有添加权限进行管理。若启用”paging”的feature,首先会调用axmm中的init_memory_management(),进行创建内核空间(new_kernel_aspace()),将根页表地址写入stap寄存器(axhal::paging::set_kernel_page_table_root)。

多任务

启用”multitask”的feature,执行axtask::init_scheduler(),会进行就绪队列的初始化,以及系统timers的初始化。

  • 就绪队列的初始化:初始化系统任务idle、main、gc
    • main为主任务,其他任务均为其子任务
    • idle,其他任务都阻塞时会执行它
    • gc,除main之外的任务退出后,将由gc负责回收清理

调度算法

CFS

“init_vruntime”在os启动调度的时候决定调度顺序,”nice”则是优先级,优先级越大”vruntime”增长越慢,从而达到高优先。

当时间片结束后,当前任务将被为设为可抢占,当前任务释放控制权,加入就绪队列。并且如果外部条件满足抢占,则会将就绪队列中的队首弹出并切换到该任务

宏内核

m_1_0启动

  • 首先为应用创建独立的用户地址空间。

axmm::new_user_aspace

  • 将应用程序代码加载到地址空间。

load_user_app

  • 初始化用户栈

init_user_stack

  • spawn创建用户任务,以用户地址空间及应用入口、用户栈为参数

task::spawn_user_task

  • 当前任务释放CPU,使用户任务运行

user_task.join

用户空间

页表管理内核地址空间和用户地址空间

内核地址空间只有高端(高地址)存放内核代码数据

用户地址空间高端存放内核,但这部分的页表项设为用户不可见,只有陷入内核态之后才能访问。低端地址存放应用

每个用户地址空间高端的内核均相同,只有存放应用的区域不同

地址空间后端Backend:

Linear:目标物理地址空间已经存在,直接建立映射关系,物理页帧必须连续

Alloc:仅建立空映射,当真正被访问时将会触发缺页异常,然后在缺页响应函数内部完成物理页帧的申请和补齐映射,也就是Lazy方式。物理页帧通常情况下不连续

ELF格式应用加载

代码段加载无偏移。

数据段加载到虚拟地址空间分为.data、.bss。但.bss在ELF文件中为节省空间紧凑存储不做存放,仅做标记位置和长度。内核直接预留空间并清零

缺页异常

当发生缺页异常时,由aspace的handle_page_fault来完成对物理页帧的申请与映射

首先检查发生页面错误的虚拟地址 vaddr 是否在当前虚拟地址范围 va_range 内。

然后找到vaddr的区域area,进入area的后端,缺页异常通常由后端Alloc的Lazy策略造成,故进入Alloc分支调用handle_page_fault_alloc对页表remap完成页表映射

Hypervisor

虚拟化基于RISCV64的S特权级的H扩展,Host将在HS特权级下进行VM_ENTRY以及VM_EXIT

S特权模式进行H扩展后,原有的s[xxx]寄存器组作用不变,将新增hs[xxx]和vs[xxx]

  • hs[xxx]寄存器组的作用:面向Guest进行路径控制
  • vs[xxx]寄存器组的作用:直接操纵Guset域中的VS,为其准备或设置状态

设置hstatus的SPV位(指示特权级模式的来源,1为VS,0为U)SPVP位(指示HS对V模式下地址空间是否由操作权限)

启动Guest之前,设置Guest的sstatus,设置初始特权级为Supervisor

设置sepc为OS启动入口地址VM_ENTRY,地址为0x8020 0000

run_guest切换:保存Host上下文,将Guest上下文(第一次切换为伪造的上下文)载入寄存器组

VM_EXIT返回Host:保存Guest上下文,将Host上下文载入寄存器组

Guest和Host地址空间

Hypervisor负责基于Host物理地址空间HPA面向Guest映射Guest物理地址空间GPA

Guest会认为GPA是实际的物理地址空间,它基于satp映射内部的GVA虚拟空间

启用RISC64指令集的G扩展:

  • 引入vsatp用于第一阶段的页表翻译,即将Guest的虚拟地址空间映射为Guest的物理地址空间
  • 引入hgatp用于第二阶段的页表翻译,即将Guest的物理地址空间映射到Host的物理地址空间

虚拟机物理地址空间布局

低端区域留给设备空间和DMA

0x8000 0000在Host中是存放SBI的,但是虚拟机没有M模式,是无法访问SBI,所以这部分进行保留

0x8020 0000存放内核

高于内核的地址用作物理内存区

Hypervisor主逻辑

  • 准备VM的资源:VM地址空间和单个vCPU
  • 切换到进入Guest的代码
  • 响应VM_EXIT各种原因的代码

实现流程:

  1. 创建地址空间 为目标虚拟机创建物理地址空间 axmm
  2. 建立区域布局 在地址空间中为Guest内核和设备建立区域 axmm
  3. 加载内核 把Guest内核Image加载到内核区域 axmm, axfs
  4. 初始化vCPU 把vCPU的启动入口设置为Guest内核入口,同时设置EPT页表地址

最后在Host和Guest环境循环切换,支持虚拟机持续运行

VCPU的准备:

  • 通过set_entry(VM_ENTRY)设置sepc来配置入口地址0x8020 0000
  • 通过set_ept_root向hgatp设置模式(SV39)和根页表的页帧

axruntime和axhal时钟中断处理

axhal::irq::register_handler 通过update_timer在中断向量表中注册对应的中断响应函数,更新时钟。然后axtask::on_timer_tick()触发定时任务