uboot下能看到linux文件,从Uboot到Linux技术内幕

在专用的嵌入式板子运行 GNU/Linux

系统已经变得越来越流行。一个嵌入式 Linux 系统从软件的角度看通常可以分为四个层次：

引导加载程序。包括固化在固件(firmware)中的 boot 代码(可选)，和 Boot

Loader 两大部分。

2. Linux

内核。特定于嵌入式板子的定制内核以及内核的启动参数。

文件系统。包括根文件系统和建立于 Flash 内存设备之上文件系统。通常用 ram disk 来作为 root fs。

用户应用程序。特定于用户的应用程序。有时在用户应用程序和内核层之间可能还会包括一个嵌入式图形用户界面。常用的嵌入式

GUI 有：MicroWindows 和 MiniGUI 懂。

引导加载程序是系统加电后运行的第一段软件代码。回忆一下 PC

的体系结构我们可以知道，PC 机中的引导加载程序由 BIOS–(Basic Input

Output System)(其本质就是一段固件程序)和位于硬盘 MBR 中的 OS Boot Loader(比如，LILO

和 GRUB 等)一起组成。BIOS 在完成硬件检测和资源分配后，将硬盘 MBR 中的 Boot Loader 读到系统的

RAM 中，然后将控制权交给 OS Boot Loader。Boot Loader 的主要运行任务就是将内核映象从硬盘上读到 RAM

中，然后跳转到内核的入口点去运行，也即开始启动操作系统。

而在嵌入式系统中，通常并没有像 BIOS

那样的固件程序(注，有的嵌入式 CPU 也会内嵌一段短小的启动程序)，因此整个系统的加载启动任务就完全由 Boot Loader

来完成。比如在一个基于 ARM7TDMI core

的嵌入式系统中，系统在上电或复位时通常都从地址 0x00000000 处开始执行，而在这个地址处安排的通常就是系统的 Boot

Loader 程序。

的主要任务、Boot Loader 的框架结构以及 Boot Loader 的安装等四个方面来讨论嵌入式系统的 Boot

Loader。

简单地说，Boot Loader

就是在操作系统内核运行之前运行的一段小程序。通过这段小程序，我们可以初始化硬件设备、建立内存空间的映射图，从而将系统的软硬件环境带到一个合适的状态，以便为最终调用操作系统内核准备好正确的环境。

通常，Boot Loader

是严重地依赖于硬件而实现的，特别是在嵌入式世界。因此，在嵌入式世界里建立一个通用的 Boot Loader

几乎是不可能的。尽管如此，我们仍然可以对 Boot Loader 归纳出一些通用的概念来，以指导用户特定的 Boot Loader

设计与实现。

每种不同的 CPU 体系结构都有不同的 Boot Loader。有些

Boot Loader 也支持多种体系结构的 CPU，比如 U-Boot 就同时支持 ARM 体系结构和MIPS 体系结构。除了依赖于

CPU 的体系结构外，Boot Loader

实际上也依赖于具体的嵌入式板级设备的配置。这也就是说，对于两块不同的嵌入式板而言，即使它们是基于同一种 CPU

而构建的，要想让运行在一块板子上的 Boot Loader 程序也能运行在另一块板子上，通常也都需要修改 Boot Loader

的源程序。

系统加电或复位后，所有的 CPU 通常都从某个由 CPU

制造商预先安排的地址上取指令。比如，基于 ARM7TDMI core 的 CPU 在复位时通常都从地址 0x00000000

取它的第一条指令。而基于 CPU 构建的嵌入式系统通常都有某种类型的固态存储设备(比如：ROM、EEPROM 或 FLASH

等)被映射到这个预先安排的地址上。因此在系统加电后，CPU 将首先执行 Boot Loader 程序。

下图1就是一个同时装有 Boot

Loader、内核的启动参数、内核映像和根文件系统映像的固态存储设备的典型空间分配结构图。

正如前面所说，stage2 的代码通常用 C

语言来实现，以便于实现更复杂的功能和取得更好的代码可读性和可移植性。但是与普通 C 语言应用程序不同的是，在编译和链接 boot

loader 这样的程序时，我们不能使用 glibc

库中的任何支持函数。其原因是显而易见的。这就给我们带来一个问题，那就是从那里跳转进 main() 函数呢接把 main()

函数的起始地址作为整个 stage2 执行映像的入口点或许是最直接的想法。但是这样做有两个缺点：1)无法通过main()

函数传递函数参数；2)无法处理 main() 函数返回的情况。一种更为巧妙的方法是利用

trampoline(弹簧床)的概念。也即，用汇编语言写一段trampoline 小程序，并将这段 trampoline 小程序来作为

stage2 可执行映象的执行入口点。然后我们可以在 trampoline 汇编小程序中用 CPU 跳转指令跳入 main()

函数中去执行；而当 main() 函数返回时，CPU 执行路径显然再次回到我们的 trampoline

程序。简而言之，这种方法的思想就是：用这段 trampoline 小程序来作为 main() 函数的外部包裹(external

wrapper)。

下面给出一个简单的 trampoline

程序示例(来自blob)：

.text

.globl _trampoline

_trampoline:

bl main

b _trampoline

可以看出，当 main() 函数返回后，我们又用一条跳转指令重新执行

trampoline 程序――当然也就重新执行 main() 函数，这也就是

trampoline(弹簧床)一词的意思所在。

3.2.1初始化本阶段要使用到的硬件设备

这通常包括：(1)初始化至少一个串口，以便和终端用户进行 I/O

输出信息；(2)初始化计时器等。

在初始化这些设备之前，也可以重新把 LED 灯点亮，以表明我们已经进入

main() 函数执行。

设备初始化完成后，可以输出一些打印信息，程序名字字符串、版本等。

3.2.2 检测系统的内存映射(memory

map)

所谓内存映射就是指在整个 4GB

物理地址空间中有哪些地址范围被分配用来寻址系统的 RAM 单元。比如，在 SA-1100 CPU 中，从 0xC000,0000

开始的 512M 地址空间被用作系统的 RAM 地址空间，而在 Samsung S3C44B0X CPU 中，从

0x0c00,0000 到 0x1000,0000 之间的 64M 地址空间被用作系统的 RAM 地址空间。虽然 CPU

通常预留出一大段足够的地址空间给系统 RAM，但是在搭建具体的嵌入式系统时却不一定会实现 CPU 预留的全部 RAM

地址空间。也就是说，具体的嵌入式系统往往只把 CPU 预留的全部 RAM 地址空间中的一部分映射到 RAM

单元上，而让剩下的那部分预留 RAM 地址空间处于未使用状态。由于上述这个事实，因此 Boot Loader 的

stage2 必须在它想干点什么 (比如，将存储在 flash 上的内核映像读到 RAM 空间中)

之前检测整个系统的内存映射情况，也即它必须知道 CPU 预留的全部 RAM 地址空间中的哪些被真正映射到 RAM 地址单元，哪些是处于

“unused” 状态的。

(1)

内存映射的描述

可以用如下数据结构来描述 RAM

地址空间中的一段连续(continuous)的地址范围：

typedef struct memory_area_struct {

u32 start;

u32 size;

int used;

} memory_area_t;

这段 RAM

地址空间中的连续地址范围可以处于两种状态之一：(1)used=1，则说明这段连续的地址范围已被实现，也即真正地被映射到 RAM

单元上。(2)used=0，则说明这段连续的地址范围并未被系统所实现，而是处于未使用状态。

基于上述 memory_area_t 数据结构，整个 CPU 预留的

RAM 地址空间可以用一个 memory_area_t 类型的数组来表示，如下所示：

memory_area_t memory_map[NUM_MEM_AREAS] = {

[0 … (NUM_MEM_AREAS – 1)] = {

.start = 0,

.size = 0,

.used = 0

};

(2) 内存映射的检测

下面我们给出一个可用来检测整个 RAM

地址空间内存映射情况的简单而有效的算法：

for(i = 0; i

memory_map[i].used = 0;

for(addr = MEM_START; addr

* (u32 *)addr = 0;

for(i = 0, addr = MEM_START; addr

调用3.1.2节中的算法test_mempage()；

if ( current memory page isnot a valid ram page) {

if(memory_map[i].used )

i++;

continue;

}

if(* (u32 *)addr != 0) {

if ( memory_map[i].used )

i++;

continue;

}

if (memory_map[i].used == 0) {

memory_map[i].start = addr;

memory_map[i].size = PAGE_SIZE;

memory_map[i].used = 1;

} else {

memory_map[i].size += PAGE_SIZE;

}

在用上述算法检测完系统的内存映射情况后，Boot Loader

也可以将内存映射的详细信息打印到串口。

3.2.3

加载内核映像和根文件系统映像

(1)

规划内存占用的布局

这里包括两个方面：(1)内核映像所占用的内存范围；(2)根文件系统所占用的内存范围。在规划内存占用的布局时，主要考虑基地址和映像的大小两个方面。

对于内核映像，一般将其拷贝到从(MEM_START＋0x8000)

这个基地址开始的大约1MB大小的内存范围内(嵌入式 Linux 的内核一般都不操过 1MB)。为什么要把从

MEM_START 到 MEM_START＋0x8000 这段 32KB 大小的内存空出来呢是因为 Linux

内核要在这段内存中放置一些全局数据结构，如：启动参数和内核页表等信息。

而对于根文件系统映像，则一般将其拷贝到

MEM_START+0x0010,0000 开始的地方。如果用 Ramdisk

作为根文件系统映像，则其解压后的大小一般是1MB。

(2)从 Flash

上拷贝

由于像 ARM 这样的嵌入式 CPU

通常都是在统一的内存地址空间中寻址 Flash 等固态存储设备的，因此从 Flash 上读取数据与从 RAM

单元中读取数据并没有什么不同。用一个简单的循环就可以完成从 Flash 设备上拷贝映像的工作：

while(count) {

*dest++ = *src++;

count -= 4;

};

3.2.4

设置内核的启动参数

应该说，在将内核映像和根文件系统映像拷贝到 RAM

空间中后，就可以准备启动 Linux 内核了。但是在调用内核之前，应该作一步准备工作，即：设置 Linux

内核的启动参数。

Linux 2.4.x 以后的内核都期望以标记列表(tagged

list)的形式来传递启动参数。启动参数标记列表以标记 ATAG_CORE 开始，以标记 ATAG_NONE

结束。个标记由标识被传递参数的 tag_header 结构以及随后的参数值数据结构来组成。数据结构 tag 和

tag_header 定义在 Linux 内核源码的include/asm/setup.h 头文件中：

#define ATAG_NONE 0x00000000

struct tag_header {

u32 size;

u32 tag;

};

……

struct tag {

struct tag_header hdr;

union {

struct tag_core core;

struct tag_mem32 mem;

struct tag_videotext videotext;

struct tag_ramdisk ramdisk;

struct tag_initrd initrd;

struct tag_serialnr serialnr;

struct tag_revision revision;

struct tag_videolfb videolfb;

struct tag_cmdline cmdline;

struct tag_acorn acorn;

struct tag_memclk memclk;

} u;

};

在嵌入式 Linux 系统中，通常需要由 Boot Loader

设置的常见启动参数有：ATAG_CORE、ATAG_MEM、ATAG_CMDLINE、ATAG_RAMDISK、ATAG_INITRD等。

比如，设置 ATAG_CORE 的代码如下：

params = (struct tag *)BOOT_PARAMS;

params->hdr.tag = ATAG_CORE;

params->hdr.size = tag_size(tag_core);

params->u.core.flags = 0;

params->u.core.pagesize = 0;

params->u.core.rootdev = 0;

params = tag_next(params);

其中，BOOT_PARAMS

表示内核启动参数在内存中的起始基地址，指针 params 是一个 struct tag 类型的指针。宏 tag_next()

将以指向当前标记的指针为参数，计算紧临当前标记的下一个标记的起始地址。注意，内核的根文件系统所在的设备ID就是在这里设置的。

下面是设置内存映射情况的示例代码：

for(i = 0; i

if(memory_map[i].used) {

params->hdr.tag = ATAG_MEM;

params->hdr.size = tag_size(tag_mem32);

params->u.mem.start = memory_map[i].start;

params->u.mem.size = memory_map[i].size;

params = tag_next(params);

}

可以看出，在

memory_map［］数组中，每一个有效的内存段都对应一个 ATAG_MEM 参数标记。

Linux

内核在启动时可以以命令行参数的形式来接收信息，利用这一点我们可以向内核提供那些内核不能自己检测的硬件参数信息，或者重载(override)内核自

己检测到的信息。比如，我们用这样一个命令行参数字符串”console=ttyS0,115200n8″来通知内核以 ttyS0

作为控制台，且串口采用

“115200bps、无奇偶校验、8位数据位”这样的设置。下面是一段设置调用内核命令行参数字符串的示例代码：

char *p;

for(p = commandline; *p == ‘ ‘; p++)

;

if(*p == ‘ ’)

return;

params->hdr.tag = ATAG_CMDLINE;

params->hdr.size = (sizeof(struct tag_header) + strlen(p) + 1 + 4) >> 2;

strcpy(params->u.cmdline.cmdline, p);

params = tag_next(params);

请注意在上述代码中，设置 tag_header

的大小时，必须包括字符串的终止符’ ’，此外还要将字节数向上圆整4个字节，因为 tag_header 结构中的size

成员表示的是字数。

下面是设置 ATAG_INITRD 的示例代码，它告诉内核在 RAM

中的什么地方可以找到 initrd 映象(压缩格式)以及它的大小：

params->hdr.tag = ATAG_INITRD2;

params->hdr.size = tag_size(tag_initrd);

params->u.initrd.start = RAMDISK_RAM_BASE;

params->u.initrd.size = INITRD_LEN;

params = tag_next(params);

下面是设置 ATAG_RAMDISK 的示例代码，它告诉内核解压后的

Ramdisk 有多大(单位是KB)：

params->hdr.tag = ATAG_RAMDISK;

params->hdr.size = tag_size(tag_ramdisk);

params->u.ramdisk.start = 0;

params->u.ramdisk.size = RAMDISK_SIZE;

params->u.ramdisk.flags = 1;

params = tag_next(params);

最后，设置 ATAG_NONE

标记，结束整个启动参数列表：

sstatic void setup_end_tag(void)

{

params->hdr.tag = ATAG_NONE;

params->hdr.size = 0;

}

3.2.5

调用内核

Boot Loader 调用 Linux

内核的方法是直接跳转到内核的第一条指令处，也即直接跳转到 MEM_START＋0x8000

地址处。在跳转时，下列条件要满足：

1． CPU 寄存器的设置：

R0＝0；

R1＝机器类型 ID；关于 Machine Type

Number，可以参见 linux/arch/arm/tools/mach-types。

R2＝启动参数标记列表在 RAM 中起始基地址；

2． CPU 模式：

必须禁止中断(IRQs和FIQs)；

CPU 必须 SVC 模式；

3． Cache 和 MMU 的设置：

MMU 必须关闭；

指令 Cache 可以打开也可以关闭；

数据 Cache 必须关闭；

如果用 C

语言，可以像下列示例代码这样来调用内核：

void (*theKernel)(int zero, int arch, u32 params_addr) =

(void (*)(int, int, u32))KERNEL_RAM_BASE;

……

theKernel(0, ARCH_NUMBER, (u32) kernel_params_start);

注意，theKernel()函数调用应该永远不返回的。如果这个调用返回，则说明出错。

在 boot loader

程序的设计与实现中，没有什么能够比从串口终端正确地收到打印信息能更令人激动了。此外，向串口终端打印信息也是一个非常重要而又有效的调试手段。但是，

我们经常会碰到串口终端显示乱码或根本没有显示的问题。造成这个问题主要有两种原因：(1) boot loader

对串口的初始化设置不正确。(2) 运行在 host

端的终端仿真程序对串口的设置不正确，这包括：波特率、奇偶校验、数据位和停止位等方面的设置。

此外，有时也会碰到这样的问题，那就是：在 boot loader

的运行过程中我们可以正确地向串口终端输出信息，但当 boot loader

启动内核后却无法看到内核的启动输出信息。对这一问题的原因可以从以下几个方面来考虑：

(1)

首先请确认你的内核在编译时配置了对串口终端的支持，并配置了正确的串口驱动程序。

(2) 你的 boot loader

对串口的初始化设置可能会和内核对串口的初始化设置不一致。此外，对于诸如 s3c44b0x 这样的 CPU，CPU

时钟频率的设置也会影响串口，因此如果 boot loader 和内核对其 CPU

时钟频率的设置不一致，也会使串口终端无法正确显示信息。

(3) 最后，还要确认 boot loader

所用的内核基地址必须和内核映像在编译时所用的运行基地址一致，尤其是对于 uClinux 而言。假设你的内核映像在编译时用的基地址是

0xc0008000，但你的 boot loader 却将它加载到 0xc0010000

处去执行，那么内核映像当然不能正确地执行了。

Boot Loader

的设计与实现是一个非常复杂的过程。如果不能从串口收到那激动人心的”uncompressing

linux……………… done, booting the

kernel……”内核启动信息，恐怕谁也不能说：”嗨，我的 boot loader 已经成功地转起来了！”。

文章知识点与官方知识档案匹配，可进一步学习相关知识CS入门技能树Linux入门初识Linux24768 人正在系统学习中相关资源：橘子快速启动软件(橘子启动器)v3.0绿色免费版-其它代码类资源…

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

uboot下能看到linux文件,从Uboot到Linux技术内幕

相关推荐