原创 PowerPC 的仿真和交叉开发

2006-8-24 12:17 5768 16 8 分类: MCU/ 嵌入式

http://www-128.ibm.com/developerworks/cn/linux/pa-emulation.html




PowerPC 的仿真和交叉开发


避免新硬件成本

developerWorks



文档选项


将此页作为电子邮件发送

将此页作为电子邮件发送

未显示需要 JavaScript 的文档选项



最新推荐



Java 应用开发源动力 - 下载免费软件,快速启动开发



级别: 初级


Hollis Blanchard, 软件开发人员, IBM


2005 年 2 月 07 日


本文为那些无法与 PowerPC 的真实硬件亲密接触的开发人员介绍 PowerPC 的仿真(emulation)和交叉编译(cross-compiling)。本文适合那些熟悉计算机体系结构、拥有基于 x86 的工作站并且有兴趣对 PowerPC 进行实验的开发人员。

有些开发人员可能没有机会亲手操作 PowerPC® Linux™ 系统(不过,您可以买一个这样的系统,在我撰写这篇文章的时候,它的价格不超过 200 美元)。对于有好奇心的 x86 Linux 用户,仿真是一种方便而又廉价的选择。现在至少有三种开源 PowerPC 仿真器,其中有两种还相当新。


精确度


有些仿真器,尤其是专业开发人员使用的那些仿真器,都是周期精确(cycle-accurate)的,也就是说,对于一个给定上下文环境下的特定指令,它在仿真器中花费的周期与它在真实硬件上运行所需的周期完全一致。这些仿真器不仅可以仿真指令集,而且还可以仿真内部的管道和处理器的缓存。在拥有实际芯片之前的开发过程中,这些仿真器特别有用。与硬件性能计数器收集到的信息相比,仿真器让开发人员可以更深入地洞悉性能瓶颈。然而,这些仿真器也有一些严重的局限性。由于它们在编制文档时对知识产权和硬件技巧有太多的要求,因此想免费查看或修改其内部结构几乎是不可能的。相反,处理器设计人员会提供一些可用的二进制文件,有时候它们是免费的,但通常只适用于非常严格的范围内的主机。对于更高级的软件开发人员来说,另一个问题是,由于他们要仿真大量的处理器内部结构,所以速度会非常慢。最后,这些仿真器可能不如真实硬件那样精确。由于速度或复杂性的原因,即使是周期精确的仿真器,也可能忽略了缓存或 IO 的仿真,从而导致有偏差的结果。在大多数情况下,这些仿真器都很接近,但也存在这样的事实,即一个仿真器在某个时候只仿真硬件,因而其行为可能会有所偏差。


这里讨论的仿真器都不是周期精确的。实际上,它们甚至还不完全是行为精确(behavior-accurate)的。(如果出现行为不精确的现象,则称之为一个 bug,这种 bug 通常最终都会得以解决。)








回页首



仿真的用户模式


对于好奇的开发人员来说,一个非常方便的特性就是用户模式仿真。如果一个仿真器只仿真处理器和 IO(例如一个网络设备),那么首先需要启动(和仿真)一个 Linux 内核,然后在此基础上启动一个仿真的应用程序。对于更重大的工作而言,这当然很重要,但是对于简单的实验,这样做要方便得多,可以避免完全处理内核。如果仿真器不仅能够仿真处理器,而且还可以仿真操作系统内核,那么对于那些不依赖很多内核服务的小程序,例如只需要使用 writeexit 系统调用的小程序,运行起来就要容易得多。


当仿真器正常地碰到一个 PowerPC 系统调用指令时,它便将指令地址存入到 SRR0 寄存器,设置 SRR1 中某些体系结构定义的位,并将控制权转交给物理地址 0xC00,从而仿真这个异常(有些 PowerPC 的变种允许对这种行为有更多的控制,但是这里的这种是传统的 PowerPC 模型)。就像在硬件上一样,仿真的内核在 0xC00 处有它自己的系统调用异常处理程序,因此内核可获得对处理器的控制。


另一方面,当一个支持用户模式仿真的仿真器碰到一个系统调用指令时,它并不是把控制转交给仿真的异常处理程序,相反,它会自己解释该系统调用。最简单的例子是像 readwrite 这样的系统调用:这两种系统调用几乎可以立即转换为仿真器作出的实际的系统调用。用于在仿真的应用程序作出的仿真系统调用与仿真器作出的实际系统调用之间进行转换的 glue 层可能还有其他的功能,例如记录仿真的应用程序作出的所有系统调用。


除了绕开构建一个用于仿真的内核和一个用于启动到其中的文件系统镜像,以及为 IO 配置虚拟网络设备的复杂性之外,这条捷径还加快了仿真的速度,因为绕开了从异常处理程序到 VFS 再到设备驱动程序的很多内核指令,而这些内核指令本来就是用来处理系统调用的。不过,很显然,不在仿真器里运行内核就意味着总体行为可能会有很大的偏差。在最坏的情况下,仿真器系统调用 glue 中出现一个 bug 就会使仿真的应用程序看上去像是充满了 bug,即使它在实际的内核上能够运行得很好也无济于事。



即时编译

通过即时编译(Just In Time,JIT)这种方法,可以动态地将解释的字节码(例如,一个仿真的指令流)翻译成本地指令。这种方法不是简单地依次解释和仿真每条指令,而是将整个指令序列转换成本地对应的指令序列,并将它们缓存起来,这样,在随后执行指令序列时,就不需要再进行翻译了。相应地,已解释代码的严格 CPU 限制循环应该可以以接近本地的速度执行,因为本地代码被保存在缓存中。另一方面,带有很少循环的代码的性能则得不到太多的改善。JIT 编译器对于 Java™ 虚拟机来说非常常见,这种编译器也可以用于提高仿真虚拟机的效率。


Qemu


Qemu 是非常新的一种仿真器,它使用动态翻译(例如 Java Just In Time (JIT) 编译器),以便获得良好的性能。在这种情况下,良好的性能大约要比本地硬件慢 4 到 10 倍,这取决于基准的不同。Qemu 支持一些不同的主机和目标,但我们只需考虑 x86 主机和 PowerPC 目标,这正好是受支持的配置。Qemu 还支持远程 GDB (GNU Debugger)连接,这对于调试非常有价值。不幸的是,qemu 不支持用户模式仿真中的 GDB 连接,只支持全系统模式中的 GDB 连接。Qemu 不支持 AltiVec™ 向量处理指令。


PearPC


PearPC 是另一种新的仿真器,它可以使用 JIT 动态翻译,但只能和 PowerPC 目标一起在 x86 主机上使用 —— 不过,本文使用的正好是这种环境。它的性能不如 qemu 好,大约要比主机系统慢 15 倍。不幸的是,PearPC 不支持用户环境,因此还需要一个内核和一个基本文件系统(Linux、Darwin 和 Mac OS X 目前都受支持)。 PearPC 不支持 GDB 连接,也不支持 AltiVec 向量处理指令(不过开发人员打算在未来版本中添加对它们的支持)。


PSIM


PSIM (PowerPC 仿真器)是 PowerPC 仿真的祖宗:它编写于 1994 年,对于当时还算新的 PowerPC 体系结构,它在 Linux 和 NetBSD 的初始端口中起辅助作用。PSIM 与 GDB 代码集成在一起,令人惊奇的是,虽然自 1996 年以后就没有人对它作进一步开发,但它至今仍被使用。通过与 GDB 集成,PSIM 还支持 GDB 连接,包括用户模式。因为早于 AltiVec 出现,所以 PSIM 不支持 AltiVec 向量处理指令。








回页首



选择仿真器


由于上述原因,本文将使用 qemu。一些常见的基本问题也适用于其他仿真器,但就本文来说,qemu 是最易于构建的。请下载和解压 qemu tarball (请参阅 参考资料),然后:


清单 1: 构建 qemu




这将产生 ./ppc-user/qemu-ppc,以后还要使用这个文件执行 PowerPC 二进制文件。








回页首



交叉编译


在交叉开发中,第二个关键组成部分是交叉编译器(cross-compiler)。交叉编译器运行在一种体系结构上,但是却产生用于另一种体系结构的二进制文件。如果像大多数嵌入式系统开发那样,部署系统相对于开发系统来说存在明显的不足,那么交叉编译可能带来很大的方便。交叉编译器不会覆盖系统的本地编译器,也不会通过任何方式与本地编译器交互。


Crosstool


构建 GNU 交叉编译器可能非常容易,取决于牵涉到的体系结构,但有时候也会出现构建中断(build break)的情况。有时可能还要求完成几个阶段的构建,以便让所有组件以正确的方式为彼此进行构建。为了消除猜测,并自动化这个过程,Dan Kegel 开发了一个非常有用的构建脚本,即 crosstool。


请下载和解压最新版本的 crosstool (请参阅 参考资料)。然后:


清单 2:构建 crosstool




这要运行一段时间,在完成时,用于交叉编译的 binutils、GCC 和 glibc 将安装在 /opt/crosstool。请查看一下那里的目录结构,并考虑将它添加到 PATH 环境变量中,这样以后便可以不用输入目录。








回页首



Hello, world


至此,我们已经构建好了一个仿真器和一个交叉编译器,现在可以将它们汇总,测试一下这个新的环境。将下面的代码放到 hello.c 中:


清单 3: 一个既熟悉又陌生的程序




现在,使用静态链接,以免担心如何将 PowerPC 共享库安装到 x86 主机系统上。要产生一个名为 "hello" 的 32-位 PowerPC ELF 可执行文件,则需要运行以下命令:


清单 4: 使用 GCC 进行交叉编译




为了检验它是否是预期的格式,可以使用以下命令:


清单 5: 检查文件类型




最后,在 qemu 下运行这个可执行文件:


清单 5: 在 qemu 下运行可执行文件




"Hello, world." 应该输出到终端。








回页首



现在打算做什么呢?


现在您可以将 C 代码构建到 PowerPC 可执行文件中,并运行它们。而且还可以用 "Introduction to PowerPC Assembly" 这篇文章中给出的示例汇编例子做实验,这篇文章列在 参考资料 一节中。(注意,您可以直接使用交叉汇编器,不过继续使用该编译器要容易得多)。如果您对这种实验已经感到满足,那么可以将目光转移到更大、更有趣的也许还包括共享库的例子上(请参阅 qemu 文档以寻求帮助,这个文档也列在 参考资料 一节中)。


64-位 PowerPC


虽然 crosstool 可以容易地产生 ppc64 toolchains,但还没有用于 64-位 PowerPC 的开源仿真器,因此您需要使用真正的硬件来做实验。当然,ppc32 可执行文件在 ppc64 硬件上同样运行得很好(但反之则不然)。








回页首



结束语


仿真器不可能与本地硬件一样快。在硬件中实现这项功能的最大原因就是为了获得速度。仿真器不可能像真实硬件一样精确,尤其是当硬件本身包含由内部组件之间细微的定时交互所触发的勘误表(errata)时,仿真器更难像真实硬件那样精确。然而,仿真器对于开发乃至通常的计算都十分有价值。作为一种商业仿真器,虚拟 PC 被大量 Macintosh,® 所有者用于运行 Windows® 应用程序。它可能不如硬件那么快,但是它更便宜,更易于维护。在开发底层操作系统代码时,仿真器让开发人员可以洞察系统的状态,从而揭露对硬件有害的 bug。实际上,在硬件开发过程中,仿真器可能是惟一可用的开发平台!


上述仿真器曾经被用于、并且目前还被用于操作系统的开发,这证明了健壮性的一些度量标准。但是,请不要停止您尝试 32 位通用寄存器的脚步,或者停止尝试让您所编写的软件支持 PowerPC 用户。有这样得天独厚的价格和方便的环境,还有什么不放心的呢?








回页首



参考资料









回页首



关于作者




Hollis Blanchard 从事 PowerPC 汇编的程序设计大约已有 6 个月的时间了。他于 2001 年毕业于卡内基-梅隆大学,之后,就致力于作为 IBM Linux 技术中心一部分的 Linux 和其他 PowerPC 项目。您可以通过 hollis@austin.ibm.com 与他联系。他从 1998 年开始学习 PowerPC 体系结构和 Linux 内核。现在,他在 IBM Linux 技术中心工作,在这里,他参与了嵌入式 PowerPC、pSeries 服务器和 x86 系统的开发。而且他还是 penguinppc.org 的核心贡献者之一。

PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
16
关闭 站长推荐上一条 /3 下一条