采用 Linux 与 DSP/BIOS RTOS 实施双 OS 信号处理技术
Ofweek 2021-10-19

  在系统性能与编程简易性之间的权衡折中是通用操作系统与实时操作系统之间的主要区分点之一。

  GPOS 倾向于提供较高程度的资源抽象,这不仅可通过支持软件模块性与资源隔离来提高应用的便携性、简化开发流程,同时还能增强系统的稳健性。这使 GPOS 成为诸如网络、用户界面以及显示管理等通用系统组件的理想选择。

  然而,该抽象需要以系统资源的精细粒度控制作为代价,以满足信号处理代码等高强度算法的计算性能要求。对于实现这种高级别的控制,开发人员通常需要采用实时操作系统 (RTOS)。

  从嵌入式信号处理角度上讲,我们通常要考虑两种类型的操作系统,即通用操作系统 Linux 与实时操作系统 DSP/BIOS。Linux 可支持更高水平的抽象技术,而 DSP/BIOS 则可提供更精细的控制。

  为了充分发挥这两种操作系统的优势,开发人员可采用系统虚拟机,这就使编程人员可在同一 DSP 处理器上同时运行 Linux 与 DSP/BIOS 系统。

  (编者注:与 Java 虚拟机等特定编程语言使用的进程虚拟机环境不同,系统虚拟机对应于实际硬件,可在相同计算环境中与其它类似实例相隔离的情况下执行完整的操作系统。)

  然而,我们要提出一个重要的问题:为什么不使用分别运行 Linux 与 DSP/BIOS 系统的 CPU+DSP 组合器件呢?毕竟,CPU 在运行用户接口控制代码等方面具有更高的效率。此外,不同的内核可避免虚拟化带来的开销。不过,在同一颗芯片上集成所有功能还是很有吸引力的,原因如下:

  其一,当今高性能 DSP 比前代 DSP 要强大得多,这样可减少控制处理周期数。其二,大多数高性能 DSP 的通用性能均比前代产品更强,从而可实现更高效的控制代码处理工作。

  如果所有功能都可集成在 DSP 上,那么其优势将更加出众。更少的芯片数量可实现更低的成本与更小的占用空间。此外,由于不再需要在耗费大量电力的处理器间数据传输,因此还可降低能耗。

 

  进度安排

 

  操作系统最常见也是最有利的一个特性就是能同时执行多个任务或多个线程。操作系统通过时间表来管理内核处理,以连续执行相关任务。

  以往,嵌入式编程人员在使用 Linux 时会担心实时性能较低的问题。不过,对 Linux 内核的最新增强显著提高了其对系统事件的响应能力,从而使其可满足各种企业与个人以及嵌入式产品的需求。

  Linux 可实现线程的时间切片以及优先次序时间安排。时间切片技术是指在所有线程之间共享处理工作周期,以确保无封锁线程。这种方法通常适用于用户接口功能,以确保在系统超载、响应较慢的情况下也不至于完全丢失用户功能。

  与此形成对比的是,优先次序线程时间安排技术则可确保系统中最高优先级线程的执行,直至该线程放弃控制为止,这时下一个最高优先级的线程即开始执行。

  Linux 内核在每次从内核到用户模式的转换时都会对可用线程的优先级进行重新评估,这就意味着内核最新评估的任何事件(如驱动程序上数据的可用性)都能立即触发新线程(调度器的时延响应时间内)的转换。由于确定了基于优先级的线程,其通常用于必须满足实时要求的信号处理应用。

  在推出 Linux 内核 2.6 版本之前,制约实时性能的主要因素是 Linux 内核会禁用中断,且禁用时间有时会长达数百毫秒。

  就此而言,我们可以提高内核实施的效率。因为在禁用中断时,代码的某些部分无需重新进入,而这会增加中断响应的时延。

  目前的 2.6 版本提供了构建选项,可在整个内核代码中以更高的频率插入中断再启用指令。Linux 社区通常将该特性称作先占内核 (preempt kernel),尽管这会让内核性能略有下降,但却能够显著提高实时性能。对于众多系统任务而言,在先占性 Linux 2.6 内核与实时线程结合使用时,将能提供足够的性能来满足实时需求。

  例如,德州仪器 (TI) 的 DSP/BIOS 以软件中断和任务的形式仅支持优先级调度。与 Linux 调度器一样,软件中断和任务都属于先占型的。但是,DSP/BIOS 也为应用编程人员提供了直接存取硬件中断的条件,该资源仅适用于 Linux 内核模式。

  直接存取硬件中断使应用编程人员可在理论上实现底层硬件所支持的最短时延响应。对控制环路等需要绝对最低时延的应用而言,这种精细粒度的硬件中断控制机制通常是一种非常重要的特性。

 

  受保护的资源访问

 

  Linux 与大多数通用操作系统的一个基本属性就是用户空间程序与所用的底层系统资源相分离。仅在工作处于监控(如内核)模式下时才允许直接访问存储器和设备外设。

  如果用户程序希望访问系统资源,那么它必须通过称作驱动器的内核模块从内核发出请求。该应用位于用户存储器空间,并将通过虚拟文件访问驱动程序。然后,虚拟文件将应用的请求转至驱动器执行的内核存储器空间。

  Linux 可提供特性极为丰富的驱动器模型,其中包括标准流媒体外设、模块存储设备以及文件系统,甚至还包括网络与基于网络的文件系统。

  驱动器与用户空间应用的分离可实现高度的稳健性。此外,通用驱动器接口上的抽象水平使其便于将数据流传输给串行端口、闪存文件系统或网络共享文件夹,且仅需对底层应用代码稍作更改。

  然而,实现这种灵活性需要付出代价。应用与物理资源的严格分离会加大开销。如果用户空间程序要访问设备外设,则内核模式必须进行环境交换才能处理该请求。

  由于数据是成块访问,而非逐个样本 (sample-by-sample) 访问,因此通常来说这不会造成太大的局限性。这样,内核模式下每次块访问仅需进行一次环境交换即可。

  但是,在某些情况下,应用代码需与物理硬件严格匹配。如果使用 DSP 等对数据吞吐量要求较高且不能容忍停顿的高性能处理器时,通常就会出现此类情况。这时,内核空间的物理资源与用户空间的应用相分离的做法就可能会严重影响系统性能。

 

  应用与硬件的匹配

 

  我们不妨使用 TMS320DM643x 处理器架构来研究在执行块视频处理时会遇到的典型情况,该架构采用一个 600 MHz / 4800 MIPS DSP 处理内核以及诸如功能丰富的视频端口子系统等各种多媒体外设。这种硬件通常用于将输入视频流进行 H.264 格式压缩。

  为了充分发挥 DSP 内核的处理能力,处理的数据应从周期操作内部存储器读取,而不是从速度较慢的外部存储器读取。尽管在技术上可以让具有足够快的片上存储器的处理器存储一个或多个完整的视频帧,但这种技术对大多数目标市场来说成本太高。因此,采用可提供 80 KB 的单周期操作片上数据存储器的处理器取而代之。

  80 KB 虽然小,不能存储完整的视频帧,但 TI 通过模拟检测认为,这样的存储量足够为 H.264与其它视频处理算法提供最佳的面积/性能综合比。

  DSP 通过直接存储器存取 (DMA) 控制器为该存储器提供数据,这种控制器还可用于内外部存储器之间高效传输数据子块,而不会占用处理器内核的周期操作(见以下图 1)。

  图 1. DSP 处理器采用DMA 硬件将外部存储器中较小的视频帧子块传输到内部存储器中,以供 DSP内核进行处理。

 

  

  图1. DSP 处理器采用 DMA 硬件将外部存储器中较小的视频帧子块传输到内部存储器中,以供 DSP内核进行处理。

 

  从整体系统的角度来说,这种方法可提供几乎相当于具有整个视频缓冲器的芯片所提供的性能,但成本却非常低。不过,为了实现这样的高性能,就需要应用、操作系统以及底层存储器与 DMA 硬件之间的紧密配合。

  首先,应用必须能够区别快速内部存储器与大容量外部存储器。其次,应用必须能够执行许多时间精确的小型 DMA 操作。由于访问 DMA 时发生的所有时延在 DMA 访问每个视频帧时都会放大数百倍乃至数千倍,因而在 Linux 驱动程序模型内高效实现 DMA 操作虽非不可能,但也极为困难。

  这种方法的实际实施可通过 DSP/BIOS 完成,并提供原生 API 来实现应用对内外部存储器的请求,同时也使应用可直接访问 DMA 寄存器,不会产生环境交换损失。

 

  两种操作系统的优势结合

 

  尽管众多多媒体应用的大部分处理器周期操作都用来进行信号处理,但能满足消费需求的产品同时还必须执行许多更高级的功能,如用户界面、显示功能、网络以及文件处理等。

  由于上述特性对时间要求不高,因此无需精确控制 DSP/BIOS。这时,Linux驱动程序模型所提供的资源提取功能就可更好地提高灵活性,缩短开发时间,更不用说可获得 Linux 社区丰富的开源应用代码支持了。

  可使 Linux 与 DSP BIOS 操作系统同时运行在同一设备上的解决方案,就是需要使用虚拟程序 (virtualizer) 为系统开发或集成人员提供这两种操作系统的优势(见图 2)。

 

  

  图 2. Linux 和 DSP/BIOS 同时运行在 DM643x DSP 器件上

 

  虚拟程序作为快速、可预测的交换机可在 Linux 与 DSP/BIOS 操作系统之间实现 DSP 资源。当接收到中断时对 DSP/BIOS 操作系统环境做出推测性交换,从而确保 DSP/BIOS 线程的最佳性能。

  如果新到达的中断对应于 DSP/BIOS 环境中已识别的事件,那么将在已经加载且准备运行的 DSP/BIOS 环境中对其进行处理。

  在虚拟程序支持 DSP/BIOS 的同时,应用可直接访问所需的系统资源,且不会影响(挂起)Linux 环境中保持的用户与内核空间。

  一旦应用完成 DSP/BIOS 环境下的高性能信号处理计算,虚拟机就将强制转回到 Linux环境,以便访问该环境下的更高级特性。

  在虚拟程序的调节下,操作系统之间的交换时间不到 10 微秒,这使编程人员能达到实时性能要求,相对于只包含 DSP/BIOS 的原生系统而言,性能上也没什么损失。该解决方案对典型多媒体设备的处理资源占用仅约 1.5%。

 

  双操作系统的更多优势

 

  或许为了支持 DSP/BIOS 操作系统对基于 Linux 的产品进行扩展的最明显优势之一:无需移植就可使用成百上千种第三方的相关算法。由于符合 xDAIS 标准,因此可确保第三方算法无缝集成于 DSP/BIOS 环境中。

  为了支持 DSP/BIOS 操作系统对基于 Linux 的系统进行扩展的另一个优势:在 DSP/BIOS 环境下执行应用不受 Linux 内核 GNU 通用公共许可证 (GPL) 的限制。

  在实施基于 Linux 的解决方案时,我们有时不是很清楚开发商推出的独特软件知识产权在许可证方面到底有哪些具体要求。通过在 DSP/BIOS 而非 Linux 操作环境下执行 IP,可以避免这方面的法律问题。

 

  结论

 

  使用本文介绍的技术,Linux 与 DSP BIOS 可同时运行在统一的 DSP 内核上,这既能够提供 Linux 解决方案的全部功能,又可确保 DSP/BIOS 环境下的高精度与硬件控制。

  编程人员可充分利用适用于 Linux 的应用代码与适用于 DSP/BIOS的信号处理代码,无需针对不同环境进行移植。

  对要在实时嵌入式应用中采用 Linux 特性的设计人员而言,通过虚拟程序升级、同时获得 DSP BIOS 工具套件,将大幅提高信号处理性能,并可显著节省系统资源的成本。 

声明: 本文转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们及时删除。(联系我们,邮箱:evan.li@aspencore.com )
0
评论
热门推荐
  • 相关技术文库
  • 单片机
  • 嵌入式
  • MCU
  • STM
  • ARM Cortex系列处理器知识点汇总

    最近因为要为芯片选定核,所以就在了解哪些核合适且性价比好,这是一个需要结合产品各类技术、市场分析的活,看似简单却还是需要一些储备的,今天选了一篇ARM Cortex系列的科普文章与大家分享。 众所周知,英国的ARM公司是嵌入式微处理器世界当中的佼佼者。AR

    05-11
  • 你的CPU属于哈佛结构还是冯诺依曼结构?

    现代的CPU基本上归为冯诺伊曼结构(也称普林斯顿结构)和哈佛结构。 冯洛伊曼结构就是我们所说的X86架构,而哈佛结构就是ARM架构。一个广泛用于桌面端(台式/笔记本/服务器/工作站等),一个雄踞移动领域,我们的手持设备(平板\手机用的大多就是他了)。 01

    05-10
  • 如何批量修改MCU封装管脚定义

    在做产品开发时,为了缩短研发周期,我们一般都是直接找来参考设计做参考。这些参考资料要么是来自原厂的,要么是来自方案商的。  接触过这么多的参考设计资料,发现大部分的资料都有一个通病,就是不少MCU的PIN脚定义都只是标出IO口的定义,其它复用​​​​功能

    05-08
  • MCU为什么要消抖动

    简单的说,进入了电子,不管是学纯模拟,还是学单片机,DSP、ARM等处理器,或者是我们的FPGA,一般没有不用到按键的地方。按键:人机交互控制,主要用于对系统的控制,信号的释放等。因此在这里,FPGA上应用的按键消抖动,也不得不讲! 一、为什么要消抖动 在

    05-07
  • 51单片机的ISP下载知识

    本文详细介绍了串口、51单片机的ISP下载等基础知识,已经学过单片机的也可以看看,加强一下对这方面的了解。 串口 串行接口简称串口,也称串行通信接口,是采用串行通信方式的扩展接口。 我们比较熟悉的USB接口,全名通用串行总线(Universal Serial BUS),就

    05-06
  • 硬件开发如何选择合适的MCU

    点击上方关注我们! 我在做硬件开发时,如果遇到的是一个新产品,新项目,之前没有做过的,没有任何的经验,在选MCU时,我一般是这样操作的。 首先,根据产品的需求,整理出一份硬件规格。比如,电源管理,传感器接口,人机交互接口等。 然后,整理出整个原理

    05-06
  • 单片机的功耗怎么算的?

    单片机的功耗是非常难算的,而且在高温下,单片机的功耗还是一个特别重要的参数。暂且把单片机的功耗按照下面的划分。 暂且把单片机的功耗按照下面的划分。 1.内部功耗(与频率有关) 2.数字输入输出口功耗 2.1输入口 2.2输出高 2.3输出低 3.模拟输入口功耗从

    05-07
  • 嵌入式工程师必备工具:I2C和SPI总线协议

    IIC vs SPI 现今,在低端数字通信应用领域,我们随处可见IIC (Inter-Integrated Circuit) 和 SPI (Serial Peripheral Interface)的身影。原因是这两种通信协议非常适合近距离低速芯片间通信。Philips(for IIC)和Motorola(for SPI) 出于不同背景和市场需求

    04-30
  • 嵌入式面试注意事项

    找工作也是一门技能,有的人很快就找到自己喜欢的工作,有的人找了很久也没找到合适的工作。 下面给大家分享几点找工作过程中存在的“潜规则”内容。 1、面试的本质不是考试,而是告诉面试官你会做什么 经验不够的小伙伴特别容易犯的一个错误,不清楚面试官到

    04-29
  • 为什么需要RTOS?

    很多单片机初学者都是从裸机开始的,裸机确实也能开发出好的产品,但作为一个嵌入式软件工程师,如果只能用裸机开发产品,那肯定是不够的。 要从裸机的思维转变到RTOS的思维,其实需要一个过程,而且开始的一段时间会很痛苦。但过一段时间理解了一些内容,能

    04-28
  • 使用RTOS的8个理由

    嵌入式系统中,有很多方式实现任务调度。功能有限的小系统中,无限循环足够实现系统功能。当软件设计变得庞大且复杂时,设计师应该考虑使用实时操作系统。 下面给大家分享使用RTOS的8个理由: 1.硬实时响应 基于优先级抢占的RTOS,根据任务的实时需求,执行优

    04-26
  • 单片机延时程序,Keil C编译器实现

    应用单片机的时候,经常会遇到需要短时间延时的情况。需要的延时时间很短,一般都是几十到几百微妙(us)。有时候还需要很高的精度,比如用单片机驱动 DS18B20的时候,误差容许的范围在十几us以内,不然很容易出错。这种情况下,用计时器往往有点小题大做。而

    04-26
下载排行榜
更多
广告
X
广告