iMX8M-如何使用-有什么中文资料面包板社区

相关博文

NXP i.MX8M Plus 芯片解析功能性能介绍

热度 5

COLOERFUL

2021-9-30 21:11

1313 次阅读|

0 个评论

NXP发布了的一处理器，一经问世便备受瞩目，这便是i.MX系列处理器中首款集成专用神经处理引擎（NPU）的i.MX 8M Plus。NXP官方给这颗处理器的定位是“能够在工业和物联网等领域实现边缘端高级机器学习推理”，而在NXP后续的相关宣传中，也着重强调了i.MX 8M Plus处理器能够实现面向工业边缘、涉及机器学习和智能视觉相关的应用。然而，实际情况是i.MX 8M Plus的产品与行业适用性不仅限于此，它的强大性能和配置在诸如智慧医疗、智能交通以及工业自动化等领域都可发挥出最大价值。毫无疑问，这款集成了NPU（且算力高达2.3TOPS）、双千兆以太网、两个集成MIPI CSI摄像头接口和双摄像头图像信号处理器(ISP)，并支持三屏异显、HiFi语音及其他多媒体功能的处理器，必将在风起云涌的嵌入式ARM市场占据一席之地。 NXP消费和工业市场i.MX应用处理器副总裁兼总经理Martyn Humphries曾表示：“在‘智慧’边缘转变为‘智能’边缘的过程中, i.MX 8M Plus是重要的里程碑式产品，它将成为处理解决方案的潮流引领者。”这种底气并非空穴来风，还是归结于i.MX 8M Plus的强大。下面就让我们来深入了解一下i.MX 8M Plus。i.MX 8M Plus采用先进的14nm LPC FinFET工艺技术，可同时执行多个高度复杂的神经网络，如多对象识别、超过40000个英语单词的语音识别和医疗成像。强大的NPU能够处理Mobilenet，这是一种热门的图像分类网络，分类速度超过每秒500个图像工程师可将机器学习推理功能的负载转移到NPU，让高性能Cortex-A和Cortex-M内核、DSP和GPU执行其他系统级或用户应用任务。视觉部分集成了双ISP，并支持高动态范围（HDR）和鱼眼镜头校正。ISP支持两个用于实现实时立体视觉的高清摄像头或单个12兆像素分辨率摄像头。这些功能为监控、智能零售应用、机器人视觉和家居健康监测仪等实时图像处理应用提供支持。为支持语音应用，i.MX 8M Plus集成了高性能HiFi 4 DSP，通过对语音流进行预处理和后处理来增强自然语言处理性能。这一点对于需要保障视频通讯质量的应用场合，如医疗上的远程诊疗系统，具有非常明显的优势。在工业应用上，i.MX 8M Plus能够提高工业生产力和自动化，可检测、测量、精确识别对象并通过准确检测机器操作异常情况实现对设备的预测性维护。此外，通过将准确的人脸识别、语音/命令识别和手势识别相结合，工厂人机界面可以更直观、更安全。i.MX 8M Plus支持工业4.0 IT/OT融合，将千兆以太网与时间敏感型网络（TSN）相集成，结合Arm Cortex M7实时处理功能，提供确定性有线网络连接和处理。更加令人振奋的是，i.MX 8M Plus供货周期将长达15年，这对于长生命周期的产品用户来说非常重要。值得一提的是，i.MX 8M Plus应用处理器中集成的新IP（例如NPU和ISP）虽然很强大，但同时也可能会给工程师带来开发上的挑战。虽然很多工程师有能力解决这些难题，但由此增加的复杂性无疑会给项目期限带来更多压力。因此，作为NXP官方金牌合作伙伴，飞凌嵌入式与NXP深入合作，推出了基于i.MX 8M Plus处理器的开发套件OKMX8MP-C开发板与FETMX8MP-C核心板，协力解决工程师使用i.MX 8M Plus开发产品的痛点，助力客户缩短产品上市时间。凭借成熟的OKMX8MP-C开发板与FETMX8MP-C核心板，工程师可以大大减少在原理图设计和产品板卡布局以及系统移植和调试上所用的时间，并提升产品的稳定性，降低生产难度。
NXP iMX8 ARM平台Distro Boot使用

热度 11

hai.qin_651820742

2021-9-13 10:24

2633 次阅读|

0 个评论

B y Toradex 秦海 1). 简介 ARM 嵌入式平台由于其分散性，不同 SoC 厂商通常都采用互不相同的方式来引导启动系统，这就导致了针对嵌入式 ARM 平台的系统发行版本也需要根据不同硬件 SoC 平台进行针对性定制，而不像 X 86 平台（如 BIOS 或 UEFI ）或者 6 4 -bit ARM 服务器平台（如 SBSA 或 SBBR ）这样采用标准化的启动引导流程，因此通用桌面级系统发行版本比如 SUSE 、 Redhat 或 Fedora 就很难持续稳定的支持各种嵌入式 ARM 平台，反而趋势是各个硬件供应商自己定制发布针对自己硬件的系统发布版本（如 Raspbian ， Bananian ， Parabuntu ）来绑定用户。 Distro Boot 的标准名称是 Generic Distro Configuration Concept ，项目由 U-boot 开发者始于 2 014 年左右，目标就是试图用一个标准方法去引导启动不同硬件平台。当在 U-boot 中打开 Distro Boot 支持后，只需要将任意支持的系统发布版本镜像文件和一个符合 Distro Boot 定义的启动配置文件放置于一个分区的可移动设备即可引导设备启动进入系统。本文就基于 NXP 最新的 iMX 8 SoC （基于 Cortex-A 72 + A53 和 Coretex -M4 架构） ARM 平台来测试使用 Distro Boot 机制来引导系统镜像。演示平台来自于 Toradex 基于 iMX 8 QM 的 Apalis iMX 8 QM ARM 嵌入式模块平台。需要注意的是，由于不同 U-boot/Linux kernel 版本的兼容性以及 iMX8 ARM 处理器增加的底层 SECO/SCFW 固件的存在，可能导致本文测试的内容在其他 BSP 版本上面无法正常工作，本文仅基于当前测试环境进行 distro boot 的功能演示参考。 2 ) . 准备 a). Apalis iMX8QM 4 GB WB IT ARM 核心版配合 Ioxra 载板，连接调试串口 UART1 （载板 X2 2 ）到开发主机方便调试。 b ). 参考这里更新 Toradex Ycoto Linux BSP V5.3 版本 BSP image ， BSP 中包含的 U-boot 默认以及支持 Distro boot 。 c). 需要通过 U-boot distro boot 启动的 BSP image ，需要包含一个启动配置文件，通常为 extlinux.conf 或者 U-boot 专用的 boot.scr/boot.scr.uimg 文件，关于配置文件的说明请参考这里。 3). Distro boot 启动顺序 a). 默认情况下， U-boot （ Distro boot 支持）会按照如下顺序扫描启动配置文件 extlinux.conf 或者 boot.scr/boot.scr.uimg ./ 外部 SD 卡设备 ./ 内部 eMMC 存储设备 ./ 外部 USB 存储设备 ./ 外部网络设备 b). 默认扫描顺序和扫描位置由如下 U-boot 环境变量决定，如有需要可以自行修改 ------------------------------------ ### default boot devices sequence boot_targets=mmc1 mmc2 mmc0 usb0 dhcp ### boot partition scanning location boot_prefixes=/ /boot/ boot_script_dhcp=boot.scr boot_scripts=boot.scr boot_syslinux_conf=extlinux/extlinux.conf ------------------------------------ 4 ). 通过外部存储介质加载 Toradex Easy Installer 测试 a). Toradex Easy Installer 是 Toradex 提供的一个基于 Linux/QT 开发的图形界面工具，用于将不同类型的操作系统方便直观的安装到 Toradex 计算机模块的内部 eMMC 存储上面。 b). 在更新了 Linux BSP 之后， Toradex Easy Installer 即被擦除，如果想重新更新 Linux 或者其他操作系统，就需要重新将 Toradex easy installer 加载运行，官方支持的方式是参考这里通过恢复模式操作，而基于当前 Toradex Easy Installer V5.3 版本配合 Ycoto Linux V5.x 版本，可以实现通过外部存储介质（ SD 卡或者 U 盘）在 U-boot 环境下直接加载 Toradex Easy Installer 运行而无需配置恢复模式。 c ). 测试流程 ./ 从这里下载对应 Apalis iMX8 模块的 Toradex Easy Installer V5.3 版本 image 压缩包 ./ 解压压缩包，可以看到里面以及包含 distro boot 所需要的启动文件 boot-tezi.scr ，将其更名为 boot.scr 。然后将文件复制到外部存储介质 / 目录或者 /boot 目录。 ------------------------------------ $ unzip Apalis-iMX8_ToradexEasyInstaller_5.3.0+build.3.zip $ cd Apalis-iMX8_ToradexEasyInstaller_5.3.0+build.3/ $ ls boot-tezi.scr image.json overlays.txt recovery-linux.sh tezi.itb u-boot.bin hdmitxfw.bin imx-boot recovery recovery-windows.bat tezi.png wrapup.sh $ mv boot-tezi.scr boot.scr $ cp * /media/simon/ ------------------------------------ ./ 将上述准备好的外部存储介质连接到 Ixora 载板对应接口， Apalis iMX8 开机从调试串口进入 U-boot 命令行，执行下面命令启动外部存储介质的 Toradex Easy Installer ，启动后即可从调试串口看到启动信息，以及连接的显示器看到 Toradex Easy Installer 应用界面。 ------------------------------------ ### external SD storage depending on corresponding SD slot # run bootcmd_mmc1 or run bootcmd_mmc2 ### external USB stick # run bootcmd_usb0 ------------------------------------ ./ 如上述章节 3 描述的默认启动扫描顺序，如果是外部 SD 卡则即使不中断或改动 U-boot 的启动，只要具备 boot.scr 文件的 SD 卡设备插入，就会优先从外部 SD 卡启动，而对于 U 盘，如果需要自动启动，则需要修改 U-boot 环境变量，将 USB 设备扫描顺序提前。 ------------------------------------ # setenv boot_targets 'usb0 mmc1 mmc2 mmc0 dhcp' && saveen v ------------------------------------ 5 ). 通过外部存储介质加载 Ycoto Linux BSP 测试 a). 首先准备一个足够容量的 SD 卡或者 U 盘，本文测试使用一个 16GB 的 Mciro SD 卡 b). 在 Ubuntu PC 下通过 fdisk 命令在目标 SD 卡上面制作如下两个分区 ------------------------------------ Disk /dev/sdc ： 14.9 GiB ， 15931539456 字节， 31116288 个扇区单元：扇区 / 1 * 512 = 512 字节扇区大小 ( 逻辑 / 物理 ) ： 512 字节 / 512 字节 I/O 大小 ( 最小 / 最佳 ) ： 512 字节 / 512 字节磁盘标签类型： dos 磁盘标识符： 0x8a42d42a 设备启动起点末尾扇区大小 Id 类型 /dev/sdc1 2048 8390655 8388608 4G c W95 FAT32 (LBA) /dev/sdc2 8390656 31116287 22725632 10.9G 83 Linux ------------------------------------ c). 然后通过如下命令分别格式化两个分区， FAT32 分区用于存放 kernel 、 device tree 等基本 boot 文件， linux ext3 分区用于存放 rootfs 文件 ------------------------------------ $ sudo mkfs.vfat -F 32 -n boot /dev/sdc1 $ sudo mkfs.ext3 -L rootfs /dev/sdc2 ------------------------------------ d). 从这里下载适用于 Apalis iMX8 的 Ycoto Linux Multimedia Demo image ，然后解压，并分别将 Image 里面的 boot 文件和 rootfs 解压到刚才制作好的 SD 卡两个分区。 Image boot 文件中已经包含了 boot.scr 文件，无需手动创建。 ------------------------------------ ### 解压缩 image $ tar xvf Apalis-iMX8_Reference-Multimedia-Image-Tezi_5.3.0+build.10.tar ### 解压缩 bootfs 、 rootfs 到 SD 卡 $ cd Apalis-iMX8_Reference-Multimedia-Image-Tezi_5.3.0+build.10/ $ sudo tar xf Reference-Multimedia-Image-apalis-imx8.bootfs.tar.xz --no-same-owner -C /media/simon/boot/ $ sudo tar xf Reference-Multimedia-Image-apalis-imx8.tar.xz -C /media/simon/rootfs/ ------------------------------------ e). 制作完成后将 SD 卡插入 Ixora 载板 X10 插槽，启动模块，进入 uboot 命令行，执行下面命令通过 SD 卡启动 ------------------------------------ ### U-boot boot command from external SD cark Apalis iMX8 # run bootcmd_mmc1 ... ### agter booting, check current boot device is indeed external SD devcie - /dev/mmcblk1 root@apalis-imx8:~# df -h Filesystem Size Used Avail Use% Mounted on /dev/root 11G 1.1G 9.1G 11% / devtmpfs 1.4G 4.0K 1.4G 1% /dev tmpfs 1.9G 0 1.9G 0% /dev/shm tmpfs 1.9G 6.6M 1.9G 1% /run tmpfs 1.9G 0 1.9G 0% /sys/fs/cgroup tmpfs 1.9G 844K 1.9G 1% /tmp tmpfs 1.9G 24K 1.9G 1% /var/volatile /dev/mmcblk0p1 48M 11M 37M 23% /media/mmcblk0p1 /dev/mmcblk0p2 15G 1.1G 13G 8% /media/mmcblk0p2 /dev/mmcblk1p1 4.0G 11M 4.0G 1% /boot ------------------------------------ f). 另外，如果需要定制 boot 流程，可以参考这里说明修改 boot.scr 文件。 G). 类似的思路，也可以通过创建 TFTP/NFS 服务器实现网络启动，具体可以参考这里说明。 6 ). 总结本文测试了基于 NXP iMX 8 平台通过 Distro Boot 功能实现通过外部存储设备启动的方案，另外也可以延申到 TFTP/NFS 网络启动。不过由于 Distro Boot 功能兼容性和底层 firmware 以及 uboot/kernel 版本息息相关，因此本文测试仅限于当前测试平台和版本，不代表未来软件发生变化后相关功能还一定确认完整。参考文献 https://developer.toradex.cn/knowledge-base/distro-boot-linux https://developer.toradex.cn/knowledge-base/boot-from-sd-usb-sata https://developer.toradex.cn/knowledge-base/boot-from-a-tftpnfs-server
NXP iMX8系列处理器核心性能对比测试

热度 4

hai.qin_651820742

2021-8-31 16:45

3124 次阅读|

1 个评论

B y Toradex 秦海 1). 简介 NXP iMX8 系列 ARM 处理器是 NXP 近几年新发布的产品，架构均升级到了 64bit 的 ARMv8 ，其中包含了 iMX8 ， iMX8x ， iMX8M Mini ， iMX8M Plus 等一系列处理器，其基本参数属性的对比可以参考下面来自于 NXP 官网的表格，而本文就从 CPU 核心、 GPU 核心、内存性能等几个方面对于 iMX8 系列的不同产品做一个简单对比测试供参考。需要注意的是 Benchmark 测试无法做到绝对完整客观，通常和软硬件系统配置以及所采用的 Benchmark 工具有很大的相关性，不同配置或工具可能得出不同结论，因此本文的测试只是基于本文测试环境以及所用 Benchmark 工具的参考数据。本文所采用的全部测试平台均来自于 Toradex iMX8 系列 ARM 核心板和对应载板。 2). 准备 a). Apalis iMX8QM 4 GB WB IT ARM 核心版配合 Ioxra 载板，连接调试串口 UART1 （载板 X2 2 ）到开发主机方便调试。 b). Colibri iMX8QXP 2GB WB IT ARM 核心板配合 Colibri Evaluation Board 载板，连接调试串口 UART1 （载板 X2 7 ）到开发主机方便调试。 c). Verdin iMX8M Mini Quad 2GB WB IT ARM 核心板配合 Verdin Development Board 载板，连接调试串口 UART1 （载板 X66 ）到开发主机方便调试。 d). Verdin iMX8M Plus Quad 4GB WB IT ARM 核心板配合 Verdin Development Board 载板，连接调试串口 UART1 （载板 X66 ）到开发主机方便调试。 3). 预设软件测试环境 a). 所有测试模块均更新为 Toradex Ycoto Linux Reference Multimedia Image 5.3.0 Quarterly 版本。 b ). 参考这里的说明在 Linux 下将所有测试模块的 CPU 核心工作模式设置为 ” performance ” ，也就是持续运行在最高主频。 ------------------------------- /sys/devices/system/cpu/ /cpufreq/scaling_governor ------------------------------- 4 ). CPU 单核性能对比测试 a ). 测试工具软件 nbench ，测试 Linux BSP 自带 b ). 测试方法 ------------------------------- ### 进入 /usr/bin 目录，因为测试需要 NNET.DAT 这个文件 $ cd /usr/bin ### 对于 Apalis iMX8QM ，分别测试 A72 核心和 A53 核心 $ taskset -c 4,5 nbench && taskset -c 0-3 nbench ### 对于其他模块 $ nbench ------------------------------- c ). 测试结果 ./ Apalis iMX8QM A72 ------------------------------- root@apalis-imx8:/usr/bin# taskset -c 4,5 nbench BYTEmark* Native Mode Benchmark ver. 2 (10/95) Index-split by Andrew D. Balsa (11/97) Linux/Unix* port by Uwe F. Mayer (12/96,11/97) TEST : Iterations/sec. : Old Index : New Index : : Pentium 90* : AMD K6/233* --------------------:------------------:-------------:------------ NUMERIC SORT : 695.3 : 17.83 : 5.86 STRING SORT : 345.36 : 154.32 : 23.89 BITFIELD : 2.2166e+08 : 38.02 : 7.94 FP EMULATION : 198.55 : 95.27 : 21.98 FOURIER : 47074 : 53.54 : 30.07 ASSIGNMENT : 23.827 : 90.67 : 23.52 IDEA : 6381.3 : 97.60 : 28.98 HUFFMAN : 1921.2 : 53.27 : 17.01 NEURAL NET : 19.353 : 31.09 : 13.08 LU DECOMPOSITION : 1125.2 : 58.29 : 42.09 ==========================ORIGINAL BYTEMARK RESULTS========================== INTEGER INDEX : 64.608 FLOATING-POINT INDEX: 45.949 Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0 ------------------------------- ./ Apalis iMX8QM A53 ------------------------------- root@apalis-imx8:/usr/bin# taskset -c 0-3 nbench BYTEmark* Native Mode Benchmark ver. 2 (10/95) Index-split by Andrew D. Balsa (11/97) Linux/Unix* port by Uwe F. Mayer (12/96,11/97) TEST : Iterations/sec. : Old Index : New Index : : Pentium 90* : AMD K6/233* --------------------:------------------:-------------:------------ NUMERIC SORT : 432.04 : 11.08 : 3.64 STRING SORT : 142.03 : 63.46 : 9.82 BITFIELD : 1.8588e+08 : 31.88 : 6.66 FP EMULATION : 94.362 : 45.28 : 10.45 FOURIER : 19599 : 22.29 : 12.52 ASSIGNMENT : 11.424 : 43.47 : 11.28 IDEA : 2943.3 : 45.02 : 13.37 HUFFMAN : 998.72 : 27.69 : 8.84 NEURAL NET : 6.9556 : 11.17 : 4.70 LU DECOMPOSITION : 462.88 : 23.98 : 17.32 ==========================ORIGINAL BYTEMARK RESULTS========================== INTEGER INDEX : 34.226 FLOATING-POINT INDEX: 18.143 Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0 ------------------------------- ./ Colibri iMX8X A35 ------------------------------- TEST : Iterations/sec. : Old Index : New Index : : Pentium 90* : AMD K6/233* --------------------:------------------:-------------:------------ NUMERIC SORT : 370.76 : 9.51 : 3.12 STRING SORT : 103.29 : 46.15 : 7.14 BITFIELD : 1.3321e+08 : 22.85 : 4.77 FP EMULATION : 70.273 : 33.72 : 7.78 FOURIER : 16962 : 19.29 : 10.83 ASSIGNMENT : 9.5353 : 36.28 : 9.41 IDEA : 2319.5 : 35.48 : 10.53 HUFFMAN : 814.55 : 22.59 : 7.21 NEURAL NET : 5.9326 : 9.53 : 4.01 LU DECOMPOSITION : 408.75 : 21.18 : 15.29 ==========================ORIGINAL BYTEMARK RESULTS========================== INTEGER INDEX : 26.762 FLOATING-POINT INDEX: 15.731 Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0 ------------------------------- ./ Verdin iMX8M Mini A53 ------------------------------- TEST : Iterations/sec. : Old Index : New Index : : Pentium 90* : AMD K6/233* --------------------:------------------:-------------:------------ NUMERIC SORT : 576.19 : 14.78 : 4.85 STRING SORT : 189.54 : 84.69 : 13.11 BITFIELD : 2.4316e+08 : 41.71 : 8.71 FP EMULATION : 125.9 : 60.41 : 13.94 FOURIER : 26154 : 29.74 : 16.71 ASSIGNMENT : 15.263 : 58.08 : 15.06 IDEA : 3927 : 60.06 : 17.83 HUFFMAN : 1332.7 : 36.96 : 11.80 NEURAL NET : 9.2744 : 14.90 : 6.27 LU DECOMPOSITION : 621.37 : 32.19 : 23.24 ==========================ORIGINAL BYTEMARK RESULTS========================== INTEGER INDEX : 45.545 FLOATING-POINT INDEX: 24.252 Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0 ------------------------------- ./ Verdin iMX8M Plus A53 ------------------------------- TEST : Iterations/sec. : Old Index : New Index : : Pentium 90* : AMD K6/233* --------------------:------------------:-------------:------------ NUMERIC SORT : 576.66 : 14.79 : 4.86 STRING SORT : 189.55 : 84.69 : 13.11 BITFIELD : 2.429e+08 : 41.67 : 8.70 FP EMULATION : 125.89 : 60.41 : 13.94 FOURIER : 26154 : 29.74 : 16.71 ASSIGNMENT : 15.209 : 57.87 : 15.01 IDEA : 3927.1 : 60.06 : 17.83 HUFFMAN : 1332.7 : 36.96 : 11.80 NEURAL NET : 9.2744 : 14.90 : 6.27 LU DECOMPOSITION : 615.61 : 31.89 : 23.03 ==========================ORIGINAL BYTEMARK RESULTS========================== INTEGER INDEX : 45.520 FLOATING-POINT INDEX: 24.177 Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0 ------------------------------- d ). 测试结果图表展示 5 ). CPU 多核性能对比测试一 a ). 测试工具软件 7zip ，需通过 Ycoto 环境编译 ------------------------------- ### option-1 IPK package ### ### on compiling server $ bitbake p7zip $ scp deploy/ipk/aarch64/p7zip_16.02-r0_aarch64.ipk root@ :/home/root/ ### on target device $ cd /home/root && opkg install p7zip_16.02-r0_aarch64.ipk ### option-2 modify conf/local.conf to include 7zip into image IMAGE_INSTALL_append = " p7zip " ------------------------------- b ). 测试方法 ------------------------------- ### 为了将多核尽可能满负荷， benchmark threads 数量设置根据 memory 容量 1.5 或者 2 倍于设备 CPU 核心数 ### 对于 Apalis iMX8QM $ 7z b -mmt12 ### 对于其他模块 $ 7z b -mmt6 ------------------------------- c ). 测试结果 ./ Apalis iMX8 2xA72+4xA53 ------------------------------- root@apalis-imx8:~# 7z b -mmt12 7-Zip (a) 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21 p7zip Version 16.02 (locale=C,Utf16=off,HugeFiles=on,64 bits,6 CPUs LE) LE CPU Freq: - - - - - - - - - RAM size: 3713 MB, # CPU hardware threads: 6 RAM usage: 2647 MB, # Benchmark threads: 12 Compressing | Decompressing Dict Speed Usage R/U Rating | Speed Usage R/U Rating KiB/s % MIPS MIPS | KiB/s % MIPS MIPS 22: 4431 528 817 4311 | 85954 583 1257 7331 23: 4342 540 819 4424 | 84676 586 1251 7326 24: 4534 576 846 4876 | 83469 588 1246 7326 25: 4478 580 882 5114 | 82760 591 1247 7365 ---------------------------------- | ------------------------------ Avr: 556 841 4681 | 587 1250 7337 Tot: 571 1046 6009 ------------------------------- ./ Colibri iMX8X 4xA35 ------------------------------- root@colibri-imx8x:~# 7z b -mmt6 7-Zip (a) 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21 p7zip Version 16.02 (locale=C,Utf16=off,HugeFiles=on,64 bits,4 CPUs LE) LE CPU Freq: 64000000 - - - - - - - - RAM size: 1775 MB, # CPU hardware threads: 4 RAM usage: 1323 MB, # Benchmark threads: 6 Compressing | Decompressing Dict Speed Usage R/U Rating | Speed Usage R/U Rating KiB/s % MIPS MIPS | KiB/s % MIPS MIPS 22: 1885 362 506 1835 | 35207 359 837 3003 23: 1860 364 521 1896 | 36510 377 838 3159 24: 1890 378 538 2033 | 35043 368 836 3076 25: 1870 378 566 2136 | 33807 359 838 3009 ---------------------------------- | ------------------------------ Avr: 371 533 1975 | 366 837 3062 Tot: 368 685 2518 ------------------------------- ./ Verdin iMX8M Mini 4xA53 ------------------------------- root@verdin-imx8mm:~# 7z b -mmt6 7-Zip (a) 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21 p7zip Version 16.02 (locale=C,Utf16=off,HugeFiles=on,64 bits,4 CPUs LE) LE CPU Freq: - - - - - - - - - RAM size: 1982 MB, # CPU hardware threads: 4 RAM usage: 1323 MB, # Benchmark threads: 6 Compressing | Decompressing Dict Speed Usage R/U Rating | Speed Usage R/U Rating KiB/s % MIPS MIPS | KiB/s % MIPS MIPS 22: 2587 368 683 2517 | 62071 380 1393 5293 23: 2575 376 698 2624 | 58488 364 1389 5061 24: 2608 384 730 2805 | 56726 360 1384 4979 25: 2547 378 769 2908 | 56061 359 1390 4989 ---------------------------------- | ------------------------------ Avr: 377 720 2713 | 366 1389 5081 Tot: 371 1054 3897 ------------------------------- ./ Verdin iMX8M Plus 4xA53 ------------------------------- root@verdin-imx8mp:~# 7z b -mmt6 7-Zip (a) 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21 p7zip Version 16.02 (locale=C,Utf16=off,HugeFiles=on,64 bits,4 CPUs LE) LE CPU Freq: 64000000 - - 64000000 - 256000000 - - - RAM size: 3635 MB, # CPU hardware threads: 4 RAM usage: 1323 MB, # Benchmark threads: 6 Compressing | Decompressing Dict Speed Usage R/U Rating | Speed Usage R/U Rating KiB/s % MIPS MIPS | KiB/s % MIPS MIPS 22: 3100 377 801 3016 | 61989 371 1426 5286 23: 3035 375 824 3093 | 63639 386 1427 5507 24: 3035 379 862 3264 | 63178 389 1427 5545 25: 3004 377 910 3431 | 57788 360 1430 5143 ---------------------------------- | ------------------------------ Avr: 377 849 3201 | 376 1427 5370 Tot: 377 1138 4286 ------------------------------- d ). 测试结果图表展示 6 ). CPU 多核性能对比测试二 a ). 测试工具软件 smallpt ，需下载源码编译，详细的下载编译使用请参考这里 b ). 测试方法 ------------------------------- ### 对于 Apalis iMX8QM $ taskset -c 0-5 time ./smallpt 100 ### 对于其他模块 $ taskset -c 0-3 time ./smallpt 100 ------------------------------- c ). 测试结果 ./ Apalis iMX8QM 2xA72+4xA53 ------------------------------- root@apalis-imx8:~# taskset -c 0-5 time ./smallpt 100 Rendering (100 spp) 100.00% real 1m 34.80s user 9m 23.44s sys 0m 0.03s ------------------------------- ./ Colibri iMX8X 4xA35 ------------------------------- root@colibri-imx8x-06748681:~# taskset -c 0-3 time ./smallpt 100 Rendering (100 spp) 100.00% real 3m 52.67s user 15m 18.40s sys 0m 0.13s ------------------------------- ./ Verdin iMX8M Mini 4xA53 ------------------------------- root@verdin-imx8mm:~# taskset -c 0-3 time ./smallpt 100 Rendering (100 spp) 100.00% real 2m 30.11s user 9m 56.64s sys 0m 0.06s ------------------------------- ./ Verdin iMX8M Plus A53 ------------------------------- root@verdin-imx8mp:~# taskset -c 0-3 time ./smallpt 100 Rendering (100 spp) 100.00% real 2m 30.05s user 9m 56.26s sys 0m 0.07s ------------------------------- d ). 测试结果图表展示 7 ). 内存性能测试 a ). 测试工具软件 stream ，测试 Linux BSP 自带。另外 BSP 中还有其他内存测试工具，比如 tinymembench ，有兴趣的读者可以自行测试。 b ). 测试方法 ------------------------------- ### 对于 Apalis iMX8QM ，分别测试 A72 核心和 A53 核心 $ taskset -c 4-5 stream && taskset -c 0-3 stream ### 对于其他模块 $ taskset -c 0-3 stream ------------------------------- c ). 测试结果 ./ Apalis iMX8QM 2xA72 ------------------------------- root@apalis-imx8:~# taskset -c 4-5 stream STREAM copy latency: 2.60 nanoseconds STREAM copy bandwidth: 6159.37 MB/sec STREAM scale latency: 2.57 nanoseconds STREAM scale bandwidth: 6232.96 MB/sec STREAM add latency: 4.52 nanoseconds STREAM add bandwidth: 5312.67 MB/sec STREAM triad latency: 4.52 nanoseconds STREAM triad bandwidth: 5305.04 MB/sec ------------------------------- ./ Apalis iMX8QM 4xA53 ------------------------------- root@apalis-imx8:~# taskset -c 0-3 stream STREAM copy latency: 5.88 nanoseconds STREAM copy bandwidth: 2722.48 MB/sec STREAM scale latency: 7.44 nanoseconds STREAM scale bandwidth: 2149.96 MB/sec STREAM add latency: 13.36 nanoseconds STREAM add bandwidth: 1796.68 MB/sec STREAM triad latency: 15.41 nanoseconds STREAM triad bandwidth: 1557.53 MB/sec ------------------------------- ./ Colibri iMX8X 4xA35 ------------------------------- root@colibri-imx8x-06748681:~# taskset -c 0-3 stream STREAM copy latency: 5.94 nanoseconds STREAM copy bandwidth: 2695.42 MB/sec STREAM scale latency: 8.78 nanoseconds STREAM scale bandwidth: 1821.91 MB/sec STREAM add latency: 13.61 nanoseconds STREAM add bandwidth: 1763.93 MB/sec STREAM triad latency: 15.72 nanoseconds STREAM triad bandwidth: 1526.23 MB/sec ------------------------------- ./ Verdin iMX8M Mini 4xA53 ------------------------------- root@verdin-imx8mm:~# taskset -c 0-3 stream STREAM copy latency: 4.17 nanoseconds STREAM copy bandwidth: 3839.23 MB/sec STREAM scale latency: 5.46 nanoseconds STREAM scale bandwidth: 2928.26 MB/sec STREAM add latency: 9.13 nanoseconds STREAM add bandwidth: 2628.41 MB/sec STREAM triad latency: 10.70 nanoseconds STREAM triad bandwidth: 2242.15 MB/sec ------------------------------- ./ Verdin iMX8M Plus 4xA53 ------------------------------- root@verdin-imx8mp:~# taskset -c 0-3 stream STREAM copy latency: 3.06 nanoseconds STREAM copy bandwidth: 5226.20 MB/sec STREAM scale latency: 5.30 nanoseconds STREAM scale bandwidth: 3020.58 MB/sec STREAM add latency: 8.58 nanoseconds STREAM add bandwidth: 2797.53 MB/sec STREAM triad latency: 10.22 nanoseconds STREAM triad bandwidth: 2348.11 MB/sec ------------------------------- d ). 测试结果图表展示 8 ). GPU 性能测试 a ). 测试工具软件 glmark2-es2-wayland ，测试 Linux BSP 自带。 Apalis iMX8/Colibr iiMX8X 连接 LVDS 液晶屏，分辨率为 1280x800; Verdin iMX8MM/iMX8MP 连接 HDMI 显示器，分辨率 1920x1080 。 b ). 测试方法 ------------------------------- ### 保证测试输出分辨率统一为 1280x800 ### ### Apalis iMX8/Colibri iMX8X $ glmark2-es2-wayland --fullscreen ### Verdin iMX8MM/iMX8MP $ glmark2-es2-wayland --size 1280x800 ------------------------------- c ). 测试结果 ./ Apalis iMX8QM 2x GC7000XSVX GPU ------------------------------- root@apalis-imx8:~# glmark2-es2-wayland --fullscreen EGL: Warning: No default display support on wayland ======================================================= glmark2 2017.07 ======================================================= OpenGL Information GL_VENDOR: Vivante Corporation GL_RENDERER: Vivante GC7000XSVX GL_VERSION: OpenGL ES 3.2 V6.4.3.p1.305572 ======================================================= ...... ======================================================= glmark2 Score: 1308 ======================================================= ------------------------------- ./ Colibri iMX8X 1x GC7000L GPU ------------------------------- root@colibri-imx8x-06748681:~# glmark2-es2-wayland --fullscreen EGL: Warning: No default display support on wayland ======================================================= glmark2 2017.07 ======================================================= OpenGL Information GL_VENDOR: Vivante Corporation GL_RENDERER: Vivante GC7000L GL_VERSION: OpenGL ES 3.1 V6.4.3.p1.305572 ======================================================= ...... ======================================================= glmark2 Score: 516 ======================================================= ------------------------------- ./ Verdin iMX8M Mini 1x GC7000NanoUltra GPU ------------------------------- root@verdin-imx8mm:~# glmark2-es2-wayland --size 1280x800 EGL: Warning: No default display support on wayland ======================================================= glmark2 2017.07 ======================================================= OpenGL Information GL_VENDOR: Vivante Corporation GL_RENDERER: Vivante GC7000NanoUltra GL_VERSION: OpenGL ES 2.0 V6.4.3.p1.305572 ======================================================= ...... ======================================================= glmark2 Score: 165 ======================================================= ------------------------------- ./ Verdin iMX8M Plus 1x GC7000UL GPU ------------------------------- root@verdin-imx8mp:~# glmark2-es2-wayland --size 1280x800 EGL: Warning: No default display support on wayland ======================================================= glmark2 2017.07 ======================================================= OpenGL Information GL_VENDOR: Vivante Corporation GL_RENDERER: Vivante GC7000UL GL_VERSION: OpenGL ES 3.1 V6.4.3.p1.305572 ======================================================= ...... ======================================================= glmark2 Score: 521 ======================================================= ------------------------------- d ). 测试结果图表展示 9 ). 总结本文从 CPU 、 GPU 、内存等几个方面简单对 NXP iMX 8 系列嵌入式 ARM 处理器家族产品进行了一些 benchmark 测试，从结果可以看到 iMX8QM 各方面性能都是非常领先的； iMX8X 强调功耗性能比，非常均衡； iMX8M Mini 和 iMX8M Plus 在 CPU 方面基本相当， GPU 则是 iMX8M Plus 领先巨大，同时 iMX8M Plus 还拥有一个神经网络算法加速的 NPU 核心，综合下来 iMX8M Plus 性能还是好于 iMX8M Mini 。参考文献 https://developer.toradex.c n /knowledge-base/board-support-package/openembedded-core https://developer.toradex.cn/knowledge-base/toradex-easy-installer-os-and-demo-images
CAN FD 在 iMX8 计算机模块上的应用

热度 3

hai.qin_651820742

2020-12-25 17:38

3335 次阅读|

1 个评论

By Toradex胡珊逢 CAN总线在工业、汽车行业具有非常广泛的应用，为网络中设备之间点对点通信提供一种可靠、稳定、经济的方案。伴随网络中设备节点的增加，由于1Mbps速率和最长数据8字节的限制，通信效率和总线占用问题变得愈发突出。而CAN FD正是为了应对这种挑战而出现。文章接下来将介绍CAN FD的一些新特点以及使用注意事项，最后将使用Toradex Apalis iMX8QM和Verdin iMX8M Mini计算机模块简单演示CAN FD使用。相比于传统CAN协议，CAN FD最大的两个特点是采用可变速率和单帧最长64字节数据，另外包括控制位和CRC校验的变化。图1：传统CAN和CAN FD帧控制位的首位由传统CAN的RTR变为CAN FD的RRS，该位始终是显性（0）。第三个控制位在传统CAN中属于保留功能，在CAN FD位FDF，位隐性（1）。FDF位1时表示该帧是CAN FD格式。在CAN FD中紧随FDF还是一个保留功能，用于将来的扩展。BRS（Bit Rate Switch）位允许CAN FD帧以不同的速率进行传输。如果BRS为显性（0）则该帧采用和仲裁阶段（Arbitration Phase）同样的速率进行传输，既速率不发生变化。当BRS为隐性（1），该帧接下来的部分将以较高的速率传输。这里需要注意，并不是整个CAN FD帧都用高速率传输，如下图，Data Phase从BRS后的ESI位开始到CRC Delimiter位结束，该阶段的数据会以较高的速率传输。图2：CAN FD帧结构 ESI（Error Status Indicator）通常为显性（0）。当发送方遇到通讯异常后会将其置为隐性（1）。DLC表示该帧中实际数据长度，为了于传统CAN兼容，DLC仍然采用4bit。当数据长度小于8字节时，DLC位的数值可以直接表示数据长度，但超过8字节时，由于4个位最高只能表示15，为了支持CAN FD最长64字节数据，这里采用了折中的表示方法。当数据不超过8个字节时，DLC仍直接表示数据长度。当超过8个字节，只支持12到64中部分长度的数据包，而非全部的9到64任一长度。如下表所示，当DLC为9时，CAN FD数据长度为12字节，DLC为12时，数据长度是24字节。 DLC和数据长度对应关系 DLC 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 数据长度 0 1 2 3 4 5 6 7 8 12 16 20 24 32 48 64 在实际应用中最好选择上面的其中一种长度，避免通讯效率降低。如果小于某一种长度，则需要对数据进行填充，可以用0xCC和0x55作为填充字节，这样能够在总线上产生足够的波形翻转从而使CAN节点保持同步。在CAN FD中根据数据长度会采用不同的CRC校验方案，当小于等于16字节是为CRC-17，当数据大于16字节后则采用CRC-21。CRC Delimiter之后的格式CAN FD和传统CAN仍保持一致。 CAN FD虽然具有更长的数据包以及更快的传输速度，但是由于引入了更多的位到帧中，帧的开销也会增加。以同样发送1字节数据包为例，传统CAN 2.0标准帧和CAN FD标准帧具体组成如上方图1所示。传统CAN 2.0标准帧总共位54 bit，CAN FD为70 bit。CAN FD需要多消耗16 bit来传送同样的数据。如果CAN FD不采用更高的可变速率这就意味着同样的帧，CAN FD反而会要更长的传输时间。当CAN FD采用可变速率，那么情况将会变得不一样。假设CAN FD的仲裁速率是500 Kbps，和传统CAN的速率一致，而可变的数据传输速率提高8倍到4 Mbps。传统CAN耗时为54 bit/ 500 Kbps = 108 us。CAN FD中4 Mbps的速率只用于传输从ESI位开始到CRC Delimiter位之间的数据，所以CAN FD耗时为29 bit/500 Kbps + 41 bit/4 Mbps = 68 us。这里我们看到，在提高数据传输速率情况下，CAN FD即使有更多的帧开销，帧传输时间还是减少了40 us。更高的传输速度有利于发送节点更快得完成帧发送，减少CAN总线占用时间，这对越长数据的帧会更加明显，对CAN网络的实时性来讲是一个优势。然而提高传输速率不仅仅是在使用的时候设置一个参数，更重要的是保障CAN总线物理链路层的质量。可以使用示波器观察总线上信号的质量。如果信号陡峭且清晰，可以尝试将数据传输速率提高到仲裁速率的2到4倍。测量点需要遍布总线上多个位置，信号在不同位置会有所差异。线路阻抗的一致性对信号质量至关重要。通常在总线交叉点的线缆没有发生物理尺寸变化，并采用具有相同介电常数的隔离器，阻抗会保持不变。这可以参考以太网和USB中使用的专门的连接器。当CAN FD采用较高的传输速率时，每处线路分叉，每个连接器都可能会影响阻抗，从而引起信号反射。这些反射信号的能量最终可以影响CAN帧每个比特位边缘的抖动。 CAN FD最长64字节的数据包使用在实际应用中也需要注意。更长的帧不可避免在传输的时候会占用总线更多的时间，而这期间其他CAN节点则无法发送数据。对于实时性需求不高的场合，如通过CAN总线升级固件，长帧能够以更小的开销完成传输。而对实时性有要求的场合，对长帧的使用需要有一定的限制。对于8字节以下的帧，CAN FD更高的数据传输速率可以有效降低总线占用时间，前提是物理链路层能够满足高速传输的要求。对于应用开发CAN FD的使用是非常简单的。CAN FD是可以兼容传统CAN，这意味着原先基于传统CAN通信的代码可以直接运行在支持CAN FD的设备上，但不使用任何CAN FD的新功能。如果需要使用CAN FD的可变数据速率或者超过8字节数据的帧，那么代码也只需做简单的修改。我们以Linux中SocketCAN为例，使用can-utils代码进行说明。在cansend.c和candump.c中采用canfd_frame结构体来存放需要发送和接收的CAN数据。CANFD_MAX_DLEN为64，对应CAN FD最长的64字节。然后将can socket设置CAN FD格式，使用setsockopt()函数，设置CAN_RAW_FD_FRAMES参数即可。在发送时将struct canfd_frame frame结构体中len长度参数设置CAN FD定义几种长度。剩余代码中的操作可以沿用传统CAN模式下的方法。最后用下面命令配置CAN设备。这里仲裁速率为500Kbps，CAN FD可变数据速率为1Mbps，在结尾添加fd on参数启用CAN FD。接下来我们将在Apalis iMX8QM和Verdin iMX8M Mini计算机模块上演示CAN FD通信。Apalis iMX8QM 采用NXP i.MX8 QuadMax处理器，可以提供3路CAN接口。Verdin iMX8M Mini上的i.MX8 M Mini处理器本身并不支持CAN接口，我们在模块上添加了一块MCP2518实现CAN接口。 Apalis iMX8QM和Verdin iMX8M Mini分别通过Ixora和Dahlia载板进行CAN接口互联。这两个底板上均引出了CAN接口，方便用户测试。 Verdin iMX8M Mini作为发送端，依次运行下面命令，并发送4字节和10字节长度的帧。 Apalis iMX8QM作为接收端。上面测试可以看到Verdin iMX8M Mini发送一帧10字节长度的数据，但是Apalis iMX8QM在收到了12字节的数据。这是CAN FD定义没有10字节的帧长，适合发送10字节的是12字节长度的帧。所以看到实际收到的是“11 22 33 44 55 66 77 88 99 00 00 00”这12个字节，最后两个“00 00”是填充的数据。这部分填充数据来自lib.c代码 memset(cf, 0, sizeof(*cf)); /* init CAN FD frame, e.g. LEN = 0 */ 总结 CAN FD的新功能为满足了应用对更加高效的传输、更好实时性需求，但充分发挥这些功能还需要从应用开发到链路设计方面的优化。上面我们讨论简单地讨论一些注意事项，以及使用方法，具体的应用还要结合实际工况做调整。参考： https://www.microcontrol.net/en/know-how/bus-systems/can-fd/ https://www.picoauto.com/library/picoscope/can-bus-serial-protocol-decoding https://www.can-cia.org/can-knowledge/can/can-fd/#:~:text=CAN%20FD%20data%20frames%20with,support%20remotely%20requested%20data%20frames.&text=The%20control%20field%20comprises%20additional,the%20Classical%20CAN%20data%20frames. https://www.eecs.umich.edu/courses/eecs461/doc/CAN_notes.pdf https://en.wikipedia.org/wiki/CAN_FD https://www.kvaser.com/wp-content/uploads/2016/04/can-fd-considerations-for-different-stakeholders.pdf https://www.kvaser.com/wp-content/uploads/2016/10/comparing-can-fd-with-classical-can.pdf
NXP iMX8 系列产品功耗对比测试

热度 18

hai.qin_651820742

2020-7-21 15:44

2990 次阅读|

0 个评论

1). 简介 NXP iMX8 系列应用处理器是 NXP 发布的基于 Cortex-A72/A53/A35 和 Coretex-M4/M7 等架构的 ARM 处理器，其包含了如下多个子系列，本文就选取其中比较有代表性的 iMX8 、 iMX8X 以及 iMX8M Mini 进行简单的功耗对比测试，从功耗角度给大家为项目选择具体 iMX8 产品系列做参考。请注意由于目前 iMX8 系列产品软硬件还没有进入到最终稳定状态，本文测试数据仅限于当下状态供参考，后续软硬件优化后可能还会存在差异。本文所演示的 iMX8 系列 ARM 平台来自于 Toradex ARM 嵌入式平台，为了尽量减少外设对功耗的干扰，使用的都是精简的载板（除了 iMX8MM 平台手里暂时还没有精简载板），尽管如此，本文测试的还是包含了 ARM 计算机模块和载板一起的功耗数据，因此会比实际模块的功耗略大一些。 ./ iMX8QM 平台 -Apalis iMX8QM4GB WB IT ARM 核心版配合 Ioxra 载板，基于 NXP iMX8QuadMax 处理器，支持 2x Cortex-A72+4x Cortex-A53 CPU ， 2x GC7000 XSVX GPU( 高至 128GFLOPS 每核心 ) 。 ./iMX8QP 平台 -Apalis iMX8QP 2GB WB ITARM 核心板配合 Ixora 载板，基于 NXP iMX8QuadPlus 处理器，支持 1x Cortex-A72+4x Cortex-A53 CPU ， 2x GC7000Lite XSVX GPU( 高至 80GFLOPS 每核心 ) 。 ./iMX8X 平台 -Colibri iMX8QXP 2GB WB ITARM 核心板配合 Iris 载板，基于 NXP iMX8QuandXPlus 处理器，支持 4x Cortex-A35 ， 1x GC7000Lite GPU( 高至 64GFLOPS 每核心 ) 。 ./iMX8MM 平台 -Verdin iMX8MM Quad 2GB WB ITARM 核心板配合 Verdin Development Board 载板，基于 NXP iMX8M Mini Quad 处理器，支持 4x Cortex-A53 ， 1x GCNanoUltra GPU( 高至 6.4GFLOPS 每核心 ) 。 2). 准备 a). 硬件连接不同测试平台通过数字直流稳压电源（ Rek – PS-303DM+ ）进行供电，外设连接调试串口； iMX8QM 、 iMX8QP 和 iMX8MM 平台连接 HDMI 显示器， iMX8X 平台连接 VGA 显示器。 b). 测试软件： ./ 全部平台模块安装 Toradex V3.0b4 Ycoto Console Linux BSP Image, 基于 Linux Kernel 4.14.170 内核版本 ./ CPU 负载通过 BSP 自带的 stress 工具来实现 ./ GPU 负载通过 Ycoto 环境编译的 glmark2 工具来实现，编译好的 glmark2 ipk 软件包复制到平台 Linux 下通过“ opkg install ”命令安装 c). 测试流程 ./ 平台上电，进入 Linux 系统后不进行任何加载，测试系统 idle 状态直流电源的电流值和电压值得出功耗数据 ./ 执行下面命令将 CPU 负载加至满负荷，观察记录直流电源的电流值和电压值得出功耗数据 ----------------------------------- $ stress -c

更多...

标签: iMX8M