AM57x-如何使用-有什么中文资料面包板社区

相关博文

AM57x 多核SoC开发板——GPMC的多通道AD采集综合案例手册（下）

热度 4

Tronlong

2022-5-12 16:53

2234 次阅读|

0 个评论

本文档适用开发环境： Windows开发环境：Windows 7 64bit、Windows 10 64bit Linux Processor SDK：ti-processor-sdk-linux-rt-am57xx-evm-04.03.00.05 RTOS Processor SDK：ti-processor-sdk-rtos-am57xx-evm-04.03.00.05 CCS：CCS7.4 本案例主要是通过GPMC接口采集AD7606或ADS8568模块输入的AD信号，由DSP端对AD信号进行FFT处理，并由ARM端对AD信号进行Qt波形绘制、数据保存等，其中使用到的测试板卡为创龙科技的TL570x-EVM工业开发板。创龙科技TL570x-EVM是一款基于TI Sitara系列AM5708 ARM Cortex-A15 + 浮点DSP C66x处理器设计的异构多核SoC评估板，由核心板和评估底板组成。典型应用在运动控制、工业PC、机器视觉、智能电力、视频监测等领域。核心板经过专业的PCB Layout和高低温测试验证，稳定可靠，可满足各种工业应用环境。开发板接口资源丰富，引出双路PRU百兆网口、千兆网口、USB 3.0、CAMERA、GPMC、HDMI、 PCIe等接口，方便用户快速进行产品方案评估与技术预研。接下来给大家分享案例编译和ARM(Host)端、DSP(Slave)端）的关键代码部分，案例编译请按照IPC异构多核开发手册搭好建基于Linux的IPC开发环境，并使能环境变量，然后按照如下方法编译案例。将案例目录拷贝到Ubuntu，并将lib目录下的QWT库文件压缩包libqwt-6.1.3.tar.gz解压到lib目录下。图 31 进入src目录并打开products.mak文件，根据实际情况配置libqwt-6.1.3的目录路径。 Host# vim products.mak 图 32 图 33 修改完毕后保存退出，执行如下命令加载Linux Processor SDK环境变量，编译程序并安装程序镜像文件。 Host# source /home/tronlong/ti-processor-sdk-linux-rt-am57xx-evm-04.03.00.05/linux-devkit/environment-setup Host# make -j 8 && make install 图 34 命令执行完毕后，将在“install/tl-gpmc-ad-fft/debug/”目录下生成ARM端和DSP端可执行文件，分别为 app_host和server_dsp1.xe66。图 35 关键代码 ARM(Host)端关键代码图 36 Qt程序框架解析命令行参数，并显示Qt主窗口。图 37 host/main.cpp 申请CMEM共享内存空间，并转换为实际物理地址。在共享内存空间中申请两个Buffer空间，分别用于存放AD信号时域数据和经FFT处理的频域数据。申请的两个Buffer空间的内存地址将会发送至DSP端，DSP端将一个通道的AD信号时域数据和经FFT处理的频域数据存放在Buffer空间。图 38 host/app.c 发送App_CMD_SETUP消息类型至DSP端，该消息携带申请好的Buffer空间物理地址等信息，并等待DSP端返回消息。图 39 host/app.c 图 40 host/app.c 发送App_CMD_TEST消息类型至DSP端，该消息主要通知DSP端进行AD信号采集。DSP端每次采集512个点，并保存AD信号时域数据和经FFT处理的频域数据。该消息还携带loop_times参数，已设置为8。DSP端每循环8次，即采集并处理8x512=4096个点后返回消息至ARM端。当运行“./app_host 0x01000000 6 10000 /home/root 7606 ”命令时，程序循环次数设置为10000，则总采样点个数为：4096*10000=40960000。图 41 host/app.c 发送App_CMD_SHUTDOWN信息类型至DSP端，通知DSP端结束程序的运行，并等待DSP端返回消息。图 42 host/app.c Qt App线程接收到DSP端的通知后，通过信号槽通知主线程绘制波形。图 43 host/app_thread.cpp 分别绘制时域波形和频域波形。图 44 host/plot.cpp 将时域和频域数据写入文件。图 45 host/file.cpp DSP(Slave)端关键代码监听slaveQue消息队列，等待ARM端发送消息。 cmd”参数来判断不同的消息类型，从而进入相应的处理函数。处理结束后，返回消息至ARM端。图 46 dsp1/Server.c 响应ARM端发送的App_CMD_SETUP消息类型，调用ad_init和ad_test_init初始化函数。图 47 dsp1/Server.c ad_init()主要实现Timer、GPIO、GPMC等和AD芯片硬件相关的程序初始化。图 48 dsp1/ad_test.c 图 49 dsp1/ad_test.c ad_test_init()主要用于程序运行环境的准备，如信号量、内存申请、EDMA3初始化、FFT初始化等。图 50 dsp1/ad_test.c 程序通过EDMA GPIO event方式采集AD信号。定时器创建后，将以固定的时间间隔进入定时器中断服务函数。在中断服务函数中通过CONVST引脚触发AD信号采集来控制采样频率。每次采集转换完成后，AD芯片的Busy引脚将触发GPIO2的下降沿中断，从而触发EDMA传输。图 51 dsp1/ad_test.c EDMA传输完成后，将进入EDMA中断服务函数。在中断服务函数中统计采样点个数，当采样点个数达到ADC_SAMPLING_FFT_NUM(512)个后，将置位信号量，通知任务进行数据处理。图 52 dsp1/ad_test.c DSP端响应ARM端发送的App_CMD_SETUP消息类型，调用ad_test()进行数据处理。使能定时器，使定时器按固定周期触发AD信号采集。阻塞等待信号量置位，信号量置位后，对数据进行保存、FFT运算等操作。备注：测试采集周期为6us，采集满ADC_SAMPLING_FFT_NUM(512)个点后置位信号量，通知任务进行数据处理，所以设置Semaphore_pend超时时间为10ms，若用户设置采集周期过长，如60us，则采集满512个点需60 * 512 = 30.72ms，则需要对应增加下图Semaphore_pend超时时间。图 53 dsp1/ad_test.c 图 54 dsp1/ad_test.c 补充说明程序默认使用GPTimer6定时器以固定时间间隔触发AD模块的采集信号，控制AD模块进行采集转换。如需更换为其他定时器，请按照如下方法进行修改。 ① 修改dsp1/ad_test.c文件，唤醒指定定时器的时钟。图 55 ② 修改dsp1/Dsp1.cfg文件，timerSetting 代表为timer6，可修改为用户指定定时器。8代表绑定定时器中断至CPU Int8，该编号一般无需改动。图 56 ③ 修改dsp1/ad_test.c文件，下图中的Timer_create()的参数5可修改为用户指定的定时器。图 57 程序使用DSP端初始化GPMC总线，并设置GPMC时序。可查看dsp1/ad_test.c中的gpmc_init()的GPMC配置方式与时序参数。图 58 图 59 好了，本期的案例分享就到这里了，想要查看关于TL570x-EVM开发板（异构多核SoC）的规格书，详细参数资料更多内容，欢迎评论区留言。
AM57x 多核SoC开发板——GPMC的多通道AD采集综合案例手册（上）

热度 9

Tronlong

2022-5-12 16:47

1934 次阅读|

0 个评论

目录 1 ————案例功能 2 ————操作说明 2.1 ————硬件连接 2.2 ————案例测试 2.3 ————使用CCS查看信号波形 2.3.1 ————加载Symbols信息表 2.3.2 ————查看时域波形 2.3.3 ————查看频域波形 3 ————案例编译 4 ————关键代码 4.1 ————ARM(Host)端关键代码 4.2 ————DSP(Slave)端关键代码本文档适用开发环境： Windows开发环境：Windows 7 64bit、Windows 10 64bit Linux Processor SDK：ti-processor-sdk-linux-rt-am57xx-evm-04.03.00.05 RTOS Processor SDK：ti-processor-sdk-rtos-am57xx-evm-04.03.00.05 CCS：CCS7.4 本案例主要是通过GPMC接口采集AD7606或ADS8568模块输入的AD信号，由DSP端对AD信号进行FFT处理，并由ARM端对AD信号进行Qt波形绘制、数据保存等，其中使用到的测试板卡为创龙科技的TL570x-EVM工业开发板。创龙科技TL570x-EVM是一款基于TI Sitara系列AM5708 ARM Cortex-A15 + 浮点DSP C66x处理器设计的异构多核SoC评估板，由核心板和评估底板组成。典型应用在运动控制、工业PC、机器视觉、智能电力、视频监测等领域。核心板经过专业的PCB Layout和高低温测试验证，稳定可靠，可满足各种工业应用环境。开发板接口资源丰富，引出双路PRU百兆网口、千兆网口、USB 3.0、CAMERA、GPMC、HDMI、 PCIe等接口，方便用户快速进行产品方案评估与技术预研。案例功能 AM570x DSP端使用EDMA通过GPMC接口采集AD7606或ADS8568模块8通道的AD信号，同时由DSP端对其中6通道的AD信号进行FFT处理，最后将8通道时域数据和经FFT处理的6通道频域数据保存到DSP端L2SRAM中，可通过仿真器与CCS软件查看对应通道的时域波形和频域波形。程序保存通道0的时域数据和经FFT处理的频域数据至CMEM（共享内存）空间，通过IPC组件通知ARM端读取该通道的时域数据和频域数据，使用Qt在LCD显示屏上进行波形绘制，最后将数据保存到文件中。本案例默认配置AD7606模块采样周期为6us，即采样率约为167KHz；配置ADS8568模块采样周期分别为5us，即采样率为200KHz。程序工作流程图如下所示：图 1 操作说明硬件连接将Tronlong的TL7606I(AD7606)模块或TL8568I(ADS8568)模块插入评估板GPMC扩展接口，并对模块进行独立供电。TL7606I模块使用5V电源供电，J1跳线帽连接到0，使用±5V量程。TL8568I模块使用12V电源供电，软件已配置为±12V量程。将模块的待测输通道正确连接信号发生器，信号发生器输出频率为4KHz、峰峰值为2Vpp（即幅值为1V）的正弦波信号。待测信号电压请勿超过模块量程，否则可能会导致模块损坏。评估板接入LCD显示屏，并通过仿真器连接到PC机。硬件连接示意图如下：图 2 TL7606I模块硬件连接示意图图 3 TL7606I模块硬件连接示意图图 4 TL8568I模块硬件连接示意图案例测试案例位于产品资料“4-软件资料\Demo\rtos-examples\tl-linux-ipc-examples\tl-gpmc-ad-fft\”目录下，案例目录说明如下。图 5 表 1 bin目录 app_host ARM端可执行文件 load-firmware.sh DSP端可执行文件运行脚本 server_dsp1.xe66 DSP端可执行文件 lib目录 libqwt-6.1.3.tar.gz QWT库压缩包 src目录 dsp1目录存放DSP端源码和配置文件等 host目录存放ARM端源码和配置文件等 ludev目录存放共享内存库源码和镜像文件等 shared目录存放多核共用代码定义相关文件 makefile 顶层Makefile文件，用于构建整个案例程序 products.mak 顶层配置文件，用于配置编译环境由于本案例需依赖 QWT库文件，因此请将libqwt-6.1.3.tar.gz压缩包解压，并将解压目录中的lib目录下的libqwt.so、libqwt.so.6、libqwt.so.6.1、libqwt.so.6.1.3此四个QWT库文件拷贝到文件系统“/usr/lib/”目录下。同时将bin目录下的app_host、server_dsp1.xe66、load-firmware.sh此三个文件拷贝到评估板文件系统同一个目录下。图 6 Linux内核预留0xa0000000~0xac000000(192MByte)内存作为CMEM共享内存，案例使用0xa0000000~0xa0008000(32KByte)内存进行测试，此32KByte内存划分为2个16KByte (0x4000,16384)池空间，分别用于存放模块通道0的时域数据和频域数据。进入评估板文件系统执行如下命令。备注：由于 CMEM共享内存地址空间已超过512MByte，故如下测试仅支持DDR3不小于1GByte的评估板。 Target# /etc/init.d/matrix-gui-2.0 stop //关闭Matrix界面程序 Target# pkill ti-mctd //禁用ti-mctd服务，避免cmemk驱动卸载失败 Target# rmmod cmemk //卸载cmemk驱动 Target# modprobe cmemk phys_start=0xa0000000 phys_end=0xa0008000 pools=2x16384 //划分2个16KByte池空间 Target# cat /proc/cmem //查看CMEM配置图 7 图 8 进入 app_host、server_dsp1.xe66、load-firmware.sh文件所在目录并执行如下命令，运行DSP端程序。 Target# ./load-firmware.sh 图 9 执行如下命令可查看ARM端程序参数说明。 Target# ./app_host -h 图 10 执行如下命令，运行ARM端程序。 Target# ./app_host 0x01000000 6 10000 /home/root/ 7606 命令参数说明： 0x01000000 ：指定GPMC片选首地址，使用的GPMC片选为CS0。 6 ：指定信号采集周期（单位：us）。TL7606I模块设置为6，TL8568I模块设置为5。 10000 ：指定采集循环次数。 /home/root/ ：指定模块通道0的时域数据和频域数据的保存路径。时域数据保存文件为ad_raw_data.txt，频域数据保存文件为ad_fft_data.txt。 7606 ：指定模块型号。TL7606I模块设置为7606，TL8568I模块设置为8568。图 11 TL7606I模块运行命令图 12 TL8568I模块运行命令程序运行后，即可在LCD显示屏上看到通道0的时域波形和频域波形。图 13 时域波形图 14 频域波形使用CCS查看信号波形在程序运行过程中可使用CCS软件查看存储在DSP端L2SRAM中的时域和频域波形。加载Symbols信息表进入 app_host、server_dsp1.xe66、load-firmware.sh文件所在目录执行如下命令，运行DSP端程序。 Target# ./load-firmware.sh 驱动默认配置DSP端的电源控制模式为auto-suspend（自动休眠），当DSP端处于休眠状态时，CCS将无法连接DSP端。请执行如下命令设置电源控制模式为on，禁用auto-suspend模式。 Target# /sys/bus/platform/devices/40800000.dsp/power/control 请执行如下命令禁用错误恢复功能，避免发生错误时系统自动重启DSP端，干扰调试。 Target# /sys/kernel/debug/remoteproc/remoteproc2/recovery 请执行如下命令，运行ARM端程序（以TL7606I模块为例）。 Target# ./app_host 0x01000000 6 10000 /home/root/ 7606 图 15 打开CCS，创建仿真配置文件后进入Debug界面，右键点击“Connect Target”连接DSP端，如下图所示。连接后DSP端程序将会暂停运行，请点击按键恢复运行。图 16 Load Symbols...”加载案例bin目录下的server_dsp1.xe66镜像文件导入Symbols信息表。备注：请确保加载的server_dsp1.xe66文件与当前DSP端运行的是同一个镜像文件，否则可能导致符号地址不一致以及仿真运行错误。图 17 图 18 查看时域波形 Memory Browser”，在弹出界面的搜索栏搜索ch_raw_buffer数组，该数组存放时域数据，搜索结果如下图所示。ch_raw_buffer数组包含8个地址，从左到右分别对应存放通道0至7时域数据的起始地址，例如0x00828EA0为存放通道0时域数据的起始地址。图 19 Single Time”，如下图所示。图 20 在弹出界面中按照下图内容进行配置，然后点击OK，即可查看AD信号的时域波形。图 21 表 2 Acquisition Buffer Size 从Start Address开始读取的数据长度 Dsp Data Type 读取的数据类型 Start Address 从Start Addres开始读取数据 Display Data Size 显示的数据长度（即将多少个采样点的数据进行显示，该数值不能大于Acquisition Buffer Size）图 22 程序已将8通道的时域数据保存到DSP端L2SRAM，如需查看其他通道波形，请按照上述方法打开对应通道地址查看即可。本次使用TL7606I模块进行测试，在上图中可看到通道0的时域波形，波形的幅值约为6796。从CCS看到的波形值为AD芯片内部寄存器保存的数字量，从AD7606和ADS8568的芯片数据手册得到的换算公式均为：数字量=待测量/量程*32768，则AD信号实际幅值=数字量*量程/32768=6796*5V/32768=1.04V，与信号发生器的1V标称值接近。查看频域波形 Memory Browser”，在弹出界面的搜索栏搜索ch_fft_buffer数组，该数组存放频域数据，搜索结果如下图所示。ch_fft_buffer数组包含8个地址，从左到右分别对应存放通道0至7频域数据的起始地址，例如0x008292A0为存放通道0频域数据的起始地址。备注：由于受处理器的性能限制，程序默认只对通道0~5进行FFT处理，因此ch_fft_buffer数组未存放通道6和7频域数据。图 23 Single Time”，如下图所示。图 24 在弹出界面中按照下图内容进行配置，然后点击OK，即可查看AD信号的频域波形。图 25 表 3 Acquisition Buffer Size 从Start Address开始读取的数据长度 Dsp Data Type 读取的数据类型 Index Increment 索引增量（即每个采样点数据序号的相差值，由于FFT数据以复数形式存储，只取复数中的实部进行显示，因此设置成2，隔点取值显示） Start Address 从Start Addres开始读取数据 Display Data Size 显示的数据长度（即将多少个采样点的数据进行显示，该数值不能大于Acquisition Buffer Size）图 26 点击菜单栏放大按钮进行放大查看，点击打开游标工具，再点击X-Axis可查看到信号存在，如下图所示。图 27 程序已将6通道的频域数据保存到DSP端L2SRAM，如需查看其他通道波形，请按照上述方法打开对应通道地址查看即可。本次使用TL7606I模块进行测试，在上图中可看到通道0的频域波形在第12个点存在信号。程序命令已设置每6us触发一次TL7606I模块的CONVST/GPIO5 引脚进行AD信号采集。图 28 图 29 在程序运行过程中使用示波器通过测量CONVST/GPIO5 引脚，测得信号实际采集周期为5.720us，即信号实际采样率为174.8KHz。图 30 与设定的6us存在一定误差的原因主要有如下两点：程序使用的GPTimer6定时器的精度存在误差，并受系统延时影响。 GPIO引脚电平翻转存在约100ns的时延。如选择专用的定时器输出引脚作为触发信号，可降低时延。 =0)，参数解析如下表。表 4 Fn 采样频率 n 存在信号的点 Fs 信号采样率 N 信号采样长度可得出实际的采样频率Fn=12*(174.8KHz/512)=4.0969KHz，与信号发生器的4KHz标称值接近。到这里，案例功能和操作的基本说明，包括硬件连接与案例测试、如何使用CCS查看信号波形部分就介绍到这里，想要查看案例编译和ARM(Host)端、DSP(Slave)端的关键代码，请看下篇文章，感谢关注，欢迎点赞或评论区留言！
如何基于AM57x测试OpenCL的加速性能？

热度 30

Tronlong

2018-7-3 16:34

2005 次阅读|

0 个评论

1 实验说明本例程测试功能：读取指定的图像数据，然后对图像进行灰度转换和Canny算法处理，计算处理过程所耗的时间，并将处理后的图像保存到当前目录下。本例程主要是测试OpenCL是否对这两种算法有优化效果，分别从禁用OpenCL和使能OpenCL两种情况来计算处理图像数据所用的时间，将测试的结果与官方提供的测试结果进行对比和验证。例程源码路径：光盘“Demo/OpenCL/OpenCL_performance_test/src” 可执行文件以及测试脚本路径：光盘“Demo/OpenCL/OpenCL_performance_test/bin” 测试使用的图片路径：光盘“Demo/OpenCL/OpenCL_performance_test/data” 测试平台：广州创龙TL5728-IDK开发板开发板简介：  基于TI AM5728浮点双DSPC66x+双ARMCortex-A15工业控制及高性能音视频处理器；  强劲的视频编解码能力，支持1路1080P60或2路720P60或4路720P30视频硬件编解码，支持H.265视频软解码；  双核PRU-ICSS工业实时控制子系统，支持EtherCAT、EtherNet/IP、PROFIBUS等工业协议；  外设接口丰富，GPMC、USB 2.0、UART、SPI、QSPI、I2C、DCAN等工业控制总线和接口，支持高速接口PCle Gen2、USB 3.0、SATA 2.0；  应用于工业 PC&HMI、工业机器人、机器视觉、医疗影像、电力自动化等领域。 2 例程编译将光盘资料“Demo/OpenCL/OpenCL_performance_test/src”例程源码拷贝到Ubuntu任意目录，进入该源码目录执行以下命令对源码进行编译： Host# cd AM57xx/OpenCL_performance_test/src/ Host# make SDK_INSTALL_PATH=/home/tronlong/ti-processor-sdk-linux-am57xx-evm-03.01.00.06 编译完成之后会在当前目录下生成可执行文件canny，将其拷贝到开发板文件系统的“/home/root/”目录下。将光盘资料“Demo/OpenCL/OpenCL_performance_test”下的bin文件夹以及data文件夹拷贝到开发板文件系统的“/home/root/”目录下。bin文件夹下包含opencl_off.sh和opencl_on.sh测试脚本，data文件夹下是两张大小和格式不同的图片文件TL5728_1080p.jpg和lena.png。 3 例程测试以下分别从禁用OpenCL功能和使能OpenCL功能来进行对比测试，分别采用data文件夹下的图片TL5728_1080p.jpg和lena.png来测试。 3.1 禁用OpenCL 执行以下命令进行测试，先禁止运行OpenCL功能，然后清理缓存再进行测试，重复清理缓存和测试的步骤5次，如下图所示： Target# source bin/opencl_off.sh Target# /proc/sys/vm/drop_caches Target# ./canny data/TL5728_1080p.jpg 取以上5次测试结果的平均值：  BGR2GRAY tdiff=55.01ms  Canny tdiff=95.50ms 3.2 使能OpenCL 执行以下命令进行测试，先使能OpenCL功能，然后清理缓存再进行测试，重复清理缓存和测试的步骤6次，如下图所示： Target# source bin/opencl_on.sh Target# /proc/sys/vm/drop_caches Target# ./canny data/TL5728_1080p.jpg 如上一共测试了6次，每一次测试之前记得先将系统内核缓存清理干净，否则测试结果有误。因为第一次运行时，内核在AM57xx上编译，OpenCL使能时会有额外的延迟，延迟时间大约为几十秒，所以第一次测试结果不作为参考。官方解释如下： Please note that the first run, with OpenCL on, has additional delay of ~1min, due to kernel compilation on AM57xx. This is constrained to first run only, if "TI_OCL_CACHE_KERNELS" environemnt variable is set. 由以上6次的测试结果，取最后5次测试结果的平均值：  BGR2GRAY tdiff=185.38ms  Canny tdiff=17.71ms 3.3 测试结果对比同理，按照如上操作步骤在分别禁用OpenCL和使能OpenCL的情况下，计算处理lena.png图片所用的时间，并对5次测试的数据取平均值。对比以上测试结果，如下表所示：作用率=禁用OpenCL计算处理图像数据所用的时间/使能OpenCL计算处理图像数据所用的时间。以下是官方的测试数据： BGR2GRAY作用率=0.345 Canny作用率=1.690 从测试结果可以看出来，本次测试与官方测试结论是一致的：OpenCL对BRG2GRAY算法不但没有性能上的提升反而存在着负面的效果；而对Canny算法则有着非常明显的提升效果，与官方的作用率进行对比，本次测试得出的作用率要大于官方提供的作用率数据，这与待测试的图像文件有一定的关系。官方提供的其他OpenCL内核的测试数据：链接：http:// processors.wiki.ti.com/index.php/OpenCV

更多...

标签: AM57x