tag 标签: AM57x

相关博文
  • 热度 4
    2022-5-12 16:53
    1902 次阅读|
    0 个评论
    本文档适用开发环境: Windows开发环境:Windows 7 64bit、Windows 10 64bit Linux Processor SDK:ti-processor-sdk-linux-rt-am57xx-evm-04.03.00.05 RTOS Processor SDK:ti-processor-sdk-rtos-am57xx-evm-04.03.00.05 CCS:CCS7.4 本案例主要是通过GPMC接口采集AD7606或ADS8568模块输入的AD信号,由DSP端对AD信号进行FFT处理,并由ARM端对AD信号进行Qt波形绘制、数据保存等,其中使用到的测试板卡为创龙科技的TL570x-EVM工业开发板。 创龙科技TL570x-EVM是一款基于TI Sitara系列AM5708 ARM Cortex-A15 + 浮点DSP C66x处理器设计的异构多核SoC评估板,由核心板和评估底板组成。典型应用在运动控制、工业PC、机器视觉、智能电力、视频监测等领域。 核心板经过专业的PCB Layout和高低温测试验证,稳定可靠,可满足各种工业应用环境。开发板接口资源丰富,引出双路PRU百兆网口、千兆网口、USB 3.0、CAMERA、GPMC、HDMI、 PCIe等接口,方便用户快速进行产品方案评估与技术预研。 接下来给大家分享案例编译和ARM(Host)端、DSP(Slave)端)的关键代码部分, 案例编译 请按照IPC异构多核开发手册搭好建基于Linux的IPC开发环境,并使能环境变量,然后按照如下方法编译案例。 将案例目录拷贝到Ubuntu,并将lib目录下的QWT库文件压缩包libqwt-6.1.3.tar.gz解压到lib目录下。 图 31 进入src目录并打开products.mak文件,根据实际情况配置libqwt-6.1.3的目录路径。 Host# vim products.mak 图 32 图 33 修改完毕后保存退出,执行如下命令加载Linux Processor SDK环境变量,编译程序并安装程序镜像文件。 Host# source /home/tronlong/ti-processor-sdk-linux-rt-am57xx-evm-04.03.00.05/linux-devkit/environment-setup Host# make -j 8 && make install 图 34 命令执行完毕后,将在“install/tl-gpmc-ad-fft/debug/”目录下生成ARM端和DSP端可执行文件,分别为 app_host和server_dsp1.xe66。 图 35 关键代码 ARM(Host)端关键代码 图 36 Qt程序框架 解析命令行参数,并显示Qt主窗口。 图 37 host/main.cpp 申请CMEM共享内存空间,并转换为实际物理地址。在共享内存空间中申请两个Buffer空间,分别用于存放AD信号时域数据和经FFT处理的频域数据。申请的两个Buffer空间的内存地址将会发送至DSP端,DSP端将一个通道的AD信号时域数据和经FFT处理的频域数据存放在Buffer空间。 图 38 host/app.c 发送App_CMD_SETUP消息类型至DSP端,该消息携带申请好的Buffer空间物理地址等信息,并等待DSP端返回消息。 图 39 host/app.c 图 40 host/app.c 发送App_CMD_TEST消息类型至DSP端,该消息主要通知DSP端进行AD信号采集。DSP端每次采集512个点,并保存AD信号时域数据和经FFT处理的频域数据。该消息还携带loop_times参数,已设置为8。DSP端每循环8次,即采集并处理8x512=4096个点后返回消息至ARM端。 当运行“./app_host 0x01000000 6 10000 /home/root 7606 ”命令时,程序循环次数设置为10000,则总采样点个数为:4096*10000=40960000。 图 41 host/app.c 发送App_CMD_SHUTDOWN信息类型至DSP端,通知DSP端结束程序的运行,并等待DSP端返回消息。 图 42 host/app.c Qt App线程接收到DSP端的通知后,通过信号槽通知主线程绘制波形。 图 43 host/app_thread.cpp 分别绘制时域波形和频域波形。 图 44 host/plot.cpp 将时域和频域数据写入文件。 图 45 host/file.cpp DSP(Slave)端关键代码 监听slaveQue消息队列,等待ARM端发送消息。 cmd”参数来判断不同的消息类型,从而进入相应的处理函数。处理结束后,返回消息至ARM端。 图 46 dsp1/Server.c 响应ARM端发送的App_CMD_SETUP消息类型,调用ad_init和ad_test_init初始化函数。 图 47 dsp1/Server.c ad_init()主要实现Timer、GPIO、GPMC等和AD芯片硬件相关的程序初始化。 图 48 dsp1/ad_test.c 图 49 dsp1/ad_test.c ad_test_init()主要用于程序运行环境的准备,如信号量、内存申请、EDMA3初始化、FFT初始化等。 图 50 dsp1/ad_test.c 程序通过EDMA GPIO event方式采集AD信号。 定时器创建后,将以固定的时间间隔进入定时器中断服务函数。在中断服务函数中通过CONVST引脚触发AD信号采集来控制采样频率。每次采集转换完成后,AD芯片的Busy引脚将触发GPIO2的下降沿中断,从而触发EDMA传输。 图 51 dsp1/ad_test.c EDMA传输完成后,将进入EDMA中断服务函数。在中断服务函数中统计采样点个数,当采样点个数达到ADC_SAMPLING_FFT_NUM(512)个后,将置位信号量,通知任务进行数据处理。 图 52 dsp1/ad_test.c DSP端响应ARM端发送的App_CMD_SETUP消息类型,调用ad_test()进行数据处理。 使能定时器,使定时器按固定周期触发AD信号采集。 阻塞等待信号量置位,信号量置位后,对数据进行保存、FFT运算等操作。 备注: 测试采集周期为6us,采集满ADC_SAMPLING_FFT_NUM(512)个点后置位信号量,通知任务进行数据处理,所以设置Semaphore_pend超时时间为10ms,若用户设置采集周期过长,如60us,则采集满512个点需60 * 512 = 30.72ms,则需要对应增加下图Semaphore_pend超时时间。 图 53 dsp1/ad_test.c 图 54 dsp1/ad_test.c 补充说明 程序默认使用GPTimer6定时器以固定时间间隔触发AD模块的采集信号,控制AD模块进行采集转换。如需更换为其他定时器,请按照如下方法进行修改。 ① 修改dsp1/ad_test.c文件,唤醒指定定时器的时钟。 图 55 ② 修改dsp1/Dsp1.cfg文件,timerSetting 代表为timer6,可修改为用户指定定时器。8代表绑定定时器中断至CPU Int8,该编号一般无需改动。 图 56 ③ 修改dsp1/ad_test.c文件,下图中的Timer_create()的参数5可修改为用户指定的定时器。 图 57 程序使用DSP端初始化GPMC总线,并设置GPMC时序。可查看dsp1/ad_test.c中的gpmc_init()的GPMC配置方式与时序参数。 图 58 图 59 好了,本期的案例分享就到这里了,想要查看关于TL570x-EVM开发板(异构多核SoC)的规格书,详细参数资料更多内容,欢迎评论区留言。
  • 热度 6
    2022-5-12 16:47
    1564 次阅读|
    0 个评论
    目 录 1 ————案例功能 2 ————操作说明 2.1 ————硬件连接 2.2 ————案例测试 2.3 ————使用CCS查看信号波形 2.3.1 ————加载Symbols信息表 2.3.2 ————查看时域波形 2.3.3 ————查看频域波形 3 ————案例编译 4 ————关键代码 4.1 ————ARM(Host)端关键代码 4.2 ————DSP(Slave)端关键代码 本文档适用开发环境: Windows开发环境:Windows 7 64bit、Windows 10 64bit Linux Processor SDK:ti-processor-sdk-linux-rt-am57xx-evm-04.03.00.05 RTOS Processor SDK:ti-processor-sdk-rtos-am57xx-evm-04.03.00.05 CCS:CCS7.4 本案例主要是通过GPMC接口采集AD7606或ADS8568模块输入的AD信号,由DSP端对AD信号进行FFT处理,并由ARM端对AD信号进行Qt波形绘制、数据保存等,其中使用到的测试板卡为创龙科技的TL570x-EVM工业开发板。 创龙科技TL570x-EVM是一款基于TI Sitara系列AM5708 ARM Cortex-A15 + 浮点DSP C66x处理器设计的异构多核SoC评估板,由核心板和评估底板组成。典型应用在运动控制、工业PC、机器视觉、智能电力、视频监测等领域。 核心板经过专业的PCB Layout和高低温测试验证,稳定可靠,可满足各种工业应用环境。开发板接口资源丰富,引出双路PRU百兆网口、千兆网口、USB 3.0、CAMERA、GPMC、HDMI、 PCIe等接口,方便用户快速进行产品方案评估与技术预研。 案例功能 AM570x DSP端使用EDMA通过GPMC接口采集AD7606或ADS8568模块8通道的AD信号,同时由DSP端对其中6通道的AD信号进行FFT处理,最后将8通道时域数据和经FFT处理的6通道频域数据保存到DSP端L2SRAM中,可通过仿真器与CCS软件查看对应通道的时域波形和频域波形。 程序保存通道0的时域数据和经FFT处理的频域数据至CMEM(共享内存)空间,通过IPC组件通知ARM端读取该通道的时域数据和频域数据,使用Qt在LCD显示屏上进行波形绘制,最后将数据保存到文件中。 本案例默认配置AD7606模块采样周期为6us,即采样率约为167KHz;配置ADS8568模块采样周期分别为5us,即采样率为200KHz。程序工作流程图如下所示: 图 1 操作说明 硬件连接 将Tronlong的TL7606I(AD7606)模块或TL8568I(ADS8568)模块插入评估板GPMC扩展接口,并对模块进行独立供电。TL7606I模块使用5V电源供电,J1跳线帽连接到0,使用±5V量程。TL8568I模块使用12V电源供电,软件已配置为±12V量程。 将模块的待测输通道正确连接信号发生器,信号发生器输出频率为4KHz、峰峰值为2Vpp(即幅值为1V)的正弦波信号。待测信号电压请勿超过模块量程,否则可能会导致模块损坏。评估板接入LCD显示屏,并通过仿真器连接到PC机。硬件连接示意图如下: 图 2 TL7606I模块硬件连接示意图 图 3 TL7606I模块硬件连接示意图 图 4 TL8568I模块硬件连接示意图 案例测试 案例位于产品资料“4-软件资料\Demo\rtos-examples\tl-linux-ipc-examples\tl-gpmc-ad-fft\”目录下,案例目录说明如下。 图 5 表 1 bin目录 app_host ARM端可执行文件 load-firmware.sh DSP端可执行文件运行脚本 server_dsp1.xe66 DSP端可执行文件 lib目录 libqwt-6.1.3.tar.gz QWT库压缩包 src目录 dsp1目录 存放DSP端源码和配置文件等 host目录 存放ARM端源码和配置文件等 ludev目录 存放共享内存库源码和镜像文件等 shared目录 存放多核共用代码定义相关文件 makefile 顶层Makefile文件,用于构建整个案例程序 products.mak 顶层配置文件,用于配置编译环境 由于本案例需依赖 QWT库文件,因此请将libqwt-6.1.3.tar.gz压缩包解压,并将解压目录中的lib目录下的libqwt.so、libqwt.so.6、libqwt.so.6.1、libqwt.so.6.1.3此四个QWT库文件拷贝到 文件系统“/usr/lib/”目录下。同时将bin目录下的app_host、server_dsp1.xe66、load-firmware.sh此三个文件拷贝到评估板文件系统同一个目录下。 图 6 Linux内核预留0xa0000000~0xac000000(192MByte)内存作为CMEM共享内存,案例使用0xa0000000~0xa0008000(32KByte)内存进行测试,此32KByte内存划分为2个16KByte (0x4000,16384)池空间,分别用于存放模块通道0的时域数据和频域数据。 进入评估板文件系统执行如下命令。 备注: 由于 CMEM共享内存地址空间已超过512MByte,故如下测试仅支持DDR3不小于1GByte的评估板。 Target# /etc/init.d/matrix-gui-2.0 stop //关闭Matrix界面程序 Target# pkill ti-mctd //禁用ti-mctd服务,避免cmemk驱动卸载失败 Target# rmmod cmemk //卸载cmemk驱动 Target# modprobe cmemk phys_start=0xa0000000 phys_end=0xa0008000 pools=2x16384 //划分2个16KByte池空间 Target# cat /proc/cmem //查看CMEM配置 图 7 图 8 进入 app_host、server_dsp1.xe66、load-firmware.sh文件所在目录并 执行如下命令,运行DSP端程序。 Target# ./load-firmware.sh 图 9 执行如下命令可查看ARM端程序参数说明。 Target# ./app_host -h 图 10 执行如下命令,运行ARM端程序。 Target# ./app_host 0x01000000 6 10000 /home/root/ 7606 命令参数说明: 0x01000000 :指定GPMC片选首地址,使用的GPMC片选为CS0。 6 :指定信号采集周期(单位:us)。TL7606I模块设置为6,TL8568I模块设置为5。 10000 :指定采集循环次数。 /home/root/ :指定模块通道0的时域数据和频域数据的保存路径。时域数据保存文件为ad_raw_data.txt,频域数据保存文件为ad_fft_data.txt。 7606 :指定模块型号。TL7606I模块设置为7606,TL8568I模块设置为8568。 图 11 TL7606I模块运行命令 图 12 TL8568I模块运行命令 程序运行后,即可在LCD显示屏上看到通道0的时域波形和频域波形。 图 13 时域波形 图 14 频域波形 使用CCS查看信号波形 在程序运行过程中可使用CCS软件查看存储在DSP端L2SRAM中的时域和频域波形。 加载Symbols信息表 进入 app_host、server_dsp1.xe66、load-firmware.sh文件所在目录 执行如下命令,运行DSP端程序。 Target# ./load-firmware.sh 驱动默认配置DSP端的电源控制模式为auto-suspend(自动休眠),当DSP端处于休眠状态时,CCS将无法连接DSP端。 请执行如下命令设置电源控制模式为on,禁用auto-suspend模式。 Target# /sys/bus/platform/devices/40800000.dsp/power/control 请执行如下命令禁用错误恢复功能,避免发生错误时系统自动重启DSP端,干扰调试。 Target# /sys/kernel/debug/remoteproc/remoteproc2/recovery 请执行如下命令,运行ARM端程序(以TL7606I模块为例)。 Target# ./app_host 0x01000000 6 10000 /home/root/ 7606 图 15 打开CCS,创建仿真配置文件后进入Debug界面,右键点击“Connect Target”连接DSP端,如下图所示。连接后DSP端程序将会暂停运行,请点击 按键恢复运行。 图 16 Load Symbols...”加载案例bin目录下的server_dsp1.xe66镜像文件导入Symbols信息表。 备注: 请确保加载的server_dsp1.xe66文件与当前DSP端运行的是同一个镜像文件,否则可能导致符号地址不一致以及仿真运行错误。 图 17 图 18 查看时域波形 Memory Browser”,在弹出界面的搜索栏搜索ch_raw_buffer数组,该数组存放时域数据,搜索结果如下图所示。ch_raw_buffer数组包含8个地址,从左到右分别对应存放通道0至7时域数据的起始地址,例如0x00828EA0为存放通道0时域数据的起始地址。 图 19 Single Time”,如下图所示。 图 20 在弹出界面中按照下图内容进行配置,然后点击OK,即可查看AD信号的时域波形。 图 21 表 2 Acquisition Buffer Size 从Start Address开始读取的数据长度 Dsp Data Type 读取的数据类型 Start Address 从Start Addres开始读取数据 Display Data Size 显示的数据长度(即将多少个采样点的数据进行显示,该数值不能大于Acquisition Buffer Size) 图 22 程序已将8通道的时域数据保存到DSP端L2SRAM,如需查看其他通道波形,请按照上述方法打开对应通道地址查看即可。 本次使用TL7606I模块进行测试,在上图中可看到通道0的时域波形,波形的幅值约为6796。从CCS看到的波形值为AD芯片内部寄存器保存的数字量,从AD7606和ADS8568的芯片数据手册得到的换算公式均为:数字量=待测量/量程*32768,则AD信号实际幅值=数字量*量程/32768=6796*5V/32768=1.04V,与信号发生器的1V标称值接近。 查看频域波形 Memory Browser”,在弹出界面的搜索栏搜索ch_fft_buffer数组,该数组存放频域数据,搜索结果如下图所示。ch_fft_buffer数组包含8个地址,从左到右分别对应存放通道0至7频域数据的起始地址,例如0x008292A0为存放通道0频域数据的起始地址。 备注: 由于受处 理器的性能限制,程序默认只对通道0~5进行FFT处理,因此ch_fft_buffer数组未存放通道6和7频域数据。 图 23 Single Time”,如下图所示。 图 24 在弹出界面中按照下图内容进行配置,然后点击OK,即可查看AD信号的频域波形。 图 25 表 3 Acquisition Buffer Size 从Start Address开始读取的数据长度 Dsp Data Type 读取的数据类型 Index Increment 索引增量(即每个采样点数据序号的相差值,由于FFT数据以复数形式存储,只取复数中的实部进行显示,因此设置成2,隔点取值显示) Start Address 从Start Addres开始读取数据 Display Data Size 显示的数据长度(即将多少个采样点的数据进行显示,该数值不能大于Acquisition Buffer Size) 图 26 点击菜单栏放大按钮进行放大查看,点击 打开游标工具,再点击X-Axis可查看到信号存在,如下图所示。 图 27 程序已将6通道的频域数据保存到DSP端L2SRAM,如需查看其他通道波形,请按照上述方法打开对应通道地址查看即可。 本次使用TL7606I模块进行测试,在上图中可看到通道0的频域波形在第12个点存在信号。程序命令已设置每6us触发一次TL7606I模块的CONVST/GPIO5 引脚进行AD信号采集。 图 28 图 29 在程序运行过程中使用示波器通过测量CONVST/GPIO5 引脚,测得信号实际采集周期为5.720us,即信号实际采样率为174.8KHz。 图 30 与设定的6us存在一定误差的原因主要有如下两点: 程序使用的GPTimer6定时器的精度存在误差,并受系统延时影响。 GPIO引脚电平翻转存在约100ns的时延。如选择专用的定时器输出引脚作为触发信号,可降低时延。 =0),参数解析如下表。 表 4 Fn 采样频率 n 存在信号的点 Fs 信号采样率 N 信号采样长度 可得出实际的采样频率Fn=12*(174.8KHz/512)=4.0969KHz,与信号发生器的4KHz标称值接近。 到这里,案例功能和操作的基本说明,包括硬件连接与案例测试、如何使用CCS查看信号波形部分就介绍到这里,想要查看案例编译和ARM(Host)端、DSP(Slave)端的关键代码,请看下篇文章,感谢关注,欢迎点赞或评论区留言!
  • 热度 28
    2018-7-3 16:34
    1792 次阅读|
    0 个评论
    如何基于AM57x测试OpenCL的加速性能?
    1 实验说明 本例程测试功能:读取指定的图像数据,然后对图像进行灰度转换和Canny算法处理,计算处理过程所耗的时间,并将处理后的图像保存到当前目录下。 本例程主要是测试OpenCL是否对这两种算法有优化效果,分别从禁用OpenCL和使能OpenCL两种情况来计算处理图像数据所用的时间,将测试的结果与官方提供的测试结果进行对比和验证。 例程源码路径:光盘“Demo/OpenCL/OpenCL_performance_test/src” 可执行文件以及测试脚本路径:光盘“Demo/OpenCL/OpenCL_performance_test/bin” 测试使用的图片路径:光盘“Demo/OpenCL/OpenCL_performance_test/data” 测试平台:广州创龙TL5728-IDK开发板 开发板简介:  基于TI AM5728浮点双DSPC66x+双ARMCortex-A15工业控制及高性能音视频处理器;  强劲的视频编解码能力,支持1路1080P60或2路720P60或4路720P30视频硬件编解码,支持H.265视频软解码;  双核PRU-ICSS工业实时控制子系统,支持EtherCAT、EtherNet/IP、PROFIBUS等工业协议;  外设接口丰富,GPMC、USB 2.0、UART、SPI、QSPI、I2C、DCAN等工业控制总线和接口,支持高速接口PCle Gen2、USB 3.0、SATA 2.0;  应用于工业 PC&HMI、工业机器人、机器视觉、 医疗影像、电力自动化等领域。 2 例程编译 将光盘资料“Demo/OpenCL/OpenCL_performance_test/src”例程源码拷贝到Ubuntu任意目录,进入该源码目录执行以下命令对源码进行编译: Host# cd AM57xx/OpenCL_performance_test/src/ Host# make SDK_INSTALL_PATH=/home/tronlong/ti-processor-sdk-linux-am57xx-evm-03.01.00.06 编译完成之后会在当前目录下生成可执行文件canny,将其拷贝到开发板文件系统的“/home/root/”目录下。 将光盘资料“Demo/OpenCL/OpenCL_performance_test”下的bin文件夹以及data文件夹拷贝到开发板文件系统的“/home/root/”目录下。bin文件夹下包含opencl_off.sh和opencl_on.sh测试脚本,data文件夹下是两张大小和格式不同的图片文件TL5728_1080p.jpg和lena.png。 3 例程测试 以下分别从禁用OpenCL功能和使能OpenCL功能来进行对比测试,分别采用data文件夹下的图片TL5728_1080p.jpg和lena.png来测试。 3.1 禁用OpenCL 执行以下命令进行测试,先禁止运行OpenCL功能,然后清理缓存再进行测试,重复清理缓存和测试的步骤5次,如下图所示: Target# source bin/opencl_off.sh Target# /proc/sys/vm/drop_caches Target# ./canny data/TL5728_1080p.jpg 取以上5次测试结果的平均值:  BGR2GRAY tdiff=55.01ms  Canny tdiff=95.50ms 3.2 使能OpenCL 执行以下命令进行测试,先使能OpenCL功能,然后清理缓存再进行测试,重复清理缓存和测试的步骤6次,如下图所示: Target# source bin/opencl_on.sh Target# /proc/sys/vm/drop_caches Target# ./canny data/TL5728_1080p.jpg 如上一共测试了6次,每一次测试之前记得先将系统内核缓存清理干净,否则测试结果有误。因为第一次运行时,内核在AM57xx上编译,OpenCL使能时会有额外的延迟,延迟时间大约为几十秒,所以第一次测试结果不作为参考。官方解释如下: Please note that the first run, with OpenCL on, has additional delay of ~1min, due to kernel compilation on AM57xx. This is constrained to first run only, if "TI_OCL_CACHE_KERNELS" environemnt variable is set. 由以上6次的测试结果,取最后5次测试结果的平均值:  BGR2GRAY tdiff=185.38ms  Canny tdiff=17.71ms 3.3 测试结果对比 同理,按照如上操作步骤在分别禁用OpenCL和使能OpenCL的情况下,计算处理lena.png图片所用的时间,并对5次测试的数据取平均值。对比以上测试结果,如下表所示: 作用率=禁用OpenCL计算处理图像数据所用的时间/使能OpenCL计算处理图像数据所用的时间。 以下是官方的测试数据: BGR2GRAY作用率=0.345 Canny作用率=1.690 从测试结果可以看出来,本次测试与官方测试结论是一致的:OpenCL对BRG2GRAY算法不但没有性能上的提升反而存在着负面的效果;而对Canny算法则有着非常明显的提升效果,与官方的作用率进行对比,本次测试得出的作用率要大于官方提供的作用率数据,这与待测试的图像文件有一定的关系。 官方提供的其他OpenCL内核的测试数据: 链接:http:// processors.wiki.ti.com/index.php/OpenCV