原创 基于OMAP的嵌入式TCP/IP开发【转】

2008-3-29 20:52 2134 5 5 分类: 通信
基于OMAP的嵌入式TCP/IP开发


张阳,唐昆

(清华大学 电子工程系微波与数学通信国家重点实验室 北京 100084)



着人们对智能化产品需求的增加,未来的嵌入式产品,包括各种家电、通信、PDA、仪器仪表等设备正逐渐走向网络化,以共享互联网中庞大的信息资源,因此使
嵌入式设备的网络化开发有广阔市场前景,由于嵌入式硬件资源有限,而传统的TCP/IP等网络通信协议对计算机存储器、运算速度的要求较高,所以不能直接
应用,为此,必须开发一套适合嵌入式系统的、高度优化的、最为精简的TCP/IP协议栈。


开放式多媒体应用平台OMAP(Open Multimedia
Application
Platform)是美国德州仪器公司推出的高度集成的软硬件平台。OMAP具有独特的双芯结构,结合了DSP与RISC内核,可为无线多媒体设备提供独
一无二的性能和功耗优势,OMAP可连接十分丰富的外围设备,包括USB、摄像头、声音设备、视频设备、网络设备等,OMAP拥有开放式体系结构,其应用
环境完全可编程。



软件协议的设计与实现在很大深度上决定了通信终端的质量,基于OMAP的3G移动终端软件协议结构由信令协议栈和应用业务协议栈组成,如图1所示,
TCP/IP协议栈位于应用业务协议栈的底层,为上层的H.323协议栈提供基础与服务,其性能质量将直接决定整个通信终端软件系统的运行质量。因此,针
对嵌入式系统联网的发展方向,为OMAP系统其设计一套高效、简洁的TCP/IP协议,对其应用具有十分重要的意义。



xsj063211_1.jpg


1 开发方案



PC上有功能强大的VC平台和网络分析工具(如Sniffer)便于调试,其设计不针对任何一个嵌入式芯片,具有较好的通用性和可移植性,在PC机上实现
的TCP/IP协议,除了以太网层要结合OMAP平台的网卡硬件重写外,基本上可以直接移植到OMAP平台上,不需要再做大的改动,作为一个通信程序,必
须需要两端程序同时调试,在PC机上编好的程序能度OMAP平台上程序的调试提供可靠的帮助,因此,协议开发采用先模拟再移植、先整体再部分的设计思路,
而协议各层实现的顺序为自下而上。具体步骤是:



(1)在PC机上的Windows操作系统及VC6.0开发平台上,实现嵌入式系统TCP/IP协议族的模拟器,该模拟器应该能实现TCP/IP协议的基
本功能,包括以太网驱动程序、ARP、IP、UDP、TCP等,并且实现的ARP、IP、UDP、TCP层的程序应该通用于各嵌入式系统并可移植。



(2)将该模拟器移植到OMAP开发平台,用其以太网卡的驱动程序替换原模拟器的链路层程序,在TI提供的CCS平台上最终实现基于OMAP的TCP/IP协议。



2 开发平台



OMAP的多媒体开发平台Innovator主要由4个模块组成:PM(处理器模块)、IM(接口模块)、M(扩展模块)、BOB(主连接板)。OMAP
处理器在PM上,以太网卡在BOB上,可以通过Innovator上的OMAP1510芯片的ARM微处理器对单片以太网控制器LAN91C96的工作进
行控制,实现以太网帧的收发,并通过CCS对程序调试,图2为OMAP平台调试环境。



xsj063211_2.jpg


3 在PC上实现协议的基本模块



3.1 主要模块介绍



(1)主流程:首先对TCP/IP协议族的各层初始化,成功则进入主循环,主循环采用"中断+循环)"结构,简单且分层清晰,中断作为应用层发出命令,调
用下层的入口。对于接收到的以太网帧,则由下到上分别进入各层进行处理。协议实现主流程如图3所示。



xsj063211_3.jpg


(2)
PC上的以太网层:在内存中开辟接收和发送两个相同的循环缓冲区,用于存放接收和发送的以太网帧。Winpcap软件是基于Windows平台的一个网络
包工具,它提供一个系统内核级的动态链接库Packet.dll作为标准的API,具有独立于操作系统的编程接口。利用其提供的API可直接联系网卡驱动
与已定义的循环缓冲区,将缓冲区中的数据发出,并将网卡接收的数据存入缓冲区。



(3)ARP层,在内存中开辟一块循环存储区域用于存放已知的IP-MAC对应表,该表可以由上层添加,在接收到ARP应答时会自动添加,也可以上层清
空。处理ARP层函数的过程中:根据以太网首部协议字段过滤出ARP包,针对ARP请求与ARP应答进行不同的处理,应答对方的请求,记录对方的应答。




(4)IP层:根据以太网首部的帧类型标注判断接收到的是不是IP包来处理IP层函数,如果是:则调用IP包的接收函数,对给收到的IP包用各种条件进行
过滤,对于满足条件的包获取其长度与指针信息供上层使用。本层另一个主要函数是IP包发送函数,由上层调用进行IP封装。



IP的检验和仅包括IP首部,长度一般为20字节(如果没有选项)。在接收端,丢弃检验和不为OxFFFF的包,在发送端,将计算所得值的反码填入检验和
字节,由于主机和网络对数据中高低字节默认的顺序不同,在读写包中的16、32数据时,应该先进行高低字节的交换。



(5)UDP层,处理UDP层函数应根据IP首部的协议字段判断是否UDP包。如果是:则调用UDP包接收函数,用各种条件对其进行过滤,提出UDP数据
及各种有用信息,根据端口号提交给应用进程处理,本层的另一个主要函数是UDP发送函数,实现封装UDP包(包括载入UDP数据,计算并填入UDP首部信
息),最后调用IP发送函数,较由IP层处理。



(6)TCP层:与UDP不同,TCP主机要进行数据通信之前,必须与对方建立连。与几个主机通信,就要建立几个连接。然而,若要知道接收到的TCP包属
于哪个连接且使得几个不同的连接之间独立工作、互不干扰,则需要定义TCP的控制模块,这里用一个结构体数组实现,存放所有关于连接的信息。


xsj063211_4.jpg

xsj063211_5.jpg

处理TCP层函数,判断接收包的类型,如果是TCP包,则调用TCP接收函数,TCP接收函数用指定条件进行过滤,找到该包所属的连接或完成一个新连接的被动打开,根据TCP的状态转换则完成11种状态的转移,并且实现了多路数据同时、双向的传输。




TCP的发送函数包括主动打开、主动关闭(由上层调用完成新连接的主动打开,或主动关闭一个已建立的连接)和发送控制包(用于TCP连接的建立与终止,会在TCP接收函数中调用,从而实现TCP的转换)三个函数。




TCP层还实现了两个定时器,TCP重传定时器函数可提供服务可靠性的有效保障;TCP保活定时器能够避免资源的浪费。



3.2 程序特点分析



(1)简单性:4.4BSD-Lite版的完整TCP/IP内核实现大约有15 000行,而本程序源代码约有1 400行,更适合嵌入式系统的应用。




(2)可重用性:本程序分层清晰。对于不同的嵌入式系统,可能使用的CPU和以太网卡不同,这就需要针对其特点的以太网层设计,而ARP、IP、UDP、TCP则不需要改动。




(3)可拓展性:TCP/IP协议是底层网络协议,本程序留有很好的接口,可在其上构件更高层的网络协议,包括H.323协议、ftp、telnet。




4 在OMAP平台上的移植



4.1 单片以太网控制器LAN91C96



LAN91C96是SMSC公司生产的专门用于嵌入式产品的10Mbps以太网控制器,具有性能优良,功耗低及尺寸小的特点,如图4所示。




xsj063211_6.jpg


6KB的RAM:用来存放数据包。



MMU:对RAM进行有效管理,为接收和发送包在RAM中分配存储空间。

ARBITE:使MMU和RAM与CPU、CSMA很好地连接。



CSMA/CD模块:集成了IEEE 802.3 MAC层协议,负责监听网络情况和地址过滤。若目的地址是LAN91C96的地址、广播地址或多播地址,则接收此数据包,否则抛弃。




ENDEC:负责与10Mbps为以太网物理媒体的连接。



LAN91C96采用地址映射方式,通过访问Innovator为的指定地址对其存储器访问。LAN91C96的寄存器在Innovator内存中的地址
分配为:0x08000300-0x0800030F。寄存器共有4组(BANK0-BANK3),使用相同的地址,通过BANK_SELECT寄存器选
择。



4.2 移植过程



先实现该网卡芯片的驱动程序,再用它替换PC模拟器的以太网层,程序驱动主要包括以下三个部分:



(1)初始化:主要为Lan91C96的各寄存器填入正确的初始值使其正常工作。



(2)接收:如图5所示,由CSMA(载波侦听模块)接收到符合地址要求的后,MMU(存储器管理单元)为其请求在RAM中分配存储空间并分配一个编号,
DMA将其存入RAM。接着在接收数据的前面封装STATUS的化COUNT字节信息,如果CRC检测正确,则将其编号放入接收FIFO,如果接收
FIFO不为空,则RCV_INT(接收中断标识)被设置。检查接收中断寄存器状态,如果就接收中断,对应其编号,上层协议便可以取出数据了,取出后,将
该数据编号从FIFO中清除。



xsj063211_7.jpg



态字可以从RCR寄存器中读取,它反应了接收过程出现的各种措施,如CRC错误、接收帧过长等,数据包的编号从FIFO_PORTS寄存器中获得,而数据
指针可从POINTER寄存器中获得,数据信息从DATA寄存器中得到,根据这些信息将接收数据包复制到CPU内存,供上层使用,接收函数的主要流程如图
6。



xsj063211_8.jpg


(3)
发送:图7描述了发送数据包FIFO中的排队过程,首先MMU在RAM中分配一定字节的存储空间,然后,将分配结果寄存器中的编号放入PNR寄存器,写数
据指针寄存器POINTER并将上层数据封装后拷入DATA寄存器,根据其编号放入发送FIFO,排队的包将自动发出,发出包的编号接着进入发送完成
FIFO。如果发送成功,则存储空间自动释放;否则释放存储空间并将其重新排队。



xsj063211_9.jpg


5 实验结果



5.1 内存资源占用量



运行该TCP/IP协议栈需要3MB内存,而Innovator体32MB SDRAM 和32MB Flash,内存占用率为:3M/64M=4.7%,完全适用于嵌入式系统。




5.2 数据传输可靠性



TCP利用以下机制纠错。数据的传输过程中的误码:检验和机制与重传机制,数据的重复,在接收端会自动舍弃已经接收过的数据包,并且不发ACK,故不会发
生一个数据包接收多次的情况,数据包的丢失,接收端在接收完一段数据后,会计算下一个预期数据的序号,如果不符合就不发ACK,从而导致发端重发,避免了
数据包的丢失,经测试,在未发生拥塞情况下,传输的误码率几乎为0。



5.3文件最大平均传输速率



下面就本程序所实现的利用TCP进行文件传输功能,给出不同情况下的最大传输速率,实验环境为10Mbps以太网。



理想状态下的理论最大吞吐量:假定发送方传输两个背对背、满长度的TCP数据,接收方为其发出两个ACK,每包中用户数据量为1460位,总数据量为1538位,故最大的用户数据吞吐量为:



xsj063211_10.jpg

本实验测得文件的平均传输速率随着TCP连接数的增多有如图8所示的曲线变化,前半段随着连接数的增加成线性增长,后半段由于出现了网络拥塞,整体的平均速率反而有所下降。




xsj063211_11.jpg


实验结果与理论最大吞吐量有所差距,原因在于:



(1)理论上只是一种理想的状态,现实中难以达到。



(2)受CPU处理速度及文件传输过程的读、写文件操作的限制。



(3)本程序采用的数据传输机制是当收到上一个包的ACK之后再发送下一个数据包,这样避免了对接收数据的排序,提高了可靠性,但数据的传输速度会受到制约。


 

本文摘自《电子技术应用》

PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
5
关闭 站长推荐上一条 /3 下一条