>
首页 » 市场趋势 » 基带SoC的系统解决方案

基带SoC的系统解决方案

作者:ARM公司 Dominic Pajak  时间:2007-02-02 13:11  来源:本站原创

SoC设计的复杂度在不断增加,同时,市场的压力对产品的质量和交付时间都提出了更加苛刻的要求。本文将以TTPCom公司的CBEmacro 3G调制解调器为例,介绍ARM公司在面对当今无线SoC芯片平台设计挑战时的解决方案。

CBEmacro 3G调制解调器
CBEmacro 3G是针对GSM、GPRS、EDGE、WCDMA和HSDPA标准的完整调制解调器解决方案(见图1)。该解决方案充分利用了TTPCom公司在无线调制解调器技术上的专业经验和大量投资,能够实现基带设计平台的快速开发。
在设计CBEmacro时,TTPCom公司选择了ARM1156T2-S处理器作为基带子系统的核心,在实现时利用了ARM PrimeCell外围设备、AMBA 3 AXI总线和RealView工具。本文将着重考虑如何令CBEmacro的设计从基于ARM处理器的解决方案中获利,以及如何利用ARM的生态系统将CBEmacro设计快速集成到更大的SoC设计中。

图1 CBEmacro 3G调制解调器结构框图

满足性能要求
先进的微架构、分支预测单元,再加上Thumb-2指令集结构使得ARM1156T2-S处理器能够带来任何ARM11系列处理器的最佳指令吞吐量。
在测试时,与在ARM9处理器上运行Thumb代码相比,在ARM1156T2-S处理器上运行Thumb-2代码能带来高达2倍的性能提升。在实际的系统中,预期的性能提升大概在1.5倍左右,这已通过了TTPCom公司协议堆栈代码的验证。当在ARM1156T2-S处理器上编译Thumb-2指令时,与将同样的代码在ARM946E-S处理器上运行相比,协议软件的抽样显示出大概1.5倍的性能提升。性能的提高意味着执行相同操作时,时钟频率可以相应降低;再利用ARM的Artisan Metro单元库,可以将3G无线应用的功耗降低47%。

减小芯片面积
由于性能较高,因此ARM1156T2-S处理器可以在相对较低的频率下被综合,而且可以使用高密度的高速缓存。在90nm工艺下,具有16k指令和数据高速缓存的ARM1156T2-S处理器的面积仅为2.4mm2。相反地,为了满足HSDPA基带设计的性能要求,ARM926EJ-S必须在其目标频率之上被综合,而且需要大容量的高速RAM。因此,和ARM926EJ-S相比,ARM1156T2-S处理器具有更小的尺寸和更低的功耗。通过运用ARM的CoreSight技术来共享调试模块,还能够进一步减小芯片面积。



图2 系统集成和安全内核

内存面积
除了ARM1156T2-S本身的内核面积比较小以外,Thumb-2指令集架构也可进一步降低芯片面积成本。Thumb-2指令集能够在单指令集架构中满足代码密度和性能的严格要求。除了能实现异常处理和系统控制功能外,Thumb-2还能提供SIMD和NEON操作,并支持完全寄存器和协处理器的访问。通常用ARM代码实现的那些性能关键的部分以及系统程序都可用Thumb-2实现,而且能保证较高的代码密度。
TTPCom公司的测试显示:利用RealView编译工具(RVCT)2.2.1进行编译时,在保证性能提升的同时,Thumb-2代码只比Thumb增加了3%。这个结果和ARM公司对9MB现实指令的代表代码所作的标准测试结果一致。而且,当使用最新版本的编译器(RVCT 3.0 beta版)进行编译时,Thumb-2代码的大小还比Thumb减小了0.5%。

系统集成
应用处理器的集成
利用AMBA 3 AXI的适应性可扩展总线结构,CBEmacro 3G调制解调器可以非常容易地集成到应用处理器中,如ARM1176JZF-S或Cortex-A8。其它应用处理器可以通过系统中预先配置好的ARM PrimeCell PL300 AXI互联系统和ARM1156T2-S基带MCU共享总线系统(见图2)。
高性能的AMBA AXI总线交互模型允许数据和地址相互分离,在实现系统带宽最大化的同时降低了工作频率。通过降低从主内存中对性能关键代码的指令提取,运行在ARM1156T2-S处理器上的Thumb-2代码可以让出更多总线带宽,将其提供给高性能视频或应用处理器。同时也允许大量重要的程序驻留在高速缓存中,从而提高了高速缓存的命中率。这些都有助于降低功耗,延长电池寿命。
安全性
为了提高收入,网络运营商向用户提供了许多无线服务,如多媒体内容点播、软件下载和移动商务等。为了安全可靠地实现这些服务,需要利用安全技术来保护软件和媒体内容的版权、防止病毒侵害,并为敏感的用户数据建立一个可以信任的平台。
因此,CBEmacro 3G集成了ARM可信赖的计算技术TrustZone。TrustZone给那些安全性要求比较高的应用提供了软件和硬件的支持。它可以使应用处理器通过安全的内核和基带系统进行通讯,在应用处理器上执行的不被信任的用户程序(如下载的游戏)在访问安全内存时会受到限制。这样,基带MCU和操作系统均受到了保护,未经授权的用户代码将无法访问。进一步,系统设计师也可以现场配置安全应用,如允许运营商为购买服务的用户配置DRM代理。这样,在不降低系统完整性的前提下,也保证了内容的灵活性。
快速的系统开发
利用ESL(电子系统级)设计工具,如RealView Create系列的SoC Designer,可以大大加速CBEmacro 3G调制解调器的SoC设计。SoC Designer可以利用大量可扩展的System C模型,快速设计、仿真和调试复杂的SoC。这个模型库包括ARM内核、AMBA总线架构,以及一系列第三方处理器的内核和DSP。精确的模型加上系统建模功能意味着可以比以前更快、更准确地实现最优设计。
利用SoC Designer提供的虚拟设计原型,系统软件的上市时间也可以被大大缩减,器件驱动程序、应用代码以及测试等都能尽早提供。另外,由于具有图形用户界面,因此SoC Designer能够为开发和调试提供快速的System C仿真。

降低系统功耗
如前所述,对于3G基带系统,和ARM9系列的处理器相比,利用ARM1156T2-S处理器可令器件工作在相对较低的频率下,因此大大降低了功耗。利用ARM Artisan Metro单元库,系统的功耗可以进一步降低。Metro平台是第一个专门针对高性能、低功耗的便携式电子设备应用的物理IP解决方案,因此非常适合CBEmacro。
Metro单元库基于一系列的新的架构,充分利用了新的工艺、电路设计、电压缩放、低功耗EDA工具和芯片设计技术,从而显著地降低了功耗,同时提高了密度。Metro平台能够给设计者提供基于低功耗设计的物理IP,这些物理IP集成有低功耗设计所需要的权衡考虑技术,因而能获得过去有经验的全定制设计者才能获得的结果。
使用90nm工艺的Metro库,在315MHz下,ARM1156T2-S处理器的面积约为1.12mm2,和标准实现相比,功耗只有其75%。这相当于在CLN90G工艺下,功耗只有0.19mW/MHz。

降低软件开发上市时间
多内核调试
随着无线技术的不断发展和数据带宽的不断增加,人们期望着无线设备的功能和性能可以不断提升。针对多核SoC的复杂应用,设计和验证越来越成为产品上市的瓶颈。因此,片上调试和追踪能力对软件的可靠性、性能和上市时间有着致关重要的影响。
CoreSight技术为多核系统的调试和追踪提供了完整的解决方案。CoreSight设计包提供了强大的调试架构,可利用最小的芯片面积和引脚成本对与CoreSight兼容的多核SoC提供单点调试和追踪。以CBEmacro 3G为例,ARM1156T2-S基带处理器中包含的ETM11CS选项可以为实时指令和数据提供追踪,处理器中的总线监控器可在ARM1156T2-S处理器和DSP子系统之间提供通讯。结合了应用处理器,如ARM1176JZ-S或Cortex-A8时, CoreSight允许利用一套工具来对ARM处理器进行追踪和调试,并且共享片外调试和追踪连接。CoreSight技术也可以被扩展,对第三方外设或DSP进行追踪。
CoreSight追踪技术在保证引脚和芯片面积最小的同时,允许对多个器件的实时指令和数据进行追踪,其中多个追踪源可以通过一个追踪端口接口单元(TPIU)从片外获得。CoreSight调试访问端口(DAP)利用一个5引脚的JTAG接口,提供了独立的JTAG访问多核模式(见图3)。当一个内核被切断电源或处于休眠状态时,连至其它内核的调试模块仍然正常工作。这样就大大减少了引脚数目,当采用了2个21引脚的追踪端口和2个5引脚的JTAG端口时,就可以节省26个引脚。CoreSight Serial Wire Debug(串行线调试)技术可以进一步将JTAG需要的调试引脚数从5个降至2个。



图3 CoreSight调试系统

编译工具
利用Thumb-2后,由于无需极耗时间的建模、编译,以及ARM核和Thumb程序之间的相互作用,ARM1156T2-S基带处理器的编译流程可以被进一步简化。对于一般的应用,Thumb代码无需修改即可直接在Thumb-2内核中运行。ARM1156T2-S基带处理器具有先进的分支预测功能,可以大大提高Thumb代码的执行效率。
为了充分利用Thumb-2代码的优点, 可以用RealView编译工具(RVCT2.2.1,现在是RealView开发套件RVDS的一部分)或第三方工具,如GNU编译器来重新编译C源代码。 将ARM9E系列处理器中的GSM协议层1的代码移植到ARM1156T2-S的Thumb-2代码中时,TTPCom公司只发现了一个需要修改的地方,进而快速解决了问题。
早期软件开发
RealView SoC设计技术不仅加速了系统硬件的原型设计,而且也允许在仿真平台上进行软件开发和调试。由于采用了精确的内核和外设模型,在硬件设备完成之前,就能大大加速器件驱动程序的开发。这就允许在硬件设备完成之前就进行软件的开发,从而大大加快了产品上市速度。
在ARM1176JZ-S处理器上的大型应用程序的开发可以使用实时系统模型(RTSM)模拟技术来完成,它能提供快速、准确的指令仿真,以及与RealView Debugger的无缝连接。RTSM模拟包括LCD显示器、键盘和鼠标等外设的仿真。不到5s,就可以利用PC在ARM1176JZ-S处理器上对Linux的启动进行模拟。

结语
本文概述了ARM公司针对SoC设计挑战提出的一系列解决方案,采用这些方案,TTPCom公司在最小化芯片面积的同时满足了性能要求,能够迅速地开发和调试复杂度不断增加的软件系统,并提高了安全性能,为客户提供了高性能、低功耗的产品。■

相关推荐

ARM收购Geomerics 强化行动装置游戏视觉

ARM  游戏视觉  2013-12-18

ARM:2013年Mail芯片出货量将超三亿片

ARM  芯片  2013-12-06

ARM控制智能机及平板芯片市场趋势将持续

ARM  控制智能机  2013-11-28

推动连网与行动创新 ARM聚焦物联网商机

ARM  物联网  2013-11-26

全球75%企业高管关注物联网新机遇

ARM  物联网  2013-11-08

英特尔将代工ARM芯片 或引发芯片价格下跌

英特尔  ARM  2013-10-31
在线研讨会
焦点