Cortex-M3与ARM7TDMI-S内核运算性能比

首页 » 业界动态 » Cortex-M3与ARM7TDMI-S内核运算性能比

Cortex-M3与ARM7TDMI-S内核运算性能比

作者：时间：2008-07-30 11:26 来源：EDN

自从STM32推出后，我对它很感兴趣，由于它采用了ARM的Cortex-M3内核，所以很想了解一下其性能和ARM7相比究竟如何？很巧的机会知道了EDNCHINA，参加了EDN这次的团购活动，我得到了一块STM32开发板，使得我有机会测试一下这2种内核CPU的性能。

　　在测试之前先简单测试的2个平台，编译环境和测试方法。

　　Cortex-M3：ARM公司为要求高性能(1.25 Dhrystone MIPS/MHz)、低成本、低功耗的嵌入式应用专门设计的内核。Cortex-M3内核主打存储器和处理器的尺寸对产品成本影响极大的各种应用市场，是针对这些市场的低成本需求，专门开发设计的微处理器内核。Cortex-M3内核增强了芯片上集成的各种功能，包括把中断之间延迟降到6个CPU周期的嵌套向量中断控制器、允许在每一个写操作中修改单个数据位的独立位操作、分支指令预测、单周期乘法、硬件除法和高效的Thumb 2指令集，这些改良技术使Cortex-M3内核具有优异的性能、代码密度、实时性和低功耗。

　　ARM7TDMI-S：也是ARM公司的高性能（0.95 Dhrystone MIPS/MHz），低功耗的嵌入式应用CPU内核。该CPU内核带有实时调试接口，包含JTAG和嵌入式跟踪。能够执行32位ARM和16位Thumb指令。可以针对性能或代码大小，优化应用。当内核在Thumb状态下执行指令时，它可将代码规模降低超过30%，性能的损失却很小；而在ARM状态下执行指令时，内核的性能达到最大化。

　　测试平台对比：

测试平台对比
测试方法：设置25ms定时（各自通过片内定时器实现），在这段时间内分别计算32位加/减/乘/除法，然后统计运算次数打印到串口输出。运算次数越多性能越高。编译时，去掉各种优化（平台1使用Thumb-2，平台2使用ARM v4）。编译后，程序下载到MCU的RAM中执行，避免Flash速度的不足对测试成绩造成的影响。