>
现在,高性能计算(High Performance Computing -- HPC)解决了世界上最为复杂和艰巨的计算难题,并且能够轻松处理。气象建模、模拟撞车试验、人体基因绘图以及核爆炸模拟等多种与人类生命相关的重要领域都要用到HPC。突飞猛进的性能、急剧下降的成本以及势如潮涌的需求等众多因素,促使HPC迅速走出科学研究实验室,步入主流商业领域。英特尔不但提供了商业化/即时可用(Commercial, Off-the-shelf -- COTS)技术解决方案,而且还在致力于联合业界主要厂商和服务提供商,共同部署和支持上述要求苛刻的系统。通过将台式机、集群和大型SMP系统的性能进行完美结合,HPC正在步入网格计算时代,它将使任何人都能随时随地、经济高效地进行计算。
从科研领域到主流产业
短短几年时间里,在大型PC集群上并行运行科学和技术应用的实践已经从幕后走到台前,成为一种主流趋势。1994年,NASA*工程师在Goddard飞行中心建造了第一个由Linux*系统电脑组成的小型集群-“Beowulf”。他们的成功激发人们的对此的广泛兴趣,很快,类似的集群便在全球各地的大学和政府实验室投入运行。
1997年,桑地亚(Sandia)国家实验室*和英特尔公司合力打造出了ASCI Red-世界上第一台TFLOP计算系统(每秒执行一万亿次浮点计算)。作为美国能源部(DOE)高级战略计算计划的一部分,这个大规模并行处理系统成了第一批采用COTS组件建造的真正的超级计算机之一。与此同时,康奈尔理论中心*开始用Microsoft* Windows*和英特尔架构服务器组成的集群,替换其RISC架构超级计算机。这一举措标志着COTS集群从此进入了商业应用领域。
今天,几大领先制造商,尤其是专业解决方案提供商都在提供英特尔架构COTS集群系统,并配有完备的商用软件和全面产品支持。众多企业都被其几乎不可抗拒特性和优势所打动,并争相进行部署。除政府、教育和国家实验室等公共部门之外,HPC在制造、金融、能源、生命科学和数字媒体等行业都广受青睐。
网格:分布式计算的又一次浪潮
广受欢迎的网格计算已被视为下一代分布式计算的标志。网格扩展了基于标准的开放式集群平台的概念,可以支持任何互连的计算设备之间进行协作 – 甚至将扩展到全球任何一个角落。网格囊括了台式电脑、部门级服务器、大型SMP系统和大型数据中心服务器,能够以空前的规模效益提供更为经济的资源。网格技术可将计算资源进行“虚拟”组合,并可以不限地点、硬件类型和操作系统的差异使它们协同工作,从而实现总体性能大于各部分相加的整体优势。
全世界正在兴建一种工作网格平台,将众多国家实验室、大学和工业实验室连到一起。其中的重要开发资源包括美国万亿次网格计算(TeraGrid)、欧盟网格计划以及新加坡生物信息学院网格系统。同时,网格技术已经不可避免地与正在开发的互联网服务交付标准(即网络服务标准)相融合。互联网分布式计算这种综合性技术即将浮出水面,它将使全球数以百万计的系统作为一个巨大无比的计算资源来运行,并允许遍布全球的用户灵活地进行高性能技术计算。
通过把大量客户机作为网格的入口并开发开放的标准,任何组织都可以对台式机、集群或大型SMP系统上的闲置计算资源加以利用。这将大大提高总体计算性能,并在实时访问信息的基础上取得更先进的成果。
英特尔引领HPC与早期的网格部署
下面介绍一些近期内出现的,基于英特尔架构或业界领先技术的HPC集群和网格部署情况。
Ÿ 企业级网格:Novartis
– 挑战:在一年之内以低于10倍的成本,将领先优势及规模提高10倍。
– 试验重点:首次用7天时间完成以前需要3.18年才能完成的处理任务。对超过600台windows台式机进行无缝整合,降低累积带宽消耗量。
Ÿ 合作伙伴级网格:TeraGrid
– 此类网格成员使用拥有13.6 TFLOP处理能力的3300节点分布式计算网格,进行分子建模、气候和大气模拟以及能源研究等领域的研究。
Ÿ 公共网格:探索癌症疗法
– 与国家癌症研究基金会和牛津大学的合作项目证明,这种革命性的科学计算可用于探索癌症疗法。
– 由于无与伦比的响应能力,将可处理的项目规模扩大100倍以上,成为目前最大的计算化学研究项目。
Ÿ 太平洋西北国家实验室
– 挑战:在环境研究、能源、保健和国家安全等研究领域要想获得突破性进展,必须拥有超凡的处理性能
– 解决方案:在716个惠普*节点内部署1432颗英特尔®安腾®2处理器,将实现超过9 TFLOPS的性能。
Ÿ 路易斯安那州大学(LSU)
– 挑战:气象学的研究工作要求超强的处理性能,LSU需要使用世界上最快的超级计算机。
– 解决方案:1024颗英特尔至强处理器在Atipa Technologies*的512节点Linux集群上运行,以满意的价格为该大学提供提供超过2.2 Teraflops的性能。
Ÿ 戴姆勒克莱斯勒
– 挑战:创新的模拟撞车试验解决方案需要更短的“结果算出时间”(计算出结果所需的时间缩短20%),并替代三台超级计算机。
– 解决方案:采用英特尔®至强™处理器的108节点IBM*集群保持了极高的分析精确度,而成本却只是以前系统的60%
Ÿ 康奈尔理论中心
– 挑战:需要顶级的性能以减轻计算密集型工程建模方面的计算瓶颈。
– 解决方案:采用英特尔®奔腾®处理器及Microsoft Windows*操作系统的730节点Dell*集群可提供所需的性能、可靠性和支持。
英特尔在网格和HPC领域的作用
作为业界HPC解决方案标准构建模块的领先供应商,英特尔是全球众多设备制造商、软件开发商、系统集成商和服务提供商的动力核心,这些厂商基于开放的标准体系结构全力打造一流的解决方案。在与业界的通力合作下,基于英特尔的HPC设备已经实现了优异的性能、可扩充性、灵活性和升级能力–而成本只是基于RISC的专有HPC集群和超级计算机的几分之一。英特尔战略的核心组成部分包括:
技术构建模块
英特尔可提供支持HPC集群和网格的全套构建模块:处理器;性能增强的芯片组合服务器平台、互连技术和广泛的开发软件。
英特尔平台
· 高性能台式机–主频高达3.06 GHz并支持超线程技术的英特尔®奔腾®4处理器可为组建经济的集群和分布式对等台式机环境提供理想的平台。英特尔®NetBurst™微体系结构采用32位体系结构,支持创新的HPC。
· 高价值工作站–英特尔Ò至强Ô处理器可为双处理器集群节点提供完美平衡的性能、可靠性、灵活性和价值。英特尔NetBurst体系结构和超线程技术的完美结合可为要求苛刻的应用提供更短的响应时间、更高的处理速率和更强劲的性能。
· 服务器–英特尔至强处理器MP专为大型多路SMP应用设计—是要求每个节点都具有更高处理能力的集群应用的绝佳选择。通过英特尔NetBurst体系结构和超线程技术与大容量集成式3级高速缓存相结合,可为32位处理器提供无与伦比的性能。
· 高端集群–英特尔Ò安腾Ò 2处理器可提供大规模浮点执行资源,从而能够支持最繁重的技术处理工作负载。64位显式并行指令计算(EPIC)体系结构结合高达3 MB的集成式三级高速缓存可提供更高的处理速度和更充足的内存访问空间。可靠性特性包括增强错误探测和纠错机制,以及高级系统检测体系结构,能够避免造成数据丢失、破坏和停机。
英特尔系统构件模块
· 英特尔芯片组具有平衡的体系结构,支持为完善英特尔处理器而度身定制的系统总线、内存和互操作性带宽。芯片组还具备出色的可靠性、可用性、可扩充性和可管理性等诸多高级特性,可确保实现独立的、无故障的运行。
· 英特尔服务器平台几乎是一种完全盒装的服务器系统,由英特尔采用一流的构件模块设计而成,可为系统集成商提供极为可靠、可扩展和可管理的平台,并能针对多种应用轻松进行现场配置,包括安装高密度集群。
低延迟互连技术
· InfiniBand*体系结构是支持信道式交换结构和互操作性互连技术的业界标准,其最大优点在于能够降低外部存储访问和进程间信息发送的延迟,从而显著提高集群性能。
软件:英特尔开发商工具和服务
· 英特尔编译器支持OpenMP*标准和自动并行性,能够简化和加快线程应用的开发,并针对采用英特尔处理器的系统来优化性能。
· 英特尔性能库提供了针对英特尔处理器而优化的众多功能,可加快开发速度,降低成本并提高应用性能。
· 英特尔线程工具来自英特尔KAI软件实验室,它可以简化多线程应用的开发,从而充分利用多线程技术和OpenMP并行编程模式。其主要特性包括自动检测线程错误和提供直观的性能瓶颈视图。
· 英特尔®并行应用中心(PAC)提供了具有领先水平的实验环境,独立软件厂商(ISV)可以利用它来改进基于英特尔的