群集技术全接触

群集技术全接触
刘志勇

科学群集
科学群集是指以提高科学计算能力为目的计算机群集技术，基于并行计算的基础之上，需要为之开发并行编程应用程序，以解决复杂的科学计算问题——将一个应用程序分割成多块可以并行执行的部分并指定到多个处理器上执行，。但是，科学群集并不使用专门的并行超级计算机，采用这种技术的超级计算机内部通常由十至上万个独立处理器组成，使用商业系统，如通过高速连接来链接的一组单处理器或双处理器个人计算机，并且在公共消息传递层上进行通信以运行并行应用程序。平常所说的便宜的Linux超级计算机实际上就是一个计算机群集，其处理能力与真正的超级计算机相等。通常一套象样的群集配置开销要超过80万元人民币，对一般用户来说过于昂贵，但与价值动辄数百万元人民币的专用超级计算机相比还是很划算的。采用这种群集技术的典型代表有IBM的“深蓝”超级计算机。
比较流行的HPC采用Linux操作系统和其它一些免费软件来完成并行运算。这一集群配置通常被称为Beowulf集群。这类集群通常运行特定的程序以发挥 HPC cluster的并行能力。这类程序一般应用特定的运行库, 比如专为科学计算设计的MPI库。壳牌石油公司（Shell）所使用的由IBM xSeries服务器组成的1024节点的Linux HPC Cluster是目前世界上计算能力最强的计算机之一。

负载均衡群集
    当企业的业务量的发展都超出了过去最乐观的估计，即使按照当时最优配置建设的络，也很快会感到吃不消。尤其是各个络的核心部分。在此情况下，如果扔掉现有设备去做大量的硬件升级，将造成现有资源的浪费，而且如果再面临下一次业务量的提升，又将导致再一次硬件升级的高额成本投入，甚至性能再卓越的设备也不能满足当前业务量的需求。于是，负载均衡机制应运而生。
    对于企业需求而言，负载均衡群集是一种更实用的系统。顾名思义，负载均衡群集可以使负载在系统中尽可能平均地分摊处理。负载可以是需均衡的应用程序处理负载，也可以是络流量负载……这类系统适合于运行同一组应用程序的大量用户。每个节点都可以处理一部分负载，并且可以在节点之间动态分配负载，以实现平衡。对于络流量亦如此。通常，络服务器应用程序会接受过多的入流量以致无法迅速处理，这就需要将流量发送给在其它节点上运行的络服务器应用。还可根据每个节点上不同的可用资源或络的特殊环境来进行优化。
    负载均衡群集就是带均衡策略（算法）的服务器群集。负载均衡群集在多节点之间按照一定的策略（算法）分发络或计算处理负载。负载均衡建立在现有络结构之上，它提供了一种廉价有效的方法来扩展服务器带宽，增加吞吐量，提高数据处理能力，同时又可以避免单点故障。
负载均衡群集运行时一般通过一个或者多个前端负载均衡器将工作负载分发到后端的一组服务器上，从而达到整个系统的高性能和高可用性。这样的计算机集群有时也被称为服务器群（Server Farm）。
    Linux虚拟服务器（LVS）项目在Linux操作系统上提供了最常有的负载均衡软件。

高可用性群集
高可用性群集的出现是为了使群集的整体服务尽可能可用，以便考虑计算硬件和软件的易错性。如果高可用性群集中的主节点发生了故障，那么这段时间内将由可用的次节点代替它，这就是故障切换。次节点通常是主节点的镜像，所以当它代替主节点时，它可以完全接管其身份，并且因此使系统环境对于用户是一致的。它的具体实现思路是这样的：负责监视资源的资源监视器一旦发现资源出现故障，它就会通知群集服务，群集服务会根据事前定义好的策略触发对应的事件。虽然发现的是个别资源的故障，但是，群集还是会把整个资源组进行故障切换。

格计算
格计算，或者称为格群集，是一种与群集计算关系比较密切的技术。格与传统群集的主要区别在于，格是连接一组相关并不信任的计算机，它的运作更像一个计算公共设施而不是一个独立的计算机。还有，格通常比群集支持更多不同类型的计算机集合。格计算是针对有许多独立作业的工作任务作优化，在计算过程中作业间无需共享数据。格主要服务于管理在独立执行工作的计算机间的作业分配。资源如存储可以被所有结点共享，但作业的中间结果不会影响在其他格结点上作业的进展。

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

群集技术全接触

相关推荐