一:集群相关概念及知识点介绍:
LVS(LinuxVirtualSystem)
本项目在1998年5月由章文嵩博士创立,是中国国外最早出现的FreeSoftware项目之一。linux虚拟服务器(LVS)项目在linux操作系统上提供了最常见的负载均衡软件。
集群定义:
集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的利润linux多线程编程,其任务调度则是集群系统中
的核心技术。本文就集群系统的定义、发展趋势、任务调度等问题进行了简略阐述。集群是一组互相独立的、通过高速网路互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个顾客与集群互相作用时,集群像是一个独立的服务器。集群配置是用于提升可用性和可缩放性。
集群系统的主要优点:(高可扩充性、高可用性、高性能、高性价比)
目前运行在LINUX最主流的三种集群:
负载集群之一:LB(LoadBalancing)
负载均衡集群运行时,通常通过一个或则多个后端负载均衡器(DirectorServer),将用户发来的恳求资源信息,通过一种调度算法发送至到前端的一组应用服务器(RealServer)上,进而达到整个系统的高性能和高可用性。这样的计算机集群有时也被称为服务器群(ServerFarm)
通常高可用性集群和负载均衡集群会使用类似的技术,或同时具有高可用性与负载均衡的特性。
负载集群之二:HA(High-Availability)
通常是指当集群中有某个节点失效的情况下,其上的任务会手动转移到其他正常的节点上。而且还可以将集群中的某节点进行离线维护再上线,该过程并不影响
整个集群的运行。
高可用集群:为了保证服务仍然在线的高可用能力的集群
评判标准:可用性=在线时间/(在线时间+故障处理时间)
负载集群之三:HP
高性能估算集群采用将估算任务分配到集群的不同估算节点因而提升估算能力,因此主要应用在科学估算领域。比较流行的HPC采用Linux操作系统和其它一些免费软
件来完成并行运算。这一集群配置一般被称为Beowulf集群。这类集群一般运行特定的程序以发挥HPCcluster的并行能力。这类程序通常应用特定的运行库,例如专为科学估算设计的MPI库。
HPC集群非常适宜于在估算中各估算节点之间发生大量数据通信的估算作业,例如一个节点的中间结果或影响到其它节点估算结果的情况。
高性能处理集群:
借助的是分布式储存:分布式文件系统,分布式文件系统把一个大任务切割为小任务、分别进行处理
LVS系统结构:
负载均衡器(LoadBalancer)、服务器群组(ServerAarry)、共享储存(SharedStorage)
负载均衡层:
整个集群服务最后端设备,它有一个或多个调度器(DirectorServer)组成,LVS软件运行在调度服务器上。
调度服务器的功能:
将用户的恳求,按照调度算法进行IP分流,将数据包发送到前端应用服务器上(RealServer)linux 集群服务器,假如调度服务器安装了
监控模块Ldirectord,这么调度服务器会将出现故障的应用服务器标记为不可用,晓得此应用服务器恢复正常。
服务器群组层:
这是由一个或则多个应用程序服务器(RealServer)组成,而且每位应用服务器提供相同的服务,调度服务器会将用户的恳求定向到具体的应用服务器上,之后由前端的应用服务器响应顾客端。
共享储存层:
功能只要是保证服务器群组中的应用服务器提供数据的一致性。
共享储存的实现方法:
c盘阵列、集群文件系统(OCFS2)
LVS是linux系统上的一种机制,类似于iptables,其相关属性也是通过(ipvsadm)与iptables命令类似的形式定义的,
LVS是工作于linux系统内核空间,通过内核来提供工作,其工作空间在iptables的INPUT链上,当顾客端恳求抵达INPUT链上之后,通过LVS规则的验证,倘若是内部恳求,发送至用户空间,假如发觉是集群,将此恳求发送至POSTROUTING链linux 集群服务器,并交给前端应用程序服务器来响应用户的恳求。
注意:前面所提及LVS虽然是工作在iptables的INPUT和postrouting链上的,所以在此系统上iptables和LVS不能同时存在。
LVS的组成:
ipvsadm:用于管理集群服务的命令行工具linux教程,工作于Linux系统中的用户空间
ipvs:为lvs提供服务的内核模块,工作于内核空间(相对于是框架,通过ipvsadm添加规则,来实现ipvs功能)
注:在linux内核2.4.23之前的内核中模块默认是不存在的,须要自己自动打补丁,之后把此模块编译进内核才可以使用此功能
LVS类型:
LVS-NAT模式、LVS-DR模式、LVS-TUN模式
NAT:(Networkaddresstranslation)
原理:把用户的恳求发来的IP包的IP报头目的地址,通过LVS服务器转换至前端提供服务的RealServer的地址并将用户的恳求报文发送至应用服务器。而应用服务器打开报文并响应用户恳求发送并经过LVS服务器,LVS服务器将源地址更改为LVS服务器插口上的VIP地址。
NAT模式特征:
123456789
用户发来的恳求和响应,都必须经过LVS服务器。集群节点跟Director必须在同一个IP网路中;RIP一般是私有地址,仅用于各集群节点间的通讯;Director坐落Client和RealServer之间,并负责处理进出的所有通讯;Realserver必须将网段指向DIP地址;支持端口映射;Realserver可以使用任意OS;LVS服务器必须有两块网卡较大规模应当场景中,Director易成为系统困局;
DR:(Directrouting)
DR模式工作在数据链路层,其原理,LVS服务器和应用服务器使用同一个IP地址对外服务,但只有LVS服务器对ARP恳求进行响应,所有应用服务器对本身这个IP地址的ARP恳求保持沉静。网段会把所有的ARP恳求定向至LVS服务器,而LVS服务器收到用户恳求数据报文,按照调度算法进行IP分流,之后相应的MAC地址的更改,发送至前端对应的应用服务器。
注:因为LVS服务器对二层数据包进行更改,所以LVS服务器和应用服务器必须在同一个广播域。
DR模式特征:
12345
集群节点跟director必须在同一个化学网路中;RIP可以使用网段地址,实现方便的远程管理和监控;Director仅负责处理入站恳求,响应报文则由RealServer直接发往顾客端;RealServer不能将网段指向DIP;不支持端口映射;
注:在DR模式中,LVS服务器只负责接收用户恳求,按照调度算法及IP分流,直接路由转发,其响应报文交给RealServer自行处理。
DR模式是三种模式当中性能最好的,惟一的缺陷是LVS服务器和前端的应用服务器必须在同一个广播域中,因而不能实现集群的跨网端应用。
TUN(IPTunnel模式)
TUN模式,LVS将TCP/IP恳求进行重新封装并转发给目标应用服务器,有目标应用程序服务器对用户恳求作出相应。LVSRouter和RealServer通过TpTunnel通过隧洞技术
进行转发,因而二者可以存在不同的网路当中。
注:因为应用服务器须要对LVS发送的报文进行还原,也就是说应用服务器也要支持IpTunnel合同。(Networkoptions)
TUN模式特征:
123456
集群节点可以跨越Internet;RIP必须是网段地址;Director仅负责处理入站恳求,响应报文则由RealServer直接发往顾客端;RealServer网段不能指向director;只有支持隧洞功能的OS能够用于RealServer;不支持端口映射;
LVS负载均衡八种调度算法:
rr-->wrr-->lc-->wlc-->lblc-->lblcr-->dh-->sh
轮叫(RoundRobin):
该算法将用户恳求有顺序地分发到前端的应用服务器,均等看待所有RealServer,而并不估算具体服务器上的链接和负载。
加权轮叫(WeightedRoundRobin):
该调度算法依照各个应用服务器的不同负载能力,给服务器设置不同的残差,处理能力强的应用服务器的残差设置大点,来响应更多的用户恳求。
最少联接(LeastConnections):
该算法将用户发送的恳求分配到联接做少的应用服务器上。
加权最少联接(WeightedLeastConnections):
该算法按照应用服务器的不同负载能力,设置不同大小不同的残差,残差较大而且联接恳求数少的应用服务器则优先分配用户恳求信息。
基于局部性最少联接:(Locality-BasedLeastConnections):
该算法针对目标IP地址的负载均衡算法,主要用于缓存集群系统。此算法会依据用户恳求的目标IP地址找出与目标地址近来的应用服务器,假如服务器没有超员,则恳求被分发到该应用服务器,假如服务器不可用或则负载较大,则使用最少联接算法,选择目标应用服务器
带复制的基于局部性最少联接(Locality-BasedLeastConnectionswihtReplication)
该算法也是针对目标IP地址的负载均衡算法,主要用于缓存集群系统。域LBLC区别在于,后者维护一个IP地址到一组服务器的映射。而前者则是维护一个IP地址到一台应用服务器的映射。
目标地址散列(DestinationHashing)
该算法将用户恳求的目标地址作为散列键,并尝试从静态分配的散列表中找出对应的应用服务器。假如目标应用服务器没有超员,这么将用户的恳求信息分发至该应用服务里,否则返回空。
源地址散列(SourceHashing)
该算法将恳求的源地址作为散列键,并尝试从静态分配的散列表中找出对应的应用服务器。假如目标应用服务器可用而且没有超员,这么将用户恳求的信息分发至此应用服务器,否则返回空。
LVSIPAddressNameConventions:(LVSIp-address命名规范)
12345
Director'sIP(DIP)address:中间层,按照不同模式,来接收并响应用户的恳求。VirtualIP(VIP)address:向外提供服务的地址。RealIP(RIP)address:RealServerIP:前端提供应用服务的主机地址。Director'sIP(DIP)address:和内部的IP通讯所使用的地址:设置在DirectorServer上Clientcomputer'sIP(CIP)address:顾客端地址
ipvsadm命令详尽介绍:
pvsadm:管理集群服务的命令行工具,而ipvs系统内核中的一个模块
1234567891011121314151617181920
-A:在内核的虚拟服务器列表中添加一条VIP记录-E:更改内核虚拟服务器列表中的一条VIP记录-D:删掉内核虚拟服务器列表中的一条VIP记录-C:清空内核虚拟服务器列表中的所有VIP记录-S:保存虚拟服务器规则-R:恢复虚拟服务器策略规则-a:在内核虚拟服务器列表中添加一个应用服务器的地址。-e:更改一个虚拟服务器列表中的一条应用服务器地址记录-d:删掉一个虚拟服务器列表中的一条应用服务器地址记录-L/-l:查看内核虚拟服务器列表-Z:将内核中的虚拟服务器计数清为0-tservice-address:指定虚拟服务器使用TCP服务-uservice-address:指定虚拟服务器使用UDP服务-sscheduler:指定调度算法:-ptimeout:在应用服务器上的持续服务时间,单位为秒-rservice-address:指定应用服务器的地址-g:指定LVS工作模式为直接路由(DR-defalut)-I:指定LVS工作模式为隧洞模式(IpTunnel)-m:指定LVS工作模式为地址转换模式(NAT)-w:设定应用服务器的残差