From bc95ef702333e72cf8e98caa6f7ce22faca7a2dc Mon Sep 17 00:00:00 2001 From: sirius Date: Sat, 16 Mar 2019 16:49:22 +0800 Subject: [PATCH] rpc --- java/RPC/dubbo.md | 243 ++++++++++++++++++++++++++++++++++++++++++++-- 1 file changed, 237 insertions(+), 6 deletions(-) diff --git a/java/RPC/dubbo.md b/java/RPC/dubbo.md index 0af63ae..8d21205 100644 --- a/java/RPC/dubbo.md +++ b/java/RPC/dubbo.md @@ -134,10 +134,61 @@ Redis方案要求服务器时间同步且存在性能消耗过大的缺点 #### Random LoadBalance: 基于权重的随机负载均衡 - -访问的次数在整体上是保持和权重比同步的 - - +RandomLoadBalance 是加权随机算法的具体实现,它的算法思想很简单。假设我们有一组服务器 servers = [A, B, C],他们对应的权重为 weights = [5, 3, 2],权重总和为10。现在把这些权重值平铺在一维坐标值上,[0, 5) 区间属于服务器 A,[5, 8) 区间属于服务器 B,[8, 10) 区间属于服务器 C。接下来通过随机数生成器生成一个范围在 [0, 10) 之间的随机数,然后计算这个随机数会落到哪个区间上。比如数字3会落到服务器 A 对应的区间上,此时返回服务器 A 即可。权重越大的机器,在坐标轴上对应的区间范围就越大,因此随机数生成器生成的数字就会有更大的概率落到此区间内。只要随机数生成器产生的随机数分布性很好,在经过多次选择后,每个服务器被选中的次数比例接近其权重比例。比如,经过一万次选择后,服务器 A 被选中的次数大约为5000次,服务器 B 被选中的次数约为3000次,服务器 C 被选中的次数约为2000次。 + + +```java +public class RandomLoadBalance extends AbstractLoadBalance { + + public static final String NAME = "random"; + + private final Random random = new Random(); + + @Override + protected Invoker doSelect(List> invokers, URL url, Invocation invocation) { + int length = invokers.size(); + int totalWeight = 0; + boolean sameWeight = true; + // 下面这个循环有两个作用,第一是计算总权重 totalWeight, + // 第二是检测每个服务提供者的权重是否相同 + for (int i = 0; i < length; i++) { + int weight = getWeight(invokers.get(i), invocation); + // 累加权重 + totalWeight += weight; + // 检测当前服务提供者的权重与上一个服务提供者的权重是否相同, + // 不相同的话,则将 sameWeight 置为 false。 + if (sameWeight && i > 0 + && weight != getWeight(invokers.get(i - 1), invocation)) { + sameWeight = false; + } + } + + // 下面的 if 分支主要用于获取随机数,并计算随机数落在哪个区间上 + if (totalWeight > 0 && !sameWeight) { + // 随机获取一个 [0, totalWeight) 区间内的数字 + int offset = random.nextInt(totalWeight); + // 循环让 offset 数减去服务提供者权重值,当 offset 小于0时,返回相应的 Invoker。 + // 举例说明一下,我们有 servers = [A, B, C],weights = [5, 3, 2],offset = 7。 + // 第一次循环,offset - 5 = 2 > 0,即 offset > 5, + // 表明其不会落在服务器 A 对应的区间上。 + // 第二次循环,offset - 3 = -1 < 0,即 5 < offset < 8, + // 表明其会落在服务器 B 对应的区间上 + for (int i = 0; i < length; i++) { + // 让随机值 offset 减去权重值 + offset -= getWeight(invokers.get(i), invocation); + if (offset < 0) { + // 返回相应的 Invoker + return invokers.get(i); + } + } + } + + // 如果所有服务提供者权重值相同,此时直接随机返回一个即可 + return invokers.get(random.nextInt(length)); + } +} +``` +RandomLoadBalance 的算法思想比较简单,在经过多次请求后,能够将调用请求按照权重值进行“均匀”分配。当然 RandomLoadBalance 也存在一定的缺点,当调用次数比较少时,Random 产生的随机数可能会比较集中,此时多数请求会落到同一台服务器上。这个缺点并不是很严重,多数情况下可以忽略。RandomLoadBalance 是一个简单,高效的负载均衡实现,因此 Dubbo 选择它作为缺省实现。 #### RoundRobin LoadBalance 基于权重的轮询 @@ -152,7 +203,130 @@ Redis方案要求服务器时间同步且存在性能消耗过大的缺点 #### LeastActive LoadBalance 最少活跃数 -统计上一次的调用时间,上次调用时间短的,优先使用 + +LeastActiveLoadBalance 翻译过来是最小活跃数负载均衡。活跃调用数越小,表明该服务提供者效率越高,单位时间内可处理更多的请求。此时应优先将请求分配给该服务提供者。在具体实现中,每个服务提供者对应一个活跃数 active。初始情况下,所有服务提供者活跃数均为0。每收到一个请求,活跃数加1,完成请求后则将活跃数减1。在服务运行一段时间后,性能好的服务提供者处理请求的速度更快,因此活跃数下降的也越快,此时这样的服务提供者能够优先获取到新的服务请求、这就是最小活跃数负载均衡算法的基本思想。除了最小活跃数,LeastActiveLoadBalance 在实现上还引入了权重值。所以准确的来说,LeastActiveLoadBalance 是基于加权最小活跃数算法实现的。举个例子说明一下,在一个服务提供者集群中,有两个性能优异的服务提供者。某一时刻它们的活跃数相同,此时 Dubbo 会根据它们的权重去分配请求,权重越大,获取到新请求的概率就越大。如果两个服务提供者权重相同,此时随机选择一个即可。 + + +```java +public class LeastActiveLoadBalance extends AbstractLoadBalance { + + public static final String NAME = "leastactive"; + private final Random random = new Random(); + @Override + protected Invoker doSelect(List> invokers, URL url, Invocation invocation) { + int length = invokers.size(); + // 最小的活跃数 + int leastActive = -1; + // 具有相同“最小活跃数”的服务者提供者(以下用 Invoker 代称)数量 + int leastCount = 0; + // leastIndexs 用于记录具有相同“最小活跃数”的 Invoker 在 invokers 列表中的下标信息 + int[] leastIndexs = new int[length]; + int totalWeight = 0; + // 第一个最小活跃数的 Invoker 权重值,用于与其他具有相同最小活跃数的 Invoker 的权重进行对比, + // 以检测是否“所有具有相同最小活跃数的 Invoker 的权重”均相等 + int firstWeight = 0; + boolean sameWeight = true; + + // 遍历 invokers 列表 + for (int i = 0; i < length; i++) { + Invoker invoker = invokers.get(i); + // 获取 Invoker 对应的活跃数 + int active = RpcStatus.getStatus(invoker.getUrl(), invocation.getMethodName()).getActive(); + // 获取权重 - ⭐️ + int weight = invoker.getUrl().getMethodParameter(invocation.getMethodName(), Constants.WEIGHT_KEY, Constants.DEFAULT_WEIGHT); + // 发现更小的活跃数,重新开始 + if (leastActive == -1 || active < leastActive) { + // 使用当前活跃数 active 更新最小活跃数 leastActive + leastActive = active; + // 更新 leastCount 为 1 + leastCount = 1; + // 记录当前下标值到 leastIndexs 中 + leastIndexs[0] = i; + totalWeight = weight; + firstWeight = weight; + sameWeight = true; + + // 当前 Invoker 的活跃数 active 与最小活跃数 leastActive 相同 + } else if (active == leastActive) { + // 在 leastIndexs 中记录下当前 Invoker 在 invokers 集合中的下标 + leastIndexs[leastCount++] = i; + // 累加权重 + totalWeight += weight; + // 检测当前 Invoker 的权重与 firstWeight 是否相等, + // 不相等则将 sameWeight 置为 false + if (sameWeight && i > 0 + && weight != firstWeight) { + sameWeight = false; + } + } + } + + // 当只有一个 Invoker 具有最小活跃数,此时直接返回该 Invoker 即可 + if (leastCount == 1) { + return invokers.get(leastIndexs[0]); + } + + // 有多个 Invoker 具有相同的最小活跃数,但它们之间的权重不同 + if (!sameWeight && totalWeight > 0) { + // 随机生成一个 [0, totalWeight) 之间的数字 + int offsetWeight = random.nextInt(totalWeight); + // 循环让随机数减去具有最小活跃数的 Invoker 的权重值, + // 当 offset 小于等于0时,返回相应的 Invoker + for (int i = 0; i < leastCount; i++) { + int leastIndex = leastIndexs[i]; + // 获取权重值,并让随机数减去权重值 - ⭐️ + offsetWeight -= getWeight(invokers.get(leastIndex), invocation); + if (offsetWeight <= 0) + return invokers.get(leastIndex); + } + } + // 如果权重相同或权重为0时,随机返回一个 Invoker + return invokers.get(leastIndexs[random.nextInt(leastCount)]); + } +} +``` + +上面代码的逻辑比较多,我们在代码中写了大量的注释,有帮助大家理解代码逻辑。下面简单总结一下以上代码所做的事情,如下: + +遍历 invokers 列表,寻找活跃数最小的 Invoker +如果有多个 Invoker 具有相同的最小活跃数,此时记录下这些 Invoker 在 invokers 集合中的下标,并累加它们的权重,比较它们的权重值是否相等 +如果只有一个 Invoker 具有最小的活跃数,此时直接返回该 Invoker 即可 +如果有多个 Invoker 具有最小活跃数,且它们的权重不相等,此时处理方式和 RandomLoadBalance 一致 +如果有多个 Invoker 具有最小活跃数,但它们的权重相等,此时随机返回一个即可 +以上就是 LeastActiveLoadBalance 大致的实现逻辑,大家在阅读的源码的过程中要注意区分活跃数与权重这两个概念,不要混为一谈。 + +以上分析是基于 Dubbo 2.6.4 版本进行的,由于近期 Dubbo 2.6.5 发布了,并对 LeastActiveLoadBalance 进行了一些修改,下面简单来介绍一下修改内容。回到上面的源码中,我们在上面的代码中标注了两个黄色的五角星⭐️。两处标记对应的代码分别如下: + + +```java +int weight = invoker.getUrl().getMethodParameter(invocation.getMethodName(), Constants.WEIGHT_KEY, Constants.DEFAULT_WEIGHT); +``` + +```java +offsetWeight -= getWeight(invokers.get(leastIndex), invocation); +``` + +问题出在服务预热阶段,第一行代码直接从 url 中取权重值,未被降权过。第二行代码获取到的是经过降权后的权重。第一行代码获取到的权重值最终会被累加到权重总和 totalWeight 中,这个时候会导致一个问题。offsetWeight 是一个在 [0, totalWeight) 范围内的随机数,而它所减去的是经过降权的权重。很有可能在经过 leastCount 次运算后,offsetWeight 仍然是大于0的,导致无法选中 Invoker。这个问题对应的 issue 为 #904,并在 pull request #2172 中被修复。具体的修复逻辑是将标注一处的代码修改为: +```java +// afterWarmup 等价于上面的 weight 变量,这样命名是为了强调该变量经过了 warmup 降权处理 +int afterWarmup = getWeight(invoker, invocation); +``` +另外,2.6.4 版本中的 LeastActiveLoadBalance 还要一个缺陷,即当一组 Invoker 具有相同的最小活跃数,且其中一个 Invoker 的权重值为1,此时这个 Invoker 无法被选中。缺陷代码如下: +```java +int offsetWeight = random.nextInt(totalWeight); +for (int i = 0; i < leastCount; i++) { + int leastIndex = leastIndexs[i]; + offsetWeight -= getWeight(invokers.get(leastIndex), invocation); + if (offsetWeight <= 0) // ❌ + return invokers.get(leastIndex); +} +``` +问题出在了offsetWeight <= 0上,举例说明,假设有一组 Invoker 的权重为 5、2、1,offsetWeight 最大值为 7。假设 offsetWeight = 7,你会发现,当 for 循环进行第二次遍历后 offsetWeight = 7 - 5 - 2 = 0,提前返回了。此时,此时权重为1的 Invoker 就没有机会被选中了。该问题在 Dubbo 2.6.5 中被修复了,修改后的代码如下: +```java +int offsetWeight = random.nextInt(totalWeight) + 1; +``` + + ![图中右边表示上次调用花费的时间](.images/dubbo/2019-03-12-21-54-01.png) @@ -288,4 +462,61 @@ resource/META-INFO.spring/dubbo-demo-provider.xml ## 类加载器和SPI -SPI 全称为 Service Provider Interface,是一种服务发现机制。SPI 的本质是将接口实现类的全限定名配置在文件中,并由服务加载器读取配置文件,加载实现类。这样可以在运行时,动态为接口替换实现类。 \ No newline at end of file +SPI 全称为 Service Provider Interface,是一种服务发现机制。SPI 的本质是将接口实现类的全限定名配置在文件中,并由服务加载器读取配置文件,加载实现类。这样可以在运行时,动态为接口替换实现类。 + + + + + + +在 Dubbo 中,所有负载均衡实现类均继承自 AbstractLoadBalance,该类实现了 LoadBalance 接口,并封装了一些公共的逻辑。所以在分析负载均衡实现之前,先来看一下 AbstractLoadBalance 的逻辑。首先来看一下负载均衡的入口方法 select,如下: + +```java +@Override +public Invoker select(List> invokers, URL url, Invocation invocation) { + if (invokers == null || invokers.isEmpty()) + return null; + // 如果 invokers 列表中仅有一个 Invoker,直接返回即可,无需进行负载均衡 + if (invokers.size() == 1) + return invokers.get(0); + + // 调用 doSelect 方法进行负载均衡,该方法为抽象方法,由子类实现 + return doSelect(invokers, url, invocation); +} + +protected abstract Invoker doSelect(List> invokers, URL url, Invocation invocation); +``` + +AbstractLoadBalance 除了实现了 LoadBalance 接口方法,还封装了一些公共逻辑,比如服务提供者权重计算逻辑。具体实现如下: + +```java +protected int getWeight(Invoker invoker, Invocation invocation) { + // 从 url 中获取权重 weight 配置值 + int weight = invoker.getUrl().getMethodParameter(invocation.getMethodName(), Constants.WEIGHT_KEY, Constants.DEFAULT_WEIGHT); + if (weight > 0) { + // 获取服务提供者启动时间戳 + long timestamp = invoker.getUrl().getParameter(Constants.REMOTE_TIMESTAMP_KEY, 0L); + if (timestamp > 0L) { + // 计算服务提供者运行时长 + int uptime = (int) (System.currentTimeMillis() - timestamp); + // 获取服务预热时间,默认为10分钟 + int warmup = invoker.getUrl().getParameter(Constants.WARMUP_KEY, Constants.DEFAULT_WARMUP); + // 如果服务运行时间小于预热时间,则重新计算服务权重,即降权 + if (uptime > 0 && uptime < warmup) { + // 重新计算服务权重 + weight = calculateWarmupWeight(uptime, warmup, weight); + } + } + } + return weight; +} + +static int calculateWarmupWeight(int uptime, int warmup, int weight) { + // 计算权重,下面代码逻辑上形似于 (uptime / warmup) * weight。 + // 随着服务运行时间 uptime 增大,权重计算值 ww 会慢慢接近配置值 weight + int ww = (int) ((float) uptime / ((float) warmup / (float) weight)); + return ww < 1 ? 1 : (ww > weight ? weight : ww); +} +``` + +上面是权重的计算过程,该过程主要用于保证当服务运行时长小于服务预热时间时,对服务进行降权,避免让服务在启动之初就处于高负载状态。服务预热是一个优化手段,与此类似的还有 JVM 预热。主要目的是让服务启动后“低功率”运行一段时间,使其效率慢慢提升至最佳状态。 \ No newline at end of file