主要内容
冗余和容错性
在 Internet协议(IP)中,计算机将消息拆分为数据包,这些数据包从一个路由器传到另一个路由器直至到达目的地:
如果网络路径不再可用,例如由于自然灾害造成物理破坏或网络犯罪劫持,会发生什么?数据包将永远无法到达目的地吗?
路由冗余时间
幸运的是,数据包为了达到同一个目的地,往往有许多可能的路径。 多条路径的可用性增加了网络的 冗余 。
设想这个简化的网络连接四个主要城市的路由器:
从Oakland路由器到New York路由器有多条路径。
第一条也是最短的路径从Oakland到Austin到New York:
从Oakland到Austin,从Tampa到New York的路径稍长:
为什么这种冗余如此重要? 如果Austin和New York路由器之间的连接不再可用,那么数据包还有另一种方式可以到达目的地。
网络中路径的冗余增加了数据包能够到达目的地的可能方式的数量。
容错
容错的 系统是一个可以在组件中出现一次故障(或多次故障),但仍然继续正常运行的系统。
因特网是一个庞大而复杂的系统,它拥有可能随时中断的数百万个组成部分——其中许多组成部分 会 断开。 但到2020年,没有人毁灭了整个互联网。
互联网容错的一个主要因素是网络路由路径的冗余。
考虑连接美国东部与欧洲西部的海底电缆的数量:
如果其中一条电缆遭到破坏,还有许多其他电缆可以跨大西洋承受因特网通信压力。
或者用另一种方式说,沿海之间没有单一的故障 。 一个单一的故障点是系统中的一个组件,如果它出错,将会使整个系统停止。 当我们试图使一个系统容错, 我们寻找单一的故障点,并设法在这些问题上增加冗余。
现在考虑一下南太平洋波利尼西亚岛屿之间海底电缆的少得可怜的数量:
如果库克群岛和法属波利尼西亚之间的电缆被切断,这将如何影响这些岛屿上的互联网?
在某些情况下,电缆切割可使整个国家停摆。 2019年,一艘拖船在海底停靠的船停泊,切断了通往汤加的电缆,切断了其网络通信11天。
切割电缆不需要太多力气。 2011年,格鲁吉亚国的一位祖母用她的铲子意外地损坏了一条电缆。 这使得亚美尼亚全境失去了五个小时的网络连接。
根据网络分析员Stephan Becker,电缆断裂相对频繁地发生——“每3天左右就有一次”。 大部分时间, 当断裂发生时,互联网平均用户甚至不会注意到,而电缆将被许多电缆修理船之一修理完毕。 当我们注意到电缆断裂时, 这通常意味着有一个单一的故障点,现在是给系统增加冗余的时候了。
为什么我们不到处添加冗余?你可能猜想得到,这是昂贵的。 连接汤加与斐济的海底电缆费用约为3,000万美元,而这个电缆还是相对较短的。 谷歌在美国和东京之间安装高速光纤电缆的时候花费为 $3亿元,
当增加资源太过昂贵的时候,可能有办法找到在故障面前让系统体面的退化的方法。在汤加的互联网停摆的时候,卫星服务的供应商快速的续上了网络连接。 这可能不会比光纤更快,但是有网总比没有好。
🤔 考虑你周围基础设施的容错度。 你家中或计算机室的电力系统有多少冗余?是否有任何一个故障点? 增加冗余的最廉价方法是什么?