# 网络模型

网络无处不在,人们经常会提起各种网络,不同物种也会组织成食物链,企业也会建立供应链,网络对于社会关系一直都很重要。在历史大部分的时间里,由于受到地理限制,很多社会互动和贸易都是通过虚拟网络进行的。

# 网络的结构

网络由节点以及连接点的边组成。由边连接起来的节点互为相邻,如果沿着边,可以从任何一个节点到达任何其他节点,这样的网络被称为连接的网络。网络中的边可以是定向的,可以从一个节点指向另一个节点,在信息网络中,一条有向边表示一个人从另一个人获取信息。边也可以是非定向的,在学校的网络中,连接两个同年级学生的边就是非定向的,在非定向网络中,一个节点的度等于连接到它边的数量。

网络以一组网络统计数据为特征,对于每个统计量,我们看一看计算网络平均值和所有节点的分布,度分布告诉我们某些节点是否比其他节点连接的更多,路径长度指两个节点之间的最小距离,与度成反比。关于网络结构还有一个统计量是聚类系数,它等于节点的相邻节点对中,同时彼此也互为相邻节点对所占的比例。例如,一个人有10个朋友,这些朋友可以组成45个对,如果在这45个对当中,有15个对本身也是朋友,那么这个人的聚类系数就等于1/3,如果这45对都是朋友,那么这个人的聚类系数就等于1。

网络统计量有如下参数:

  • :节点的邻居数(边数)
  • 路径长度:从一个节点到另一个节点必须遍历的最小边数。
  • 介数:经过某个节点连接两个其他节点的最短路径数量。
  • 聚类系数:一个节点的邻居对当中,同样也由一条边连接的邻居对所占的百分比。

下图显示了一个辐射网络和一个地理网络:

我们可以使用社区检测算法去查看网络数据的问题,在分析网络时,我们可能会遇到网络多样性的问题,少数几个网络统计量无法确定具体的网络结构,人们可以构建出数十亿个具有10个节点且平均度为2的不同网络。有几种常见的网络模型:

  • 随机网络:随机网络就是边和节点的连接都是随机的,所有节点有相等的机会获得链接。只要网络足够大,几乎所有节点拥有的链接数都基本相同。因此,随机网络是一个高度平等的网络。如果想检验这个网络是不是随机网络,可以通过蒙特卡洛的方法生成很多随机网络之后把这个网络代入,进行标准的统计检验,以确定是否接受随机的假设。
  • 地理网络:节点排列成圆形并且每个节点在每个方向上都连接到最近的节点,地理网络都具有较低的度,即节点仅连接本地邻居,并且具有相对较大的路径长度,在地理网络上,介数和聚类不会发生变化。
  • 幂律网络:这种网络的度是幂律的,少数节点有许多连接,同时大多数节点的连接则非常少。通过幂律网络可以观察互联网的特征,以及一些技术和经济相关的现象。
  • 小世界网络:它结合了地理网络和随机网络的特征,构建小世界网络可以从一个地理网络开始,然后进行随机选择一条边,并把这条边所连接的一个节点替换为一个随机节点。如果重新安排边的概率是1,那么就是随机网络,如果概率是0,就是地理网络。如果概率在0和1之间就会得到小世界网络。社交网络类似于小世界,每个人都有一些关系紧密的朋友,以及一些关系比较远的随机的朋友,在这种网络中,大部分节点彼此并不相连,但节点之间经过少数几步就可到达。

# 友谊悖论

友谊悖论:如果网络中任何两个节点的度不同,那么平均而言,节点的度会低于其相邻节点。换句话说,平均而言,人们不可能比他们的朋友拥有更多的朋友,人们的朋友比他们自己更受欢迎。

我们用一个极端的例子来解释一下友谊悖论的原理:在辐射网络中,12个人中的每个人都只有一个朋友,1个人有12个朋友。平均来说,所有人只有不到两个朋友,但是平均每个人的朋友又都有超过11个朋友。

友谊悖论适用于任何网络:电子邮件网络、学术引文网络、银行网络和国际贸易网络等。平均而言,一篇学术论文引用的参考文献被引用的次数比这篇文章本身更多;与一个国家的贸易伙伴进行贸易的国家数量,要比与这个国家进行贸易的国家更多;食物网络中与单一物种相连接的多个物种的连接比该物种自身更多。根据Facebook的数据对友谊网络进行的一项研究表明,一个人平均大约有200个朋友,而他们的朋友平均有超过600个朋友。

# 六度分隔理论

我们可以构建了一个简化版的小世界网络,来看一下六度分隔理论。这个小世界网络假设每个人都有一个由若干个圈内好友构成的小群体,这些人彼此认识,而且每个人都拥有不属于这些圈内的朋友,我们把这些圈子外的朋友称为“随机朋友”(random friends)。可以看上图,某人(用黑色圆圈表示)有5个圈内好友和两个随机朋友。它还显示了这个节点的朋友(用浅灰色圆圈表示)的部分“朋友圈”。

在这种网络结构中,我们可以计算出二度邻居,也就是朋友的朋友的数量,方法是将随机朋友的所有朋友人数相加,以此类推,假设每个节点有100个全中好友(C),他们彼此都是朋友,以及20个随机朋友(R),他们没有与节点共同的朋友。经过计算,六度以后会有超过200亿的人会产生关联。所以六度分隔理论中说:社会网络中任意两个素不相识的人之间,最多只需经过六步即可建立相互联系。

# 网络结构的健壮性

网络最重要的性质是,它在受到冲击时是不是仍然能保持连接,他们可以使用模型计算来保持连接的概率,还可以考虑当移除某些节点时平均路径会发生什么变化。例如,在航空公司的航线网络中,通过这种分析可以告诉我们,如果某个机场由于天气原因或电力故障而关闭,将会需要多少额外的航班。

在中心化的网络结构中,我们要考虑网络最大连接部分怎样随着节点的随机失败而变化。在去中心化的网络中,因为绝大多数的节点连接很少,每个聚类都可以顶住多个节点发生故障的冲击,局部故障不会放大的传播到整个网络,所以可以有效的防止整个网络崩溃。