按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
当季普夫最初描述他的定律时,人们只知道极少数其他标度定律。他试图挑起这样一个重大的讨论,即他的原理怎样使行为科学与物理学区别开来,因为物理学中不存在这些定律。如今,在物理学中发现了许许多多的幂定律之后,各种评论似乎倾向于贬损而不是抬高季普夫的声誉。据说还有另外一个因素也使他名声大降,那就是他对希特勒重新分配欧洲领土的计划表示出某种同情,但他辩论说希特勒的征服趋向于使欧洲各国人口更加符合季普夫定律,这也许很能说明他的态度。
不管这件事情是真是假,它都教给我们一个关于将行为科学应用到政策上的重要教训:正因为可能会出现某些特定关系,所以,那些完全符合标度定律的情况并不总是理想的。在埃斯彭研究所(Aspen Institute)最近的一期讨论班上,我也遇到了这个问题。当时我提到,福利或收入分布在某些特定条件下趋向于服从标度定律。立即有人问我,出现这样一种情况是否是件好事。我记得当时我耸了耸肩膀。毕竟,决定福利或收入不平均程度的分布坡度,取决于定律中出现什么样的幂。图8…1 幂定律(这里是原季普夫定律)的标度性
季普夫定律的基本机制至今还不清楚,许多其他幂定律也一样。在研究这些定律(特别是它们与分形的联系)方面作出过重要贡献的曼德布罗很坦白地承认,如果说他在科学生涯的早期取得了成功,那么,部分原因就在于他将重点放在探寻与描述幂定律上,而不是试图解释它们。(他在《自然界的分形几何》(TheFractal Geometry ofNature)一书中,曾提到“喜欢强调结果而非原因”。)不过他立即又指出,在某些领域,特别是物理学中,已经提出了相当具有说服力的解释。例如,非线性动力学中的混沌现象就与分形和幂定律有着密切的联系,不过其联系方式科学家们尚未完全弄清楚。曼德布罗也时常建构一些符合幂定律的模型。例如,他计算了由著名的猴子打出的文章中,单词的出现频率。它们服从修正后的季普夫定律,其幂随着打出符号的越来越多而趋近于1(对应于原季普夫定律的幂值)。(顺便提一句,他也注意到,在用正常语言写出的文章中,当单词的出现频率符合修正后的季普夫定律时,其幂可能远不等于1,偏差量的大小取决于所讨论的文章中词汇量的大小。)标度不变性
最近几年,在解释某些幂定律方面取得了很大的进展。这些努力之一涉及到被称作“自组织临界态”(self…organizedcriti…cality)的问题。这一概念是由丹麦理论物理学家佩尔·贝克(Per Bak)和唐超(Chao Tang)与库特·维森菲尔德(KurtWiesenfeld)一起提出来的。最初他们将这个概念应用到沙漠或沙滩上常见的沙堆上,那些沙堆大致成圆锥形,每堆都具有清晰的斜坡。这是如何形成的呢?假定风不断将沙粒吹到沙堆上(或者物理学家用容器不断往试验沙堆上滴加沙粒)。随着沙堆的增大,其斜面变得越来越陡,但这种变化关系只发生在坡度达到一个临界值之前。一旦坡度达到那个临界值,继续添加的沙粒开始使沙堆崩落,从而降低其高度。
如果沙堆坡度大于临界值,那么将会出现一种不稳定的情况,这时沙堆的崩落迅速地使坡度不断减小,直到它回到临界值为止。这样,沙堆自然而然地被“吸引”到坡度的临界值,而勿需任何特殊的外部调节(所以称为“自组织”临界态)。
崩落量通常用参与崩落的沙粒数来衡量。观察表明,当沙堆的坡度接近其临界值时,崩落量相当精确地服从幂定律。
在这个情况中,附加到季普夫定律的幂上的常数很大。换句话说,如果按从大到小的顺序给崩落量排名,那么参与崩落的沙粒数将随名次的增大而急剧减少。沙堆中崩落的分布是一个无论从理论上,还是实验上都被成功地研究过的一个幂定律的例子。由贝克和他的同事所做的崩落过程的数值模拟,不但重现了该定律,而且还得出大指数(幂)的一个近似值。尽管随着名次的增加,崩落量急剧下降,但在一定程度上,几乎各种标度的崩落量都存在。一般来说,服从幂定律的分布是一个“标度不变”的分布。这就是幂定律也被称为“标度定律”的原因。那么一个分布律具有标度不变性究竟意味着什么呢?
幂定律的标度不变性可以通过原季普夫定律来很好地说明。拿城市人口来说,根据季普夫定律,各城市的人口数成1/1∶1/2∶1/3∶1/4∶1/5??的比例。为简单起见,将人口数取成100 万,1002万,1003万,等等。让我们用一个固定不变的分数,不妨设为1/2,去乘那些人口数字;那么新的以百万计的人口数就变成了1/2,1/4,1/6,1/8,1/10??它们恰好是原来处于第2,4,6,8,10,??位的原有人口数。因此,以2 除所有的人口数相当于以2 乘城市的名次,使它们从1,2,3,4,??变成2,4,6,8??。如图8…1 所示,将新名次与原来名次的关系在图上画出来,将得到一条直线。
这种直线关系可作为标度定律(其中涉及到的量可以为任何类型)的定义:所有各个量换算为任意常数倍(在上述例子中为1/2 倍)相当于给原来的那组量编新的名次,使新名次与原名次成直线关系。(新的名次并不总是整数,但在每种情况下,规模大小与名次之间的关系式都将给出一条简单的光滑曲线,这条曲线可用作整数之间的插值线。)
在沙堆崩落的情况中,因为崩落量的分布服从幂定律,所以用任一公因数去换算所有崩落量,相当于对原来的崩落序列的名次进行一个简单的重编。很显然,在这样一个定律中不存在任何特殊的标度,但在被研究量取值范围的两端除外,因为那里存在明显的限制。任何崩落中的粒子数都不会少于一个;显然,幂定律在单粒子的标度上必然不适用。在取值范围的另一端,任何崩落中的粒子数都不会大于所讨论的沙堆中的总粒子数。但是至少最大的崩落可以轻易地挑拣出来,并被冠以第一名。
琢磨这最大的崩落,不禁使人想起自然事件规模的幂定律分布中一个常有特征。名次极靠前的那些最大或最具毁灭性的事件,即使其或多或少处在幂定律所规定的曲线上,也仍然可能被当作具有大量显著后果的单个历史事件,而名次很靠后的那些小事件,人们通常只是从统计角度来考虑。里氏8。5 级左右的巨大地震都被记载在耸人听闻的报纸标题与历史书上(特别是当震灾波及到大城市时)。而众多关于里氏1。5 级左右地震的记录只是默默无闻地居于地震专家的数据库中,主要供统计研究使用。然而地震中的能量释放确实遵循幂定律,这是很早以前被两位现已故去的加州理工学院的教授,查尔斯·里克特(CharlesRichter)和他的顾问比诺·古腾伯格(Beno Gutenberg)所发现的。(在1933 年的一天,古腾伯格和爱因斯坦两人正专心地讨论地震学的问题,以至于他们谁也没有注意到由于长堤(LongBeach)地震引起的加州理工学院校园的震颤。)同样,不断飞抵地球的极小的陨石主要是由专家们在统计测量中摘记下来的,而在6500万年以前发生的,促使白垩纪绝灭的巨大碰撞则被认为是生物圈历史中的重大的单个事件。
因为幂定律已被证明是在自组织临界态情况下生效,所以本已很流行的词组“自组织”就具有了更大的通用性,它常常与“自然生成”(emergent)一词并列使用。包括圣菲研究所许多成员在内的科学家们正力图弄清楚,在没有引入外部作用的情况下,结构是怎样产生的。在种种令人惊讶的过程中,具有简单规则的系统形成了显然很复杂的结构。这些系统被说成是自组织的,它们的性质也被说成是自然生成的。最完美的例子是宇宙自身,它在简单规则与偶然性作用的基础上,产生出了十足的复杂性。
在很多情况下,由于现代计算机的使用,关于自生结构的研究已经容易多了。通过计算机的方式比在纸上列方程往往更易于跟踪新特征的自生。由于自生过程需花费很长的时间,因此计算机的作用往往特别引人注目,因为计算机能够通过使用一个很大的因子而有效地加速有关过程。可是计算机计算仍然需要许多步骤,这将引起一个全新的问题。深度与隐蔽性
到目前为止,在对复杂性所进行的讨论中,我们考虑了关于系统或其规律性的压缩描述(或用于产生编码描述的短小计算机程序),并将各种各样的复杂性与那些描述或程序的长度联系起来。可是,我们很少关注为实规压缩或识别规律所需要的时间、人力或技巧。既然一个理论科学家的工作严格地包括识别规律,并将有关它们的描述压缩成理论,所以我们对上述因素的忽视也就等于是藐视了理论家工作的价值,这显然是一种荒诞的犯罪行为,必须采取措施来矫正这种错误。
我们已经了解到,要完全捕捉住关于复杂性的直觉观念,需要有好几种不同的概念。下面我们就要给有效复杂性的定义补充其他一些量的定义,这些量将描述,计算机要花多长时间才能从一个短小的程序到给出对一个系统的描述,反之亦然。(在一定程度上,这些量必然与一个问题的计算复杂性相似,后者已在前面被我们定义成计算机产生一个解答所用的最短时间。)
许多人都研究过这样的附加概念,但唯有查尔斯·贝纳特(CharlesBennett)是以一种特别优美的方式来处理它们的。查尔斯·贝纳特是IBM公司一位卓越的思想家,领导给他的任务就是创立新的观点与概念,将它们发表,并到各处去作关于它们的演讲。我乐意拿他的旅行同12 世纪时期一些抒情诗人在现在的法国南部,从一个庭院到另一个庭院的游历作对比。那些诗人们吟诵的是爱情诗,而贝纳特“吟诵”的是复杂性与熵,量子计算机(quantum puters)与量子编码(quantum encipherment)。我有幸与他一起在圣菲共过事,并在帕沙第纳一起工作过一学期,当时他在我们加州理工学院的研究小组中作访问学者。
贝纳特所定义的两个特别有意思的量“深度”(deepth)与“隐蔽性“(crypticity)均与计算复杂性有关,并且它们彼此之间也是相关的。对这两个量的研究进一步说明,一个系统虽然很明显十分复杂,但由于其描述可以通过一个简短的程序得出,因而具有很低的算法信息量与有效复杂性。关键在于下述问题的答案:(1)从一个简短的程序或一个高度压缩的图式发展到一个对系统本身或其规律的成熟的描述,其艰难程度如何?(2)从系统着手,将对它的描述(或对其规律的描述)压缩成一个程序或图式,又有多艰难?
粗略地说,深度是第一种困难的量度,而隐蔽性是第二种困难的量度。显然,与理论家的工作价值有关的是隐蔽性(虽然关于理论创立过程的更细致的描述,还应该对人的灵巧与纯粹的艰难作出区别)。一个假想的例子
为了举例说明许多的简单性怎样与巨大的深度产生联系,让我们回到哥德巴赫关于每个大于2 的偶数都可表示为两个素数之和的猜想上来。如前面所提到的,这一猜想从来未被证明或证伪过,但是在某个相当大的范围内的所有偶数都被核实了,这个范围是根据计算机的容量与研究者的耐心而设定的。
以前我们允许自己相信哥德巴赫猜想(在数论公理的基础上)是不可判定的。这次让我们假定它是错误的。在这种情况下,某个很大的数g 是大于2 但不能表示为两个素数之和的最小的偶数。这个假想的g 有一个相当简单的描述,也就是我们刚刚给出来的。同样,也会有很简短的程序来求它。例如,你只需有顺序地寻找越来越大的素数,并将所找到的最大素数加上3,然后检验小于或等于所得数的全部偶数,看它们是否符合哥德巴赫猜想。用这一方法,违背哥德巴赫猜想的最小偶数g 将最终被发现。如果哥德巴赫猜想真是错的,那么用于寻找g 的任何一个简短程序,其运行时间实际上可能很长。因而在这种假想情况下,数g 有着相当低的算法信息量与有效复杂性,但有很大的深度。再论深度贝纳特对深度的定义涉及到计算机,与我们讨论算法信息量时所引入的那种计算机相同:一个理想的多功能的计算机,它的存贮容量在任何时候都可以按需要扩充(或一开始就具有无限大的容量)。他从一个用来描述被研究系统的信息比特串入手。他不仅考虑致使计算机打