第四十七章 语言-《地球上的一百亿个夜晚》


    第(1/3)页

    减少现代科技援助、尤其减少信息科技的援助,在当时看来,算是个危险的想法。

    从后来的记录看,之所以能得到一定程度的认同,主要得益于第二次回归时的突发情况。

    当时,在目标的身上,衣服、头发,通过饮食等手段没入身体内部的发信器并不在少数。这些发信器为无名部门构建出了一个严密且即时的健康数据监查网络。时空穿越发生后,它们自然不起作用。但在回归后,它们理应开始汇报库存的数据。然而这时失常,监视组们诧异地见到屏幕上出现了一连串怪异的符号。

    时晴不在场,因此后来才知道当时地下基地的震撼,警报大作,几乎被认为是一种逆向入侵。

    于是在目标送医后,所有发信器均被取下,连同密文一起送往解密局。

    这比李明都与钢星人的交流更加复杂。这些符号单纯来自于基地计算机系统本身具有的字库中的符号,没有具体的指称,很难与现实事物一一相连。然而单纯研究每个符号出现的频率,以及出现的位置本身,意即研究语言的结构,也可以一窥其中的奥妙。

    以人类的语言为例,反复出现的“的”、“和”,“是”通常是结构的指示符,是一种逻辑符号。

    “是”类似于数学中的等号,“和”相当于加号。“的”则相当于集合论中的属于。

    而人类语言中的,“水”、“火”则是意义符号。

    通常而言,逻辑符号比意义符号的出现率更高,并且会频繁出现在同一结构的不同话语的同一位置。

    解密局一天即使用超级计算机进行一次遍历,初步勘破了规律。他们发现该密文的写作符合逆波兰表示法的特点,也有点像日语。这一特点体现在,所有逻辑符号通常出现在第二个意义符号的后方。

    譬如汉语中讲“你没有女朋友”。然而这门密文的结构则会这样写“你女朋友没有”。

    逆波兰表达式在人类世界的诞生,是基于上世纪计算机的堆栈需求。对于计算机而言,先识别数据,再识别不同的运算符,然后动用不同的运算器求值,比起先识别一个数据,再识别运算符,再来识别另一个数据,再动用运算器求值,能省去不少步骤。

    解密局思虑过后,即将其抄送中央编译器与编程语言设计院,也就是一般所说的程序院。程序院收到标识了秘密的任务后不敢懈怠,只在三天内即发来私下不正式的回复:

    “该密文内藏复杂的解释器功能,可以直接将自身编译为当代大多数计算机环境下的汇编语言。换而言之,它可以作为程式启动,启动的后果即是自我复制,并使用可能的一切方式将自身的复制发出。尽管通过底层的逆向追溯,我们确定了密文中属于解释器的部分所在的位置,但不论是整体,还是散落在各处的解释器的部分均有百分之九十九以上无法识别、也没有实际干涉机器指令的未解明密文。它有点像tcc,能够自己编译自己,但比tcc复杂太多。冒昧请问一下,这份密文是从哪里得来的?”

    解密局回复道:

    “这与有关部门有关。”

    之后,即牵线程序院与其余数个国立保密机构共参破译工作。

    这场研究经历了数次反转,直到李明都冬季回归后,才将这一事件真实的面貌展现得较为清晰。

    最开始的一个月,程序院即破译出这是另一种计算机语言,内含了多种使用另一种计算机语言书写的程式。

    整个密文发送过程被中央程序院理解为如下:

    第一阶段:发信器被控制。

    地下基地所使用的发信器虽然不足头发丝大小,但集成了当时最先进的高速单片机,同时具有简单的运算和储存信息的功能。写入密文后,这一发信器即会被实际控制,原本储存的人体健康数据大量被清除,存储器仅开始存储密文。

    第二阶段:翻译。

    密文是以接近于健康数据的形式保存的,因此它被收信器读取后,即以健康数据的方式写出。所有符号均是健康数据会采用的符号。

    第三阶段:发送。

    由于伪装成人体健康数据信息,收信器接收后,送入计算机时,防火墙没有识别异常。

    第四阶段:呈现。

    实际呈现在人们面前的密文,即是密文文档。这个文档可以执行,执行的后果之一即是把这个文档重新从发信器中输出。但是这些功能只占据了密文中百分之一不到的内容。剩下百分之九十九被发出的内容没有参与发信的过程,好像是密文中无关紧要的部分。

    发信器的存储采用的是dna硬盘技术,密文的大小是这种微型发信器所能储存的信息的上限,约等于一百万张cd。想要破译绝非是简单的事情。

    实际上,对于密文的研究也是长期陷入泥沼。纵然反复启动程式,尝试观察并记录全部的流向,它的可读性也差到可怕,对逻辑电路的调动来源分布在密文相差甚远的位置,更让人感到困惑不解,直到第二个月的开头,有人发现,从数句可能是示例性的计算书写中发现,属于意义符号串的部分具有一种可怕的对称性。这种对称性体现在,它不需要符号位,即可自然地表示自身的负数。

    该规律并不存在于现代的二进制电脑。使用0与1的二进制,无法直接表示负数。想要表示负数,需要其他手段,譬如把首位或末位作为“符号位”,在这个符号位上用0与1来表示这个数是负数还是正数。二进制的计算即需要识别这一符号参数,单从数码上来看,这是一种不对称的浪费的行为。

    天然负数表达的存在,代表这种计算机语言并非是二进制,可能更接近于三进制,并且体现的是平衡三元的三进制做法。
    第(1/3)页