阅读设置
第60节(第2951-3000行) (60/107)
判定出题者使用何种语言,乃是解读暗号的关键。
不过,安藤已经解决这个问题了。
先前他顺利地将「178136」转换成英文单字「RING」,因此认为这若是
龙司给予的提示,那么可以大胆假设这次的盐基排列是要转换成英文字母。
他将四十二个盐基排列区分成两两一组,全部可以得到二十一组。其中AA有四组
重复、TA和TC各有三组重复、CC则有一组重复,所以共有十三种。安藤将这些数
字写在笔记本上,翻开说明书内页,在里面寻找文字出现种类数表格。
例如:英文字母虽然有二十六个字母,实际作成文章时,常会有某些字母的使用次
数较为频繁。像E、T、A等字出现的频率非常高,而Q、Z在一页的文字里只出现一
、两次。
暗号解说书的卷末经常会刊载英文字母出现频率的统计资料,这个统计如果属实,
就可以轻易推测出暗号是以何种「语言」写下来的。
统计的结果是──「在二十一个英文字母中出现的字母种类平均数为十二」。
安藤一看到这个数据,心里不禁感到一丝雀跃。
十二这个平均值和盐基排列的十三种数目非常接近,也就是说,四十二个盐基排列
两两区分,共有二十一组,在各组盐基排列和某个英文字母相同的情况下,统计数据上
并没有矛盾。安藤暂且保留这一点,试著将盐基排列分成三个一组。
例二:每三个一组的区分方法ATGGAAGAAGAATATCGTTATAT
TCCTCCTCCTCAACAACAA结果一共分成十四组,以及ATG、GAA、
TAT、CGT、ATT、CCT、CAA这七个种类。在十四个英文字当中,所出现
的文字种类平均数为九,跟七这个数字相差不远。
安藤马上察觉到重复的地方很多,像是GAA、CCT、CAA各有三组重复,T
AT则有两组重复。最令他在意的是,GAA、CT、CAA八这三组的连续重复。在
每一组等于一个字母的情况下,同样的字母应该不会连续出现三个地方才对。
例如:Feel、Class等同样字母连续使用的单字不在少数,却没有连续出
现三个相同字母的情形。
安藤顺手拿起旁边的原文书,尝试在一页内数数看有几个地方连续出现三个相同的
字母,他翻了五、六页,终于找到一个地方。而在这十四个字母当中,要找出相同字母
连续出现三次的单字的机率几乎等于零。
相反的,四十二个盐基两两构成一组,相同字母连续出现两次的情形只有一次而已。
由此看来,安藤判断四十二个盐基应该是每两个一组,区分为二十一组,在统计上的差
距最校接下来的工作便是不断地反覆尝试。
ATGGAAGAAGAATATCGTTATATTCCTCCTCCTCAA
CAACAA由于AA的组台出现了四次,因此可以预测AA指定的字母使用次数非常
频繁。
安藤再度翻开专业书籍中所附的英文字母使用次数表,查出使用频率最高的是E,
于是他首先假设AA为E。
接著,出现次数第二高的是TA和TC(三次),而且AA后面接著TA、TC后
面接著AA的情形各有一次,这是重要的提示。
这一点表示文字的连接(字母是以何种方式来接续)有其特徵,而这也是经过统计
整理出来的结果。
安藤又将TA、TC与统计表上的字母互相对照,继E之后,使用次数也很高的是
A。从这个情况来看,TA指的是A,依相同的理由,TC可以用T填进去,CC则以
连接的方式来决定字母是N。
到目前为止,暗号与字母之间组合得很圆满,在统计上完全没有抵触。
…………E…………EAT……AA……NT……NTE…………E安藤将这四十
二个重复的盐基排列区分为二十一组,再依使用频率次数表和英文字母相对应,结果做
出以上的字母排列。
他以此为基础,再依据母音和子音的关系,以及连接次数等相关线索,填补中间的
空隙。