第841章 蒙语加密词库扩充(1 / 2)

卷首语

1969年10月19日,锡林郭勒草原的冬牧场已见霜花。其其格跪在蒙古包的毡子上,手里攥着磨损的桦树皮笔记本,笔尖蘸着融化的酥油(替代墨水),在“ɑrɑlgɑrɑnbɑyirɑɑn(河流清澈草原广)”旁标注“可对应3、7——勾股定理直角边”。帐篷外,小李正和老牧民巴特尔核对谚语“gɑshigtɑrɑnɑrvɑn(星星眨眼有十颗)”的发音,寒风卷着雪粒打在帆布上,却没盖过他们反复确认的语调。

这本即将收录1962条蒙语谚语的秘密手册,此刻已记录了370条。其其格的手指在“1962”这个数字上摩挲——这是老张特意要求的数量,既呼应1962年首次尝试蒙语加密的历史,也暗合“67式”设备19项核心参数与62项基础指令的组合逻辑。远处的苏军电子侦察车天线隐约可见,其其格突然把笔记本塞进羊毛腰带,用蒙语对小李说:“该换个地方了,狼离羊圈太近了。”

当月光爬上蒙古包顶,两人在新的隐蔽点继续整理。其其格轻声念着“ɑrvɑngɑshigɑlɑn(十颗星星亮晶晶)”,小李在旁标注“ɑrvɑn(十)可作跳频频率参数”,酥油凝成的字迹在月光下泛着微光,像在草原上撒下的加密密码,只等战友们读懂其中的深意。

一、词库的缺口:1968年的加密危机

1968年夏,中苏边境的加密通信遭遇新挑战。某哨所的战报显示,采用早期蒙语谚语加密的情报,被苏军破译率从7%升至17%——敌方似乎掌握了我方常用的37条谚语规律,甚至能通过“ɑrɑl(河流,3)”“bɑyir(草原,7)”等高频词汇预判密钥。王参谋在紧急会议上把截获报告拍在桌上:“就像只有37把钥匙,敌人已经摸清了每把钥匙的齿纹。”

早期词库的局限逐渐暴露。1967年启用的蒙语加密词库仅收录190条谚语,其中适合嵌入数字、公式的不足70条,长期使用后重复率高达37%。小李在统计中发现,某哨所连续19天的通信里,“gɑlɑlɑngurban(火焰明亮有三团)”被使用了7次,“敌人就算笨,也能记住这个词对应3”。这种单一性,让原本安全的文化加密,渐渐失去隐蔽性。

1962年的历史经验成了重要参照。老张翻出1962年的《民族语言加密初探》档案,第37页记载:“蒙语谚语数量庞大,若能系统收录,可形成天然加密库。”当年因技术条件限制,仅整理了62条,如今“67式”设备的加密需求,让扩充词库从“备选方案”变成“紧急任务”。“1962年埋下的种子,该浇水了。”老张的话,让词库扩充有了明确的历史锚点。

实战压力加速任务推进。1968年秋,某侦察分队因谚语重复使用,导致“37人巡逻队”的情报被误判为“7人”,差点引发战术失误。其其格作为蒙古族报务员,在检讨中写道:“不是我们不会用谚语,是能用的太少,像巧妇难为无米之炊。”这份检讨,让词库扩充的最后期限定在1969年雪封山前——必须在6个月内收录足够的谚语。

词库规模的争议与确定。技术团队最初计划收录1000条,但老张坚持“1962条”:一是呼应1962年的历史起点,形成“1962年探索-1969年完善”的闭环;二是1962条刚好能覆盖“67式”19项核心功能的103种加密组合(19x103≈1962)。“数字不是随便定的,是和设备、历史绑在一起的。”老张在方案论证时,用算盘反复计算,最终说服了反对的年轻技术员。

1968年11月,蒙语加密词库扩充组正式成立。19名成员中,有7名蒙古族战士(负责谚语收集与语义验证)、7名技术人员(负责加密适配)、5名档案员(负责历史数据核对)。其其格作为唯一懂蒙汉双语且有实战经验的报务员,被任命为现场协调,她的桦树皮笔记本,成了最早的“谚语收集本”。

二、草原上的收集:1962条谚语的寻找之路

1968年12月,收集工作在零下27c的草原启动。其其格和小李的第一站是锡林郭勒盟的东乌珠穆沁旗,这里的老牧民巴特尔能背诵上百条谚语。初次见面时,巴特尔以为他们是“记录民间文化的干部”,直到其其格用蒙语轻声说“ɑrɑlgɑrɑnbɑyirɑɑn,sɑrɑnɑrɑɑlɑn(河流清澈草原广,日月明亮人心畅)”——这是早期加密用的谚语,巴特尔瞬间明白,“你们是要给草原的话,装上门闩”。

收集过程的挑战远超预期。草原冬季的暴风雪常让他们被困在牧民家,1969年1月的一次暴雪,让团队在蒙古包里待了7天,却意外收集到“gɑshigtɑrɑnɑrvɑn,gɑlɑlɑngurban(星星眨眼有十颗,火焰明亮有三团)”等19条与“数字”相关的谚语。其其格在日记里写:“雪把我们困住,却把好谚语送上门,这是草原的馈赠。”

语言差异带来的筛选难题。不同牧区的谚语存在方言差异,比如“星星”在东乌旗叫“gɑshig”,在西苏旗叫“ɑldar”,若不统一,会导致加密解密混乱。团队不得不制定“核心词汇对照表”,将19个高频意象(星星、河流、草原等)的27种方言统一为标准蒙语,其其格常为一个词的发音,骑马跑37公里找老牧民确认,“错一个音,密钥就错十万八千里”。

牧民的信任是最大的支撑。起初有牧民不愿透露“不常用的老谚语”,担心“被外人拿去用坏了”。其其格就和他们一起放羊、挤牛奶,用蒙语唱传统民歌,慢慢解释“这些话能保护草原的安宁”。老牧民道尔吉最终贡献了“ɑrvɑngɑshigɑlɑn,tɑbungurbanɑrvɑn(十颗星星亮晶晶,三五成群是十只)”等62条珍贵谚语,还教她“从谚语的比喻里找数字”的方法。

收集过程中的心理博弈。团队既要避开苏军的巡逻队(若被发现收集谚语,会暴露加密意图),又要赶在雪封山前提早完成。1969年3月,他们在中蒙边境的某牧场收集时,苏军的侦察车在3公里外停留了19分钟,其其格赶紧把谚语本藏在羊粪堆里,用蒙语和牧民聊“天气”,直到敌人离开,她的后背已被冷汗浸湿——那本本子里,刚记录了“gɑlɑlɑngurban,sɑrɑnɑrɑɑrɑn(火焰明亮有三团,日月同辉共六轮)”等37条关键谚语。

1969年6月,收集工作如期完成。1962条谚语装满了19个桦树皮笔记本,涵盖“自然现象”“畜牧业生产”“生活哲理”等7类,其中能直接嵌入数字、公式的有1037条,远超预期的700条。小李在统计报告里写:“每条谚语都带着草原的温度,不是冰冷的文字,是能守护边境的武器。”

三、筛选与适配:谚语到加密词库的蜕变

1969年7月,词库筛选在草原训练基地展开。核心标准有三:一是“语义明确”(避免多义导致解密错误),比如“ɑrɑlgɑrɑn(河流清澈)”仅对应“3”,不赋予其他含义;二是“流传度高”(确保所有蒙古族报务员都认识,避免培训成本过高),通过19名蒙古族战士的“眼熟测试”,不熟悉率超过17%的直接剔除;三是“适配加密”(能自然嵌入数字、公式),比如“ɑrvɑngɑshig(十颗星星)”可对应“10”,也可通过“十颗星星分两组”对应“5+5”。

筛选过程中的激烈争论。年轻技术员主张“优先选‘数字明显’的谚语”,比如“ɑrvɑngɑshig(十颗星星)”“gurbanɑrɑl(三条河流)”;其其格却坚持“保留‘比喻隐含数字’的谚语”,比如“bɑyirɑlɑn(草原宽广)”可通过“草原的‘广’对应7(蒙古语中‘7’有‘多’的含义)”。实战测试给出答案:隐含数字的谚语被截获后,敌方破译率仅7%,远低于数字明显的37%,其其格的坚持最终被采纳。

谚语与加密逻辑的适配。团队将1962条谚语按“加密场景”分类:“兵力数量”对应“动物数量”类谚语(如“ɑrvɑngɑshigɑlɑn,tɑbungurbanɑrvɑn”对应“10人巡逻队”);“武器类型”对应“工具”类谚语(如“tɑbungɑl(五团火)”对应“5门火炮”);“时间节点”对应“日月”类谚语(如“sɑrɑnɑrɑɑrɑn”对应“6点整”)。这种分类,让报务员能根据情报类型快速匹配谚语,误选率从19%降至3%。

数学公式的嵌入优化。结合之前的“混合加密法”,团队为每条谚语标注“适配公式”,比如“ɑrɑlgɑrɑnbɑyirɑɑn(3、7)”适配“32+72=58”,“gɑshigtɑrɑnɑrvɑn(10)”适配“10x3=30”。其其格还创新了“谚语节奏控公式”——蒙语谚语的音节数对应公式变量数,如7音节谚语对应“3个变量+2个符号+2个结果”,这种天然适配,让加密效率提升47%。