在网络上有许多“双机热备”“双机互备”的解释和条目,但是费了很大的力气我也没有找到实际使用的“双机”事例。我曾听到1981年,广州电信局从日本引进一台计算机转报双机系统的故事,而且好几个单位到广州来考察、学习这台机器的双机倒机性能,多有收获,我想知道他们究竟学到什么知识,引发本文。
从头说起,双机热备是主机和从机通过网络连接,主机运行工作,从机监视。主机工作异常时,从机迅速替代主机。双机互备是指在双机热备的基础上,两个相对独立的应用在两台机器上同时运行,但彼此均为备机。当一台服务器出现故障时,另一台服务器立即接管故障服务器,保证运行持续。双机互备,采用“心跳”的方法保证主系统与备用系统的联系,双机系统之间相互定时发送信号,表明运行正常。一旦主机“心跳”信号停止,系统管理软件会确认主机发生故障,即将系统资源转移到备用系统,保证系运行不间断。
双机互联是逐步认识与实践的过程
中国的计算机首开双机运行,发生在何时?在网上搜索,均无结果,似乎少有人 描述使用“双机”的项目,或是研发过程。还是回到《溯源中国计算机》的记载,还是依靠自己所做的工作来解答。奇怪的是这么多的事例,为什么在网上搜索不出来呢?
1967年冬,哈军工康鹏提出“数字仿真”。1968年,实现了441-B/C双机实时数字仿真系统,在室内就可以虚拟飞行,虚拟炮击,重复飞行、观察分析。后在天津投产,比美国早期的AD-10超前9年。
1970年二季度末,738厂完成了“651”工程的2台320机(双机系统),与8120部队在26基地现场调机,奋战9个月完成了整机联试,列装于西安卫星测控中心。1971年3月3日,发射“实践1号”,测控计算出卫星运行轨道。
1969年5月24日,周恩来总理在九○五乙机的研制请示上批示:“照办,如可能,争取更快一点。”金怡濂反复构思,采用双处理器系统结构,双机并行,弥补元器件质量的不足,提高机器速度和可靠性、可维性。1973年年初,完成了双处理器体系结构的九○五乙机的具体实现方案。
1969年,由国家计委、国防科委、国防工办下达给华东计算所联合设计905甲电子计算机。该机是国内速度最高、规模最大的计算机系统,从双机并行到群机并行,张效祥和金怡濂为大型机确认一条并行之路。
1976年10月,上海无线电十三厂按四机部通知接产大型计算机905乙机,这是由总参56所研制的样机,该机运算速度单机每秒200万次,双机每秒350万次,主机技术指标达到国外同类产品的水平。
1969年11月4日,国防科委召开“远望”科学测量船中心处理机方案论证会。慈云桂详述集成电路化、双机系统方案,获准 718工程百万次计算机试制任务。1977年夏,百万次151—Ⅲ机研制成功,1年后,200万次的151—Ⅳ双机系统连续运行169小时,装于远望一号科学测量船。1979年2月,双机稳定性考核,无故障运行分别为76小时和68小时34分,1980年5月18日,我国首次向南太平洋发射洲际导弹,测量船准确跟踪,完成任务。
1975年1125工程重新启动,电子十五所的杨天行、张集祥、王祖永等参加了系统论证,十五所研制的DJS-183计算机和双机控制切换系统被选用于工程的雷达情报自动化团站系统,上世纪80年代安装、调试,获国家科技进步一等奖。
上海无线电十三厂(上海计算机厂)生产的DJS-131机运算速度每秒50万次,增加了乘除法、实时时钟、内存页面分配保护、32条自动引导程序只读存储器4个部件,增加了实时操作系统等软件,又推出DJS-131Ⅱ型机、Ⅲ型机和双机系统等。
1976年,上海电报局购置2套上无十三厂的DJS-131机,双机系统的备机紧随主机流程,每份电报同步三次,确保主机故障时备机可将电报重发,不丢报。1978年,双机拷机超过1000小时,达到运营要求。上海电报局先后研制出64路、128路、256路、512路自动转报系统。
1977年下半年,苏州计算机厂采用DJS-130计算机构建的H761海关双机信息系统,在深圳完成现场调试,付之试用,经过每天数万人的出入关高峰考验,系统软件和硬件运行情况均达到预期,表现稳定。
1978年,山西侯马的电信七所在西安长途局进行ZB44机的中间试验,调通双机系统。从1979年7月25日起进行了15个电信局参加的中间试验。1980年1月2日开始24小时运行,每份电报转接时间3分钟左右,比人工降低10倍,近一年的中间实验取得了丰富经验。
1983年11月初,738厂承担了“331工程”的测量,在三次联试中,DJS-240双机系统,终于找出了应用程序的一条指令错误,又调整了单稳时间,恰到好处的校准了程序窗口时间,最终解决了20C窗口的问题。
1985年6月22日,上海电报局256路转报系统经过10个月的运行,通过部级鉴定,256路系统,由两台DJS-131-Ⅱ机双机控制,性能优于引进的同类设备,所需投资不到1/6。1985年,电报年交换量达4300万份,3个转报报房仅用300人,人年均工作量14.3万份,比1979年增加2.5倍,比部颁定额减少502人。
1987年5月,安徽淮南市邮电局组成了有淮南矿业学院参加的分集器研制小组。16/32路分集器使用高性能的8031单片机构成双机,使分集器在运行期间能插抜子系统电路板,为用户维护提供了方便。
早期的双机系统,都是执行最重要的任务,也是国人自己不断创建的,卓有成就。当然首先实现了硬件的互联,然后才是数据互通,最后才达到系统互联,走过了逐步认识,逐步完善的过程。
引进日本转报机,服务广交会
1981年4月30日,广州自动转报中心引进日本OKI转报系统与香港转报中心和澳门的中心报房联通。此前,上海、西安、成都等地都在自力更生研发、运营转报计算机,而且四机部联合设计的集成电路系列计算机已经实现工业化生产,质量大幅提高之时,还有引进国外转报计算机的必要吗?
这一切,要从中国出口商品展览会——广交会说起。
1957年4月25日,第一届“中国出口商品交易会” 开幕,由商务部和广东省政府联合主办,每年春、秋两季定期举行,从未中断。

电话和电报是广交会客户的重要工具,供应商急于查找国外客户到达日期和驻地,业务员在报文中用数字序号代码表达商品类型、款式、规格,以便省钱。
1959年第6届广交会(秋交会)在海珠广场新建的的商品陈列馆举行,设有邮电服务点。此后,历届展会国内外参展厂商持续增多,高峰期省内输入电报量极大,通信直接关系到展会交易额,可电路端口已近饱和。
广州电信局的国内转报网和国际及港澳电报转报网是一个两网合一的系统,国际及港澳电报只有上海、北京和香港三个对外的电报电路。几十年来“广交会”的电报通信是广州电信局的重任,也是转报的主流。广东省邮电管理局在广州市成立了为广交会服务的“通信服务局”,业务由广州市邮局管理。广州电信局派出报房人员支援广交会,报务员劳汉雄几乎每届广交会都到电报服务点支援。
1965年,邮电部朱学范部长果断决定,广交会主会场及居住参会客商的东方宾馆开通了直达上海电报局国际报房的电路。上海局也派来报务员支援广交会,后来领衔程控转报系统的李国仪就是其中之一,劳汉雄说因此与他早就相识。

当年日本客户抵穗数量众多,1966年,周恩来总理批准将爱群大厦扩建为17层,更名为人民大厦,专门接待日本来宾。在大厦开设电报服务点,有3条电路直通上海国际报房,1条通至市中心报房。

爱群大厦于1937年落成开业,位于广州市越秀区沿江西路113号,在1937年至1967年作为“广州第一高楼”的地位保持了整整30年。1966年在东侧建18层新楼,高67.7米,并更名人民大厦,1988年恢复原名。
后来,人民大厦的300间床位也满负荷,周总理特批在广州市越秀区起义路2号建起高86.51米,全国最高的27层的广州宾舘,也是当时全国规模最大的宾馆,1968年4月15日落成开业。电信服务点和直达电路随之移至广州宾舘(人民大厦只住港澳客商,不设服务点)。日本人收发的电报特多特长,常见300至500字的报文。从日到夜来报不停,去报从每日交易会闭馆的18点忙至24点。宾馆服务点的国际电报营业、电报收发、投递,有一大批人在紧张服务。

广州宾馆位于广州市越秀区起义路2号,是一家集住宿、餐饮、会议、商务、旅游、购物于一体的涉外酒店。是广州市第一批历史建筑。
广州宾馆于1968年4月15日落成开业。该宾馆主楼27层,高86.51米,成为当时全国最高的楼房,也是当时全国规模最大的宾馆。
1981年,广州局引进并开通了日本OKI KD-1000B 136路自动转报系统,很快便不敷使用。广州转报中心便自力更生开发引进时作为冷备份的三机系统,于1986年3月19日开通36路转报系统,以应对日益上升的电报业务量。随着使用传真机,电报业务量有所减少,但由于传真用的话路质量不好,加上 国际长途话费昂贵,日本人和一批外商还是继续使用公众电报。


1981年,广州电信局引进并开通了日本OKI KD-1000B 136路自动转报系统。
广州自动转报系统的电报处理能力要求是较高的,特别是广交会电报业务高峰期,电报高度洪峰般地集中输入,使用引进的日本OKI 136路转报系统后不久,正值广东各地处于改革开放前沿,特别是深圳开通至广州的3条直达电路一直满负荷,市内多个营业点也多次发生在业务量高峰期系统电报积压,因为输出至某几个方向电路的电报过多,不能及时转出,好些报文积压在系统内等候,东北曾经发生由人打包,通过车辆运送到上级电报局的情况。
广州局开通自动转报系统之后,广交会服务点发至北京国际报房方向和港澳台的电报都接入自动转报系统。当时,上海国际报房还是人工通报,所以广交会经上海国际出口的电路依然直通上海报房,不经过广州自动转报系统。
广州引进的转报双机得到哪些收获?
实用的转报计算机双机设备必须同步复制运行数据,以保证安全稳定传输电报。而承担科学计算、数据处理任务的双机系统,只需硬件热备用。出现故障时,可以倒机重新启动运算,读出定时存盘保存的运行数据,再次启动计算。但是,电报转报的双机遇到故障,转换重启运行却十分复杂,一开始只能取出倒机时正在转发电报的输入流水号,打印出报告,再依照流水号找出报文人工补救依次重发。
当时,上海局的64路DJS-131双机转报系统,虽然达到1000小时以上的稳定性运行,却不会自动重发因故障倒机中断的电报。倒机重发操作时,如要对64条电路逐一核对,到256路、512路转报系统后,倒机核对中断停发电报的工作量就更大了,现场操作十分麻烦。有时不能辨明发报是否已经成功,因为多补发比漏补要好,所以对可能漏发的报文也都会当做漏发大补特补,稍有不慎缺报就是重大事故。
OKI KD-1000B 136路转报双机系统最大的优势是,可以在发生故障倒机时,自动依次重发因刚才倒机中断停发的电报,不要人工干预。一些电信局转报部门知道广州的oki系统有自动重发功能时,纷纷前来学习。上海局李国仪等人来到广州局,不到一星期就明白了工作原理,回上海后也就10多天,便把他们的DJS-131系统双机系统,改造到与广州局的双机数据同步运行功能相当。四机部的贵州凯里830计算机厂的技术人员和有关部队的技术人员也来到广州,他们毕竟是科班专业人员,马上就理解、明白了双机倒机重发的原理,立即返回单位去改造设备。
郑州邮电设计院也有软硬件人员到广州学习,他们多是有专业知识的年轻人,第一次来了解自动转报都原理,他们相信是可以做到倒机自动重发的。

要是转报机有128、256路,这个监控程序就要巡回128、256次,当然这对计算机不是难事。
还有一个研究所也来广州学习,带队人说我就不相信系统能够自动重发,倒机时能找出原来正在发放的电报流水号重新发放”。结果他学习了一个月,回到单位再弄了一个多月,也弄出来了能自动重发功能。,
改革开放,自力更生先行,却也不是盲目自尊,排除国外先进技术。为了保障广交会的通信服务,特别是与日本客商的交易服务,引进日本通信服务是必要的,同时也是国内计算机人员得到启发。计算机的功能没有做不到,只有想不到。就像现在都人工智能,首先要有思路,有想法,再进行创作,终于让“死人也能说话”。