华声在线首页 | 湖南

“银河”疑是九天来——国防科技大学和超级计算机的故事

2018-08-20 06:59:20 [来源:华声在线]  [编辑:欧小雷]字体:【  
7月下旬,国防科技大学传出喜讯,由该校牵头研制的“天河三号E级原型机系统”完成研制部署并通过验收,标志着我国向新一代百亿亿次(E级)超级计算机发起了冲锋。从每秒1亿次,到10亿次,再到现在的百亿亿次,回想中国超算之路,年逾6旬的国防科大计算机研究所胡庆丰教授感慨万千。

“银河”疑是九天来

——国防科技大学和超级计算机的故事

天河一号千万亿次超级计算机系统。(资料图片)何书远 摄

“天河二号”落户国家超算广州中心。(资料图片) 何书远 摄

制图/刘铮铮

湖南日报·华声在线记者 周小雷 施泉江 通讯员 韩雪

超级计算机是国之重器,也是一个国家科技实力的重要标志之一。

7月下旬,国防科技大学传出喜讯,由该校牵头研制的“天河三号E级原型机系统”完成研制部署并通过验收,标志着我国向新一代百亿亿次(E级)超级计算机发起了冲锋。

从每秒1亿次,到10亿次,再到现在的百亿亿次,回想中国超算之路,年逾6旬的国防科大计算机研究所胡庆丰教授感慨万千。

“假如人生能实现一个梦,我的这个梦,就是让中国在世界高性能计算领域拥有一席之地。”胡庆丰向记者感叹,著名计算机专家、“银河-Ⅰ”总设计师慈云桂教授的这句话,是“银河”团队生生不息的创新动力源泉,一代代“银河”人在创新实践中培育形成的“胸怀祖国、团结协作、志在高峰、奋勇拼搏”的“银河”精神,也成为我国科研工作者不断攀登世界科技高峰的精神力量。

1 “中国要搞四个现代化,不能没有巨型机”

改革开放之初,我国由于没有高性能的计算机,勘探的石油矿藏数据和资料不得不用飞机送到国外去处理,不仅费用昂贵,而且受制于人。当我国提出向某发达国家进口一台性能不算很高的计算机时,对方却提出:必须为这台机器建一个六面不透光的“安全区”,能进入“安全区”的只能是国外的工作人员。

1978年,那是一个科学的春天。

“中国要搞四个现代化,不能没有巨型机。”1978年,在中央召开的一次重要会议上,邓小平同志将研制亿次巨型计算机的任务郑重交给国防科大。

受领任务后,以慈云桂教授为代表的科研人员当即立下军令状:每秒1亿次一次不少;6年时间一天不拖;预算经费一分不超。“就算是豁出这条老命,也要把中国的巨型机搞出来!”当时已年过半百的慈云桂说。

研制巨型计算机,谈何容易?胡庆丰教授回忆,改革开放之初,我国技术落后,资料匮乏,西方国家又对我们实行技术封锁,了解国外研制巨型机的情况十分有限。国防科大虽然是国内最早研制计算机的单位,但此前为远望号测量船研制的“151”机,每秒运算速度只有100万次,而现在要研制每秒运算一亿次的机器,计算机运算速度一下要提高100倍,其困难不言而喻。面对这样的情况,大家只有一个信念,全力以赴造出自己的巨型机,大家把它叫做“争气机”,就是要争一口气,不让外国人再卡我们的脖子。

研制工作迅速展开之后,各种复杂技术问题随之冒了出来。走什么样的技术路线?采取什么样的体系结构?如何实现每秒一亿次的运算速度?问题像一个个“拦路虎”。科研人员们迎难而上,他们把实验室当战场,像打仗一样攻关,大家吃在工厂,睡在机房,夜以继日地进行着一场没有硝烟的战斗。当时参与研制的李思昆教授回忆说:那时加班费一个晚上两毛钱,我让大家登记领钱,结果没一个人愿意来领。大家心里想的是省下每一分钱,尽快造出中国的巨型机。

在紧张的攻关途中,43岁的蹇贤福倒在了工作岗位上,年仅35岁的讲师俞午龙牺牲在出差路途中。把生命献给了我国巨型机事业的,还有40岁的张树生、41岁的王育民、49岁的钟士熙……他们把生命化作前进的“燃料”,用身躯化作“台阶”,推动着巨型机研制不断向前发展,支撑着战友们继续向上攀登。

天道酬勤,5年没日没夜的顽强拼搏,以慈云桂教授为代表的科研人员,闯过了一个个理论、技术和工艺难关,攻克了数以百计的技术难题,创造性地提出了“双向量阵列”结构,大大提高机器的运算速度,提前一年完成了研制任务,系统达到并超过了预定的性能指标,机器稳定可靠,且经费只用了原计划的五分之一。

1983年12月26日,我国第一台命名为“银河-I”亿次巨型计算机通过国家技术鉴定,向全世界宣告:中国成为继美、日之后,第三个能独立设计和制造巨型机的国家。

1984年10月1日,在新中国成立35周年国庆大典上,我国首台“银河”巨型机模型受阅通过天安门广场,向世人展示了她那迷人的风采。

2 要让别人不“卡”不“冲”,你就得奋起直追,迎头赶上

“银河”疑是九天来,妙算神机费剪裁;跃马横刀多壮士,披星戴月育雄才。那些真正的艰辛与苦涩在老一辈银河人的眼里一笑而过,他们用倔强破开一层层冰封,在历史的车轮中顽强眺望。

“银河-I”横空出世后,一股“倒春寒”却悄然袭来。

西方国家突然同意将每秒亿次级巨型机向中国出口,而且价格十分低廉,降价幅度在50%以上。

银河人心里明白:西方国家试图用“价格战”打入中国计算机市场,试图抢占中国巨型机市场,把刚刚问世的“银河-I”冲垮。在经济尚不乐观的情况下,国内有需要的行业都想选择性价比高的计算机。渐渐地,“银河-I”被挤出巨型应用机市场,民族巨型机不奋起直追,最后只会被西方越甩越远。落后就要挨打,除了继续创新发展,别无选择。

要让别人不“卡”不“冲”,你就得奋起直追,迎头赶上。

1987年,国防科工委在北京邀请全国巨型机主要用户和同行专家对“银河-II”进行方案论证,确定“银河-II”主要面向气象、石油、航空与航天等大型科学计算、工程计算与大规模数据处理,并与用户密切合作,支持用户建立应用系统,开发应用软件。

中国抢占世界巨型机新的制高点的重任,落在以陈福接、周兴铭为代表的第二代银河人的肩上。党的支持、人民的信任、科研条件的改观,给了银河人前所未有的勇气与信心。为了节省科研经费,采购元器件时银河人精打细算,货比三家,能自己开发的元件设备坚决不采购,银河人的艰苦奋斗创造了“银河-II”的高性价比。银河人以高度的政治责任感和精益求精的态度快速稳妥推进任务进程,于1992年成功实现中国巨型机又一跨越,使我国成为继美国、日本后第三个掌握了每秒10亿次巨型机研制技术的国家。

20世纪末,世界超级计算机主流由向量并行计算向大规模并行处理转型。1993年,“银河-Ⅲ”百亿次巨型机正式立项。“银河-Ⅲ”总指挥卢锡城院士回忆道,“虽然沿着既往技术路线也能造出来,却很难突破更高性能的技术。如果走国际公认的新一代巨型机的技术路线——大规模并行处理,则难度高、风险大。”

“科研攻关,如同打仗攻山头一样,必须杀出一条血路!”作为总指挥,卢锡城带领科研团队分析论证后,果断选择了新路线,决定以千亿次量级的关键技术,实现百亿次巨型机,确保巨型机全面领先。后来,这种大规模并行处理机成为世界巨型机发展的主流方向。

3 坚持自主创新潜心攻关,五星红旗插上超算世界之巅

经过“银河人”数十年艰苦攀登,进入新世纪,中国冲击超级计算机“珠峰”的条件已经形成。

2007年11月,美国研制出世界首台千万亿次超级计算机,峰值计算速度每秒1456万亿次。在2009年6月公布的世界超级计算机500强(TOP500)中,美国占据291席,欧洲占据145席,且前10名均为美国产品。与发达国家相比,我国不仅在计算能力上相差一个量级,装机数量也相去甚远。

在日新月异、竞争激烈的超级计算机研制领域,不进则退是十分现实而残酷的生存法则。面对高性能计算领域的严峻挑战,国防科大计算机学院的科研人员再次吹响了研制“天河一号”的号角。为打破西方的技术垄断,他们坚持自主创新,潜心攻关。

天河团队在国际上首创了CPU和GPU相结合的异构融合计算体系结构,以提高计算效能。按常理,CPU是用来计算的,GPU是用来进行图形和视频处理的,如果将GPU用来计算,不仅编程很难,而且计算效率也很低。但GPU具有并行度高、功耗低、价格便宜等特点,如果能在用于科学计算上取得突破,将具有十分突出的优势。为此,他们大力攻关,花了近2年的时间进行可行性验证。那一段时间,研究室里晚上灯火通明,大家废寝忘食,同心协力,创造性地采用混合语言编程技术,终于攻克了这一难题。

2009年10月29日,天河团队研制成功了4700万亿次“天河一号”超级计算机,2010年11月,首次将五星红旗插上超级计算的世界之巅。

然而,从2011年到2012年这短短两年时间里,日本的“京”、美国“红杉”和“泰坦”系统先后超过“天河一号”,“天河一号”的排名随之从世界第一滑落到第二、第五和第八。

凭着雄厚的技术积累和预先研究取得的成果,国防科大成功立项国家科技部863计划信息技术领域“高效能计算机研制”重大项目。科研人员奋勇拼搏,勇攀高峰,2013年5月,峰值速度达5.49亿亿次的“天河二号”惊艳亮相,并先后六次站在世界超算500强榜首,让古老的“算盘王国”一次次矗立在世界超算之巅。

2013年6月,中共中央总书记、国家主席、中央军委主席习近平对国防科大研制成功“天河二号”超级计算机系统作出重要批示。习近平总书记指出,“天河二号”超级计算机系统研制成功,标志着我国在超级计算机领域已走在世界前列。习近平总书记希望同志们总结经验,再接再厉,坚持以我为主,勇于自主创新,不断强化前沿技术研究,为推动我国科技进步、建设创新型国家作出更大贡献。

“从‘银河’巨型机‘零’的突破到‘天河’跃上世界之巅,这种在披荆斩棘、攻坚克难中形成的‘银河’精神,早已融入国防科大师生的血脉,成为走中国特色自主创新道路的高度文化自觉。”胡庆丰教授欣慰地对记者说。