长沙 | 中国超算之路从这启航

(天河二号超级计算机。刘于蓝摄)

“中国要进入四个现代化,不能没有巨型机。”1978年,改革开放刚启程,邓小平提出这一观点,点名让国防科委负责研发。

“5年时间,一天不多;每秒一亿次,一次不少。”著名计算机专家、长沙工学院计算机系首任主任慈云桂教授现场立下军令状。

研制工作迅速展开,各种复杂技术问题迎刃而解……一场研制超级计算机的全国大协作在长沙拉开序幕,开启了从银河到天河的华丽之旅。

改革开放四十年,中国计算机的超算之路越走越宽阔。

(位于国防科大里的银河楼。刘于蓝摄)

“中国制造的超级计算机面世了”

走进位于长沙的国防科大计算机学院,宽敞、明亮的“银河”机房里,矗立着一台由7个机柜组成的圆柱形机器,这就是开启我国超算之旅的“银河一号”超级计算机。

“亿万星辰汇银河,世人难知有几多。神机妙算巧安排,笑向繁星任高歌。”这首时任国防科工委主任张爱萍为我国研制成功的第一台巨型计算机题的诗,道出了无数科研人员研制超级计算机的艰辛历程。

改革开放之初,国内技术条件落后,加之西方国家的技术封锁政策,让国内的超算研制处于极其艰难的环境中。

“就算是豁出这条老命,也要把中国的巨型机搞出来!”抱着不甘于人后的信念,以慈云桂为代表的科研团队,参考当时国际上先进巨型机的设计思路,集智攻关,创造性地为巨型机设计了一个“双向量阵列”体系结构,攻克了一个个技术难关,提前一年完成了研制任务。

1983年12月,我国第一台亿次计算机研制成功,正式通过鉴定,取名为银河一号。从此,中国成为继美、日之后第三个能独立设计和制造巨型机的国家。

“这解决了我们石油物探的大问题。” 天河一号副总设计师、天河二号副总质量师胡庆丰介绍,当时一共生产了3台超级计算机,其中一台用于石油部物探研究院,用作石油地震物理处理系统。

胡庆丰介绍,石油物探通过地震波反射反应地层结构变化,分析合油地方,这种分析会产生大量数据,以前是用磁带记录,每年的数据都要用卡车来拖。“当年我国的计算机处理能力低,需要把数据寄出去给别的国家处理,这样既耗时又耗钱,还有数据泄漏的可能。”

“我们能自己独立完成石油物探,还能完成数据分析,方便多了。”银河一号研制成功后,这些难题迎刃而解;接下来银河系列超级计算机相继问世,一系列迫在眉睫的问题都慢慢得以解决。

1992年,银河二号完成研制,运算速度提升到每秒10亿次。国家气象局以此来做中长期数值预报系统,可以进行5—7天的天气预报。

“早期气象局想买美国的计算机来做预报系统,但是他们要价非常高,前前后后谈了差不多10年时间,一直都没有拿下来。”胡庆丰介绍,银河二号研制成功后,国防科大派出相关团队和气象局合作,去进行数据调试和研发气象软件。

“当时需要数据备份,就买了台美国计算机。银河二号配有18万根电线,硬软件调试2个月后投入使用,而美国的计算机光调试就用了一年时间。”胡庆丰笑着表示,当时国防科大派出的专家有的后来甚至成了气象专家。

(天河一号计算机全系统设备。刘于蓝摄)

“中国有了最快的计算机”

进入新世纪后,我国各项事业进入高速发展时期,对超级计算机的运算速度和容量都有了更迫切的需求,以胡庆丰为代表的“超算人”,继续日以继夜的科研攻关,将更快速度更高性能的超级计算机作为目标,全力发起冲锋。

2007年11月,美国研制出世界首台千万亿次超级计算机,峰值计算速度每秒1456万亿次。2009年6月公布的世界超级计算机500强(TOP500)中,美国占据291席,欧洲占据145席。计算能力和装机数量上的差距,让国内的超算研究团队,感受到了压力。

压力带来动力。经过科研团队废寝忘食、同心协力的攻关,2009年10月,我国首台千万亿次超级计算机系统“天河一号”问世。2010年11月,“天河一号”超级计算机系统以峰值速度4700万亿次的高性能排名同期世界超算500强榜单的榜首,首次将五星红旗插上超级计算的世界之巅。

4700万亿次是多快的速度?胡庆丰给记者举了个例子:“天河一号”运算1小时,相当于全国13亿人同时计算340年以上;“天河一号”运算1天,相当于1台双核的高档桌面电脑运算620年以上。

然而,竞争激烈的世界超算领域,“不进则退”的法则体现得尤其明显。在随后的两年时间里,“天河一号”先后被日本的“京”、美国“红杉”和“泰坦”系统超过,世界排名滑落至第八名。

为了重回榜首受,国内的超算人更加努力地埋头研发。

(位于国防科大里的天河楼。刘于蓝摄)

坐落在湖南国防科技大学的天河楼因此得名。在国防科技大学天河楼里,“天河二号”超级计算机研发成功正在运行,长达数十米的机箱后面,无数的指示灯明暗闪烁,气象、医学等数据以每秒亿亿次的速度运行。

“研发的路上,我们一直在起跑,就是为了能在世界超算领域有我们的一席之地。”胡庆丰介绍,面对更庞大的系统规模和更为复杂的技术难度,超算研究向着新的“中国速度”全力进发。

2013年6月17日,“天河二号”再次登上世界超算500强榜首,并连续6次排名世界第一。

(国家超级计算长沙中心外景。黄张伟摄)

为了赶上这趟“超算快车”,2010年10月,湖南省向科技部申请建设国家超级计算中心并获得批复,国家超级计算长沙中心正式成立。长沙超算坐落于湘水之滨、麓山脚下的岳麓山国家大学科技城核心地带、湖南大学南校区内的,很快就开始服务于湖南的各项大数据研究。

“汛期各个大坝的数据统计,我们一目了然,比以前工作效率提高了很多。”除开医学领域,长沙超算中心在湖南的应用涉及领域越来越广。

2018年6月,湖南省水利厅、湖南省水利水电科学研究所“湖南省大坝安全信息管理系统”成功实施运营,该系统的投产大大缩短了水库巡检人员的工作量,建立了水库巡检工作的标准化流程。

同时,为湖南全省中大型水库的实时数据信息,包含库容、水位、雨量等安全生产关键信息数据在水利网上方便、快捷的展示,为全省水利工作提供了极大的方便,推进了数字化水库的建设进度。

“中国有了自己的CPU”

然而,不管是银河系列,还是天河一号,都是用的CPU并构模式。同时用数以千计甚至万计的CPU,不仅功耗大,需要差不多一个中小城市用电量,而且系统的稳定性和可靠性都很低。

“中国的超级计算机要重回世界领先,必须要自主创新,进行技术提升。”胡庆丰介绍,当时美国商务部发出禁令,CPU对国防科大出口必须经过商务部,这让他们意识到,有些关键技术必须用自己的。

历经数万次实验,天河团队成员终于发现了 CPU 和 GPU 高效协同计算的内在规律,首创CPU和GPU相结合的异构融合计算体系结构,使计算效率由 20% 提高到 70%。

不仅是速度快,在实际应用方面,科研团队的成员们也在不断创新,拓展应用领域,让超算真正走入日常生活。

(基于长沙超算中心研制的骨质疏松人工智能筛查机器人项目。吕英俊摄)

“一年内是否有关键部位脆性骨折?”“每天日照是否低于30分钟?”这些专业的“就诊”问题,可不是来自于经验丰富的医疗专家,而是从骨质疏松人工智能筛查机器人里传出。

基于国家超级计算长沙中心的大数据,骨质疏松人工智能筛查机器人“大脑”中,涵盖了200余种骨质疏松风险体征的问题库,可精确“问诊”骨质疏松症,3至5分钟内提供个性化诊疗报告,准确率超过90%。

“当预测到长沙有恶劣天气,可更准确更及时地进行预报。”国家超级计算长沙中心主任李肯立介绍,以同样的计算精度为例,原来要24小时才能计算出气候模式,借助超级计算机运算后,只要几分钟就可计算出来,速度比原来快了300多倍,还可实时追踪未来3-5天长沙市及周边不同地区、不同行业污染源排放对长沙市空气质量的贡献量和贡献率。

国家超级计算长沙中心依托“天河”超级计算机、“天河·天马”人工智能计算机群等计算平台,不断拓展服务用户和应用领域。

截至目前,长沙超算先后为637家单位提供了高性能计算、云计算、大数据及其他综合性服务,资源使用率达85%以上,已处于饱和运行状态,对国家特别是湖南省科技创新以及经济社会发展起到了良好的科技支撑作用。

今年6月25日,新一期全球超级计算机500强榜单发布,美国超级计算机“顶点”以峰值速度每秒20亿亿次占据榜首;在超算总数上,中国以206台位居第一。

“比世界排名更让人欣慰的是,我们是全方位自主研制。” 从每秒1亿次,到现在的20亿次,从受制于人到自主可控,回想中国超算之路,胡庆丰感慨不已。

评论一下
评论 0人参与,0条评论
还没有评论,快来抢沙发吧!
最热评论
最新评论
已有0人参与,点击查看更多精彩评论