转自:东南财金

近日,中国工程院院士、清华大学计算机系教授、出生于东钱湖的郑纬民院士受邀回到家乡讲学、考察。

4月16日、4月17日,郑纬民分别作了三场不同主题的演讲,也展示了他和团队近几年在人工智能、大数据、高性能计算等前沿领域的全新成果,让宁波学界和政企界大开眼界。

其成果的名称也非常有趣——“诸葛弩”“八卦炉”……

那么,这位中国计算机的“一代宗师”的新成果有多厉害?这些成果又透露哪些最新的趋势?

郑纬民院士回乡讲学。

 “八卦炉”让中国能造出更聪明的“GPT”

4月17日,在“甬数未来”人工智能产业高峰论坛上,郑纬民院士团队展示了关于AI(人工智能)的两大最新成果,其中一项就是“超大规模预训练模型”——“八卦炉”。

这个模型有啥用?

“我们可以用现在最火的ChatGDP举例。”郑院士介绍。

ChatGPT的原理“单字接龙”,如联系上文“白日依山”的下个字就是“尽”。而要实现自然语言的问答,就需要大量的“预训练”。

GPT的直译就是Generative Pre-trained Transformer(生成型预训练变换模型)。GPT1的训练参数是1.1亿个,GPT2是15亿个,GPT3是1750亿个。当到达GPT3时,量变推动了质变。GPT3基于人类的文章、编程逻辑、解题思路涌现出“理解指令”“模仿例子”“分步解题”等原本科学家都没有想到的“能力”。

各模型训练参数数量

现在,学界普遍认为,只要预训练参数足够,就能涌现更多能力。这就是为什么全球在大语言模型上展开“军备竞赛”的原因。但训练量更大的模型,需要性能更强的机器,也需要能适配机器的模型。

于是,郑纬民院士团队在国产E级(1E=1024P,1P=1024T,1T=1024G)高性能计算机上训练了一个170万亿参数的超大规模预训练模型,模型参数接近于人脑中的突触数量(人脑大约1000万亿个),比GPT3大一千倍。这就是去年清华和阿里达摩院等联合发布的“八卦炉”。

这个模型破解了“高效数据存储”“软硬件适配”“数据精度选取”“动态负载”等一系列业界难题,是目前中国在AI领域用“魔法打败魔法”的利器。

未来,不仅是GPT之类的大规模语音模型,“八卦炉”能在从自动驾驶汽车到科学研究的各种场景中应用。

自主研发AI计算机“跑分系统”

模型参数比GPT3大一千倍……这位甬籍院士研发的人工智能破解了一系列业界难题

我们通常说的“超算即超级计算,大家第一反应是“太湖之光这种科学计算机(HPC计算)。而AI计算即人工智能高性能计算,其原理与HPC计算不太一样,HPC是双精度即64位以上的浮点运算,而AI计算一般半精度即可。

比如,宁波人工智能超算中心就是两者结合——兼具100P(FP16半精度人工智能算力、5P(FP64双精度高性能计算算力。

郑纬民介绍——

世界上对HPC计算有一个评价体系,通过Linpack标准排出全球超算500强榜单并发布,中国的神威太湖之光、天河二号近几年一直位居前三。

但AI计算并没有一个标准排名,于是,郑纬民团队研发了AIPerf标准。可以把它比作一个AI计算机“跑分系统”。这个系统做到了统一分数、可变的问题规模、具有实际的人工智能意义、评测程序包含必要的多机通信四大功能,目前被国际认可。

自2020年开始,深圳的鹏城云脑已连续三年名列全球第一。

最新一期AIPerf排名

从目前趋势看,由于人工智能的大规模应用,人工智能计算的需求越来越大。因此,宁波的超算中心二期也正在加快建设。

“诸葛弩”横空出世

当前,全世界已经迈入大数据时代,大数据的分析、处理、运算系统成了决定生产力发展的关键工具之一。

在4月16日举行的第七届宁波市计算机大会上,郑纬民向家乡父老展示了他和团队最新研发的用于大数据处理的高性能计算引擎——“诸葛弩”。

为什么叫“诸葛弩”?因为它可以连续发射、效率更高。

郑纬民院士介绍——

目前,全世界应用最广泛的大数据处理系统是Apache Spark,由加州大学伯克利分校的AMPLab开发。这种系统具有高性能和广泛的适用性,可以处理更多类型的工作负载,且可以在内存中缓存数据以提高性能。同时,Spark还提供许多附加功能,如流处理、机器学习、图形处理等。

但Spark存在几个大的缺点——

一是,需要在内存中缓存数据,在处理大规模数据时需要足够的内存。

处理1TB的数据需要20TB的内存,也就是20倍的关系。

郑纬民介绍,“有人会说,我有钱,我可以买很多内存条。但运算量到达一定程度后,物理增加内存的方法行不通了,因为你插内存条的卡槽也不够了。

二是,Spark处理时间较长,运算需要长时间等待。同时,Spark在小规模数据处理方面的性能并不占优势,也就是小规模数据同样耗时长。

基于上述痛点,郑纬民院士团队花了数年时间,打造了自主研发的高性能计算引擎——“诸葛弩

实验表明,“诸葛弩在迭代算法上可以比Spark快20倍,在非迭代算法上比Spark快5倍,占用内存仅Spark的十分之一左右。

有企业出4亿元向我学生买这个系统,我觉得还不完善。宁波的老乡们有兴趣可以加入我们,去完善这个系统,让它在大数据时代发挥更大作用。

近年,郑纬民院士团队还研发出全国首个完全自主可控且实时开源的区块链“海河智链”,目前已经与宁波的区块链系统“甬链”底层互通。

宁波的超算中心建设也离不开郑纬民院士的指导和帮助。

他曾多次表示:“家乡如有计算机方面的需要,可以找我。我不行的话,我会找人帮助解决。

文字:乐骁立

一审:戴晓燕二审:张波