飞腾龙芯两大国产芯片巨头相继推出新型桌面芯片,性能如何?
2019年年末,两大国产CPU芯片巨头飞腾和龙芯相继组织了规模宏大的年会,发布了新型桌面芯片及其整机产品,顿时硝烟四起。这两款芯片性能到底如何?谁能扛起国产化的大旗?笔者有幸获取了两种产品样机,客观公证地进行了摸底测试。
从基于两款芯片的整机产品发布情况来看,采用龙芯3A4000的台式机,主频标称1.7-2.0GHz,一般为1.8GHz,四核,CPU功耗40W左右;笔记本上采用的主频一般为1.5Ghz,CPU功耗是30W,笔记本上有风扇。发布会上厂商联合发布的产品有8个台式机,3个笔记本,3款一体机。
飞腾FT-2000/4台式机,主频2.6-3.0GHz,一般为2.6GHz,四核。笔记本主频2.3GHz,CPU功耗10W,采用无风扇超薄设计。发布会上厂商联合发布的产品有10个台式机,4款笔记本,6款一体机。
我们对龙芯3A4000样机和飞腾FT-2000/4样机进行了对比,配置如下表。公平起见,龙芯3A4000与飞腾FT-2000/4采用相同内存,显卡和机械硬盘。
SPEC CPU可以说是目前CPU性能评估最为客观而可信的基准测试,可以客观反映CPU自身计算性能情况。它测试通过一系列测试集,对CPU整形运算和浮点运算进行测试并进行打分。
采用Spec2006版本进行测试,结果如下:
从测试结果可以看到, SPECint(整型计算性能)FT-2000/4是龙芯3A4000 的1.5倍。SPECfp(浮点计算性能) FT-2000/4是龙芯3A4000 的1.7倍。
内存的访存延迟会影响应用性能,延迟越低越好。
使用Lmbench工具进行访存延迟测试,结果如下:
龙芯3A4000的连续访问延迟是FT-2000/4的2倍,龙芯3A4000的随机访问延迟是FT-2000/4的3倍。
Stream测试是业界公认的内存带宽性能测试基准工具,可以客观反映CPU访存性能。
Stream访存带宽测试结果:
可以看到,在同样的8G内存配置下,FT-2000/4的stream值为龙芯3A4000的1.33倍。
UnixBench更能综合反应搭载芯片整机的性能水平,是非常重要的评价指标。UnixBench的值越高越好。UnixBench测试结果:
UnixBench测试值,FT-2000/4是龙芯3A4000的1.9倍。这代表着整机综合性能FT-2000/4是龙芯3A4000的1.9倍。
图形性能不仅与所配显卡有关,也与CPU的性能有很大关系,只有CPU处理能力强,才可以把图形能力完全发挥出来。
x11perf是一个2D图形测试工具,用于测试Xserver图形性能。它在各种分辨率窗口下测试进行一定数量的图形绘制运算,耗时越低越好。
X11perf测试结果:
X11perf测试项众多,挑选几个典型绘图场景做比较,1) 绘制同样数量的点, 3A4000耗时是FT-2000/4的10倍;2)绘制线的耗时是3.5倍;3)绘制同样数量的椭圆的耗时,龙芯3A4000是FT-2000/4的4倍。
glmark2是一个针对OpenGL2.0和ES2.0性能的基准工具。Glmark2进行一系列3D图形绘制,最终得分越高,说明3D性能越好。
Glmark2测试结果如下:
从3D Glmark2的测试来看,FT-2000/4的性能为龙芯3A4000的1.8倍。
Octance测试是由google研发的Javascript引擎测试标准,其使用了各大型网站中频繁使用的Javascript代码来测试浏览器的JS引擎性能,测试Case更贴近当前的复杂网络环境,且还加入延时测试,数值越高说明浏览器的表现越优秀。
浏览器性能测试Octance在Firefox和Chromium两个浏览器上的得分为:
可以看到FT-2000/4对比龙芯3A4000,在Firefox得分为其1.63倍,在Chromium得分为其2.57倍。
Fish Tank是微软公司推出的一款工具,可以用于评测PC浏览器的性能,也可以用来考核手机GPU性能。它是一个虚拟的鱼缸场景,有很多游动的鱼,鱼鱼游得越快,说明浏览器和GPU的性能越强,用户可以自由选择缸内鱼的数量(最多1000只),当然,鱼越多,对性能的要求就越高。Fish Tank鱼缸测试本质上是一个GPU加速的测试应用,它会提供充足的时间(60秒)让HTML5浏览器渲染内容,屏幕中的鱼按照轨迹进行由大至小散开游动。这对GPU一个很大的负担,右上角的fps数代表每秒帧数,得分越高,说明性能越强。
浏览器Fish Tank测试结果:
龙芯的Firefox浏览器在FishIETank图形性能测试时会直接卡死,多次测试未能成功。在Chromium浏览器上,250条鱼时为30帧。FT-2000/4上,500条鱼时都是满帧60fps。
飞腾与龙芯JAVA版本都是OpenJDK 1.8.0,版本一致。SPECjvm测试结果越高越好。
JVM性能测试结果如下:
FT2000/4的java性能是龙芯3A4000的1.8倍。
本次测试使用WPS软件对不同大小的文档进行打开和保存的速度测试,时间越短越好。
可以看到在打开同样的文件时,飞腾FT-2000/4的速度要快于龙芯3A4000平台,在10M大小的情况下,FT-2000/4的打开速度是龙芯3A4000的一倍多。当文件变大时,每次保存是非常耗时的事,在飞腾FT-2000/4上保存100M的文档比龙芯3A4000要快4秒。
在龙芯3A4000上使用两种显卡测试,分别是R7 240、HD7450显卡,播放时都不流畅,出现明显卡顿丢帧。
在FT-2000/4上使用R7 240播放流畅,没有卡顿丢帧。而使用HD7450时,也会有一点丢帧。
从基于两款芯片的整机产品发布情况来看,采用龙芯3A4000的台式机,主频标称1.7-2.0GHz,一般为1.8GHz,四核,CPU功耗40W左右;笔记本上采用的主频一般为1.5Ghz,CPU功耗是30W,笔记本上有风扇。发布会上厂商联合发布的产品有8个台式机,3个笔记本,3款一体机。
飞腾FT-2000/4台式机,主频2.6-3.0GHz,一般为2.6GHz,四核。笔记本主频2.3GHz,CPU功耗10W,采用无风扇超薄设计。发布会上厂商联合发布的产品有10个台式机,4款笔记本,6款一体机。
我们对龙芯3A4000样机和飞腾FT-2000/4样机进行了对比,配置如下表。公平起见,龙芯3A4000与飞腾FT-2000/4采用相同内存,显卡和机械硬盘。
龙芯 3A4000 | FT-2000/4 |
主频:1.8G OS: 中标麒麟 内存:8G 显卡:HD7450 硬盘:SATA机械硬盘 |
主频: 2.6 G OS: 银河麒麟 内存:8G 显卡:HD7450 硬盘:SATA机械硬盘 |
测评项及结果
1)CPU性能测评
SPEC CPU是SPEC组织推出的CPU子系统评估软件软件, 是一项评估处理器计算性能的全球性测试标准。(SPEC全称是标准性能评估公司,是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。)SPEC CPU可以说是目前CPU性能评估最为客观而可信的基准测试,可以客观反映CPU自身计算性能情况。它测试通过一系列测试集,对CPU整形运算和浮点运算进行测试并进行打分。
采用Spec2006版本进行测试,结果如下:
SPEC2006测试项 | 龙芯3A4000 | FT-2000/4 | ||
核数 | 1 | 4 | 1 | 4 |
SPECint 整型 | 13.5 | 38.1 | 16.5 | 55.5 |
SPECfp 浮点 | 13.3 | 33.2 | 16.8 | 57.5 |
2)内存访问延迟测评
Lmbench工具测试了所有系统的缓存延迟,例如一级,二级和三级缓存,还有内存和TLB 表的未命中延迟,是内存访问延迟的主工基准测试,内存的访存延迟会影响应用性能,延迟越低越好。
使用Lmbench工具进行访存延迟测试,结果如下:
龙芯3A4000 | FT-2000/4 | |
Lmbench |
连续访问延迟:22.3ns 随机访问延迟:343.1ns |
连续访问延迟:10.4ns 随机访问延迟:128.4ns |
龙芯3A4000的连续访问延迟是FT-2000/4的2倍,龙芯3A4000的随机访问延迟是FT-2000/4的3倍。
3)Stream访存带宽
随着处理器处理核心数量的增多,内存带宽对于提升整个系统性能越发重要,如果某个系统不能够足够迅速地将内存中的数据传输到处理器当中,若干处理核心就会处于等待数据的闲置状态,而这其中所产生的闲置时间不仅会降低系统的效率还会抵消多核心和高主频所带来的性能提升因素。Stream测试是业界公认的内存带宽性能测试基准工具,可以客观反映CPU访存性能。
Stream访存带宽测试结果:
龙芯3A4000 | FT-2000/4 | ||
Stream (MB/s) |
Copy | 7991 | 10706 |
Scale | 7898 | 10647 | |
Add | 8019 | 10851 | |
Triad | 8063 | 10763 |
4)系统综合性能测试
UnixBench是通用的测试系统性能的工具。UnixBench会执行一系列的测试,包括2D和3D图形系统的性能衡量,测试的结果不仅仅只是CPU,内存,或者磁盘为基准,还取决于硬件,操作系统版本和编译器。测试系统各个方面一系列的性能,然后将每个测试结果和一个基准值进行比较。UnixBench更能综合反应搭载芯片整机的性能水平,是非常重要的评价指标。UnixBench的值越高越好。UnixBench测试结果:
龙芯3A4000 | FT-2000/4 | |||
核数 | 1 | 4 | 1 | 4 |
unixbench | 741.8 | 1587.2 | 1168 | 2881 |
5)2D性能测试
在桌面终端上,图形处理的性能直接影响用户使用体验,影响图形界面、图文处理和浏览器的性能。2D和3D都是桌面终端关注的重要指标。图形性能不仅与所配显卡有关,也与CPU的性能有很大关系,只有CPU处理能力强,才可以把图形能力完全发挥出来。
x11perf是一个2D图形测试工具,用于测试Xserver图形性能。它在各种分辨率窗口下测试进行一定数量的图形绘制运算,耗时越低越好。
X11perf测试结果:
2D性能测试指标 | 龙芯3A4000 | FT-2000/4 | |
X11perf (msec) 数据越低越好 |
绘制点速率 | 0.0001 | 0.00001 |
绘制线速率 | 0.0007 | 0.0002 | |
绘制三角形速率 | 0.0099 | 0.00199 | |
绘制椭圆形速率 | 0.0311 | 0.0073 |
6)3D性能测试
同样,在桌面终端上,3D的性能很大程度影响用户使用体验,还会影响一些软件比如地图和游戏的运行能力。glmark2是一个针对OpenGL2.0和ES2.0性能的基准工具。Glmark2进行一系列3D图形绘制,最终得分越高,说明3D性能越好。
Glmark2测试结果如下:
3D性能测试指标 | 龙芯3A4000 | FT-2000/4 |
3D GLMark2 | 455 | 807 |
7)浏览器性能测试
浏览器是桌面终端上最重要的应用。随着HTML5的普及,浏览器不再只是信息获取的入口,而取代了众多传统客户端成为了应用的主要入口。所以浏览器的性能对用户体验是非常重要的。Octance测试是由google研发的Javascript引擎测试标准,其使用了各大型网站中频繁使用的Javascript代码来测试浏览器的JS引擎性能,测试Case更贴近当前的复杂网络环境,且还加入延时测试,数值越高说明浏览器的表现越优秀。
浏览器性能测试Octance在Firefox和Chromium两个浏览器上的得分为:
工具|浏览器 | 龙芯3A4000 | FT-2000/4 | |
Octance | Firefox | 8159 | 13349 |
Chromium | 6377 | 16399 |
8)FishIETank浏览器图形性能测试
在当今的网络上,每个网页基本上都充斥着大量的图形,使用GPU加速渲染已经成为重要的性能要求。所以对 GPU图形加速的测试,成为了必不可少的项目。Fish Tank是微软公司推出的一款工具,可以用于评测PC浏览器的性能,也可以用来考核手机GPU性能。它是一个虚拟的鱼缸场景,有很多游动的鱼,鱼鱼游得越快,说明浏览器和GPU的性能越强,用户可以自由选择缸内鱼的数量(最多1000只),当然,鱼越多,对性能的要求就越高。Fish Tank鱼缸测试本质上是一个GPU加速的测试应用,它会提供充足的时间(60秒)让HTML5浏览器渲染内容,屏幕中的鱼按照轨迹进行由大至小散开游动。这对GPU一个很大的负担,右上角的fps数代表每秒帧数,得分越高,说明性能越强。
浏览器Fish Tank测试结果:
工具|浏览器 | 龙芯3A4000 | FT-2000/4 | |
FishIETank |
firefox | 浏览器卡死,未能测试成功 |
500条鱼,60帧 1000条鱼,20+ |
Chromium |
250条鱼,30帧 1000条鱼,10帧 |
500条鱼,60帧 1000条鱼,34帧 |
9)JVM性能测试
Java是桌面及服务端主要的跨平台应用运行环境,SPECjvm2008也是SPEC标准性能评估组织开发的Java基准性能工具。它的测试用例涵盖了大部分java基础应用场景,是架构选型和VM性能评测最主要的工具。飞腾与龙芯JAVA版本都是OpenJDK 1.8.0,版本一致。SPECjvm测试结果越高越好。
JVM性能测试结果如下:
龙芯3A4000 | FT-2000/4 | |
SPECjvm2008 | 64.14 | 113.92 |
10)Word/PDF文档测试
当前国产桌面CPU最重要的使用场景是办公环境,其对Word和PDF等文件处理软件的性能情况,对用户体验有非常重要的影响。本次测试使用WPS软件对不同大小的文档进行打开和保存的速度测试,时间越短越好。
文档操作 | 文件大小 | 龙芯3A4000 | FT-2000/4 |
Word打开速度 |
10M文件 | 6.65s | 2.45s |
100M文件 | 7.7s | 5.14s | |
Word修改保存速度 | 100M 文件修改 | 13s | 9.2s |
PDF打开速度 |
10M文件 | 1.21s | 1.1s |
100M文件 | 2.18s | 1.61s |
11)视频播放测试-4K
视频播放测试使用4K 片源,格式为H.264,码率为20M。在龙芯3A4000上使用两种显卡测试,分别是R7 240、HD7450显卡,播放时都不流畅,出现明显卡顿丢帧。
在FT-2000/4上使用R7 240播放流畅,没有卡顿丢帧。而使用HD7450时,也会有一点丢帧。