English Page

SSS-CORE の性能

[ホーム | 特徴 | 論文 | 性能 | デモ | スタッフ | 用語]
[CSS2 対応ブラウザ向け | CSS2 未対応ブラウザ向け | 表をうまく表示できないブラウザ向け]

これまでに SSS-CORE の 性能評価が様々な面から行われています。 ここでは以下の評価結果を要約して示します。

詳細な実験の内容および考察に関しては論文を ご覧下さい。

以下の文中で、「SPARCstation 20」という表記は Sun Microsystems SPARCstation 20 およびその互換機を指します。 実験では主に、互換機である Axil 320 model 8.1.1 を使用しました。


基本的なシステムコールの性能

実験条件
ワークステーション SPARCstation 20 (85 MHz SuperSPARC × 1)
OS SSS-CORE Ver. 1.1
SunOS 4.1.4
タスク ID の取得コスト
SSS-CORE get_taskid() 1.12 μsec
SunOS getpid() 4.39 μsec
メモリ獲得/返却システムコールのコスト (単位: μsec)
サイズ (byte) 4 K 16 K 64 K 256 K 1 M
SSS-CORE allocate 23.91 28.91 48.77 123.2 431.2
SSS-CORE free 19.49 20.36 23.91 36.23 99.06
SunOS sbrk() 133.2 375.8 894.3 1828 2020

MBCF の基本通信性能

Gigabit Ethernet 使用時

実験条件
ワークステーション Sun Microsystems Ultra 60 (450 MHz UltraSPARC-II × 1)
NIC Sun Microsystems GigabitEthernet/P 2.0 Adapter
ネットワーク (直結)
OS および通信方式 SSS-CORE Ver. 2.3 MBCF
Solaris 2.6 TCP/IP
MBCF/1000BASE-SX の片道遅延時間 (単位: μsec)
data size (byte) 4 16 64 256 1024
MBCF 9.6 11.0 11.5 16.2 35.9
TCP/IP 95.08 95.22 95.39 99.45 114.15
MBCF/1000BASE-SX のピークバンド幅 (単位: Mbyte/sec)
data size (byte) 4 16 64 256 1024 1408
MBCF 2.29 5.67 22.30 55.41 78.22 80.92
TCP/IP 0.09 0.43 1.67 5.56 12.79 20.21

MBCF において、送受信のソフトウェアオーバヘッドが十分に小さいにも かかわらずピークバンド幅がハードウェア性能の限界(125 Mbyte/sec)近くまで 出ていないのは、Ultra 60 のハードウェア側にボトルネックがあるものと 推定される。

Fast Ethernet 使用時

実験条件
ワークステーション SPARCstation 20 (85 MHz SuperSPARC × 1)
NIC Sun Microsystems Fast Ethernet SBus Adapter 2.0
ネットワーク SMC TigerStack 100 5324TX (non-switching 100BASE-TX HUB)
Bay Networks BayStack 350T (switching 100BASE-TX HUB)
OS SSS-CORE Ver. 1.1
MBCF/100BASE-TX の片道遅延時間 (単位: μsec)
data size (byte) 4 16 64 256 1024
MBCF_WRITE 24.5 27.5 34 60.5 172
MBCF_FIFO 32 32 40.5 73 210.5
MBCF_SIGNAL 49 52.5 60.5 93 227.5
MBCF/100BASE-TX のピークバンド幅 (単位: Mbyte/sec)
data size (byte) 4 16 64 256 1024 1408
MBCF_WRITE, 半二重 0.31 1.15 4.31 8.56 11.13 11.48
MBCF_WRITE, 全二重 0.34 1.27 4.82 9.63 11.64 11.93

MPI/MBCF の通信性能

実験条件
ワークステーション SPARCstation 20 (85 MHz SuperSPARC × 1)
NIC Sun Microsystems Fast Ethernet SBus Adapter 2.0
ネットワーク SMC TigerStack 100 5324TX (non-switching 100BASE-TX HUB)
Bay Networks BayStack 350T (switching 100BASE-TX HUB)
OS および MPI 実装 SSS-CORE Ver. 1.1 MPI/MBCF
SunOS 4.1.4 MPICH Ver. 1.1 (TCP を使用)
100BASE-TX における MPI/MBCF の round-trip time (単位: μsec)
message size (byte) 0 4 16 64 256 1024 4096
MPI/MBCF on SSS-CORE 71 85 85 106 168 438 1026
MPICH/TCP on SunOS 968 962 980 1020 1080 1255 2195
100BASE-TX における MPI/MBCF の peak bandwidth (単位: Mbyte/sec)
message size (byte) 4 16 64 256 1024 4096 16384 65536
MPI/MBCF on SSS-CORE, 半二重 0.14 0.53 1.82 4.72 8.08 9.72 10.15 9.78
MPI/MBCF on SSS-CORE, 全二重 0.14 0.57 1.90 5.33 10.22 11.68 11.77 11.85
MPICH/TCP on SunOS, 半二重 0.02 0.09 0.35 1.27 3.54 6.04 5.59 7.00

MPI/MBCF による NAS Parallel Benchmarks の実行性能

実験条件
ワークステーション SPARCstation 20 (85 MHz SuperSPARC × 1)
NIC Sun Microsystems Fast Ethernet SBus Adapter 2.0
ネットワーク SMC TigerStack 100 5324TX (non-switching 100BASE-TX HUB)
OS および MPI 実装 SSS-CORE Ver. 1.1 MPI/MBCF
SunOS 4.1.4 MPICH Ver. 1.1 (TCP を使用)
NAS Parallel Benchmarks の実行結果
プログラム [実行台数] EP [8] MG [8] CG [8] IS [8] LU [8] SP [9] BT [9]
MPI/MBCF on SSS-CORE
実行時間 (sec) 15.14 7.48 11.02 3.02 160.36 154.91 67.30
対 1 台スピードアップ率 (倍) 7.99 5.24 6.27 3.33 6.26 8.11 9.16
通信データレート (Mbyte/sec) 0.00 9.68 12.69 13.58 1.89 7.83 5.32
通信メッセージレート (個/sec) 4 4670 2138 466 1199 421 488
平均メッセージサイズ (Kbyte) 0.00 2.07 5.94 29.14 1.58 18.60 10.90
MBCF_WRITE 利用率 (%) 51.10 0.01 53.33 99.22 13.37 49.01 47.24
集団通信関数の使用 あり なし なし あり なし なし なし
MPICH/TCP on SunOS
実行時間 (sec) 16.25 13.72 14.59 4.81 185.04 231.66 96.02
対 1 台スピードアップ率 (倍) 7.73 2.83 4.71 2.13 5.84 6.01 6.53
MPI/MBCF on SSS-CORE versus MPICH/TCP on SunOS
性能向上率 (倍) 1.07 1.83 1.32 1.59 1.15 1.50 1.43

MBCF を用いた RPC の性能

実験条件
ワークステーション SPARCstation 20 (85 MHz SuperSPARC × 1)
NIC Sun Microsystems Fast Ethernet SBus Adapter 2.0
ネットワーク SMC TigerStack 100 5324TX (non-switching 100BASE-TX HUB)
OS および RPC 実装 SSS-CORE Ver. 1.1 SUNRPC 4.0 移植版
SunOS 4.1.4 SUNRPC 4.0
100BASE-TX における RPC によるデータ転送の Round-trip latency (単位: μsec)
data size (byte) 4 256 512 1024
SSS-CORE, MBCF_SIGNAL 127 173 221 315
SSS-CORE, MBCF_FIFO 148 194 251 372
SunOS TCP 863 903 918 1033

RCOP による SPLASH-2 suite の実行性能

ADSM

実験条件
ワークステーション SPARCstation 20 (85 MHz SuperSPARC × 1)
NIC Sun Microsystems Fast Ethernet SBus Adapter 2.0
ネットワーク Bay Networks BayStack 350T (switching 100BASE-TX HUB)
OS SSS-CORE Ver. 1.1
ランタイムシステム ADSM
LU-Contig (n = 512, b = 16) に対する最適化の効果
最適化手法 実行時間 (sec) コンシステンシ管理コード数 パケット数 通信量 (Mbyte)
なし 28.20 5592 K 5207 K 47.73
動的なパケットコンバイニング 14.35 5592 K 83.5 K 113.00
静的な手続き間冗長性除去(コアレシング) 2.17 1.43 K 7.73 K 9.42
コンバイニングとコアレシング 2.16 1.43 K 7.60 K 9.27
Radix (#key = 1 M) に対する最適化の効果
最適化手法 実行時間 (sec) コンシステンシ管理コード数 パケット数 通信量 (Mbyte)
なし 21.90 793 K 3220 K 76.72
動的なパケットコンバイニング 12.13 793 K 75.8 K 101.08
静的な手続き間冗長性除去(コアレシング) 1.57 2.08 K 19.5 K 13.47
コンバイニングとコアレシング 1.24 2.08 K 10.1 K 13.63
[graph (17KB)]
図: ADSM によるスピードアップ

UDSM

実験条件
SSS-CORE システム ワークステーション SPARCstation 20 (85 MHz SuperSPARC × 1)
NIC Sun Microsystems Fast Ethernet SBus Adapter 2.0
ネットワーク Bay Networks BayStack 350T (switching 100BASE-TX HUB)
OS SSS-CORE Ver. 1.1
ランタイムシステム UDSM
AP1000+ システム MPP Fujitsu AP1000+ (50 MHz SuperSPARC × 256)
OS Cell-OS
ランタイムシステム UDSM
実行時間の内訳
Sync 同期処理
WC 書き込み処理
PF ページフォールト処理
Msg メッセージ処理
Task アプリケーション本来の計算
[graph (6KB)]
図: LU-Contig の実行時間
[graph (6KB)]
図: Radix の実行時間
[graph (17KB)]
図: UDSM によるスピードアップ(SSS-CORE)

SSS-CORE ホームページ
お問い合わせは <info@ssscore.org> まで
(c) 1998-2000 SSS-CORE Project Team.