Home >

news ヘルプ

論文・著書情報


タイトル
和文:メモリアクセスパターン依存故障の注入のためのQEMUベース故障注入器 
英文: 
著者
和文: 小林佑矢, 實本英之, 野村哲弘, 松岡聡.  
英文: Yuya Kobayashi, HIDEYUKI JITSUMOTO, Akihiro Nomura, SATOSHI MATSUOKA.  
言語 Japanese 
掲載誌/書名
和文:研究報告ハイパフォーマンスコンピューティング(HPC) 
英文: 
巻, 号, ページ 2018-HPC-163    8    1 - 10
出版年月 2018年2月 
出版者
和文:一般社団法人情報処理学会 
英文:Information Processing Society of Japan 
会議名称
和文:第163回 ハイパフォーマンスコンピューティング研究会 
英文: 
開催地
和文:〒790-0843 愛媛県松山市道後町2丁目5−1 
英文: 
公式リンク https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=186037&item_no=1&page_id=13&block_id=8
 
アブストラクト 近年,大規模計算機システムでの故障の増加が問題になっている.様々な耐故障技術が開発されたが,オーバーヘッドと耐故障性の間にトレードオフがあり,適切な手法の選択が難しい.耐故障技術の評価には故障注入が用いられるが,既存の故障注入器ではハードウェア特有の故障を再現し,アプリケーションレベルの詳細な解析ができない.我々は,ハードウェアに特有の故障を再現し,アプリケーションレベルの解析を容易に行える故障注入プラットフォームの提供を目的とする.本研究では,故障の主な発生源の一つである DRAM を対象にして,メモリアクセスパターン依存故障をメモリ I / O フックにより注入した上で,耐故障性テスト対象のプロセスのメモリマップ情報を取得できる QEMU ベース故障注入器 MH - QEMU を作成した.評価では,MH - QEMU の故障注入機能使用時には,テスト対象アプリケーションの実行時間が最良の場合でも 77 倍になることを確認した.中でも,メモリインテンシブであったり,ノード間通信が少ないアプリケーションほどオーバーヘッドが大きいことを確認した.また,MH - QEMU で NAS Parallel Benchmark の CG カーネルの耐故障性評価を行い,Row - Hammer 発生時に Silent Data Corruption につながりやすいデータ領域を特定した

©2007 Tokyo Institute of Technology All rights reserved.