dcmodel ミーティング記録(2014/05/26)

参加者

  • 北大
    • 石渡
  • 神戸大
    • 林, 高橋, 村上, 河合, 船橋
  • 理研 AICS
    • 西澤
  • 宇宙研
    • 樫村
  • 九大
    • 中島
  • 京大
    • 石岡, 佐々木, 竹広

ISPACK2 の開発に向けて (石岡)

  • ベクトル機向けの実装(stpack)
    • いちばん内側のループ, 普通はガウス緯度の方向
    • 当時は T42 程度の解像度⇒ベクトル長が稼げなかった
    • そこでいちばん内側のループを東西波数に関して回すようにした
    • OpenMP などのスレッド並列になじまない
  • Intel CPU (スカラー機)向けの実装(sjpack)
    • キャッシュの有効利用がポイント
    • 多層モデルを前提にして行列積の形にする手もあったが, 一層モデルで速くすることを目指した
    • ルジャンドル陪函数の漸化式計算に工夫を施した
    • SSE2 命令の利用, ホットスポットをアセンブラでかいた
    • AVX 命令に対応
    • GPGPU 対応も試みたが, バス転送に時間がかかりあまり速度が上がらなかった
  • ISPACK2
    • 開発の動機
      • ES2 上での ISPACK/SPMODEL の計算速度が sjpack では上がらない
      • Xeon Phi, Intel Broadwell 等大きなベクトル計算ができそう
    • 開発方針
      • FFT ベクトル計算は複数データ同時処理に用いつつ AVX 対応
      • ルジャンドル変換計算は sjpack を踏襲
      • 英語マニュアル対応のため, 既存の ISPACK と切り離す
      • セクター計算は簡単に実装できる
    • 現状
      • FFT 部分はできている
      • ルジャンドル変換はコード整理の段階
      • MPI 並列は変換部分では対応しない. ユーザで層方向に MPI 並列することを想定している

次回日程

  • 2014 年 6 月 10 日(火) 10:00 〜