%表題 1998 (H10) 年度計算科学技術活用型特定研究開発推進事業 %表題 短期集中型 %表題 研究開発提案 %表題 JST (科学技術振興事業団) 平成 11 年 2 月 % %履歴 99/02/11 林 祥介 % 計算科学技術活用型特定研究開発推進事業 (短期集中型) 申込書 代表研究者 林 祥介 ふりがな はやし よしゆき 所属機関所在地 〒060-0810 札幌市北区北 10 条西 8 丁目 TEL 011-706-2760, 3827 (地球物理学事務室) FAX 011-746-2715 (地球物理学事務室) 機関名 北海道大学 所属部署 大学院理学研究科地球惑星科学専攻 役職名 教授 連絡先 所属機関 応募分野 地球・宇宙観測 --------------------------------------------------------------------- 【研究開発課題要旨】 研究開発課題名(20字程度) 地球惑星流体現象を念頭においた 多次元数値データの構造化 要旨本文 地球や惑星での流体現象(大気や海洋, マントルや 中心核)の研究における困難は, 得られた多次元デー タを認識可能な形に整形するのに多大な労力がかか るという点にある. 本開発研究は, この困難に対して, データのオブジェ クト指向な構造化を導入することにより, 数値計算 や観測データ解析での関連する問題を一挙に整理・ 合理化することを目的とするものである. 地球惑星 科学ではこれまであまり利用されてこなかった計算 機科学での処方箋の導入を試みるわけである. 地球 惑星科学で扱っている主として時空間データとその 解析手法を吟味し, 可能な構造化処方をさぐりデー タの形式を定めること, オブジェクト指向型言語と の関連においてその実装を試みることを行なう. 実装実験は, 数値計算・データ解析・可視化のソフ トウェアの(再)構築という形を通して行なう. デー タを構造化し標準化することによって, プラットフ ォームに依存しない環境の拡張性を確保する. その 範囲は, Windows PC から Unix スーパーコンピュー タまでの環境と, 分散メモリ型並列計算機やネット ワーク上の分散計算機群による分散計算とを視野に いれたものである. キーワード (10 文字以内 6 単語) 地球惑星流体現象 多次元データの構造化 オブジェクト指向言語 オブジェクト数値計算 大規模分散データ 大規模分散計算 --------------------------------------------------------------------- 【研究開発構想】 ● 経緯 大気や海洋, あるいはマントルの運動や惑星中心流体核など, 地球や 惑星での流体現象の解明と理解を目的とする研究において, もっとも 大きな技術的問題の一つとなっているのが, 時空間データの加工と表 示の効率化である. この問題点は, たとえば衛星観測から得られるグ ローバルで大容量の実データについてはもちろんのこと, 大気大循環 モデル等から得られる数値計算結果データなどを扱う際に顕在化する. つまり, これら大容量のデータを解析するときの最大の困難は, 得ら れたデータを認識可能な形へ整形するために多大な労力を要するとい う点にある. しかし逆にいうと, データ処理能力が高ければ, それだけで先端を切り開くことができるといっても過言ではな い. 多次元データ処理作業とは, 具体的には次のような作業の積み重 ねからなる. ・現象を抽出する物理量(統計量)を探す; さらには, 着目 する物理量に変換する -- データの加工. ・特徴がよく分かる時・空間断面を取り出す; そのために は経験的あるいは盲目的な試行がおこなわれる -- データ の表示 この加工と表示の作業は, 世間に流通する統計解析ソフトウェアや表 示ソフトウェアを使えば済むというほど単純ではない. それぞれの分 野で知られている特徴的な量(たとえば地球流体分野において重要な ポテンシャル渦度, 温位など)が, 基礎的な物理量データ(温度場や速 度場)から容易に計算できなければならい. また, ポテンシャル渦度 というような特徴的な量(物理量や統計量)を探すこと自体が研究の対 象となりうる. 空間断面も単に緯度・経度で輪切りを行なえばよいの ではなく, 適切なフィルター処理を経た後に, さまざまな面(例えば 渦度強度一定の面)の上で表示できなければならない. しかし, こういった作業を, 異なるデータ毎に個別の道具を用意して (プログラムを書いて)進めていくのは得策ではない. 数値実験のデー タと衛星観測データとは容易に結合されねばならないし, 複数の別々 なグループで行なわれた実験の比較検討を進める上でも同じ処理が可 能でなければならない. だが, 現状では, グループやプロジェクトが 異なれば, データの形がふつう異なるので, データ毎に個別の道具を 用意するのが常であり, 効率が著しく悪い. このような問題点を克服するために我々が提案するのは, データの構 造化, 簡単にいえばデータを記述するための仕様を決めることによっ て, データの解析・可視化作業を我々にとって分かりやすいものにし ようということである. 統合された仕様を決めておくことによって, データの加工も容易になるであろうし, ほかの研究でのデータの再利 用も簡単におこなえるようになることが期待できる. 同じデータ構造を共有することによって, 可視化の作業が容易になる ばかりでなく, 以下のような点で新たなる発想に基づく研究, あるい はそのための道具が生み出される可能性を持っている. ・数値計算と観測データとの有機的結合 ・ネットワーク接続された計算機への対応とその利用 ・並列計算機による並列処理への対応とその利用 これらの具体的な例については, 次の「研究開発内容」で述べるが, どれも昨今の計算機技術の進歩のもとで実現可能なものである. ● 研究開発内容 我々がめざすことを一言でいえば, データに対して適切な情報を付加 することによって「データ自身に語らせること」にある. すなわち, 物理量のさまざまな属性, あるいはその時空間における配置に関する 情報をデータ自身が内包することによって, さまざまなオペレーショ ンが容易におこなえるようにするのである. ● 地球・惑星の流体現象を記述するデータ構造分析 まず最初におこなわなければならないことは, 我々が地球・惑星の流 体現象を記述する日常的な研究・教育活動において, データをいった いどのように取り扱っているのかを, 情報の構造という見地から整理 することである. 我々はデータをどのように加工し可視化しているの か, あるいはしたいのか, その日常的な作業/あらまほしき作業の流 れを明確化する必要がある. 具体的には, データに対するさまざまなオペレーションを容易におこ なえるようにするため, データ自身が内包しているべき物理量の属性, あるいはその時空間における配置に関する情報などなどを洗い出す作 業をおこなう. ● データ構造の実装と必要な層構造の構築 ・最下層の実装実験 ネットワーク透過なファイル形式(NetCDF等)を選択し, 分析されたデー タ構造の実装をおこなう. ファイルに対する我々が必要とする読み書 きがどのような命令のあつまりで実現されるべきかを検討し, 具体的 にプログラム言語を選んで表現する. 開発のベースとしては, オブジェクト指向プログラミング(OOP)を可 能にするインタープリタ型の言語を想定している. まずは, その選択 に関する検討から始められなければならない. 同時に, 数値計算やデー タ処理の計算エンジンとして用いられる言語(FortranやC)では, どの ような読み書きがなされるべきかについても検討し, 実装実験をおこ なう. ・データ処理系の階層化の検討 ネットワークやマルチ CPU など分散型の計算環境の存在までを考慮 したデータ処理の階層化, 切り分けを検討する. 少なくとも, 以下の ように, 個々のデータ加工計算エンジン, 表示可視化系, これらを組 み合わすメタ処理系の 3 サブシステムに分割されるはずである. ・【データ処理系の実装】 -- データ加工の計算エンジンの詳 細なる設計を検討し実装を行なう. インタープリタ型のオ ブジェクト指向プログラミング言語での実装実験,ならびに Fortran や C で書かれた部品としての計算エンジンとの関 係について検討されることとなろう. ・【表示系の検討と試作】 -- DCL や IDL, AVS 等, 既存の表 示システムとのデータ交換の実装を試みる. 同時に, これら の表示システムの欠点を洗い出し, オブジェクト指向的なパ ラダイムにのっとった新たな表示システムの構築を試みる. ・【メタ処理系】 -- 計算エンジンを呼び出すメタ処理系のプ ログラムをオブジェクト指向プログラミング言語で実装する. ・分散計算への対応 分散計算へ対応するべく, 並列計算機ならびにネットワーク分 散している計算機でのデータへのアクセスの仕方について検討 する. ● データ解析や数値計算の実装 データ構造の情報を共有することによって, さまざまなプログラムや 異なる計算機資源から構造化されたデータへのアクセスが容易になる. このことにより新しい研究が推進できる可能性があるが, その有用性 を具体的に評価すべく新しい道具の設計と製作を試みる. ・数値計算プログラムの再構築 データ構造を理解する(簡単)大気大循環モデルを作成を試みる. これ は, 「地球流体電脳倶楽部」(ここで申請をおこなっている中心的グ ループである; 詳しくは「国内外の情勢」を参照のこと)がこれまで 築き上げてきた資源の再構築という形でおこなう. ・観測データとの有機的結合 もはや数値計算(シミュレータ)とはデータ解析エンジンを時間方向に つなぎあわせたものにほかならない. したがって, 逆に, データ構造 情報を共有することによって, 海面水温は観測データを用いたり, 海 面水温を計算するモデル結果のデータに差し替えるなどの異る実験を 容易におこなうことができるようになる. 数値計算(シミュレータ)と 観測データ解析との統合を試みる. ・ネットワーク接続された計算機への対応とその利用 観測データあるいはモデル出力データは今後も大容量化することが予 想される. しかし, それらのデータを各研究機関が個別に保持しよう とすると, たいへんなリソースと労力を必要とする. ネットワークを 介し他研究機関のデータを利用することは可能であるが, 大容量デー タを扱うにはネットワーク性能, データ転送の効率化など, さまざま な側面を考慮しなければならない. ここでは, ネットワークを用いた 大容量データの新しい利用技術をデータ構造化の面から推進する. 具体的には, 決められたデータ構造で記述されたデータ群を保持する データサーバーと交信する際, データをまるごと転送することによっ て実現するのではなく, 要求されたスライス(断面)のデータのみを切 り出し, 送信することによって, 短時間にデータをやりとりすること ができるような仕組みを実装する. ・並列計算機による並列処理への対応とその利用 これまで提唱されているような仕事を単に小分けにする意味での並列 処理とは異なって, A というホストは力学計算, B というホストは放 射の計算... のように物理過程ごとに計算作業を分散するような並列 処理システムを考えることができる. その際, ここで提案するデータ 構造さえ正しく定義しておけば, それぞれのホストが必要とする他の ホストの情報は容易に交換可能となるはずであり, そのような実装実 験をおこなう. ● 研究開発環境と必要な投資 全国に散らばる「地球流体電脳倶楽部」のサーバー群 dennou-h.ees.hokudai.ac.jp dennou-t.ms.u-tokyo.ac.jp dennou-k.gaia.h.kyoto-u.ac.jp dennou-q.geo.kyushu-u.ac.jp を拠点にして, ネットワークアクセスにより研究開発を実行する. サーバー間では大きなデータトラフィック実験が行なわれることが 期待される. ・【サーバー群の増強投資】 -- 現在 AT 互換機で稼働させているこれらサーバー群の能力 (CPU, メモリ容量, HD 容量)を増強しなければならない. ・【ネットワーク接続への投資】 -- それぞれの大学のキャンパスネットワーク運営方の協力によ り, できるだけ SINET バックボーンと直結させることを行な わなければならない. ・【プラットフォーム資源への投資】 -- Windows PC や Linux PC などが個々人の研究開発環境として 装備されなければならない. ● 国内外の情勢 我々がここで提案している研究内容は, 地球・惑星流体分野における 計算機科学の応用であり, 現在のところ国内では活発に活動している グループはほかにほとんどない. (この背景については, 「(様式7) 応 募の理由など」を参照のこと. ) このようなどちらかというと研究の本流とは離れていると考えられが ちな領域について, 我々は「地球流体電脳倶楽部」という同志の集ま りで基盤整備に努めてきた. これまでおこなってきた活動としては ・データの可視化ツールの作成(DCL: Fortran ベースのライブ ラリ) ・データの構造化/解析・可視化ツールの作成 (GTOOL: DCL を使った解析・可視化ソフト) ・数値モデルの作成(主として"簡単"大気モデル) ・現実データのアーカイブ(衛星画像等) などが上げられる(前述, 地球流体電脳倶楽部サーバー, を参照の こと). また最近では, まさにここで提案しているような多次元デー タの解析と可視化に関するメーリングリストを開設して意見交換をお こなっている. 特に, 解析・可視化に関する国外の状況を簡単に述べれば, もちろん すでに, 有料・無料のツールが各種出回っているわけであるが, これ まで我々が述べてきたような, データ構造情報を充分に踏まえたもの は皆無に近い. データ構造共有の先にある, ネットワーク透過な分散計算の問題につ いては, 既に5年ほど前から, 米国大気研究センター(NCAR: National Center for Atmospheric Research)で Climate System Model (CSM) が基礎研究を積み重ねてきている. (CSM に関する情報は http://www.cgd.ucar.edu/csm/ を参照のこと. ) ここでは, 独立に 設計された 4 つのモデル(大気, 海洋, 陸面, 氷床)を別々のプロセッ サで走らせることが可能である. さらに, それぞれのモデル間の情報 交換は, まさにデータを構造化することによって実現されており, 各 モデル部分が必要とする情報として, モデル結果ばかりではなく観測 データを差し込むこともできる. データ構造を解釈できる言語として, 我々は今のところオブジェクト 指向プログラミング(OOP)を可能にする, インタープリタ型の言語を 開発のベースにしたいと考えている. この分野では Python, Ruby な どが知られており, 我々のアイディアの実装可能性について調査中で ある. 【研究開発構想-II】 ● 知的資産の形成内容 本研究開発によって得られることが予想される知的資産は, 地球惑星 の流体現象にまつわるデータ構造の定式化, ならびに, その実装資源, すなわち, PC から並列計算機にいたるまでさまざまな計算機資源上 で動くデータ処理ソフトウェアである. データ構造の定式化は広く公開され流通されることが期待される. デー タ処理の実装についてもこれまでの地球流体電脳倶楽部の多くの活動 と同様にフリーウェアとして広く公開されることになる. ● 将来展望と社会への貢献 我々がおこなう研究開発の結果が, 一般ユーザーから見えるよ うになるためには, 文字通り, 可視化道具の開発が必要とされ る. 本研究開発においては可視化道具開発は直接のターゲット とはされていない. しかしながら, データ構造の実用的設計を きちんと行っておくことにより次のステップへの進行が極めて 容易に行えるようになるもの 本開発研究で行なわれる結果の期待値は, 地球惑星の流体現象にまつ わるデータ構造を標準化する一つの試みに過ぎないかもしれない. しかし, ねがわくば, そのデータ構造の定式化が普及し世界標準が取 れれば, 世界中の地球惑星データが「同じ言葉を理解」することにな るのである. 天気図, 地形図, などなどが自由に書けるための 礎となるわけである. 現在, WWW でよく行なわれていること, すなわち, どこでもだれでも ネットワークを介して絵や文字が見れる, ということと似たようなレ ベルで, どこでもだれでもネットワークを介して数値データにアクセ スできるようになるわけである. そしてそのデータを自分で加工し, 可視化することにより, データがふたたび意味を持って我々の目の前 に現われる(データが自ら語る)ことを可能にするわけである. データ構造の標準化の結果, 各部品の専門家がチューンしたデータを ネットワークを介しそれぞれの必要に応じて任意に統合し, 各々は他 の部品の細部を知らなくてもよい, という分業も積極的に成り立つよ うになる. ネットワーク上に分散するそれぞれの専門家が責任をもっ て提供する情報資源から, 放射のモデル, 流体のモデル, オゾンの観 測データ等など, 必要に応じて取ってきて組み込むという形の道具が 作られることになろう. --------------------------------------------------------------------- 代表研究者の業績あるいは論文リスト 業績 1. 計算機とネットワークの応用について 林 祥介, 1995: 気象学におけるインターネット (7)地球流体電脳 倶楽部(GFD-DENNOU-Club)大学現場でのインターネット・情 報計算環境の発展史と問題点を交えて. 天気, 42, 545-558. 2. 地球・惑星大気大循環論 石渡正樹, 中島健介, 竹広真一, 林祥介, 1998: 3 次元灰色大気構造 の太陽定数依存性と暴走温室状態. ながれマルチメディア 98, http://www.nagare.or.jp/mm/98/ Hosaka, M., Ishiwatari, M., Takehiro, S., Nakajima, K., Hayashi, Y.-Y., 1998: Tropical precipitation patterns in response to a local warm SST area placed at the equator of an aqua planet. J. Met. Soc. Japan, 76, 289-305. 林 祥介, 1994: 木星大気の運動構造と彗星衝突(特集 / シューメー カー = レビー第 9 彗星の木星衝突). 遊星人, 3, 276-291. 林 祥介, 1992: 赤道大気上下結合, 第 2 章 ハドレー循環の力学. 気象研究ノート, 176, 15-49. Hayashi, Y.-Y. and Sumi, A., 1986: The 30-40 day oscillation simulated in an "aqua-planet" model. J. Met. Soc. Japan, 64, 451-467. 3. 地球流体力学 Hayashi, Y.Y., Ishioka, K., Yamada, M., Yoden, S., 1998: Emergence of circumpolar vortex in 2-D turbulence on a rotating sphere. Developments in Geophysical Turbulence. Kluwer (to appear). Takehiro, S. and Hayashi, Y.-Y., 1995: Boussinesq convection in rotating spherical shells. --- A study on the equatorial superrotation. (The Earth's Central Part: Its Structure and Dynamics, edited by T. Yukutake, TERAPUB, Tokyo, 123-156) Hayashi, Y.-Y. and W. R. Young, 1987: Stable and unstable shear modes of rotating parallel flows in shallow water. J. Fluid Mech., 184, 477-504. 林 祥介, 1987: 二次元定常ロスビー波の線形論. 気象研究ノート, 156, 29-48. 参考となる文献等の情報 代表研究者ならびに本研究組織構成員の多くは, 「地球流体電脳倶楽 部」と称して, 地球・惑星にまつわる流体現象の研究教育のための計 算機とネットワークの利用, その情報化への試みのための活動を行なっ て来た. 地球流体電脳倶楽部はネットワーク上に分散して存在する仮 想的研究教育グループである. 地球流体電脳倶楽部では次の公開サー バーを運営している. http://www.gfd-dennou.org = http://dennou-h.ees.hokudai.ac.jp http://dennou-t.ms.u-tokyo.ac.jp http://dennou-k.gaia.h.kyoto-u.ac.jp http://dennou-q.geo.kyushu-u.ac.jp --------------------------------------------------------------------- 【応募の理由など】 ● 人件費がある 文部省の科学研究費補助金ではポスドク(研究員)や院生(研究補助者) に対する人件費をまかなうのが困難である. 研究の実働部分はこれら 若手人材によるところが大きく, それに対するサポートが陽に保証さ れていない従来型の文部省科学研究費補助金では矛盾が大きい. ● 基盤的な(応用的な)技術研究開発に対する投資である 文部省の科学研究費補助金は, 伝統的・学術的な意味において「先端」 的な研究を対象に支給される. たとえば, 気象学・海洋学なら, 大気 や海洋に関する新しい知見をもたらしてくれるようなテーマでなけれ ば研究補助の対象とはなりにくい. 他方, 技術開発という見地からも 同様のことが言え, 技術として「先端」的な研究に対しては補助が得 られやすいわけであるが, 必ずしもすでに「先端」的でなくなった技 術を応用する研究に対してはなかなか補助が得られにくい. しかるに, 我々が現在痛切に必要を感じている問題は, 気象学・海洋 学の「先端」を可能ならしめる基盤的な技術の圧倒的な遅れ・不足で ある. ところが, 基盤技術開発を行うためには, それ自身先端である 他分野の技術を当該分野へ向けて加工・発展させ, それぞれの分野に おいて意味のある形にしていかなければならない. 我々が応用を試み ようとしている計算機科学・情報技術分野はそれ自身高度化してしまっ ており, その応用コストは通常の当該分野における「先端」研究成果 を得るためにかかるコストの比ではなく, 従来のように研究の片手間 に整備すればよいという類のものではなくなっている. にもかかわらず, これまで, そのような活動を補助する投資活動が存 在しなかった. 応募要領の研究開発提案に記された文言「地球, 天体 および宇宙そのものの研究は対象となりません」は, まさにぴったり な制約条件と思われる. これまでの地球, 天体および宇宙に関わる研 究補助金には見られなかった新しい投資態度である. ● 欧米と日本の科学基盤の格差拡大について 先にも述べたように, 我が国における先端研究に対する投資は, 通常, 直接当該分野の「先端」が得られるものに対してのみおこなわれる傾 向にある. それは, 我々の地球惑星科学的分野においても著しいよ うに思われる. それでよしとされてきた背景には, 当該分野の少なか らざる領域において, 欧米のインフラストラクチャに便乗した研究が おこなわれてきたからに他ならない. 新たな知見を得るのに必要とさ れるデータの取得, データの整形, ソフトウェアやハードウェアの構 築, 支援体制の構築などには関わりをもたず, いわゆる「論文になる 部分」においてのみ参加してきたのである. 残念ながら, 現在の気象学・海洋学では, もはや先進国として存続で きるかどうかの瀬戸際である. ソフトウェアや観測データ処理系はほ とんど欧米製である. それでいて, その状況に対する日本の科学者の 危機意識は低い. データは欧米が取ってくれて CD-ROM や ftp で取って来るものだ, という風潮になりつつある. 研究現場や 最近では現業現場においても, 気象庁作成のデータよりは ECMWF や NCEP という欧米製データソースが流通するようになっ てしまった. 可視化ソフトや数値計算ソフトも ftp で取って来 るものになりつつある. 後進国型から脱皮し先進国型の研究開発体制を当該分野に導入するに は, そろそろ最後のタイミングになっているのかも知れない. 研究基 盤技術の研究開発力は国際競争に打ち勝つことができず, 結局, 利用 者型の研究のみが主流となり, 新の意味で先端を走る力は失われるこ とを我々は危惧している.