gtool4/Fortran 90 tools チュートリアル

gtool4 プロジェクトの現状と展望

― 多次元数値データと可視化情報の統合データスキーマの開発を目指して ―

2001年01月02日 豊田英司


1. 背景

「量的変化はついには質的変化を惹起する」
ヘーゲルの言葉らしい

私たち gtool4 の開発者グループは主に地球流体科学関係者、つまり気象・海洋・惑星大気・地球の核やマントルなどの研究者からなっています。私たちが gtool4 を開発するのは、データの嵐と呼ばれる現象にまつわる諸問題の解決としていくつかの方法論を提示し実験していくためです。

データの嵐

私たちは日ごろ多量のデータを交換して仕事をしています。たとえば他人が観測したデータ、理論的な計算の結果得られたデータ、それらを用いて遠くの計算機センターで計算したデータなどです。

計算機の能力向上や観測手段の開発に伴って、私たちが扱うデータは年々巨大化しています。10年前ならスーパーコンピュータでも取り扱うことさえままならなかったような巨大なファイルをノートパソコンで作成したり保存したりできるようになりました。巨大化だけではなく、取り扱うデータの種類や計算の複雑さも激増しています。

データの量の増大により、メタデータ管理の重要性が増してきました。メタデータとはデータ自身を意味あらしめるために必要なデータの総称で、たとえば物理量名称、単位、格子配置、取得法、各種パラメタなどです。データを多数の作業者で共有する場合、あるいは記憶に頼れない長期間にわたった作業においてはメタデータを保持する方法の如何が作業の速度や信頼性を左右します。

メタデータを紛失したり、個人の記憶に依存するような事態を避けるためには、データ自身がメタデータを保持するようにすべきです。このような考慮にたったデータ形式は自己記述的(★概念創案者について調べるべき)と呼ばれています。

自己記述的データ形式を設計するにあたっては、メタデータの項目リストを決めなければなりません。この項目リストはデータベース界においてはデータスキーマと呼ばれています。gtool4 の目標のひとつは、地球流体科学界におけるデータスキーマの標準を利用者自身によって確立することにあります。

可視化情報の統合

 

2. 利用した既存物

netCDF

データ形式は netCDF 形式によることにした。機種依存の物理表現を吸収してくれる上に、メタデータ表現のための余地が用意されているからである。

GTOOL3

概念モデルを抽象する基礎として用いた。コードやデータ形式は継承しない。

コマンドラインツールで編集できるデータ。

クイックビューアの提供。

数値計算プログラム内における入出力・演算ライブラリとしての機能。

DCL

主にグラフィックツールとして用いた。

3. 現状

netCDF 規約という形式でデータスキーマ案を考察した。netCDF に依存した事項の捨象が今後必要である。

実装は可視化構造の Fortran による表現を作成した。

自己記述性によるメタデータ管理の省力化を検証するためには、今後各種データ処理におけるメタデータの自動処理実験が必要である。

4. 展望

非 netCDF データ形式によって gtool4 データスキーマを表現

分散オブジェクト的データサーバ・データマイニングへの発展

数値演算(ナンバークランチ)プログラム内部での自動処理、とくに単位の自動換算

ツールの充実、極端にはシェルコマンドによる数値計算

樹状ヒストリ管理の考察

可視化の拡張、三次元的可視化・動画