すばる望遠鏡のデータベース　

高　田　唯　史

〈国立天文台ハワイ観測所　650 North A揺oku Place, Hilo, HI96720, U.S.A.〉

e-mail: takata@naoj.org

　すばる望遠鏡の運用を支えるデータベースには様々なものがありますが，観測データを管理し，ユーザーに提供するためには様々な仕組みが用意されています．今回はどういった種類のデータをどうやって処理し，管理をしているかの現状を紹介するほか，ハワイと日本という離れた環境下でどうやってデータの一元的な管理を実現しているか，また，データベース天文学と呼ばれる大量データを用いた天文学の新しい取り組みに際して，すばるのデータをどのように生かして行くべきかなどについての我々の活動などを紹介したいと思います．

１．“すばる”を支える様々なデータベース

　すばる望遠鏡は非常に大きくしかも複雑なシステムであり，出てくるデータも様々な場面，形態，利用方法がありますので，当然その運用を支えるために様々なデータベースが存在しています．観測データなどの管理についてはもちろんですが，その他にもオートガイド用の星を観測時に提供するため，USNOカタログ（約５億天体）の中から，ガイド用の星に適当であるかを示すパラメータを付加したカタログのデータベース1)や，ファインディングチャートを提供するDSSの画像データベース，観測を実行するために必要な観測手順書を作成する場合に，それを補助するための標準星などのデータを集めたカタログデータベース，望遠鏡のポインティングアナリシスを行うときに必要な，非常に位置精度の高い星を集めたカタログデータベースなどのいわゆる天体カタログデータベース2)と呼ばれるものから，プロポーザルの管理や，観測者の計算機アカウントを管理しているデータベースのようなもの3)や，オペレーターのトラブルシューティング方法を集めて検索できるFATS (FAult Tracking System) と呼ばれるデータベース4)など，非常に様々なものがあります．

　本原稿はデータベース天文学を目指す意味でのデータベースのあり方と現状の紹介についてが主目的ということなので，以後は観測データ及びそれに付随するデータを管理するためのデータベースに関連する事柄に絞って紹介することにします．

２．すばる望遠鏡のデータを管理するデータベース

　すばる望遠鏡から生産される観測データ他を管理・ハンドルするためにSTARS (Subaru Telescope ARchive System)というシステムが国立天文台ハワイ観測所のヒロ山麓施設内で運用されています．また，これとほぼ同じ機能とデータ量を有するMASTARS (Mitaka Advanced STARS) が，国立天文台三鷹の解析研究棟内で運用されています．ここでは，これらのシステムで管理運用されているデータの種類やデータの管理方法，実際のデータの流れなどについて書いてみようと思います．その他に，公開用のデータについては国立天文台計算センターを中心とした有志の方々と共同で運用しているSMOKA (Subaru Mitaka Okayama Kiso Archive) システム5)が存在し，それぞれの役割を担っています．各システム間のつながりなどは図１に簡単に示してあります．

2.1 データの種類と現状のデータ容量

　現在すばる望遠鏡において稼働している（または稼働した事のある）観測装置は10装置にのぼりますが，そのうちの９装置についてはデータはすばる望遠鏡のデータルールに従う形でFITS化され，STARSに登録されて管理されています．それぞれの観測装置は表１に示すように様々な形式のデータを生産しますが，これらは全てすばる独自で定めたルールに従ったヘッダーキーワードを使っているため，その情報をうまく抜き出すことでデータベースで一元的に管理ができ，同じ枠組みで様々なデータが検索取得できるための基本となっています．

　観測データから二次的に生産されるものとして，FITSのヘッダーの部分だけを切り取ったファイル（HDI: HeaDer Information file），より速くデータの性質などを知ることができるように，元データを20倍以上に圧縮して作られたQLIファイル（Quick Look Image file）6)なども同時にSTARS内で生産・保存され，管理されています．その他にも，主鏡鏡面の測定を行うためのシャックハルトマン（SH）画像や，オフセットガイドに使われた星（AG）の画像なども管理の対象となります．データセットと呼ばれる，将来的にデータ解析パイプラインに流し込むのに必要な情報を集めたファイルについても保存・管理も行っています7)．

　このほかにも，地上望遠鏡では必要不可欠な環境情報の保存・管理が必要で，１日に数GBに及ぶ望遠鏡関連のステータスログファイル群や，スカイモニター（赤外線全天モニターカメラ）の画像なども保存管理されています．また，非常に頻繁に使われる環境データをログ群から切り出して日毎にまとめた簡易版ログも生産，管理を行っています．

　このように管理運用するデータは多岐にわたり，データベースでの管理，検索用ユーザーインターフェースでの便利なデータ提供はすばる望遠鏡を運用していく上で必要不可欠なものとなっています．

2.2 データの管理方法

　観測データの管理は，必要な情報をデータ本体から抜き出すなどしてリレーショナルデータベースに登録しておき，データ本体については別途ハードディスク，もしくはそれと連動したテープライブラリに保存しておいて，データベースを検索することによってその保存場所がわかるようにしてあります．観測データについては，取得後１年半という占有期間内についてはそれぞれの観測を行ったグループメンバーのみがアクセスできるように，パスワードによる認証を通してデータにアクセスできるように設計されています．観測者は，STARS検索用のユーザーインターフェース（図２）を介してデータを検索，取得できるため，自分の観測日時とその時に使われたプロポーザルIDと呼ばれる専用の番号さえ覚えていればデータは比較的簡単に手にすることができることになります．このUIは既に運用システムとして活躍していたMOKA (Mitaka Okayama Kiso Archive)8)を原点としているので，比較的簡単に操作ができるような工夫も色々な場面で施されています．もちろん，そのユーザーインターフェースは，どのアドレスにWEBブラウザを介してアクセスする必要があるかを知っておく必要はあります．例えば，ハワイ観測所内部でしたらば，現状ではSTARSホームページ（http://s03.naoj.org）にアクセスする必要があります．管理の詳細などについては以下の文献などが参考になるでしょう2)，9)．

2.3 データハンドリング（データの流れ）

　データは山頂で取得された後，ヒロの山麓施設内のコンピュータシステムに高速ネットワークを通じて即座に転送され，データは瞬時にSTARSのデータベースに登録され，検索取得が可能になります．さらに，１日１回の頻度でヒロ－三鷹間の専用高速ネットワーク回線を介してデータは三鷹に転送され，約１日をかけてMASTARSに登録されます．これによって，同じデータを，ハワイと三鷹で保持でき，検索，取得も可能になります．実際，日本国内からアクセスする場合にはネットワークの速度の関係からも，MASTARSにアクセスする機会が多くなってきているようです．取得後１年半が過ぎたデータについては，基本的にアーカイブデータとして公開が可能になるので，それらについてはSMOKAシステムに情報が転送され，SMOKAより，観測者以外の人々にも検索・取得が可能になります．このように太平洋を挟んで２つのデータベースを分散化させているため，アクセスの分担によるロードの軽減や，２重化によるデータの安全性の更なる確保などを行っているわけですが，反面，ヒロから三鷹またはその逆というように，管理情報の交換には手間がかかり，管理者にはそれなりの負担もかかります．自然に放っておけば良いというわけにはなかなか行かないのが問題といえば問題です．が，逆に言えばこれは機械や植木などと同じで，毎日丹念に様子を見てあげれば安定して動くようにもなるものです．結局は，こういった地道なあまり目立たない作業が明日のデータベース天文学を支えていく基盤となるのです．

３．データベース天文学へ向けての取り組み

　データベース天文学を推進する上で，システムとして備えている必要があるのは以下のようなものだと思われます．あくまでも理想的な事を書いていますが，使いやすいデータ，システムがこの分野の発展を大きく左右するのは事実です．この数年間で，世界的な規模でバーチャル観測所（Vitual Observatory）構想が進められ始めているのも，やっと“使える”データがたまりだし，これから巨大データをうまく使って，今までにない天文学のパラダイムを作り出そうとする動きの現れです．これらの動きにも目を向けながら，一体今後どうやって我々のシステムを発展させて行くかの早急な方向付けが現在大きな課題となっています．

●提供されるデータが比較的誰にでも使いやすいものであること

　データが処理済みで，測光情報及び位置，時刻といった，天文学において基本的と思われる情報を一目で見ることができる，もしくは簡単な手続きで知ることができるような有用なソフトウェアと一緒に提供されること．これには，データそのものに付随する形の情報以外に，例えば，地上観測の望遠鏡であるすばる望遠鏡などの場合には，データの取得中に周りの環境はどういった変化を見せたか（空の透明度は？シーイングは？）などの付加情報も必要になることでしょう．

●データの検索がユーザーの欲しいデータの選び方を提供できるようになっていること

　難しいデータベース用の言語などは知らなくても，ある程度の天文学的な知識さえあれば，ユーザーが自分の欲しいデータを自分で定義できるような，いわゆる独自の「データ検索モデル」を構築できることが重要で，これを使って，ユーザーが自分独自の観点でデータベースの世界から取得（観測）したサンプルを選んでこれる事が理想的な形といえるでしょう．現在日本でもSMOKAグループがこういった取り組みを行い始めています．将来的にはすばるに限らず様々な種類のデータがこのようなユーザーインターフェースで検索取得できる日も来るのではないかと期待できると思います．

●他のデータとの比較が簡単に行えるようになっていること

　多波長のデータを単純にオーバープロットして使える機能から，カタログ同士のcross-correlationをとってみたり，やりたいサイエンスによって様々なデータの加工，表示方法が必要となります．全てをシステムで網羅するのは無理としても，上記のような基本的な機能を備えたシステムの整備は必要不可欠です．海外ではNASAのSkyview10)やCDSのAladin11)などが有名ですが，日本でもjMAISON12)がそのような機能を備えているシステムです．このような国際的な流通に乗せられるようなデータを生産できるかが，データベース天文学を展開できるかの鍵を握っています．

　観測所のデータベースとしてまず第一に確立されねばいけないものが先の１番目にあげた項目です．観測所は自分の観測所の生産するデータについて責任を持ってその性質や有効性を証明し，その情報を公開して行かねばなりません．これらの情報は観測を立案する上でも不可欠な情報ですので，アーカイブデータを使う以前に既に必要となってくるものも多いのです．また同時に，安定して使えるデータを提供できるよう努力する責任もあります．このためには，常に装置や望遠鏡の状態を把握し，出力されるデータを日常的にある決まったルーティンを使って処理しながら，経年変化的な情報を見て行くなどの日々の努力と，それらを整理して蓄えていくいわゆる２次的な情報用のデータベースシステムの整備が必要です．ただためるだけでなく，うまく情報を使いこなせるような様々なソフトウェアとの融合の上にそういった機能は成り立つのです．すばるでも少しずつではありますがそういった試みが行われようとしていますが，まだまだハッブル宇宙望遠鏡やESOのVLTのような本格運用システムにまでは発展できていません．我々に課せられた今後の課題の大きなものの１つです．そして，これらの責任を観測所として果たしていけるということが，利用できるアーカイブデータを生産していけることに直接つながります．これらの土台を積み重ねることで，観測装置や望遠鏡の癖などが除去できたいわゆるキャリブレーション済みデータが提供できるようになります．これらのキャリブレーションが，ある程度自動化され，人的な手をあまり介さなくても行えるレベルに達しないとなかなか「使いやすいアーカイブデータ」にはなっていきません．現在，我々はそういった土台作りの真っ最中といえるでしょう．そのための土台として，共通化されたFITSフォーマットや，データセットの概念などを含めたデータのくくり出しの機能が実装されてきているわけです．また，装置や望遠鏡関係者のたゆまぬ努力で，少しずつデータが整理され始めているわけです．先は長いかもしれませんが，すばる望遠鏡のスタッフはそういったたゆまぬ努力で日進月歩望遠鏡を進化させていっているわけです．２番目，３番目に書かれていることは，国立天文台の計算センターなどの色々なデータを集めているいわゆるデータセンターなどとうまくタイアップしながら作り上げて行くべきものです．HSTのアーカイブデータのように非常にうまくキャリブレーションされて，すぐに使える形でデータが提供されると，こういったツールの効果がありありと見えるようになります．観測所としてはその枠組みに乗せられるような付加情報を観測データと共に提供できるようにする努力が必要です．

　2002年６月からはすばる望遠鏡の共同利用観測で取得されたデータも公開され始めます．８メートルクラス望遠鏡としては最大の視野を誇る主焦点カメラのデータなどは，様々な場面で利用される事になるでしょう．また，2002年度からは，観測所プロジェクトとして，１平方度に達するような非常に広く，しかもハッブルディープフィールドに匹敵するような非常に深い撮像データを取得するプロジェクトが走ることが決定し，これらのデータが迅速に公開がされる予定になってきています．こういったデータが観測者以外の人々にも色々なところで有効であって欲しいというのが，アーカイブシステムを作る側の希望ですし，今後もそういったデータ作りのための努力を怠らないようにしていかねばならないと思っています．もちろん，望遠鏡を使った観測によって世界に誇る成果を生みだすことが観測所の第一目標ですが，それを追求していく上で，自然と使えるデータを作り出せる仕組みを少しずつでも組み上げていくことができれば，非常に良い事だと思っています．

図１　すばる望遠鏡データに関連するアーカイブシステム構成図．基本的には，データはネットワークを介して流れる．マウナケア山頂と山麓施設間のネットワークが不通になったときはテープでデータをヒロまで運び，山頂模擬装置と呼ばれるシステムからデータをSTARSに流し込む．

図２　STARSのユーザーインターフェース画面の一部．検索条件を指定することで，山麓施設コンピュータシステム内の一時領域にデータを転送してくることができ，その後テープに収めたり，ftpによってデータを持ち帰ることが可能となる．

表１　2002年２月５日現在の，各観測装置のデータフォーマットとデータ生産量一覧．

※データ量は1998年末のファーストライト時からの積算で，テスト用の画像などは計算には含んでいない．

参考文献

１）安田直樹他，2000，「すばる望遠鏡ガイド星カタログの作成」，国立天文台報第４巻，p.195

２）Takata., et al., 1998, "Data archive and database system of the SUBARU Telescope", Proc. SPIE 3349, 247

３）Ogasawara R., et al., 2000, "Proposal management system of the Subaru Telescope", Proc. SPIE 4010, 1590

４）Winegar T., Noumaru J., 2000, "Subaru FATS (fault tracking system)", Proc. SPIE 4010, 136

５）市川伸一，2002，天文月報第95巻，p.266

６）Hamabe., et al., 2000, "New Image Quick-Look System for Subaru Telescope Data Archive", Proc. ADASS 9, 482

７）Kosugi., et al., 2000, "Data quality control for Subaru Telescope", Proc. SPIE 4010, 174

８）Horaguchi., et al., 1999, "An Astronomical Data Archive System with a Java-Based User Interface", PASJ 51, 693

９）Takata., et al., 2000, "STARS (Subaru Telescope archive system) for the effective return from Subaru Telescope", Proc. SPIE 4010, 181

10）http://skyview.gsfc.nasa.gov/

11）http://aladin.u-strasbg.fr/

12）Watanabe M., et al., 2001, "MAISON: A Web Service of Creating Composite Images On-the-fly for Pointing and Survey Observational Images", Proc ADASS 10, 70

Databases in Subaru Telescope

Tadafumi Takata

Subaru Telescope, National Astronomical Observatory of Japan, 650 North A揺oku Place, Hilo, Hawaii 96720, USA

Abstract: There are various types of database which are helping the operation of Subaru telescope, especially some useful functions are prepared for providing users the observational data. In this article, I will introduce the current status of data archive system of Subaru telescope, and how we are managing and handling the enormous amount of data between Hawaii and Japan. Our works and future plans for using Subaru data in coming "database astronomy era" will also be presented breifly.

すばる望遠鏡のデータベース

高 田 唯 史

〈国立天文台ハワイ観測所 650 North A揺oku Place, Hilo, HI96720, U.S.A.〉

１．“すばる”を支える様々なデータベース

２．すばる望遠鏡のデータを管理するデータベース

2.1 データの種類と現状のデータ容量

2.2 データの管理方法

2.3 データハンドリング（データの流れ）

３．データベース天文学へ向けての取り組み

すばる望遠鏡のデータベース　

高　田　唯　史

〈国立天文台ハワイ観測所　650 North A揺oku Place, Hilo, HI96720, U.S.A.〉