ヒッパルコス星表のデータを取得する

ヒッパルコス星表のデータを取得して、使いやすいようにcsv形式にします。

 

【まめちしき】ヒッパルコス星表はヒッパルコス衛星という観測衛星によって観測された星のデータベースで、一般的に星といわれるものの位置や視差、明るさ、スペクトル型などを含む網羅的なデータベースです。

 

国立天文台の天文データセンターからいろいろなデータベースを入手でき、その中にヒッパルコス星表も含まれています。

 天文データアーカイブセンター

 ┗天文カタログ

  ┗カタログ一覧(HTML形式)

   ┗1. Astrometric Catalogues

ここにある1239  The Hipparcos and Tycho CataloguesからダウンロードするFTPサイトに飛べます。NASAでもCDSでもいいので、hip_main.dat.gzというファイルがお目当てのヒッパルコス星表のデータです。

f:id:love_and_sessue:20160216212824j:plain

しかし、このデータはヒッパルコス星表の全ての項目を丸ごとテキストにしており、サイズは53MBほどあります。12万行近いデータは取り回しが面倒であり、これら全ての情報が必要になるケースも限られます。

 

以下に掲げるNASAのサイトでは、ほしいパラメーターの種類・範囲を選択することで必要最小限のデータを抽出・ダウンロードすることができます。

HEASARC Browse: Search of STAR CATALOG Catalog(s)

f:id:love_and_sessue:20160216213453p:plain

左のチェックボックスで取得したいパラメーター(列)を選びます。"Query Terms"というところでは数値の範囲を指定できます。たとえば"vmag"(視等級)の行で"<1.5"と入力すると、1.5未満*1の視等級のデータだけを抽出することができます。name,ra(赤経),dec(赤緯),vmagの4つで試してみます。

f:id:love_and_sessue:20160216214243p:plain

 ページの下の方に行くと、色々なオプションがあります。Coordinate SystemはとりあえずJ2000(2000年分点)で大丈夫です。Limit Results Toは状況に応じて設定します。今回はいわゆる1等星だけを抽出するので、20では足りませんが30あればお釣りが来ます。

f:id:love_and_sessue:20160216214601p:plain

Start Searchをクリックすると設定の通りにデータが抽出されます。データ量によっては時間がかかります。今回は一等星だけなので、すぐに表示されました。

f:id:love_and_sessue:20160216220636p:plain

実はここに上がっているデータは22行になっています。一等星は21個として知られていますが、実はケンタウルス座αは連星であり、そのうちの2つが一等星クラスの視等級です。肉眼ではひとつの星に見えます。そんな事情から、ここでは22個の星の座標データを得ることになりました。今回のように少ないデータならこの表を直接エクセルにコピペすることもできますが、もうすこし大きい場合はページ上方にある"Save All Objects To File"をクリックすることで結果をダウンロードできます。

 

ダウンロードしたテキストは、先の国立天文台のサイト経由でダウンロードしたものと同じやり方で区切られたデータです。

f:id:love_and_sessue:20160216222001p:plain

各パラメーターは固定長になっています*2。データの区切りは"|"です。これをcsvになおします。

 

適当なスクリプトで処理するのもいいですが、ここでは簡単にExcelをつかいます。コピペすれば自動でどうにかなります。ならない時も、"区切り位置"という機能を使えば自由に区切り記号を指定できます*3

f:id:love_and_sessue:20160216222555p:plain

 

あとは名前をつけて保存をするときに、csv形式を指定すれば完了です。

f:id:love_and_sessue:20160216223133p:plain

できました!

 

*1:あくまで数字の上で1.5より小さいので、1.5等より明るい星のことです

*2:文字数が揃っている、ということです

*3:Mac用のExcelなのでWindowsではちょっと振る舞いが違うかもしれません