memiscGUIパッケージの使い方

インストールはこちらで

起動

インストール後,起動は以下のようにするだけです。

library(memiscGUI)
memiscGUI()

f:id:phosphor_m:20100628190511p:image

データの読み込み(ファイルから)

起動すると,上のようなWindowが表示されます。メニューバーのファイルをクリックすると,次の画像のようなメニューが出てきます。
f:id:phosphor_m:20100628190512p:image

まずは,インポートを選んでファイルを読み込んでみます。現在のところ読み込めるのはSPSSシステムファイル(*.sav),SPSSポータブルファイル(*.por),Stataファイル(*.dta)です。読み込む形式を変えたいときは,右下のドロップダウンメニューから選んでください。
f:id:phosphor_m:20100628190513p:image

大きなデータだと読み込みに時間がかかると思います。読み込みが終わると,以下のようにWindowの表示が変わります。
f:id:phosphor_m:20100628190514p:image

値ラベル以外は,行を一度選択してから,次に各セルをクリックすると編集できます。尺度はドロップダウンメニューが出てきます。欠損値は,欠損値に指定したい数値をコンマで区切って入力してください。

行にカーソルを合わせると,変数のsummaryがポップアップします。行をダブルクリックすると,より詳しい要約がコンソールに表示されます。これはmemiscパッケージのcodebookという関数を使っています。
f:id:phosphor_m:20100628190515p:image

複数データを読み込んだ場合も,手軽に切り替えることができます。
f:id:phosphor_m:20100628190516p:image

作業環境からのデータの読み込み

「大局的環境からのインポート」では,すでに作業環境にあるデータをmemiscGUIに読み込むことができます。読み込めるデータは,data.frameかdata.setです。ドロップダウンメニューから読み込みたいデータを選択してください。
f:id:phosphor_m:20100628190519p:image

data.frameとの関連づけ

データは,memiscGUIから読み込んだ場合,そのままでは利用することができません。Rの作業環境(大局的環境)とは別の環境でデータを管理する仕組みになっているためです。memiscパッケージではdata.frameの高機能版のようなdata.setというクラスでデータを管理するのですが,高機能な分,扱いを覚えなければならなかったり,data.frameと全く同じようには扱えなかったりします。そのため,memiscGUIではdata.setの操作をユーザーの目からは完全に隠蔽し,ユーザーが使うのはdata.frameだけで済むようにしています。

具体的には,memiscGUIの管理しているdata.setを作業環境のdata.frameと関連づけ,data.setへの変更が即座にdata.frameに反映される機能を付けています。メニューバーのファイルから「データセットをデータフレームと結び付ける」を選ぶと,下のようなダイアログが表示されます。
f:id:phosphor_m:20100628190517p:image

左の列がmemiscGUIが管理しているdata.set,右の列が作業環境中でdata.setに関連づけられるdata.frameです。関連づけるdata.frameは,関連づけのさいに存在していなくてもかまいません。ここで関連づけられたdata.frameは,data.setを編集したさいに上書きされます。data.frameへの上書きは変数単位ではなく,まるごと上書きされるようになっているので,注意してください。逆に,data.frameの編集はdata.setには影響を与えません。関連づけは常にメイン画面で確認できるようになっています。
f:id:phosphor_m:20100628190518p:image

上級編

データはmemiscGUIのパッケージ環境内にある.memiscGUI.envという環境オブジェクト内で管理しています。.memiscGUI.envに直接アクセスすることで,data.setオブジェクトを取り出すことができます。

> ls(envir=.memiscGUI.env)
[1] "JIS2001_040219_sav"                   
[2] "JIS2002_030603_sintax_040223_area_sav"
[3] "JIS20041012_sav"
> ds1 <- .memiscGUI.env$JIS2001_040219_sav

また,データを自分で作った環境オブジェクト内で管理することもできます。

data.env <- new.env()
memiscGUI(envir=data.env)

こうすることで,データをひとまとめにせず,分類して管理できます。また,環境オブジェクトを保存しておいて,次回起動時に使い回すという使い方もおすすめです。この操作はそのうちGUIでできるようにしようと思っています。

感想・要望・不明な点等

これで一通りの機能を説明したと思います。感想・要望・不明な点等あれば@phosphor_mかコメントでよろしくお願いします。