R版CATDAP利用マニュアル

catdap2ext を想定しての解説です。それ以前のバージョンについても大部分共通しますができるだけ最新公開版を使用して下さい。 ロードしたCATDAPのバージョンは help(catdap2ext) で表示されるページの最後に [[Package catdap2ext version 0.2.0 Index] のように表示されます。

Rを使ったことがないPCユーザーが「統計モデリング」1章 表1.9 を求めるまで

  1.  R のインストール
    https://jasp.ism.ac.jp/ism/catdap/に、 PCにRをインストールする方法と、catdap パッケージのインストールとロードの方法が説明されている。 角度データ(circular data) の扱いと条件付き確率のグラフィカル出力が可能な catdap2ext パッケージを使いたい場合には https://jasp.ism.ac.jp/ism/catdap2ext/からダウンロード。
  2. 適当なフォルダー(ディレクトリ)を用意し、そのフォルダーを「作業フォルダー」として以下の作業を行う。
  3. データファイルtable1.7.csvと、Rスクリプトファイル compute.Rと、 output.Rと、manage.Rをダウンロードする。
  4. R を起動し、これ以降は「コンソール」で
  5. 作業フォルダーを設定する。Windows上で RGui を利用する場合はファイルメニューで「ディレクトリの変更」をする。
  6. コマンド source("compute.R")  をキー入力して実行。
  7. 帯グラフを表示するウィンドが開くが今は閉じる。続いて開くウィンドも閉じる。
  8. コマンド source("output.R")  をキー入力して実行。
  9. 作業フォルダーにtable1.9.csvと同じものが出来ていることを確認。

風向、日付を含むデータの例

  1. windrainDATA.csvは降雨、年初からの日数、その日の最多風向の記録であり、年初からの日数も風向も「角度」データである。
  2. windrainDATAanalysis.Rの手順で、分析と結果の表示ができる。

CATDAPを自分のデータに適用出来るようになるまで

  1. table1.7.csv のような形でデータを用意する。
  2. compute.R の中身(以下)をデータに合わせて書き換える(特に 赤字のところ).。
    # スクリプト compute.R
    
    # データの読み込み。既に読み込み済なら不要
    
       table1.7<-read.csv("table1.7.csv")
    
    # catdap2c 関数に渡す引数の設定
    #  pool:各変量の離散化方式精度を設定するベクトル。
    #        連続値変量に対しては 0(=等間隔離散化の離散化) あるいは 1(=不等間隔離散化の離散化)を選ぶ。
    #            特に理由がなければ不等間隔離散化(1)がお勧め。下記の例ではそうしている。
    #    離散値に対しては 2 を設定。
    # accuracy:各変量の(初期)離散化精度を設定するベクトル。
    #        連続値変量の離散化は AICを見ながら最適化されるので、小さくとっておけばいい。
    #    離散値に対しては 0 を設定。
    
         pool <- c(2,    1, 2)
     accuracy <- c(0, 0.01, 0) 
    
    # catdap2c 関数の呼び出し(catdap2ext パッケージの場合。catdap パッケージの場合は catdap2c でなく catdap2 を呼ぶ)
     z <- catdap2c(table1.7, pool, "INT2", accuracy)
    
    # 計算結果プリント出力
    z
    
    # あと片づけ
    rm(pool)
    rm(accuracy)
    
  3. あとは「表1.9 を求めるまで」の 6〜8 を実行。
  4. 「第7ステップ」で現われる帯グラフの意味は z の入力でコンソールに表示される内容に書かれているが、詳しいことはCATDAP についての文献、たとえば 「CATDAPマニュアル」で勉強してほしい

R をCATDAP 以外のデータ処理に使えるようになるまで

  1. Rの文法を学んだ上で compute.R と output.R を全面的に書き直して使う。
  2. manage.R がそんな時に役にたつかもしれない。

注意

「統計モデリング」サポートサイト