第55巻第1号3−25(2007)  特集「統計データの可視化」  [統計ソフトウェア]

XMLによるインタラクティブな統計グラフ
—Webベースの統計環境への活用—

東海大学 山本 義郎
福岡女子大学 藤野 友和
岡山大学大学院 飯塚 誠也

要旨

Web上での統計グラフの表示方法として,XMLテクノロジーを利用し,2次元グラフの表示のためにSVG,3次元グラフの表示のためにX3Dの利用を提案する.SVGとX3Dはともに,Webブラウザで閲覧することにより,Webページの一部としてベクターグラフィックスを描画できるグラフ記述言語であり,ビューアの機能を用いて拡大・縮小などができ,プログラムにより更なるインタラクティブな機能を実装することが可能である.
本論文では,SVGおよびX3Dにより実現できるインタラクティブな統計グラフの作成方法について紹介するが,XMLベースのグラフィックスフォーマットであるSVGとX3Dの理解のためには,XMLについての理解が不可欠であるため,まずXMLの概要を述べ,SVGおよびX3Dの特徴について概説する.その後で,SVG,X3Dによるインタラクティブ統計グラフを紹介するとともに,著者らが作成したXMLベース統計グラフの作成ツールについても紹介する.最後にXMLベースのグラフィックの活用方法として,Webを利用した教育ツールを例に,SVGを利用したティーチウェアおよびXMLベースのインタラクティブテキストについて提案を行う.

キーワード:SVG,X3D,Webベースグラフ.

全文pdf閲覧前画面に戻る


第55巻第1号27−45(2007)  特集「統計データの可視化」  [統計ソフトウェア]

デザインパターンを用いた統計グラフのためのJavaライブラリ

徳島文理大学 山本 由和
統計数理研究所/総合研究大学院大学 中野 純司
総合研究大学院大学 本多 啓介

要旨

本稿では,現代的な統計グラフライブラリに必要な条件を考察するとともに,それらを満足させる実装としてわれわれが開発している統計グラフライブラリJasplot (Java statistical plot)の詳細を説明する.Jasplot は,マウスによる対話的な操作を実現しており,基本的なグラフやグラフを構成する部品を組み合わせることによって新しいグラフを作ることを可能にしている.また,R や Jasp のような既存のシステムから利用しやすくなっている.このような機能を実現するために,プログラムの設計においてデザインパターンの考え方を積極的に利用したことがその特徴となっている.

キーワード:対話的な操作,統計グラフライブラリ,Java,linked views.

全文pdf閲覧前画面に戻る


第55巻第1号47−68(2007)  特集「統計データの可視化」  [原著論文]

Textile Plot 環境

慶應義塾大学大学院 熊坂 夏彦
慶應義塾大学 柴田 里程

要旨

本論文では,汎用な視覚化手法Textile Plot を用いることによって,高次元データの的確な認識を可能にする一つの体系的な環境の設計と実装について述べる.Textile Plotは,平行座標プロットを基本としているが,各軸の位置と尺度を適切に変換し,同時にデータのさまざまな属性をプロットと有機的に結びつけることで,汎用なヴィジュアリゼーションを可能にする.Textile Plot環境は,Data,Parallel Coordinate,Visual Analogue,Textile Plotの4つのオブジェクトの流れで構成され,ユーザの視覚的操作を体系的に処理する.Dataオブジェクトは座標ベクトルの集まりであるParallel Coordinateオブジェクトに変換され,Parallel Coordinate オブジェクトはTextile Plotとは相似であるがその抽象表現であるVisual Analogueオブジェクトに変換される.さらにVisual Analogueオブジェクトは現実のディスプレイ,すなわちサイズや解像度に依存しないTextile Plotオブジェクトへと変換される.ユーザは最終的にこのTextile Plotオブジェクトをさまざまなインタフェイスを通じて眺めることになる.このようにデータからのTextile Plotの生成を一連のオブジェクトの変遷とみなすことで,対話的な操作を各オブジェクトに適切に振り分け,同時にそのログを保存することも可能となる.またこの環境設計は特定のデータや視覚化手法に依存しない汎用なものであるが,実際のデータを理解するうえで必要十分な環境であることも,いくつかの実データを用いて明らかにする.

キーワード:平行座標プロット,最適な位置と尺度の変換,データの属性記述,視覚的操作,Information Visualisation.

全文pdf閲覧前画面に戻る


第55巻第1号69−83(2007)  特集「統計データの可視化」  [原著論文]

3次元平行座標プロット

総合研究大学院大学 本多 啓介
総合研究大学院大学/統計数理研究所 中野 純司

要旨

平行座標プロットは多変量データを視覚化するのに有用な統計グラフである.平行座標プロットで変数間の関係を調べるためには,brushed highlightingと呼ばれる対話型操作を用いることが一般的であるが,これだけでは変数間の関係を同時に把握することは難しい.本論文では,平行座標プロットを3次元に拡張し,変数の関係を全体的に表示することを目的とした手法を提案する.これは,平行座標プロットで,観測値を表す折れ線を直交した座標に配置することにより実現する.この視覚化手法で,条件変数の値でデータを分割することにより,非線形関係にある変数に対して,部分的な線形関係を視覚化することが可能である.例題を用いた解析で,この手法が探索的なデータ解析に有用であることも示す.

キーワード:3次元データ表示,条件付きグラフ,対話型操作,統計グラフ.

全文pdf閲覧前画面に戻る


第55巻第1号85−100(2007)  特集「統計データの可視化」  [統計ソフトウェア]

小地域データにおける地理統計解析とSVGによる可視化

株式会社  数理システム 亀川 佳美
福岡女子大学 藤野 友和
岡山大学 垂水 共之

要旨

インターネット接続環境が整備され,国勢調査に代表される官庁統計の小地域集計データについても入手が容易となってきているが,新たな知見を得るためには,単に公開されているデータを眺めるだけでは不十分である.それは,デスクトップGISなどを利用し,個々の環境において分析することで,初めて達成されると考えられる.しかしながら,一般ユーザーにとって,高度な分析機能を有するデスクトップGISは高価であり,利用方法を習得するには時間もかかる.このような問題を解決するためには,Web上にそのような空間データを対象とした分析ツール(WebGIS)をデータと共に公開することが効果的であると考えられる.WebGISにおいては,一般的なWeb上の統計解析システムなどに比べ,地図などのグラフィックスをサーバ側で動的に生成し,さらにクライアント側でそのグラフィックスに対話的機能を持たせるというように,グラフィックスに対してより充実した機能が求められる.本論文では,国勢調査の小地域集計データに関するWebGISを紹介するが,グラフィックスに対するそのような要求を満たすため,開発コストや操作性の面で優れた性質を持っているSVGを画像フォーマットとして採用した.
一方,小地域集計データの統計解析においては,各小地域の代表点を2次元の連続確率場からの標本データと見なして,空間予測のための理論(クリギング)を適用することができる.各小地域の特異性の度合いを可視化するため,特異性の指標として,小地域ごとの特性値に対するクリギングによる予測値と観測値の予測誤差をコロプレス図により表現することを考案する.さらにこれをWebGISに実装した例を示す.

キーワード:空間統計解析,小地域データ,インターネット,GIS,SVG.

全文pdf閲覧前画面に戻る


第55巻第1号101−112(2007)  特集「統計データの可視化」  [研究ノート]

GoogleMapsを用いた地理統計データの可視化

岡山大学大学院 久保田 貴文
岡山大学 垂水 共之

要旨

気象データや環境データなどの地理統計データをあつかう場合,その特性値とともに位置情報が重要となってくる.予測を行う場合には空間構造をあらわす指標の1つであるバリオグラムのモデルを求める必要がある.また,可視化の場面では,地図上に観測点をプロットし,バリオグラムと連携してインタラクティブな操作をし,予測値を地図上に描画する要求がうまれてくる.そこで本研究では,GoogleMapsを用いて,観測値のプロットや空間構造さらには予測値などの表示を行う.

キーワード:GoogleMaps,地理統計解析,AJAX,SVG.

全文pdf閲覧前画面に戻る


第55巻第1号113−124(2007)  特集「統計データの可視化」  [原著論文]

連動する統計グラフィックスによる
多変量地理情報データの視覚化

徳島文理大学 小林 郁典
徳島文理大学 山本 由和
統計数理研究所/総合研究大学院大学 中野 純司
Soong Sil University Jung Jin Lee

要旨

近年の情報技術の発達により,地理情報データを誰もが比較的容易に入手することができるようになっている.地理情報データは地球表面の位置に関する情報をもつデータであるため,その視覚化には地図を利用したグラフィックスが有用である.しかしながら,これまで提案されてきた地図を利用したグラフィックスでは一度に表示できる変数の数に制限があり,多変量データをうまく視覚化することができないという問題がある.
そこで,本論文では,多変量地理情報データを視覚化するひとつの方法として,条件付きコロプレスマップと平行座標プロットなどの連動が,多変量地理情報データの探索的な解析を支援する道具として有用であることを示す.
ここで提案する統計グラフィックスは,われわれが開発を進めている統計解析システムJaspで実装された.本論文では,その機能と使い方を実際のデータを解析しながら説明する.

キーワード:コロプレスマップ,条件付きコロプレスマップ,平行座標プロット,Jasp.

全文pdf閲覧前画面に戻る


第55巻第1号125−142(2007) [研究ノート]

「国民生活基礎調査」データに基づく居宅介護
サービス利用に関する多変量プロビット分析

筑波大学大学院/(財)医療経済研究・社会保健福祉協会 山村 麻理子
広島大学大学院 蛹エ 宏和

要旨

多変量プロビットモデルは,複数の 2値データについて,互いに相関を考慮し同時に解析を行う事ができるモデルである.本研究の目的は,厚生労働省が全国を対象に実施するアンケート調査の国民生活基礎調査において,平成13年に新たに加わった介護票より,居宅介護サービス利用に関する分析への本モデルの適用可能性を検討することである.分析結果から各居宅介護サービスの利用要因については,訪問系の居宅介護サービスは健康状態が重く家族介護力の低い要介護者に多く利用されていることが分かった.同様に通所系居宅介護サービスでは,健康状態は中間層で軽いもしくは重くはなく,家族介護力は高い要介護者が多くみられた.ショートステイについては,最も健康状態の軽い要介護者を基準とすると,基準より重い健康状態で,家族介護力は高い要介護者の利用が多かった.同時に利用が行われているサービスの組合せについて,訪問系と通所系のサービスのいずれか一方が利用されている傾向がややあり,両サービスをそれぞれ利用している高齢者の健康状態や世帯像,および居宅介護サービスに対するニーズが異なることが予想された.得られた解析結果は,常識的に予想されるものであり,多変量プロビットモデルを用いた解析法は,十分に実解析に適用可能であると考えられた.

キーワード:介護保険制度,居宅介護サービス利用,国民生活基礎調査,多変量二値変数データ,多変量プロビットモデル.

全文pdf閲覧前画面に戻る


第55巻第1号143−157(2007) [研究ノート]

RDD調査における世帯内抽出法の比較実験

統計数理研究所 土屋 隆裕

要旨

Random digit dialing法による電話調査において,世帯内の回答者の抽出法として二通りの手法を試みた.一つは,世帯内の年齢順に基づき回答者を無作為抽出する確率法であり,もう一つは,世帯内の誰でもよいから回答者となってもらう任意法である.任意法は回収率が高い一方,途中拒否やその他・わからないという回答が多い傾向が見られた.人口統計学的属性変数や質問項目の調査結果は,世帯人数を除き,手法間に実質的な違いは認められなかった.原因の一つは,確率法であっても,最初に電話に出た人が回収サンプルの8割を占めることにあると考えられる.ただし,キャリブレーションにより調査不能バイアスの補正を試みると,多くの項目では手法間の差が拡大した.

キーワード:電話調査法,random digit dialing法,確率抽出,非確率抽出,キャリブレーション.

全文pdf閲覧前画面に戻る


第55巻第1号159−175(2007) [研究ノート]

個別面接聴取法におけるItem Count法の諸問題と実用化可能性

統計数理研究所 土屋 隆裕
首都大学東京 平井 洋子
シノベイト株式会社 小野 滋

要旨

調査項目が社会的に望ましくない内容である場合,それを直接質問しても全ての回答者から正直な回答を得られるとは期待できない.間接質問法の一つであるItem Count法では,直接質問をする代わりに「当てはまる項目数」のみを尋ねることで回答者個人の情報を秘匿し,より正直な回答を促す.それと同時に,二つの等質なサンプル間の項目数の差を利用することで,目的とするキー項目の推定値を理論的には得ることができる.本稿ではItem Count法の特性と実用化可能性を探るため,直接質問法との比較実験調査を行い,「万引き」を含む四つのキー項目の経験率の推定を試みた.調査は個別面接聴取法により実施し,回答者のItem Count法の受け止め方なども調べた.その結果Item Count法では主に文脈効果などが二群の等質性を崩し,推定値を不安定にする可能性があることが示唆された.

キーワード:間接質問法,プライバシー,万引き.

全文pdf閲覧前画面に戻る


第55巻第1号177−195(2007) [研究詳解]

トラヒックの同定・推定に基づく
シェーピングアルゴリズムの検討

慶應義塾大学大学院 本多 泰理

要旨

本稿では,ネットワーク上のデータの流れ,即ちデータトラヒック(以下,単にトラヒック)の同定・推定を,パケット毎の到着間隔とパケット長に着目して実現すると共に,その適用領域として,トラヒックシェーパー(帯域制御装置)におけるパケットロスの低減と出力スループット維持の効果を実現するアルゴリズムを提案する.手法として,パケット毎の到着間隔およびパケット長の時系列データを多変数時変係数ARモデルとして記述・同定する.更に得られたモデルにカルマンフィルタを適用し,一期先のパケット到着時間間隔およびパケット長を推定する.上記推定手法に基づくトラヒックシェーピングアルゴリズムは,従来のToken Bucketアルゴリズムに比較して,トラヒックの一期先予測に基づきトークン生成率を動的に可変とすることにより,トラヒックシェーパーの入力ポートにおけるパケットロス率の低減と出力トラヒックのスループット劣化の抑制を実現する.我々は更に,提案手法の有効性を数値シミュレーションにより確認する.ただし本稿では,入力ポートにおけるキューイングは行わず,シェーパーの転送レートはシェーピングレートに比して充分高いものと仮定している.

キーワード:時変係数ARモデル,カルマンフィルタ,トラヒックシェーピング.

全文pdf閲覧前画面に戻る