講演要旨
本発表では,日立製作所中央研究所と行った会話パターンの予測可能性についてのデータ分析について紹介する.
分析の対象としたデータはある日本企業のオフィスにおける対面会話の記録である.
オフィス内の各個人は赤外線センサの付いた名札を首から下げており,近接かつ正対するセンサ間での通信が
会話イベントとして記録される.個人の会話パターンは時刻順に会話した相手の ID を並べた列として得られる.
ここでは個人の会話パターンの予測可能性を,前回の会話相手が誰だったかを知ることにより
次回の会話相手が誰なのかに関して得られる相互情報量と定義する.分析の結果,個人の会話パターン
はある程度予測可能であることが判った.この予測可能性の主な原因は行動時間間隔のバースト性である.
しかし,そのバースト性の影響を除いてもなお会話パターンには有意な予測可能性が見られた.
また,個人の予測可能性とその社会ネットワークにおける位置との相関についても述べる.
信号を基底の一時結合で表したときに、スパース性の基準のもとである目的関数を
最小にする手法が注目を集めている。compressed sensingなどがその例である。ス
パース性を追求するものとして、信号のLpノルムで制約をかけるが、p = 0は、組み
合わせ問題になり解法が難しいため、p = 1の制約で問題を解くのが通例である。こ
れには、LARSやLASSOなどの逐次解法が知られている。ここでは、LARSはMinkovskii
計量のもとでの最急降下法であることを明らかにし、この解法を一般の凸目的関数に
適用出来るように拡大する。これをもとに多数のニューロンの発火パルスの高次相関
を、スパース条件のもとで求める新しい手法を提案する。また、話を進めて、p =
1/2の場合の解法について、情報幾何の観点からの新しい見方を示し、これを新しい
解法に結びつける。この話題は統計的機械学習と密接に関係する。
ブレインリーディングからブレインマシンインターフェースへ
ブレインリーディングとは脳活動計測に基づく心的状態の推定技術であり、ブレ
インマシンインターフェースとは、脳と情報通信機器を直接つなぐ技術 であ
る。特にヒトの非侵襲脳活動計測に基づくブレインリーディングとブレインマシ
ンインターフェースについて、そこで用いられている機械学習法を 含めて紹介
する。意思決定過程のモデリングからのブレインリーディング、予測に関わるブ
レインリーディング、運動の再構成などいくつかの応用を紹 介し、近頃スター
トさせたネットワーク型ブレインマシンインターフェースプロジェクトの構想に
ついても述べる。
近年、ソーシャルネットワークの普及や、センサーデータなどの多様な
データの出現により、データ解析も回帰や分類といったタスクだけでなく、デー
タの背後に潜む複雑な構造を抽出する関係データ解析の研究が重要視され
つつある。これまで、購買履歴のPOSデータにおける相関分析、遺伝子解析のた
めのbi-clusteringなど多くの研究がなされている。しかし、現実問題では、関
係は多重性を持ち、かつ、時間的に変動する。本講演では、このようなより複雑
かつ実用性の高い問題に対し、ベイズモデルに基づく新たな研究アプローチと最
近の成果、および関連研究について話題提供する。
疎なベクトルに対する少数の線形観測の結果からもとのベクトルを推定する問題は,「圧縮センシング」といったキーワードで注目を集めている.
線形観測の結果を制約条件として,非零要素の個数が最小となるベクトルを求めるアプローチは非凸の最適化問題となるため,
凸緩和にもとづく 1-ノルム最小化によって取り扱われることが多い.
推定対象のベクトルの各要素が非零である確率が既知の場合には,
その知識を活用して適切な重み付けを行った重みつき 1-ノルム最小化によって性能を高めることができる.
我々はまず,重みつき 1-ノルム最小化における最適な重みの定め方を議論する.
また,非零確率に関する事前知識がない場合にも,
重みを更新しながら重みつき 1-ノルム最小化を繰り返す反復アルゴリズムを考えることができるが,
この反復解法の性能評価のための解析的枠組みを提案する.
インターネットや複雑システムの発達により、ネットワーク構造をもったデータ
が大量に溢れるようになった。しかもそのような時系列から背後にある構造的な変化を
捉えることは理論的にも応用的にも大きなチャレンジである。
本発表では、ネットワーク時系列の潜在的構造変化検知手法として、情報論的学習理論に
基づく手法を幾つか紹介し(動的モデル選択、コミュニティ変化検知、リンク異常検知、
サンプリングに基づく変化点検知等)、これらの応用として、ソーシャルデータからの
話題出現検知、広告の潜在的インパクト測定、市場構造変化の検知、メールデータからの
不正検出などを紹介する。