lifelog_2015
本プロジェクトはユーザのあらゆる日常行動のライフログを取り続け、常にそれらをマイニングし続けることによってsuper-personalizationの実現を目指しています。
ライフログは、
ユーザの物理的な状況の変化をスマートフォンの各種センサ(GPS、Wi-Fi、加速度、磁気、気圧など)で取得し続けるリアルライフログ
ウェブアクセスをすべて記録し続けるウェブライフログ
PCでの作業(ローカルファイルアクセス、ウェブアクセス、メールのやり取りなど)をすべて記録し続けるPCライフログ
テレビ番組を対象とする番組視聴履歴(番組視聴ライフログ)
の計4種を想定しています。 これらのライフログを融合し、ユーザ行動の未来予測や、ユーザの状況に合わせた情報提示などを目指しています。
個人特化した移動支援システムの研究開発
この研究では、GPSログを中心に分析し、ユーザ毎の意味のある場所を見つけだすことで、 その頻度、訪問時刻、場所間の移動手段を推定します。 これを用いて、より能動的で個人特化された移動支援を行うことができるアプリケーションの開発をしています。
ユーザ毎の意味のある場所を見つけ出す際には、 はじめにユーザが日常的に移動する場所の中で、比較的長期間停留する場所を「立ち寄りポイント」、 駅やバス停、駐車場、自転車置き場など移動手段を変更する場所を「乗り換えポイント」、 同一移動手段でその移動効率を決定づけるような場所を「チェックポイント」と定義しました。 これらのポイントを、ユーザ毎のライフログからそれぞれを発見し、その移動の特性をあらいだしました。
出張など非日常の移動については「乗り換え案内」などのウェブサービスと連携して、 自動的にそのユーザの近未来に起きると考えられる移動に関してプランを生成し、 そのプランに合わせて支援サービスを提供するシステムをプロトタイプ実装しています。
システムはプランを生成するプランメーカ、プランどおりにユーザが移動できているかを見守るプランチェッカ、 その時々でユーザに対して支援を提供するアシストメーカから成り立っています。
このようなシステムにより、プル型ではなくシステムの方から利用を促すプロアクティブ型の、 ライフログを利用した個人に特化した移動支援システムを実現しています。
ユーザの移動のモデル化とProactive型移動支援機構の概要
関連修論:「ライフログベースの能動型移動支援システムの構築(2012年度)」
屋内でのユーザ状態の認識
Wi-Fi基地局からの電波を中心に分析して、屋内でのユーザの状態認識をする研究を実施しています。 この屋内版のライフログ研究開発では、Wi-Fi標本の自動管理機構に特に注力してきました。 ユーザが屋内で立ち寄って長く滞在する場所で生成される、その場所を表すWi-Fi基地局の電波状況の統計量を「標本」と呼びます。 生成された標本間の仮想的な距離を算出することで、生成された標本の位置を判定します。 標本に含まれるそれぞれのWi-Fi基地局を、不良な受信状態の期間の長さをベースに重みづけをすることによって、この仮想距離の計算を信頼性の高いものに向上させることに成功しました。
このような統計処理を自動的に行なうには同じ場所での長期に渡る観測ログが必要となりますが、 自動的に標本を生成する本方式では同じ場所にいることを確信することは困難です。
そこで「サイト」という概念を導入して比較的近くに生成された標本をまとめる単位を用いることにしました。 サイト内で最も長期に滞在する標本の「位置」における統計データを用いて そのサイトで共有して信頼するに足る基地局の情報を生成することで自動化に貢献できることがわかりました。 また、サイトはその中で生成してより標本の最大数を制約する単位としても活用できます。
Wi-Fi基地局の信頼度による重みづけとサイトによる管理
関連卒論:「環境の変化に適応するWi-Fi標本自動管理手法(2013年度)」
関連修論:「屋内細粒度行動認識のためのWi-Fi標本の自動管理機構(2012年度)」
この他に、Wi-Fi基地局による行動認識にはノイズとなる移動基地局を判定する手法を研究開発しています。 従来のGPSデータを併用して見つけだす手法以外に、GPSデータがない場合にもWi-Fiの入れ替わり率などを利用して判定する手法を提案しました。 これらで発見できた移動基地局に対して、さらにベイジアンネットワークを用いることによって、信頼性の推定なども実施しています。
関連卒論:「絶対位置情報に依存しない無線LAN基地局の移動性判定手法(2012年度)」
ライフログデータに特化したデータストレージの研究開発
本研究室では、ライフログを利用したシステムの開発だけではなく、 ライブログデータの収集や分析用のデータストレージについての研究開発も行なっています。 過去には、分析用のデータストレージとしてDwarfstarを提案しました。 これまで開発してきたDwarfstarを更に性能向上するために、大量のレコードを含む書き込み性能の向上に注力して、 ライフログデータの挿入専用APIを追加したL2baseの開発を行ないました。 アップロード単位の挿入、WALの削減、時系列挿入の活用などを実装し、従来の数倍の書き込み性能向上を実現しました。
L2baseの書き込み性能比較
関連卒論:「ライフログセンシング特化ストレージL2baseの性能向上に向けた検証評価(2013年度)」
関連修論:「ライフログセンシングのための分散ストレージシステム(2012年度)」
ウェブライフログフュージョン研究開発
ウェブライフログの目標は、個人の趣味や嗜好、興味に合わせた情報推薦を実現することです。 ユーザのウェブアクセス履歴を分析することによって個人の趣味嗜好だけでなく、 時々刻々変化するその時の興味を的確に把握する技術の基盤を整えています。
ウェブライフログにおけるユーザの起点の推移とその追跡
ウェブアクセスのたびに変化するユーザの意図の推移を機械的に追跡できる機構を実装評価しました。 これはユーザがウェブページをどのようにアクセスするかを起点を明確化することによって 系列として分類し、起点が現れたところで意図が変化した可能性があることを知る手法です。 起点の例は、ブックマークからページに遷移した、URLを直に入力した、検索を行った、などです。 リンクを踏んで遷移したページを閲覧した際には、 それまで見ていたページとの関連が高い場合が多く、新たな意図が出現したとは考えません。 この機械的なアクセス系列の分類によって、ウェブ閲覧時の意図の変化を追跡することが可能になりました。
関連卒論:「閲覧の起点と関連性に注目したユーザ意図の推移追跡(2013年度)」
ウェブ閲覧時の閲覧意図の変化を追跡する際に、リンクをクリックした場合に同一の意図を持って閲覧したと考えると、本文以外の領域、たとえば広告のリンクをクリックしてページを閲覧した場合などに、変化したユーザのページの閲覧意図を追跡できないという問題が起きます。 そこでページ内の本文の部分を自動的に認識する手法の研究開発も実施しています。 これによって、ページに存在する本文以外の領域をクリックしたことがわかるようになります。 また、ユーザのウェブ閲覧履歴から、興味や趣味・嗜好を抽出する際のノイズを低減させることができるようになります。
関連卒論:「URLパス構造のグループ分けを利用したWebページの非本文要素抽出手法(2012年度)」
ライフログを用いたクロスドメインの情報推薦
テレビ番組の視聴履歴や、ウェブライフログを用いて、個人の興味や嗜好に適した、多様な領域の情報や商品を推薦する、クロスドメインの推薦システムの開発に取り組んでいます。 従来の推薦システムでは、例えば、番組の視聴履歴を用いて、適切な番組を提示するといったように、 主に、利用履歴の領域と同じ領域の情報を推薦することを目的としていますが、 この場合、推薦したい情報に関する利用履歴が存在しないと、適切な情報を推薦することが難しくなります。 そこで、本研究では、ライフログから自身の嗜好や興味に適した多様な領域の情報を推薦することを目指しており、 番組の視聴履歴から、番組やユーザ個人の嗜好・興味に適した書籍を推薦するシステムの構築に取り組んでいます。