データ爆発とコンテキスト

こんにちは。湯本正典です。
先端IT活用推進コンソーシアム(AITC)
コンテキスト・コンピューティング研究部会(CC研究部会)で
サブリーダをしています。

この研究部会では、以下の計画で活動しています。
http://aitc.jp/wg/context/plan.html



現在、インターネットでつながれている、いわゆるクラウドの中の「データ」は爆発しているといわれています。ほとんど指数関数的に、増大しているそうです。これからも、この勢いで増え続けるのでしょうね。

そこで問題になってくるのが、「データ爆発」(一般には「情報爆発」)です。私の個人的趣味なのですが、「データ」と「情報」は若干区別して使おうと思っています。「データ」というのは、「なんらかの記憶媒体に格納されている記号の集合」くらいの意味です。ここで、私が言いたいことは、「データは、それを見た人にとって、分かるもの(理解できるもの)と分からないもの(理解できないもの)がある。」という、暗黙の了解をいただいてのことです。そして、「情報は、それを見た人にとって、分かるもの(理解できるもの)である。」という前提を考えています。同じデータであっても、あるひとには「情報」であり、あるひとには「ただのデータであって、情報ではない。」ということが起こると、私は考えています。このような、わからないデータは、それを見た人には、なんら価値を与えるものではなく、かえってゴミになるのです。そして、「有益な情報」とは、さらに、それを見た人の「次のアクションのきっかけ」になる情報のことです。

たとえば、AKB48のイベントのチラシ(データ)があったとしましょう。AKB48のファンにとっては、すぐに会場に駆けつけるというアクションにつながる「有益な情報」です。ところが、AKB48という文字を見ても、なんのことだかさっぱり分からない人にとっては、このイベントのチラシ(データ)はゴミにしかならないのです。

インターネットの雲の中には、データはあふれているけれど、情報を抽出するのが難しくなっているのです。つまり、前にも書きましたが、
「データへのアクセシビリティ」は向上しているのに、「情報へのアクセシビリティ」は極度に低下しているのです。これが、データ爆発(情報爆発)の本質だと私は思っています。私の定義ですと、「データは爆発しているけれど、情報は爆発しておらず、かえって不足している」と思うのです。

では、どうすればいいのか?これを解決するのが「コンテキスト」だと思います。

データを「テキスト」と捕らえれば、そのデータを見た人の「コンテキスト」を付加すること位よって、「情報」に変換することができると思うのです。

「データ」(テキスト) + Aさんの「コンテキスト」 = Aさんにとっての「情報」

というふうに考えています。

それでは、Aさんの「コンテキスト」をどう収集するか?このコンテキストの元として考えられるのが、「過去ログ」や「ライフログ」をはじめとした、Aさんがシステムに働きかけた作業の履歴や、GPSなどの位置情報をはじめとした現実世界でのAさんの行動の履歴、さらに、現在の位置情報だと思います。
こうすることによって、たとえば、リコメンドなどもより効率的に行うことが可能になるでしょう。

データ爆発の時代。データに個人のコンテキストを付加して、個人にとっての情報とする。それが、今の、ITがサービスになった時代に必要な技術だと、私は思っているのです。

【舞台裏】
シャノンの情報(ビットの記録情報)は、私の定義だと、データになります。
私の定義も、データを情報として、情報を知識とでもした方が好都合かもしれません。
その辺は、みなさんのご意見も伺いながら、考えてまいりたいと思います。