トップページ > 大学の技術・ノウハウ > データの可視化技術と機械学習の組み合わせによるビッグデータ分析・活用

大学の技術・ノウハウ

データの可視化技術と機械学習の組み合わせによるビッグデータ分析・活用

資料

データの可視化技術と機械学習の組み合わせによるビッグデータ分析・活用

組織名 お茶の水女子大学 基幹研究院自然科学系 伊藤 貴之 教授
技術分野 IT , 医工連携/ライフサイエンス , 新エネルギー/省エネルギー , 環境/有機化学/無機化学
概要

ビッグデータの分析・活用において、機械学習の活用が注目されていますが、それに加えデータの可視化技術を組み合わせることにより、データセットの作成やチューニング等の作業効率が良く、作業者のスキルレベルに適応したユーザインタフェース性を持ち、データ分析・活用がしやすいソフトウェアを開発できます。本研究室ではデータの可視化技術に関して長年のノウハウを有していますが、これに機械学習を組み合わせることで様々なアプリケーションへの応用を目指した研究を行っています。ビッグデータに対して可視化技術・機械学習技術を活用したいニーズをお持ちの企業様からのご相談をお待ちしております。

お問い合わせ

この技術・ノウハウに関するお問い合わせ

詳細

【簡略図】

20180126143922.png
【背景】
 自然科学でも社会的な現象でも、データを可視化することで文字通り「見えてくる」知見はたくさんあります。本研究室では、データの可視化技術について長年のノウハウがあり、最近では特にデータの可視化技術と機械学習を組み合わせることを主眼のひとつとして研究を進めています。

 データの可視化技術と機械学習の組み合わせにより、例えば、ビッグデータ分析のためのデータセットを作成する際、どのデータが正解データ、誤りデータであるかを人が判別しながらラベル付けしてデータ入力を行うことで、精度の高いデータセットを容易に作成することができます。

 また、データチューニングを行う際、データを一度可視化して人間の目を通すことで、異常値を排除するなどの前処理を適切に施し、業務や用途に適合した結果を導くことができます。こうした場合、何が異常かの判断はユーザーによって異なることもあり、可視化はユーザーの目的に応じた分析に役立ちます。また、機械学習では、大規模なデータをまとめて学習させる処理工程を経ることが多いですが、可視化しながらチューニングを行うことで、フレキシブルな機械学習システムの構築も期待できます。

 一つの応用例として、後述のとおり、ビルのエネルギー管理に可視化技術と機械学習を組み合わせた事例に取り組んでいます。また別の応用例として、生体試料の分析をはじめとする生物化学系の実験データでは様々な誤差要因があり、可視化によるデータの解釈は非常に重要です。この他にも、原子力発電所のような多数の計測データを含むシステムでの事故原因の究明や、SNSと位置情報を組み合わせ地理データ分析など、可視化技術は多種多様な産業分野において有用です。ビッグデータに対して可視化技術・機械学習技術を活用したいニーズをお持ちの企業様からのご相談をお待ちしております。

【技術内容】
 可視化技術は様々な応用場面があります。ここでは、エネルギー消費量管理(ビル管理システム)を例に説明します。
 東日本大震災以降の電力エネルギーの需給バランスのひっ迫などを背景に、エネルギー消費量の理解と分析が重要になっています。そのひとつの流れとしてエネルギー消費量管理の標準化が進んでおり、BEMS (Building Energy Management System) が特に有名です。これはビルのエネルギー管理に関する仕様とシステムを標準化したものです。
 BEMSに対応したソフトウェア製品の多くは可視化機能を搭載していますが、その多くは、単純な棒グラフ/折れ線グラフによる表示のみをサポートします。例えば、1日の気温の推移とビル全体のエネルギー消費量の変化をそれぞれ折れ線グラフと棒グラフで、1枚の図に重ねて表示したものです。そうした「可視化」でも、一定のできごと(例えば、朝8時の始業と午後1時台の業務再開)に応じてエネルギー消費量が変化すること、1日の気温の変化とともにエネルギー消費量が変化していくことが見て取れます。また、前日等との対比が可能な製品も存在します。
 しかし、1日や前後数日の変化量だけを見るだけでは長期的なエネルギー消費量変化の問題は可視化されません。また、ビル全体の消費を見るだけでは、特定エリアのエネルギー消費の特徴を見て取ることができません。その結果、どの日のどのエリアの消費状況は異常だったという「異常現象」を検知したり学習する機能も欠けています。

 当研究室で提案する新しい可視化ソフトウェアでは、時間軸について1日でも1月でも1年でも一覧できるマルチスケールな観察が可能です。また、フロアの全体図からエリアを取り出し(右下の平面図の赤枠内)、エリアごとのデータの推移を可視化することでエリアごとの特徴や問題を把握できます。
20180126144013.png
 下図は、本研究室の可視化ソフトウェアで、オフィスエリア(右下の平面図の赤枠内)に注目したものです。この図では、室内気温(緑)が午後に下がっていること、夕方に空調の電力エネルギー(橙)が急落していることがわかります。なお、赤は空調以外(照明や事務機器等)のエネルギー消費量です。
 この可視化結果については、「気温(緑)の低下が原因となって空調のスイッチが切られ電力エネルギー(橙)が急落した」という解釈が可能ですが、ビルの構造によっては、「空調の電力エネルギーが効き過ぎて室内気温の低下を招いた」のかもしれません。後者の場合であれば、必要以上に空調エネルギーが消費されたことになります。これはビルごとに異なるものであり、可視化によってユーザー(ビル管理者)が確認して初めて原因と対策がわかるものです。
20180126144559.png 下図は会議室エリア(右下の平面図の赤枠内)に注目したものです。この図でも、室内気温(緑)が下がり、その後、空調の電力エネルギー(橙)が急落しています。ただ、会議室エリアという特性を考えると「会議が終わり空調を止めたので気温が上昇した」と考えられます。もっとも、会議室が使用されていなかったのであれば異常な現象です。このように、エリアの特性と異常現象の有無は関連していることが多く、可視化によりユーザー(ビル管理者)が他のデータ(この例では会議室使用記録)を確認して異常か否かがわかるものもあります。

20180126144617.png 下図は計算機システムエリアの室内気温(緑)と空調エネルギー消費(橙)です。ここでは空調が真夜中まで作動して室内気温を下げるというエリア特性が現れています。

20180126144649.png このように、このソフトウェアでは、
・ビル全体またはエリアごとの長期消費量変化の表示(最上部のパネル)
・局所領域(各エリア)の1日の変化表示(左下のパネル)
・フロアマップ(右下のパネル)
が示され、時間的にも空間的にもマルチスケールな表示から局所的なデータを表示させることが可能であり、こうした可視化手法により、単一スケールの広域表示では見えないことが「見える」システムになっています。
 また、異常現象学習が可能です。これは具体的には、下記のステップからなります。
1. 初期分類結果を示す
2. 各パターンを観察する
3. 異常な日を特定する
4. 機械学習を適用する
5. 分類結果を修正する
 1の初期分類とは、例えば、「始業時や午後始めに空調エネルギーが上がり気温が下がり、終業後に空調エネルギーが急落し気温が上がる」というパターンです。
 2ではこのようなパターンを機械的に抽出します。最上部のパネルに灰色で示されているのがそのようなパターンに該当するものです。一般的にオフィスエリアでは異常な現象ではありませんが、抽出された日とエリアごとにそれが異常か否かを観察します。
20180126144709.png 3~4のステップではユーザー(ビル管理者)が異常な日を特定し機械学習を適用します。例えば、ユーザー(ビル管理者)が下記のパターンを異常パターンとして学習させます。

20180126144735.png 機械学習の結果、発見された異常パターンの例が下記です。

20180126144758.png 5の分類結果の修正では、機械学習の結果が妥当か否かを検討し、これに応じて分類結果を修正します。これにより、異常現象の学習結果を業務上の判断に合致した方向に導くことができます。

【技術・ノウハウの強み(新規性、優位性、有用性)】
 当研究室のノウハウの強みは以下の通りです。
・機械学習を行う際に、人が解釈しながら対話型に設計可能であり、データチューニングが容易となります。ユーザーの目的やレベルに応じユーザーフレンドリーなかたちで機械学習を遂行できます。
・データの可視化を行うことで、異常現象の発見や傾向分析など、ビッグデータの分析が行いやすくなります。
・機械学習から得られた結果について、結果の成否にかかわらず、説明・解釈がしにくいというケースがあります。データの可視化技術を組み合わせることで、機械学習から得られた結果の解釈がしやすくなることが期待できます。また、一般の方や非技術者の方にデータを説明する際に、理解しやすくなる効果が期待できます。
・データの可視化技術と機械学習を組み合わせた研究は、日本国内ではまだ事例が少なく、成長性が高いと考えています。 

 また、前記のエネルギー管理ソフトウェアの可視化技術の利点としては下記のものが挙げられます。
・まず広域・長期間の消費量傾向を眺め、特定の日やエリアを選んで詳しく可視化する、という操作が容易になりました。
・ビルごとに解釈が異なる異常消費状況を、可視化画面を観察しながらの対話的な操作で学習できるようになりました。
・エネルギー消費に関する長期的かつ大規模な分析業務への適用が可能です。
・モバイル機器への発信機能等を開発すれば、管理者だけでなく従業員や住民のエネルギーへの関心を高めることも期待されます。

 以上では、エネルギー消費量管理(ビル管理システム)を例にとって説明しましたが、これは、エネルギー管理に限らず、時間を追って計測されたデータ全般に適用可能な研究です。従って、多様な業界への応用の可能性があります。

【連携企業のイメージ】
 例えば、下記の企業様と連携可能です。
1)ビッグデータの活用・分析のニーズがあり、データの可視化技術と機械学習を組み合わせることに意欲的な企業。
2)機械学習の研究開発を行っており、本研究室によるデータ可視化を組み合わせたソフトウェア・ソリューション開発に意欲的な企業。
3)他、本研究の活用に関心がある企業。

また、ビルのエネルギー管理については、例えば下記の企業と連携可能です。

1)非常に長期間にわたる観察、非常に多くのエリアで構成される大規模な観察、など現場に近い規模の試用実績がないため、このようなデータの収集・蓄積が可能なビル管理会社、不動産業者、デベロッパーや建築会社
 現場のデータがなければ進展できない研究なので、データ提供可能な企業との共同研究などを期待しています。

2)エネルギー管理に限らず、時間を追って計測されたデータ全般に適用可能な研究なので、幅広くいろいろな業界への応用可能性を企業と一緒に探りたいと考えています。

【技術・ノウハウの活用シーン(イメージ)】
 前述のように可視化するデータとしてエネルギー管理以外にも多種多様なものが可能です。具体的には、下記のアプリケーションに取り組み事例があります。
①多次元のデータを含むシステム
 例:原子力発電所のようなプラント(各部の圧力、温度、流速など数百、数千以上の測定機器あり)やそのシミュレーション
 例:気象シミュレーション

②生物化学の実験データ
 例:薬物代謝による各種化合物のデータ分析など製薬分野のデータ
 例:遺伝子情報
 例:タンパク質の表面形状の分析

③社会現象的なデータ
 例:クレジットカードの使用態様(不正使用の検知)
 例:コンピュータネットワークへのアクセス(不正侵入の検知)
 例:イベントなどにおけるSNSデータ(ツイート内容の分析など)

・可視化の手法や態様として様々なものが可能です。
 上記に例として挙げたマルチスケールな可視化はもちろん、ネットワークの可視化や多次元のデータの可視化などに応用可能です。
・可視化のレベルを様々に設計可能
 ユーザーの目的やレベルに応じ最適なレベルでの可視化が可能です。

・可視化の目的を様々に設計可能
 イベントなどにおけるSNSデータの分析では、結果をVRなどのマルチメディアシステム上で提示し、情報としての有用性や親しみやすさを高めることが可能です。

ビッグデータの活用・分析において、データの可視化技術と機械学習を組み合わせることが有効な様々な用途に適用可能です。

【技術・ノウハウの活用の流れ】
 本技術の活用や製品開発に興味がある方はお気軽にお問合せください。

【専門用語】
(BEMS ※Building Energy Management System)
「ベムス」―ビルのオフィスなど居室内の環境とエネルギー消費の最適化を図るためのビル管理システム。基本的には人感センサー、温度・湿度センサー、各種機器のエネルギー消費計測システムを含み、これらを中央監視制御装置で監視・制御します。

この技術・ノウハウに関するお問い合わせ

メールフォームのご利用は、以下の項目にご記入のうえ「送信する」ボタンを押してください。
担当者より折り返しご連絡いたします。
個人情報の取り扱いについては、こちらをご覧ください。


    お名前(漢字表記) 姓 名 
    お名前(ふりがな) 姓 名 
    学校・会社・団体名 (例)株式会社キャンパスクリエイト
    部署名 (例)営業部
    郵便番号
    都道府県
    市区町村番地 (例)調布市調布ヶ丘1-5-1
    建物名 (例)調布ビルディング1階
    お電話番号 (例)042-490-5728
    メールアドレス (例)sample@campuscreate.com
    お問い合わせ内容

    技術・ノウハウを検索する

    掲載記事のお問い合わせ、技術相談など、お気軽にご相談ください。

    メールでのお問い合わせ

    株式会社キャンパスクリエイト
    調布オフィス 担当:須藤 慎

    〒182-8585
    東京都調布市調布ヶ丘1-5-1
    国立大学法人 電気通信大学
    産学官連携センター内[地図