技術解説

IoTにおけるデータ活用に最適な
時系列データベースと「Riak TS」の紹介

時系列データベースとは

近年の情報技術やハードウェアの進歩により、様々な分野でデータを活用した業務革新が促進されています。その中でも Internet of Things(IoT) の活用が一際注目を集めていますが、IoT デバイスのデータの大半はタイムスタンプが付帯されています。

このタイムスタンプ付のデータの活用例を気象情報にあてはめてみてください。データは利用目的によって、見たいデータが直近のものもあれば、長期間連続して蓄積されたものもあると思います。例えば、現在の天気を知りたい場合はその時点での天候状態が分かれば目的を達成することができます。一方、海外旅行をすることを考えた時には、月単位の年間降水量や気温などの気象データを参照して訪問地を決めることもあるかもしれません。このようなデータは連続的に収集・蓄積した過去のデータを集計した統計データです。これまで曖昧だった情報を時系列に数値化することで、事の傾向を正確に把握でき行動に移す動機となります。

 

天気過去データ

 

 

IoT によるイノベーションもこの例に類似しています。IoT におけるデータ活用の本質は迅速な意思決定を行うためのリアルタイムの利用性にあると考えられます。デバイスデータは書き込みが多く発生し、長期に渡って更新が不要で不変的なものが多く占めています。

 

時系列データベースは時間レンジを指定した問い合わせを高速に処理するよう最適化されたデータベースであり、多くの製品で NoSQL データベースエンジンが採用されています。あらゆるアナログデータをデジタル化する潮流の中で、無尽蔵に増え続けるデータを蓄積し、一定のタイムスパンでアクセスするワークロードをアプリケーションに実装する場合、時系列データベースは良い選択肢となることでしょう。

 

時系列データベース

 

 

NoSQL データベースのメリット、デメリット

時系列データの蓄積に NoSQL データベースを適用するメリットは以下となります。

 

  • DB エンジンがシンプル
  • 大半の NoSQL データベースは RDBMS が提供するトランザクションメカニズムがない代わりに、よりシンプルにデータの不整合を解決するメカニズムを備えています。また、ロックがないことで高い性能が期待できます。
  • データ構造がシンプル
  • 半構造化データや非正規化データを柔軟に扱うことができます。
  • スケーラブル
  • 構造がシンプルなため、スケールしやすく性能を予測できます。

 

しかし、NoSQL データベースは性能やスケーラビリティを重視する点から RDBMS がもつ多彩な機能をカバーしていません。利点のトレードオフに下記のデメリットがあります。

 

  • クエリーオプティマイザー機能がない
  • リッチなSQL クエリー言語をサポートしておらず、クエリーオプティマイザーによって高度に抽象化する機能がありません。
  • アプリケーションコードが複雑
  • クエリーの最適化手法をアプリケーション開発者が自ら考え、コードに実装する技術が必要になります。

 

 

時系列/位置データのレンジ処理用に最適な「Riak TS」

「Riak TS」 は時系列データに最適化された、商用システムに耐えうる唯一の NoSQL 時系列データベースです。「Riak TS」 を使うことにより堅牢でスケーラブルなストレージ基盤を構築できます。また、操作の容易性から学習コストや運用コストを低く抑えられるためすぐに利用を開始できます。

Basho 社では 「Riak TS」を Apache Spark のストレージシステムとしてインテグレーションできるよう、Apache Spark コネクターをオープンソースで提供しています。

 

「Riak TS」 は以下のユースケースで利用できます。

  • IoT/センサー/デバイスのデータ
  • メトリック/ログ分析用データ
  • 端末分析用データ
  • タイムスタンプ付きのデータフィード...金融、経済、科学などの分野

 

 

詳細は下記のリンクをご参照ください。

●弊社製品情報ページ

http://cn.teldevice.co.jp/product/detail/riak_ts

●Basho 社ホームページ

http://jp.basho.com/products/riak-ts

 

 

「Riak TS」の特徴

「Riak TS」 は多数の商用実績をもつ分散データベース 「Riak KV」 を基に開発されています。「Riak KV」 のコアテクノロジーを継承しつつ、タイムスパン毎にデータを連続的に同一ノードに格納するデータコロケーションの仕組みにより、時系列データに高速にアクセスすることができます。

また、マルチクラスターレプリケーションをサポートしているため、クリティカルなデータを遠隔サイトに複製して、より可用性の高いシステムを構築することができます。

 

「Riak TS」 の特徴

 

 

「Riak TS」 の特徴は下記の通りです。

  • 障害回復力
  • 拡張容易性
  • シンプルな運用
  • データコロケーション
  • SQLコマンドのサポートとレンジクエリーの対応
  • 高速な集計用バックエンド
  • データ削除のスケジューリング (DATA EXPIRY)
  • Apache Spark との連携による統合運用分析 (APACHE SPARK CONNECTOR)
  • 多種のクライアントライブラリを標準で提供
  • マルチクラスターレプリケーション
  • APACHE MESOS フレームワークによる分析基盤の統合

 

まとめ

「Riak TS」 はオープンソースで提供されています。何がいいのか、どこにメリットがあるのか、また、自社のサービスに組み込めるのかなど採用に悩まれているお客様は、是非一度、製品を触ってみることをお勧めします。

東京エレクトロン デバイスでは、お客様の製品評価のお手伝いをするために、
社内に PoC 環境を用意しています。ご興味をお持ちのお客様は、是非お気軽にお声がけください。

掲載製品の特長・仕様はこちらから