海外のメディアサイトを眺めていたら、「175 Zettabytes By 2025」なんてタイトルが目に飛び込んできました。どうも、世界中のデータ量は、2025年には、175ZBになるならしいのです。でも「ゼタバイト」なんて単位聞いたことありませんよね?
容量単位は、以下のように表されます。
量単位 | 読み方 | バイト数 |
KB | キロバイト | 1,000 |
MB | メガバイト | 1,000,000 |
GB | ギガバイト | 1,000,000,000 |
TB | テラバイト | 1,000,000,000,000 |
PB | ペタバイト | 1,000,000,000,000,000 |
EB | エクサバイト | 1,000,000,000,000,000,000 |
ZB | ゼタバイト | 1,000,000,000,000,000,000,000 |
YB | ヨタバイト | 1,000,000,000,000,000,000,000,000 |
ゼタバイトって0(ゼロ)が21個も並んでます。
「テラデータ」という会社もありますし、オラクル社の「エクサデータ」なんてサーバーもあります。これらの名称を採用したときには、遙か先のことでとてつもないデータ量を表すためにこんな名称を付けたのだろうと思いますが、もう超えてしまっていますね。(ヨタバイトは、日本人的には、ちょっと頼りない感じで採用されない気がしますが・・・)
なぜこんなにデータが増えているのでしょうか?
その大きな割合を占めるのがIoTデータです。
家電やスマートスピーカーといったIoTが実生活に浸透してきましたがもっとも身近に感じられるのは、自動車かもしれません。生成されるデータとしては、自動運転する場合1日で1台あたり、4TBにもなると言われています。自動運転を実現させるためには、これくらいは必要となるようです。日本国内に限っても自動車保有台数は、8000万台超です。一年間の日本国内の自動車が全て稼働していると仮定すると
4TB/日×8000万台×365日=117 ZB
になりますから調査会社の2025年に175ZBなんて数値も自動運転が実現されたら軽く上回ってしまいそうです。
私は、2000年くらいに某銀行のOracleデータベースの移行を実施したことがありますが、当時データベースの容量が30GBくらいでしたが遠隔地(10Mbps)のスナップショットレプリケーションが完了するまで含めて2晩徹夜しました。現在では、こんな容量は、スマホで持ち歩いています。データ量の爆発的な増加もありますがそれに対応した5Gなどネットワーク回線の高速化も必須ですね。
インサイトテクノロジーでは、Insight Asir(インサイトアシリ)という機械学習を使用したサービスを自社開発し、展開しています。ちなみにAsirとは、アイヌ語で「新しい」を意味しており、弊社の北海道の札幌R&Dセンターで開発された新しいサービスということで命名しました。
Insight Asirのサービスの1つにAnomaly Detector(時系列異常検知)というモジュールがあり、まさにIoTセンサーデータのような大量のデータをリアルタイムに多変量分析するというサービスに使用することが出来ます(多変量分析は、1つの時系列データだけでなく複数の時系列データの相関関係を見て分析を行います)。インサイトテクノロジーは、データベースの会社というイメージが強いかもしれませんが大量に生成されるデータをリアルタイムに捉えて「Insight」を得ることも行っています。
実際に某自動車会社様のPoCでは、人間では、気付くことが難しい変化を捉えることが出来ました。これからは、大量のデータをリアルタイムに上手く活用することが必要になります。我々は、この分野でもお役に立てればと思っています。
もし、興味を持って頂いたら是非お問い合わせくださいませ!