PayPay銀行では既存の情報系データベースの処理性能不足問題を解決するため、クラウド上に分析データベースを構築し負荷を 分散することを考えた。新たな分析データベースのために選んだのが、Amazon Redshiftとデータインテグレーションツールの Qlik Replicateだった。さらにデータマスキングツールのInsight Data Maskingも併せて採用される。これらを組み合わせた分 析データベースでは、データ同期が自動化され、個人情報のデータをマスキングしても柔軟な分析が迅速に行える環境が完成した。
性能劣化の課題解決のため クラウド上に新たな分析データベースの構築を検討
2000年10月に日本初のインターネット専業銀行として誕生したジャパンネット銀行。2021年4月にはPayPay銀行に改称され、Zホールディングスの各サービスとの連携を強化している。
PayPay銀行の口座数は約550万、預金残高はおよそ1.3兆円、ピーク時には1時間当たり67万あまりの取り引きが行われ、ユーザーの3割がPC、7割がスマートフォンでサービスを利用している。Yahoo!はもちろん、freeeやMoney Forward、JRAやBOAT RACEなど多くの提携先があり、PayPayやLINE Pay、メルペイなどさまざまなスマホ決済とも連携している。また顧客サポートではLINEを使ったAIチャットなども実現し、さまざまな面から顧客満足度向上に取り組んでいる。
多くのサービスと連携しより良いサービスを提供するには、データ活用が欠かせない。そのため「社内においては、データ活用のためのデータ分析基盤が極めて重要となっています」と言うのは、PayPay銀行株式会社 IT本部 開発二部 基盤開発第一グループの安齋將志氏だ。PayPay銀行のデータ活用基盤は、マーケティング用の顧客情報データベースの取り引き情報などを集約するデータベースを、「情報系データベース」としてオンプレミスで構築し運用している。
この情報系データベースは、SolarisベースのサーバーにOracle Databaseの2ノードRAC構成、インメモリデータベース機能も活用し運用されている。しかしながら最近は、業務量、顧客数の増加に伴うデータ量の肥大化などで性能の劣化が課題だった。そのため、一部の分析処理をクラウド上の「分析データベース」に分離し負荷の分散が検討されていた。
実績あるAmazon Redshiftと 使い勝手が良いQlik Replicateを採用
分析データベース構築では、なるべく低コストで移行、構築できるこ性能劣化の課題解決のためクラウド上に新たな分析データベースの構築を検討とが求められた。また、クラウド上には個人情報などをマスクして渡すことで、情報漏洩リスクを回避したいとも考えた。そのためには、データを同期する際に移行漏れやマスク漏れが発生しない仕組みが必要だった。
またオンプレミスの情報系データベースも引き続き運用するため、既存環境への変更は発生させず、負荷もかけないようにしたかった。もちろん新たな分析データベースには、オンプレミスと同等以上の性能も求められた。
これらの条件を満たす環境として、分析データベースのプラットフォームにはAWSの「Amazon Redshift」が選ばれた。また情報系データベースからAmazon Redshiftにデータを同期する仕組みとしては、データインテグレーションツールとして「Qlik Replicate」が採用された。さらに、データマスキングツールとしては、「Insight Data Masking」が選ばれた。
PayPay銀行では既にAWSのサービスを使っていたこともあり、Amazon Redshiftであればそれらと連携が容易で、開発や機能拡張が迅速にできると判断された。その上で、国内での実績が多く、価格も手頃だったことがRedshiftの採用ポイントとなっている。
Qlik Replicateについては、使い勝手が良く設定も容易で価格が安価な点が評価された。PayPay銀行ではこれまで他のデータレプリケーションツールも利用していたが、コマンドラインベースの設定が煩雑で、運用管理にも手間がかかっていた。「Qlik Replicateは、1つの画面で容易に設定、管理ができる点を評価しました」と安齋氏は評価する。また「Qlik Replicateについては以前から市場での良い評判を耳にしており、国内でも実績があり安心感がありました」とも言う。その上でInsight Data Maskingと連携して利用できる点が、重要な採用理由となったのだ。
情報系データベースからのデータ同期も Qlik Replicateで自動化を実現
PayPay銀行では2020年夏頃から分析データベースの検討を始め、9月にはQlik ReplicateとInsight Data Maskingを扱うインサイトテクノロジーのサポートでPoCを実施する。さまざまな検証を実施し2021年2月には構成を決定、その後1ヶ月ほどで本番環境の 設計、構築を完了する。
今回のプロジェクトでは、当初予定よりもPoCでの検証、評価に時間をかけている。それに対応するため、インサイトテクノロジーがQlik Replicateの評価版ライセンスの利用期間を延長するなどで柔軟に対応し、スムーズなPoC検証が実現できたのだ。
2021年3月には、分析データベースへ情報系データベースからデータ同期を開始する。しかしRedshiftでの更新が追いつかず、同期が終了しない問題が発生する。PayPay銀行ではこの課題の解決に当初は苦労したが、インサイトテクノロジーに相談してログ分析 などを実施して遅延の原因を明らかにし、問題を解決して迅速な同期が可能となった。
2021年9月には分析データベースのデータ移行を完了し、試験的な運用期間を経て、2022年2月にユーザーへ環境をオープンする。新たな分析データベースでは、マスキング、データ同期等のトラブルは発生せず、十分な分析処理性能を発揮し安定した運用が 続いている。
Qlik Replicateは、OracleとRedshiftの間でテーブル定義も自動移行可能で「ボタン1つ押すだけで、移行先にテーブル定義を伝搬してくれます。Qlik Replicateは本当に設定、運用が楽です」と安齋氏。Qlik Replicateの画面からどのトランザクションがどれくらい発 生したかなども簡単に見られるようになり、Qlik Replicateのモニタリング機能もかなり便利だと評価する。
従来の情報系データベースは、負荷が高く自由な分析が制限されていた。それに対して、新たな分析データベースは、十分な処理能力がありユーザーはより自由な分析が可能になった。「今回、さらなるデータ活用のための前段階の環境が実現しました。これで負 荷のかかるクエリーを投げても問題がなくなり、ユーザーにはこれを使ってデータから新しい価値をどんどん発見して欲しい」と安齋氏。データ活用を促進することで、さらなる顧客満足度の向上につなげたいとも言う。現状、分析データベースは営業部門、マーケティング部門中心に利用しているが、今後は順次全社規模へと利用を拡大することにもなりそうだ。