創業150年を迎える大成建設が、デジタルトランスフォーメーション(DX)を加速させている。Microsoft Azure上に「統合データプラットフォーム」を構築し、これまで蓄積してきたデータを一元的に集約・活用することで、生産システムの変革や業務の効率化を目指す。その膨大なデータを蓄積した分析基盤で活用しているのが、インサイトテクノロジーのデータマスキングツール「Insight Data Masking」だ。トレーニングなしでも直感的に操作できるGUIはもちろん、データ利活用時に必須となる複数のシステム間でのデータの関連性・整合性を維持する「キーの再現性」といった機能の充実が導入の決め手となった。
「統合データプラットフォーム」の構築で必要だったのは、複数のシステム間でのデータの関連性・整合性を維持した状態でマスキング処理を瞬時に実施できるツールでした。「Insight Data Masking」は我々のニーズをすべて満たしていました。
社長室 情報企画部 デジタル推進室
関口 拓希氏
日本語の文字コードのサポートやプレビュー機能など、日本のユーザーの「ないと困る」という機能を網羅しています。インサイトテクノロジーのサポートも迅速で安心感があります。
大成情報システム デザイン& ソリューション部 チームリーダー
辻 征氏
建築ライフサイクルに点在するデータを
Azure上の「統合データプラットフォーム」で一元管理
「地図に残る仕事。」をスローガンに、世界最高水準の建設技術で重要インフラや都市の建築施工を担ってきた大成建設。人々が安全で快適に生活できるレジリエントな社会の実現に向け、さらなる飛躍を目指している。
2021年に発表した中期経営計画「TAISEI VISION 2030」ではDXの推進を明記し、建設の提案から設計、工事、施工後のメンテナンスまで、建設ライフサイクルに点在するデータを一元的に集約する「統合データプラットフォーム」の構築を掲げた。部門横断的なデータ活用による生産性の向上や迅速な意思決定、さらにはよりきめ細やかな顧客支援と新たなサービスの創出が目的だ。大成建設 社長室 情報企画部デジタル推進室の関口拓希氏は、「DXを実現するには社内のオンプレミス環境に分散していたデータをクラウド上に集約し、必要なデータをすぐに検索できるデータプラットフォームが不可欠です」と説明する。
現在、建設業界全体が抱えるDXの課題は、データのサイロ化だ。土木部門や建築部門といった部門ごとにデータを管理しているため、部門横断的なデータ連携には時間とコストがかかる。その結果、意思決定の遅延や非効率なワークフローが発生しているのだ。
大成建設の統合データプラットフォームは、「データ管理基盤」と「データ活用基盤」で構成される。「データ管理基盤」では各システムのさまざまな形式のデータを収集・蓄積し、Azure上に構築したストレージに集約・統合、それを業務要件に沿ってデータを加工変換しユーザーに提供する。一方、データ活用基盤ではそうしたデータをユーザーが「SharePoint」や「Microsoft Purview」、「Power BI」などを利用し、用途に応じて参照したり分析したりできる環境を提供する。
大成情報システムのデザイン&ソリューション部でチームリーダーを務める 辻征氏は、「こうしたデータには人事データや経理データ、お客様固有の竣工データなどが包含されています。ですから、データの品質を確保しつつ、効率的に個人情報や機密情報をマスキングしなければなりませんでした」と説明する。
データ同士の関連性を維持した状態で
マスキングする難しさ
データマスキングツールの選択で重視したのは、日本語の文字コードをサポートしたマルチバイト対応であることと、複数テーブル間での参照整合性を維持した状態でマスキング処理を瞬時に実施できること、そしてGUIベースで簡単に設定ができることだ。
オンプレミス環境ではさまざまな型式のデータベース管理システムを利用している。これらのデータを統合データプラットフォームに連携し、システムを横断した分析を可能にするためには、データ同士の関連性を維持した状態でマスキングする必要がある。そのため、異なるシステムであってもデータの関連性・整合性を維持することができる、マスキング結果の再現性は必須だ。仮に一つのテーブルでマスキング結果によるデータの関連性・整合性を維持し再現できたとしても、他のテーブルやシステムと連携した時に関連性が失われれば、手動で設定し直さなければならない。
株式会社大成情報システム デザイン&ソリューション部 チームリーダー 辻 征氏
「こうした点に留意しながらPoC(概念実証)の段階でマスキングツールを比較・検討した結果、われわれの要求する必要な機能がすべて備わっていたのはインサイトテクノロジーの『Insight Data Masking』でした。」(辻氏)
大成建設で統合データプラットフォームのPoCを開始したのは2020年。翌2021年にはオンプレミス環境からAzure上のデータ統合プラットフォームへのデータ連携をはじめ、昨年度の4月から運用を開始した。
統合データプラットフォームは本番、検証、開発の3つの環境で構成されている。開発環境はサンプル用のデータを使用しているが、本番・検証環境ではオンプレミス環境から実際の生データが連携されている。この検証環境ではAzure Data Factoryのパイプラインに、Insight Data Maskingによるマスキング処理が組み込まれており、常にマスキングされたデータを利用できる仕組みになっている。
辻氏は「検証環境は本番環境とほぼ同一のデータですが、統合データプラットフォームの検証環境では保守を担当する外部ベンダーの担当者も頻繁にアクセスします。ですから、この段階でも個人情報に当たるデータはマスキングする必要がありました。」と説明する。
比較・検討した海外の製品の中には、そもそも日本語の文字コードに対応していないツールもあった。またデータの関連性・整合性を持ったキーが他のテーブルでも同様に変換できず、変換処理に時間がかかるものもあった。「その点、Insight Data Maskingは日本語の文字コードにも対応し、データの関連性・整合性を維持したまま本番同等のデータを生成できるので、マスキング処理にかかる作業を大幅に削減できます。また処理時間はPoCの時点で性能要件を満たす評価で、運用後の現在も処理が早いという印象は変わりません。」(関口氏)
大成建設株式会社 社長室 情報企画部 デジタル推進室 関口 拓希氏
痒い所に手が届く、きめ細やかで迅速なサポートと
わかりやすいGUI
もう1つ、関口氏と辻氏がInsight Data Maskingの評価ポイントとして挙げるのが、「プレビュー機能」である。これはGUI上でマスキングのデータ変換の設定をした段階で、マスキング結果のサンプルを事前に確認できる機能だ。
辻氏は「プレビューができなければマスキング後の段階でミスに気がついても手戻りが発生しますから、余計な時間を取られてしまいます。こうしたユーザーの利便性を考慮した機能が充実している点も、Insight Data Maskingの良さだと思います。」と語る。
さらに現場の担当者からは「GUIがわかりやすく直感的に操作できるので、担当者の引き継ぎや人員を増強する際にもほとんどトレーニングする必要がありません。」との声も挙がっている。不明点や要望に対してもインサイトテクノロジー担当者がすぐに対応してくれるので、マスキング作業が滞ることもほとんどないという。
「例えば、CSVファイルの区切りをカンマ(,)からパイプ(|)に変更したいと相談したとき、すぐに対応してもらえました。こうした個社独自の要望に対して柔軟に対応してもらえるのも、海外の製品にはない良さだと思います。」(辻氏)
現在、大成建設ではマスキングプロセスの自動化に挑戦している。データ転送とテーブルに格納する処理は、パイプラインに取り込んで自動化されている。さらに手動で行うマスキング処理自体もInsight Data Maskingが提供するAPIによるコマンド処理で自動化する計画もあるという。
「統合データプラットフォームの構築は、あくまでも通過点です。」と関口氏は語る。最終目標は一般ユーザーが日常業務の中で自発的にデータカタログを活用し、業務の効率化や新たな知見を得ること。そのためにはデータを安全かつ使いやすい形に整える必要がある。その実現には、Insight Date Maskingの下支えが欠かせないものとなっている。