分析の幅を確保するため、収集したデータは保持期間を定めず保管する
将来の分析に備えてデータを残すのは一見合理的で、データ保持 自体は運用設計の要素です。
しかし保持期間を定めずに保管し続けると、不要なデータが滞留して 漏えい時の被害範囲が拡大 し、データ最小化 の原則にも反します。安全な管理では用途に応じた保持・削除ルールが要るため不正解です。
ある企業が、AI システムで扱うデータを安全に管理するため、データエンジニアリングの運用ルールを定めようとしています。データを安全に管理するためのベストプラクティスとして、最も適切なものはどれですか。
安全なデータエンジニアリングのベストプラクティスを選ぶ問題。
分析の幅を確保するため、収集したデータは保持期間を定めず保管する
将来の分析に備えてデータを残すのは一見合理的で、データ保持 自体は運用設計の要素です。
しかし保持期間を定めずに保管し続けると、不要なデータが滞留して 漏えい時の被害範囲が拡大 し、データ最小化 の原則にも反します。安全な管理では用途に応じた保持・削除ルールが要るため不正解です。
データ品質の評価・アクセス制御・データ完全性の確保を行う
正解。安全なデータエンジニアリングでは、データ品質の評価、最小権限に基づくアクセス制御、改ざんを防ぐデータ完全性の確保などを行います。これらが信頼できる AI の土台になります。
運用を簡素化するため、データへの権限は全社員に同じ内容で付与する
権限を一律にすると 権限管理の運用は簡素化 され、付与漏れによる業務の停滞も避けられます。
しかし全員が同じ権限を持つと業務に不要なデータにも触れられ、最小権限の原則 に反して漏えい・誤操作のリスクが上がります。安全な管理では役割に応じたアクセス制御が要るため不正解です。
暗号化はクラウド側に任せ、データの分類やラベル付けは省略する
保管時の暗号化をマネージドサービスに任せる構成は実在し、暗号化の運用負荷を下げる 妥当な選択です。
しかし暗号化だけでは不十分で、データの分類やラベル付けを省くと機密度に応じた取り扱いができず、適切なアクセス制御や完全性の管理 が機能しません。安全な管理は分類を前提に成り立つため不正解です。
データエンジニアリングの安全管理は『品質評価(利用前に確認)・アクセス制御(最小権限)・完全性の確保(暗号化・改ざん防止)』の 3 点セットで押さえます。あわせて、機密度に応じた データ分類 と用途に応じた 保持・削除(データ最小化) も土台になります。『保持期間を定めない保管』『全員に一律の権限』『分類の省略』は、効率を理由に原則の一部を崩すパターンで、実務でもやりがちな誤りです。