A正解
データの権利・ライセンスの許諾を確認する
正解。カスタマイズに使うデータについて、著作権やライセンス上その用途で使ってよいかを確認することは、法的リスクを避けるための重要なデータガバナンスの観点です。
ある企業が、基盤モデルを自社用にファインチューニングする準備を進めています。学習に使用するデータについて守るべきデータガバナンスの観点として適切なものを 2 つ選んでください。効率よりも原則を優先します。
カスタマイズ用データで守るべきガバナンスの観点を 2 つ選ぶ問題。
データの権利・ライセンスの許諾を確認する
正解。カスタマイズに使うデータについて、著作権やライセンス上その用途で使ってよいかを確認することは、法的リスクを避けるための重要なデータガバナンスの観点です。
個人情報を適切に保護・匿名化する
正解。カスタマイズに使うデータに個人情報が含まれる場合、保護・匿名化して適切に扱うことは、プライバシーと法令順守のための重要なデータガバナンスの観点です。
データ量を増やすため出所が不明なデータも活用する
出所不明のデータは、権利侵害や品質・バイアスの問題を持ち込むおそれがあります。
出所と権利の確認がガバナンスの基本のため不正解です。
形式を揃えるためメタデータをすべて取り除く
出典・日付などのメタデータは、来歴の追跡や監査に必要な情報です。
削除すると説明責任を果たせなくなるため不正解です。
学習効率のため全データを公開バケットに集約する
公開設定のストレージへの集約は、機密データの漏えいに直結します。
アクセス制御と保護がガバナンスの基本のため不正解です。
基盤モデルのカスタマイズに使うデータでは『データの権利・ライセンスの確認(使用が許可されているか)』『個人情報(プライバシー)の保護・匿名化』が守るべきデータガバナンスの観点です(ほかにデータ品質・出所の管理)。これらで法的リスクとプライバシー侵害を避けます。