A不正解
公平性
公平性は、特定の集団が不当に不利益を被らないようにする特徴です。
本問は有害な出力を防ぐことが論点であり、集団間の公平な扱いではないため不正解です。
ある企業が、一般消費者向けの生成 AI チャットボットを公開するにあたり、危険な助言や有害な内容を出力しないようにすることを最優先で重視しています。この考え方に最も当てはまる責任ある AI の特徴はどれですか。
有害な出力を防ぐ責任ある AI の特徴を選ぶ問題。
公平性
公平性は、特定の集団が不当に不利益を被らないようにする特徴です。
本問は有害な出力を防ぐことが論点であり、集団間の公平な扱いではないため不正解です。
透明性
透明性は、モデルの学習データ・用途・制約などを開示する特徴です。
本問は有害な出力を防ぐことが論点であり、情報の開示ではないため不正解です。
安全性
正解。安全性は、AI が危険・有害な出力を生み出さないようにする責任ある AI の特徴です。ガードレールなどで有害な内容を抑止することが該当します。
堅牢性
堅牢性は、入力のばらつきや攻撃に対して性能を落とさず安定して動作する特徴です。
安全性と混同しやすいのですが、堅牢性の核心は『性能が崩れない』こと、安全性の核心は『有害な出力を生まない』ことです。本問の論点は後者のため不正解です。
『危険・有害な出力を生まない』は安全性 (safety) で、ガードレールなどによる有害コンテンツの抑止が該当します。混同しやすい堅牢性は『入力の変動や攻撃でも性能が崩れない』ことで、守る対象が違います(堅牢性=性能、安全性=出力の害)。公平性(集団間)・透明性(開示)とも区別します。