ある ML チームが、分類モデルの誤りの内訳を分析しています。予測結果を、実際のクラスと予測したクラスの組み合わせ(真陽性・偽陽性・真陰性・偽陰性)の表として整理し、誤りの傾向を把握するために使うものを何と呼びますか。

1 / 1
回答を選択してください
正解C

解説

予測結果を整理する表(混同行列)を選ぶ問題。

  • 1実際のクラスと予測したクラスの組み合わせ真陽性・偽陽性などの 内訳
  • 2表として整理し誤りの傾向を見る表=混同行列
A不正解

ROC 曲線

ROC 曲線は、しきい値を変えながら真陽性率と偽陽性率の関係を描いた曲線です(真陽性率=実際の陽性のうち正しく陽性と判定できた割合、偽陽性率=実際の陰性のうち誤って陽性と判定した割合)。

グラフであり、4 つの組み合わせを集計した表(混同行列)ではないため不正解です。

B不正解

散布図

散布図は、2 つの変数の関係を点で描く一般的な可視化です。

予測と実際のクラスの組み合わせを件数で集計した表ではないため不正解です。

C正解

混同行列

正解。混同行列は、実際のクラスと予測したクラスの組み合わせ(真陽性・偽陽性・真陰性・偽陰性)を表に整理したものです。どこで誤っているかの傾向を把握でき、各指標の計算の基礎になります。

D不正解

相関行列

相関行列は、特徴量どうしの相関係数を並べた表です。

変数間の関係の表であり、予測の正誤の内訳ではないため不正解です。

ポイント

正解の『混同行列(confusion matrix)』を押さえます。
・実際のクラスと予測したクラスの組み合わせ(真陽性・偽陽性・真陰性・偽陰性)を表に整理したもの。
・どこで誤っているかの傾向が分かり、正解率・適合率・再現率などの計算の基礎になる。