ある ML チームが、需要予測(回帰)と不良品判定(分類)で使う評価指標を区別して整理しています。回帰タスク(連続値を予測するモデル)の評価に使われる指標として適切なものを 2 つ選んでください。

1 / 1
複数選択してください
正解A, B

解説

回帰タスクの評価指標を 2 つ選ぶ問題。

  • 1回帰タスク(連続値を予測するモデル)の評価連続値予測の 誤差 を測る
  • 2適切なものを 2 つRMSE・MAE が該当
A正解

RMSE

正解。RMSE(二乗平均平方根誤差)は、予測値と実際値の誤差を二乗して平均し平方根をとった指標で、回帰タスクの誤差を評価します。大きな誤差を強く反映します。

B正解

MAE

正解。MAE(平均絶対誤差)は、予測値と実際値の誤差の絶対値を平均した指標で、回帰タスクの平均的な誤差を直感的に評価できます。

C不正解

正解率

正解率(accuracy)は、分類タスクで全予測のうち正しく分類できた割合を測る指標です(例: 不良品判定で 100 件中 95 件を正しく判定できれば正解率 95%)。

連続値の予測誤差は測れないため、回帰の評価指標としては不正解です。

D不正解

F1 スコア

F1 スコアは、分類タスクで適合率(陽性と予測したうち本当に陽性の割合)と再現率(本当の陽性のうち拾えた割合)の調和平均をとる指標です(例: 不良品の見逃しと過検出のバランスを 1 つの値で評価する)。

連続値の誤差の指標ではないため不正解です。

E不正解

AUC

AUC(ROC 曲線下面積)は、二値分類で閾値を変えながら陽性・陰性をどれだけ正しく見分けられるかを 0〜1 の面積で表す指標です(例: 良品と不良品をランダムに 1 つずつ選んだとき、不良品により高いスコアを付けられる確率に相当)。

連続値の予測誤差の指標ではないため不正解です。

ポイント

回帰分析は、金額・温度・需要量などの連続値を予測するタスクです。予測がどれだけ実際値に近いかを『誤差』で評価します。
RMSE(二乗平均平方根誤差): 誤差を二乗して平均し平方根をとる。大きな誤差を強く反映する。
MAE(平均絶対誤差): 誤差の絶対値を平均する。平均的なズレを直感的に表す。
(決定係数): モデルがデータの変動をどれだけ説明できるかを 0〜1 で表す。
一方、正解率・F1・AUC はカテゴリを予測する分類タスクの指標で、回帰には使いません。