RMSE
正解。RMSE(二乗平均平方根誤差)は、予測値と実際値の誤差を二乗して平均し平方根をとった指標で、回帰タスクの誤差を評価します。大きな誤差を強く反映します。
ある ML チームが、需要予測(回帰)と不良品判定(分類)で使う評価指標を区別して整理しています。回帰タスク(連続値を予測するモデル)の評価に使われる指標として適切なものを 2 つ選んでください。
回帰タスクの評価指標を 2 つ選ぶ問題。
RMSE
正解。RMSE(二乗平均平方根誤差)は、予測値と実際値の誤差を二乗して平均し平方根をとった指標で、回帰タスクの誤差を評価します。大きな誤差を強く反映します。
MAE
正解。MAE(平均絶対誤差)は、予測値と実際値の誤差の絶対値を平均した指標で、回帰タスクの平均的な誤差を直感的に評価できます。
正解率
正解率(accuracy)は、分類タスクで全予測のうち正しく分類できた割合を測る指標です(例: 不良品判定で 100 件中 95 件を正しく判定できれば正解率 95%)。
連続値の予測誤差は測れないため、回帰の評価指標としては不正解です。
F1 スコア
F1 スコアは、分類タスクで適合率(陽性と予測したうち本当に陽性の割合)と再現率(本当の陽性のうち拾えた割合)の調和平均をとる指標です(例: 不良品の見逃しと過検出のバランスを 1 つの値で評価する)。
連続値の誤差の指標ではないため不正解です。
AUC
AUC(ROC 曲線下面積)は、二値分類で閾値を変えながら陽性・陰性をどれだけ正しく見分けられるかを 0〜1 の面積で表す指標です(例: 良品と不良品をランダムに 1 つずつ選んだとき、不良品により高いスコアを付けられる確率に相当)。
連続値の予測誤差の指標ではないため不正解です。
回帰分析は、金額・温度・需要量などの連続値を予測するタスクです。予測がどれだけ実際値に近いかを『誤差』で評価します。
・RMSE(二乗平均平方根誤差): 誤差を二乗して平均し平方根をとる。大きな誤差を強く反映する。
・MAE(平均絶対誤差): 誤差の絶対値を平均する。平均的なズレを直感的に表す。
・R²(決定係数): モデルがデータの変動をどれだけ説明できるかを 0〜1 で表す。
一方、正解率・F1・AUC はカテゴリを予測する分類タスクの指標で、回帰には使いません。