混同しやすい混同行列

カテゴリ: misc.

よく忘れる/間違えるのでメモ。

混同行列 (confusion matrix)

データの分類で、うまくできた・できなかった回数を数えた表。
たとえば入力データから異常を発見してアラートを出したいとかいう時には、
この表の行や列はそれぞれ添え書きのような意味合いを持つ。

判定結果
+
真のクラス + True Positive False Negative ☜ アラートが出るべきもの
False Positive True Negative ☜ アラートが出てはいけないもの
☝ アラートを出した ☝ アラートを
出さなかった

種々の指標

分類性能のさまざまな評価指標を混同行列を見ながら見ていく。

正解率 (Accuracy) = (TP+TN)/(TP+FP+FN+TN)

データを正しく分類できた割合。

判定結果
+
真のクラス + True Positive False Negative
False Positive True Negative

不正解率 (Error rate) = 1 – Accuracy = (FP+FN)/(TP+FP+FN+TN)

データを正しく分類できなかった割合。

判定結果
+
真のクラス + True Positive False Negative
False Positive True Negative

適合率/精度 (Precision) = TP/(TP+FP)

見つけたもののうち、それが本当に欲しいものである割合。

判定結果
+
真のクラス + True Positive False Negative
False Positive True Negative

感度 (Sensitivity) = 真陽性率 (True positive rate) = 検出率 (Recall) = TP/(TP+FN)

見つけるべきもののうち、正しく見つけることができた割合。

判定結果
+
真のクラス + True Positive False Negative
False Positive True Negative

特異度 (Specificity) = 真陰性率 (True negative rate) = TN/(TN+FP)

アラートしてはいけないもののうち、きちんと黙っていられた割合。

判定結果
+
真のクラス + True Positive False Negative
False Positive True Negative

偽陽性率 (False positive rate) = FP/(TN+FP)

アラートしてはいけないもののうち、アラートを出してしまったものの割合。

判定結果
+
真のクラス + True Positive False Negative
False Positive True Negative

偽陰性率 (False negative rate) = FN/(TP+FN)

アラートすべきもののうち、アラートできなかったものの割合。

判定結果
+
真のクラス + True Positive False Negative
False Positive True Negative

参考文献

P.N. Tan, et al. “Introduction to Data Mining

2013/6/28 (金)