
再現率とは?わかりやすく説明します
まず、再現率(Recall)とは、正しいものをどれだけ漏らさずに見つけられたかを示す指標です。例えば、病気の検査で実際に病気の人の中から、正しく病気だと見つけられた割合です。
たとえば、100人の病気の人がいたとして、そのうち80人を正しく病気と診断できたら、再現率は80%になります。
再現率が高いということは、間違って病気の人を見落としてしまう(偽陰性)ことが少ない状態です。つまり、病気の人を漏らさず見つけたいときに重要です。
この指標は、中学生でも理解しやすいように言うと、「見つけたいものをどれだけちゃんと見つけられたか」の割合と言えます。
適合率とは?違いを押さえよう
次に適合率(Precision)ですが、こちらは「見つけたもののうち、どれだけ正しかったか」を表す指標です。
例えば、先ほどの病気の例で言えば、検査で病気だと判断した人のうち、本当に病気の人がどれだけいるかの割合です。
例えば検査で90人を病気と判断し、そのうち70人が本当に病気だった場合、適合率は約77.8%になります。
適合率が高いことは、間違って健康な人を病気と診断してしまう(偽陽性)が少ないことを意味します。つまり、間違いを減らしたい時に重要な指標です。
適合率は「自分がこれだと判断したものがどれだけ正確だったか」という意味です。
再現率と適合率の違いと関係性を理解しよう
まとめると、
- 再現率は正解をどれだけ拾えたか(漏らさなかったか)
- 適合率は見つけたものの正しさ
という違いがあります。
この2つの指標はトレードオフ(どちらかを上げるともう片方が下がる)関係になりやすいことが特徴です。
例えば、病気を見逃さないために、疑わしい人は全部病気と判断すると再現率は上がりますが、健康な人まで病気と判断してしまうため適合率は下がります。逆に、病気でない人を間違えずに病気と判断しないようにすると適合率は上がりますが、病気の人を見逃して再現率は下がります。
この関係は実際の機械学習や検査の現場でとても重要で、どちらを重視するかは目的によって変わります。
再現率と適合率の数値を比較する表
指標 | 意味 | 例(病気の検査) | 重視するとき |
---|---|---|---|
再現率 | 正しいものをどれだけ見つけられたか | 病気の人のうち、検査で病気と判断された割合 | 見逃しを減らしたい時(例:感染症の早期発見) |
適合率 | 見つけたものがどれだけ正しいか | 病気と診断された人のうち、本当に病気の割合 | 誤診を減らしたい時(例:過剰診断の防止) |
このように、どちらの指標もバランスが大切なので、
目的に応じて使い分けたり、両方の指標を合わせて見ることが多いです。
再現率と適合率の違いを理解して、普段の情報やニュースで聞くテストの評価や機械学習の結果をより正しく判断できるようにしましょう!
適合率という言葉を聞くと「なんだか難しい」と感じるかもしれませんが、実は日常でも似たような考え方を使っています。例えば、友達におすすめのゲームを教えて、「このゲーム面白いよ!」と言ったとき、適合率は「そのゲームが実際に本当に面白かったか」の割合のようなものです。もし友達に10本ゲームを勧めて、7本が面白かったら適合率は70%。これは友達の信頼度にも関わる重要な数字ですね!情報をどれだけ正確に伝えられるかという観点から考えると、適合率の意味がぐっと身近に感じられます。だから、適合率は機械学習だけでなく、生活の中の「正確さ」を測る参考にもなるんですよ。