

中嶋悟
名前:中嶋 悟(なかじま さとる) ニックネーム:サトルン 年齢:28歳 性別:男性 職業:会社員(IT系メーカー・マーケティング部門) 通勤場所:東京都千代田区・本社オフィス 通勤時間:片道約45分(電車+徒歩) 居住地:東京都杉並区・阿佐ヶ谷の1LDKマンション 出身地:神奈川県横浜市 身長:175cm 血液型:A型 誕生日:1997年5月12日 趣味:比較記事を書くこと、カメラ散歩、ガジェット収集、カフェ巡り、映画鑑賞(特に洋画)、料理(最近はスパイスカレー作りにハマり中) 性格:分析好き・好奇心旺盛・マイペース・几帳面だけど時々おおざっぱ・物事をとことん調べたくなるタイプ 1日(平日)のタイムスケジュール 6:30 起床。まずはコーヒーを淹れながらニュースとSNSチェック 7:00 朝食(自作のオートミールorトースト)、ブログの下書きや記事ネタ整理 8:00 出勤準備 8:30 電車で通勤(この間にポッドキャストやオーディオブックでインプット) 9:15 出社。午前は資料作成やメール返信 12:00 ランチはオフィス近くの定食屋かカフェ 13:00 午後は会議やマーケティング企画立案、データ分析 18:00 退社 19:00 帰宅途中にスーパー寄って買い物 19:30 夕食&YouTubeやNetflixでリラックスタイム 21:00 ブログ執筆や写真編集、次の記事の構成作成 23:00 読書(比較記事のネタ探しも兼ねる) 23:45 就寝準備 24:00 就寝
PR曲線とROC曲線の違いを正しく理解するための基礎知識
データを使って物事を判断する場面では、PR曲線とROC曲線という二つのグラフがよく登場します。両方とも二値分類と呼ばれる“ある条件を満たすかどうかを判定するモデル”の性能を評価する道具ですが、見るポイントが違います。ここでは、中学生にも分かるように、まずはこの二つの曲線の性質と使い分けの基本を押さえます。
機械学習の現場では、データの偏り(あるクラスが非常に多いか少ないか)によって、評価の見方が変わります。PR曲線は「正解のうちどれくらい正しく判断できているか(精度)」と「見逃さず拾い上げられているか(再現率)」を同時に見る曲線です。
一方、ROC曲線は「正しく分類された割合(真陽性率)」と「間違って陽性と判定してしまう割合(偽陽性率)」の組み合わせを並べて比較します。これらはどちらもモデルの閾値を変えたときの挙動を可視化する道具ですが、強みと弱みが異なるため、データの状況に合わせて使い分けることが大切です。
この先の説明で、用語の意味をはっきりさせ、実務での注意点や使い分けのコツを具体的に見ていきます。
まず覚えておきたいのは、PR曲線は「陽性クラスが少ない(データが不均衡)」ときに特に役立つことが多いという点です。なぜなら、陽性の候補を見逃さずに拾い上げる再現率が低いと、全体の精度が高くても現場で困る場面が出てくるからです。
対して、ROC曲線は閾値を変えたときの全体的な性能を広く比較するのに向いています。特に陽性と陰性の割合が大きく変わらない環境では、ROCの下の面積(AUC)が安定して評価の目安になります。
つまり、データの性質と目的に合わせて、どちらを主に見るべきかを選ぶことが、良いモデルを作る第一歩なのです。
「ROC曲線って、実は雑談のネタになるんだよね」
昔、友達とデータの話をしていて、ROC曲線とPR曲線の違いを雑談風に説明したことがあります。私たちは、まず“陽性か陰性か”という二者択一の判断をするとき、どれだけ正しく判定できるかと“間違って陽性と判定してしまう危険性”をどう抑えるかを同時に考えます。
そこで登場するのがROC曲線です。閾値を少しずつ変えると、真陽性率と偽陽性率の二軸が動く様子が見えます。友だちが「この曲線を眺めると、良いモデルは斜めに鋭く上がるんだね」とつぶやく姿を思い出します。
一方、PR曲線は「実際の陽性の部分が少ないときに特に効く」道具です。私たちが宝探しをしているとき、たくさんの“偽の手がかり”が混ざっている状況では、正しい手掛かりを見極める力が問われます。そのときの指針になるのが精度と再現率を同時に描くPR曲線です。
結局のところ、データの性質と目的を考えながら、雑談の中でも「この指標を選べばこう感じ方が変わる」という会話をするのが、データ活用の第一歩です。つまり、ROC曲線とPR曲線は“仲良く使い分ける友達”のような関係。どちらが良いかは、場面と目的次第ということを意識しておくと、授業や研究、実務でも役立つ会話になります。