スピアマンとピアソンの相関係数の違いをわかりやすく解説！データの性質でどう使い分ける？

この記事を書いた人

中嶋悟

名前：中嶋悟（なかじまさとる）ニックネーム：サトルン年齢：28歳性別：男性職業：会社員（IT系メーカー・マーケティング部門）通勤場所：東京都千代田区・本社オフィス通勤時間：片道約45分（電車＋徒歩）居住地：東京都杉並区・阿佐ヶ谷の1LDKマンション出身地：神奈川県横浜市身長：175cm 血液型：A型誕生日：1997年5月12日趣味：比較記事を書くこと、カメラ散歩、ガジェット収集、カフェ巡り、映画鑑賞（特に洋画）、料理（最近はスパイスカレー作りにハマり中）性格：分析好き・好奇心旺盛・マイペース・几帳面だけど時々おおざっぱ・物事をとことん調べたくなるタイプ 1日（平日）のタイムスケジュール 6:30　起床。まずはコーヒーを淹れながらニュースとSNSチェック 7:00　朝食（自作のオートミールorトースト）、ブログの下書きや記事ネタ整理 8:00　出勤準備 8:30　電車で通勤（この間にポッドキャストやオーディオブックでインプット） 9:15　出社。午前は資料作成やメール返信 12:00　ランチはオフィス近くの定食屋かカフェ 13:00　午後は会議やマーケティング企画立案、データ分析 18:00　退社 19:00　帰宅途中にスーパー寄って買い物 19:30　夕食＆YouTubeやNetflixでリラックスタイム 21:00　ブログ執筆や写真編集、次の記事の構成作成 23:00　読書（比較記事のネタ探しも兼ねる） 23:45　就寝準備 24:00　就寝

スピアマンとピアソンの相関係数の違いを徹底解説

相関係数とは、2つのデータの間にある関係の“強さ”と“方向”を数値で表す道具です。ピアソンの相関係数は直線的な関係を前提として計算され、データが正規分布に近いか、外れ値が少ないかといった条件にも影響を受けます。これに対して、スピアマンの相関係数はデータの値をまず順位に置き換えてから計算するため、直線的でなくても、あるいはデータに外れ値があっても比較的安定して関係の強さを示すことが可能です。要するに、データの分布の形や外れ値の有無、関係の形が異なると、どちらの指標を使うべきかが変わってくるのです。
日常のデータ分析では、まずピアソンで全体の傾向をつかみ、次にスピアマンで「関係の形がどうなっているのか」「外れ値の影響はどうか」を検証するのが実務的な流れです。例えば、試験の得点と満足度のような連続値データ、あるいはアンケートの回答のような序列データなど、さまざまな場面で活躍します。
この解説では、中学生にもわかるように、どんな場合にどちらを使うべきか、値が意味するところ、そしてデータをどう扱えばより正確に判断できるかを、具体的なイメージとともに紹介します。
結局のところ、データの性質を見極める力が重要です。 この力があれば、研究や授業の中で「この関係はどのくらい強いのか」「どんなときに信頼できるのか」を正しく判断できます。

結論から知ろう

結論として、ピアソンの相関係数は線形な関係を前提に強さを測る指標、スピアマンの相関係数は順位を使って非線形な関係や外れ値の影響に対して頑健である、という2つの特徴があります。ピアソンはデータの分布が近似正規分布に従い、2つの変数が直線的に連関する場合に最も解釈がしやすいです。一方、データが順位データだったり、関係がはっきりとした直線ではなく曲線的な形になる場合、スピアマンの方が実態をよく反映します。これを意識せずに分析を進めると、実際には「関係があるのに見落とす」あるいは「関係がないと誤解する」といった結果につながることがあります。

計算の仕組みと使い分けのコツ

ピアソンの相関係数は、2つのデータの共分散を、それぞれの標準偏差で割ることで求めます。つまり、数値データの『変動の程度と方向』を正規分布的な枠組みで捉えます。これに対して、スピアマンは各データの順位をとり、それらの順位に対してピアソンの計算を行います。ここが大きな違いで、スピアマンはデータの分布を直接扱わず、順位という順序だけを使います。よって、データに同じ値が多い場合のties（同点処理）や、データが大きく歪んでいる場合にも影響を受けにくい特徴があります。具体的な使い分けのコツとしては、データが連続変量で直線的な関係を想定できるならピアソン、関係が単調で非線形でも捉えたいときや外れ値が多い場合はスピアマンを選ぶと良いでしょう。分析の精度を高めるためには、両方を計算して比較検討することもおすすめです。

実際の活用シーンと注意点

実務では、成績データやセンサーデータのような連続値データ、あるいはアンケートの回答の順位データなど、さまざまなデータに対して相関を調べます。観察データの場合、因果関係の有無は別問題であることを忘れず、相関の強さだけで因果を断定しないことが重要です。また、データの分布が大きく歪んでいたり、外れ値が多い場合にはピアソンの結果が信頼できないことがあります。その場合はスピアマンの結果も確認し、両者の違いを解釈に取り入れると良いでしょう。最後に、サンプルサイズが極端に小さい場合は両方の統計量の信頼区間が広くなるため、過度な解釈を避けることが大切です。

ピックアップ解説

ある日の放課後、友だちとデータの山を前にして「スピアマンとピアソン、どっちを使えばいいの？」って話になりました。私は先生の話を思い出し、まずはデータの特徴を観察しました。データが等間隔で並んだ連続値なのか、順位に置き換えれば良いのかを見極めるだけで、使う指標がぐっと絞れます。話はさらに続き、私たちは同じデータに対して両方の相関係数を計算してみました。直線にきれいに乗るデータではピアソンがしっかり意味を持ちますが、曲線を描くデータではスピアマンの方が関係をよく表していることに気づきました。結果を共有していると、友達の一人が「データを読む力がつくってこういうことか」と言いました。そのとき私は、数値だけを見るのではなく、データがどんな形をしているのかを想像し、適切な指標を選ぶことの大切さを深く実感したのです。

前の記事： « ウェルチのt検定とマンホイットニー検定の違いを徹底解説｜これだけは押さえる判断基準

次の記事： t検定と一元配置分散分析の違いをわかりやすく解説｜データ分析初心者のための基礎ガイド »