目次
本記事では、そんな悩みを解決するために、相関係数の基礎知識からExcel(エクセル)での具体的な算出方法、さらには実務で陥りやすい「疑似相関」や「外れ値」の注意点までを専門家が分かりやすく解説します。
相関係数とは?データの「関係性」を数値で読み解く
・気温が上がると、アイスクリームの売上が伸びる
・駅から遠くなるほど、家賃が安くなる
・広告費をかけるほど、新規顧客数が増える
このように、2つのデータの間にある「連動性」のことを「相関(そうかん)」と呼びます。
「相関」と「相関係数」
・相関係数: その関係性の強さを「-1から1までの数字」で具体的に表した指標のこと。
「なんとなく関係がありそう」という曖昧な感覚を、誰が見ても明らかな「数字」に落とし込むのが相関係数の役割です。
3つのパターン:正・負・無相関
1. 正の相関(数値が「1」に近い)
一方が増えるともう一方も増える関係です。以下のような場合に正の相関があると言います。
例: 気温とビールの売上。気温が20℃から30℃に上がれば、売れる杯数も増えていきます。
| 気温:20℃ | ➡ | ビールが50杯売れた |
| 気温:30℃ | ➡ | ビールが100杯売れた |
一方が増えるともう一方は減る、逆転の関係です。以下のような場合に負の相関があると言います。
例: 会議の回数と提案数。会議が週3回から10回に増えると、準備に追われて顧客への提案数が減ってしまうようなケースです。
2つのデータに全く関係がない状態です。
例: 昨日のラッキーアイテムの数と、今日のテストの点数。
| 絶対値 | 強弱の見方 | 実務での解釈 |
|---|---|---|
| 0.8 ~ 1.0 | 強い関連ある | ほぼ確実に連動。 施策の優先度が極めて高い項目。 |
| 0.5 ~ 0.8 | 関連ある | 明確な関係あり。 分析や施策の根拠として活用可能。 |
| 0.3 ~ 0.5 | 弱い関連 | 傾向は見られるが、 他の要因も大きく影響している。 |
| 0.3 未満 | とても弱い関連 | 連動性はほぼなし。 改善による効果は期待しにくい。 |
| 0 | 関連ない | 全くの無関係。 データの組み合わせを再検討。 |
相関の強さは「プラス・マイナス」を無視した絶対値で判断します。
例えば「-0.9」であれば、負の相関ではありますが「強い関連がある」と解釈します。
相関係数を散布図にすると相関が捉えやすい
相関係数は散布図にすることが多いのですが、図にすると下記にようになります。
・相関係数は1に近い
・散布図は右肩上がり
・相関係数は-1に近い
・散布図は右肩下がり
・相関係数は0に近い
・散布図は円など
相関分析
相関分析も例をご紹介します。
例えば顧客への提案数が減ったとき、在宅勤務の日数と会議の数、という2つの変数で見たとします。
注意点(擬似相関など)
相関関係があるからといって、 必ずしも因果関係が認められるわけではありません
アイスの売り上げとビールの売り上げという変数の間に相関係数0.85の正の相関があるとします。
しかし、だからといってビールの売り上げを上げるためにアイスの売り上げを頑張って上げよう、とはならないと思います。
アイスの売り上げとビールの売り上げには相関関係はあっても因果関係はなく、気温という共通の要因からみられた関係と考えられます。
このように因果関係はないが相関関係がみられることを疑似相関といいます。
相関係数
0.85
「外れ値」に注意
例えば、ほとんどの人が「徒歩10分・家賃8万円」前後のデータの中で、1つだけ「徒歩60分・家賃50万円(超豪華な古民家など)」という極端なデータが混ざると、本来は負の相関(遠いほど安い)はずなのに、計算上は正の相関が出てしまうことがあります
対策としては、数で計算する前に必ず「散布図」を作成し、一つだけポツンと離れた異常なデータがないか目視で確認しましょう。散布図とは、縦軸と横軸にそれぞれ別のデータを割り当てて、点を打って作成するグラフです。
明らかな入力ミスや特殊すぎる事例は、分析対象から除外して計算するのが一般的です。
「散布図」の作成方法と外れ値を確認する手順
データの選択
比較したい2つのデータ列(項目名含む)をドラッグして選択します。
| 徒歩(分) | 家賃(万) |
|---|---|
| 10 | 8.5 |
| ...以下データが続く... | |
散布図の挿入
[挿入] タブ > グラフエリアの [散布図(X,Y)の挿入] アイコン > 左上の [散布図] を選択
グラフの目視確認
作成されたグラフを見て、メインの集団から極端に離れた点がないかチェックします。
💡 確認のポイント
この「一箇所だけ離れた点」をそのまま計算に含めると、相関係数の信頼性が著しく低下します。分析前に「本当に正しいデータか?」を確認しましょう。
-
1万円からWebアンケート調査できるサービス内容を確認する
-
初期費用や月額費一切なしコストを抑えてリサーチをする
Excelの関数紹介
身長と体重の例を当てはめるとこのようになります。
| A | B | C | |
|---|---|---|---|
| 1 | 身長(cm) | 体重(kg) | |
| 2 | Aさん | 166 | 59 |
| 3 | Bさん | 169 | 61 |
| 4 | Cさん | 162 | 55 |
| 5 | Dさん | 175 | 62 |
| 6 | Eさん | 178 | 63 |
相関係数の計算の仕方
Aさんの場合、身長166cmから平均の170を引いて-4となります。
このように個々の値から平均を引くことを偏差を求めると言います。
次に計算された偏差を二乗します。
二乗した偏差の合計を偏差の平方和、個々の身長の偏差×体重の偏差の合計を積和と言います。
それぞれの数値を相関係数の計算式に当てはめると以下のようになります。
発展1:複数の相関係数を一括で算出する方法は?
データ分析ツールを有効化する
「データ分析」ツールの有効化手順
「オプション」を開く
エクセルの左上 [ファイル] タブ > 左下 [オプション] を選択
アドイン設定画面へ移動
左メニュー [アドイン] > 下部 [管理] が「Excelアドイン」なのを確認し [設定...] をクリック
「分析ツール」を有効化
[分析ツール] にチェックを入れ [OK] を押す
✨ 完了!
[データ] タブの一番右端に [データ分析] ボタンが表示されます。
相関マトリクスを作成して確認する
この表を見れば、どの変数とどの変数の間に強い相関があるのかが一目でわかります。たとえば、広告費や訪問者数、そして売上の3つのデータがある場合、それぞれの関係性が一覧で提示されます。
ただし、元のデータを変更しても、分析ツールで出力した結果は自動更新されない点に注意が必要です。データが修正された場合は、再度同じ手順で分析ツールを実行し直すようにしてください。
「相関」ツールの実行手順
「相関」を選択
[データ分析] ボタンをクリック > 一覧から [相関] を選んで [OK]
入力範囲とラベルの設定
項目名を含めたデータ全体をドラッグ > [先頭行をラベルとして使用] にチェック
[元のデータ表]
| B | C | |
|---|---|---|
| 1 | 身長(cm) | 体重(kg) |
| 2 | 166 | 59 |
| 3 | 169 | 61 |
| 4 | 162 | 55 |
| 5 | 175 | 62 |
| 6 | 178 | 63 |
[相関ダイアログ]
出力先を指定して完了
[出力先] を選んで任意のセルを指定し [OK] をクリック
出力結果(相関行列)のイメージ
| 身長 | 体重 | |
|---|---|---|
| 身長 | 1 | |
| 体重 | 0.933762 | 1 |
発展2:散布図に近似線を追加して視認性を高める
この直線が右上がりか右下がりかを見るだけで、誰でも簡単にデータの関係性を理解できます。上司や顧客に分析結果を報告する際は、ただ数値を並べるよりも、近似線入りの散布図を見せる方が説得力が増します。
つまり、データを視覚的に加工することは、相手の納得感を引き出すための有効な手段となります。
「近似線(トレンドライン)」を追加する手順
データ系列を右クリック
グラフ上の「点(マーカー)」をどれか一つ右クリックし、メニューから [近似曲線の追加...] を選択します。
「線形近似」を選択
右側に表示される [近似曲線のオプション] から [線形近似] のラジオボタンをオンにします。
[ BEFORE ]
点の集まりのみ
[ AFTER ]
全体の傾向が線で見える!
エクセルで相関係数がうまく出ない時のチェックリスト
選択した範囲のデータの数値がすべて同じ(分散が0)になっていませんか?どちらかのデータに変化がないと相関係数は計算できません。
・相関係数が「0」になる:
数値が「文字列」として認識されている可能性があります。セルの左上に緑の三角マークが出ていないか確認し、数値形式に変換してください。
・範囲の数が合っていない:
CORREL関数の「配列1」と「配列2」のセルの個数が一致していないとエラーになります。
まとめ
・2つの変数が持つ直線的な関係の強さを「-1から1」の範囲で数値化する
・一般的に相関係数の絶対値が0.7以上であれば「強い相関がある」と解釈する
・相関関係と因果関係は異なるため、第三の要因が関与する「擬似相関」に注意する
・ExcelのCORREL関数や散布図を活用し、効率的かつ視覚的にデータを分析する
数値的な指標と視覚的なグラフを組み合わせて、客観的なデータ分析を実務に活かしましょう。
内容をしっかり理解するために、ぜひ本記事と合わせて動画もご覧いただけたら嬉しいです。
相関係数とは?概要から計算方法までわかりやすく説明します!
セルフ型ネットリサーチツール「Suveroid」のご紹介
『アンケートの作成~配信~集計』をご自身で実施することができ、意思決定のためのデータをスピーディーに取得することができます。市場調査や、新商品のニーズの掘り出しを目的とした調査など、定量と定性の両面から調査をご実施いただけますので、ご興味のある方はぜひお問い合わせください。
◆こんな方におすすめ◆
・自社でスピーディーに市場調査を行いたい
・初めて調査を実施するので、設計から結果確認まで一括で完結したい
・定量・定性の両方を低コストで試したい



サーベロイドでリサーチをはじめませんか?



