コレスポンデンス分析とは?ビジネス活用や注意点を解説!

目次

コレスポンデンス分析とは?

コレスポンデンス分析(Correspondence Analysis)とは、多変量解析の手法のひとつで、2種類のカテゴリ変数からなるデータを低次元に縮約することで各カテゴリ間の関係性を分析する手法のことです。特に、2種類の質的変数群からなるクロス集計表を2次元平面上にプロットして可視化することに使用され、各カテゴリ間の類似性などを表すことができます。

相関の最大化を用いて質的変数間の関係を低次元の座標軸で表現する数量化Ⅲ類と同様の手法で、コレスポンデンス分析は、0や1の二値データに限らず集計データも利用することができます。

お気軽にご相談ください!

当サイトの運営会社であるデータアナリティクスラボ株式会社は、データサイエンティストのプロフェッショナルサービスを提供しています。コレスポンデンス分析の実績なども多数ございますのでお気軽にご相談ください。

ご相談・お問い合わせはこちらから

コレスポンデンス分析による利点

質的変数の関係性を解釈可能な形で可視化することができるコレスポンデンス分析には、以下のようなメリットがあります。

メリット➀ 解釈が容易

コレスポンデンス分析の結果は、散布図として表すことができます。各カテゴリ間の距離や散らばり方を見ることで、傾向を目で見て直感的に確認することができます。

メリット➁ 項目数が多くても、分析可能

コレスポンデンス分析が真価を発揮するのは、項目数が大量である場合です。クロス集計表の形では、カテゴリ数が増えれば増えるほどカテゴリ間の比較や結果の解釈が難しくなりますが、コレスポンデンス分析を用いることで、1つのプロット上に情報をまとめられます。

メリット➂ 基礎分析のひとつとして他の分析に利用可能

データ処理の煩雑さが少ないクロス集計表を用いるコレスポンデンス分析は、基礎分析でしばしば利用される相関分析と同様に、変数間の関係を可視化することで、直感的な把握に繋がります。コレスポンデンス分析と、クラスター分析や主成分分析などの他の解析手法と組み合わせてデータの特性を多面的に理解することもできます。

必要なデータ

 コレスポンデンス分析では、分析したいデータをクロス集計表などにまとめて利用します。

 具体的には、ブランドイメージや満足度などに関するアンケートデータがよく用いられます。他にも、下図のような行列の形式に集計して整えることができれば、購買履歴やレビューデータなどにも幅広く利用できると考えられます。

利用するデータの例

コレスポンデンス分析のビジネス活用

ビジネスシーンでの活用方法について、具体例を3つ紹介します。

ブランドのポジションを可視化

コレスポンデンス分析を利用することで、「他社と比較して自社の製品がどのようなポジションにあるか」を直感的に把握することができます。今回はブランドイメージに関する消費者アンケートを分析した結果を紹介します。

まず、各ブランドに対して当てはまると思う選択肢を全て選んでもらう形式のアンケートを実施したところ、以下のような集計結果が得られたとします。

アンケート結果の集計例

項目数が多く、ぱっと見ただけでは各ブランドの比較が難しい状況です。ここで、以下の手順でコレスポンデンス分析を実施します。

STEP
各要素の数値を、総計で割って確率行列を作成し、各行、各列の合計値を計算。
STEP
各行・列の合計確率をかけ合わせて、各要素の確率期待値を算出。
STEP
実際の値と期待値を比較して、標準化残差行列を作成。
STEP
標準化残差行列に対して特異値分解をおこない、左特異行列(行方向の特徴)・特異値行列(成分の重要度)・右特異行列(列方向の特徴)の3つの行列に変換。
STEP
それぞれの行列から、行方向と列方向のスコアをそれぞれ算出。

得られたスコアから2次元分を取り出して散布図にプロットすると、下図のようになります。

コレスポンデンス分析による散布図

赤い点で示されたイメージを表す項目を見ると、横軸は価格や高級感に関する軸で、右側は「高級」かつ「洗練された」ポジショニング、左側は「手ごろ」で「かわいく」「親しみやすい」ポジショニングであり、また、縦軸はデザイン面のポジショニングを表す軸であると解釈できます。その上で、ブランドの位置関係を確認すると、ブランドAは他のブランドと比較して高級で洗練されたポジショニングであり、ブランドCとDは他のブランドと比較してシンプルさやお手頃さという点で似たブランドであると判断できます。

お気軽にご相談ください!

当サイトの運営会社であるデータアナリティクスラボ株式会社は、データサイエンティストのプロフェッショナルサービスを提供しています。コレスポンデンス分析の実績なども多数ございますのでお気軽にご相談ください。

ご相談・お問い合わせはこちらから

その他の活用事例

コレスポンデンス分析には、ブランド比較だけでなく、以下のような活用例もございます。

  • 顧客のセグメンテーション
  • サービス評価

顧客のセグメンテーション

コレスポンデンス分析では、アンケート結果や購買履歴を利用して、よく利用されるサービスや好きなものなどを消費者の属性ごとに集計したデータを用いることもできます。各グループ間の共通点や差異を把握することで、セグメンテーションからターゲティング、ポジショニングといった一連の戦略策定に活用することができます。

自社サービスの評価

顧客からのレビューデータを利用して、商品や実施したキャンペーンなどを行方向に、列方向に評価項目を並べた集計データを分析すると、各サービスでどのような点が顧客に評価されているのか、逆にどの点を訴求できていないのか、サービス間の違いを可視化することができます。新たなサービスの立案や改善点の把握など、ビジネスの方針決定に役立ちます。

お気軽にご相談ください!

当サイトの運営会社であるデータアナリティクスラボ株式会社は、データサイエンティストのプロフェッショナルサービスを提供しています。コレスポンデンス分析の実績なども多数ございますのでお気軽にご相談ください。

ご相談・お問い合わせはこちらから

コレスポンデンス分析の注意点

  • 軸の解釈は自分で加える必要があり、解釈不能な場合もある
  • 次元縮約の結果、こぼれ落ちてしまう情報がある
  • 表頭・表側項目をプロット上で単純比較するのは危険

軸の解釈は自分で加える必要がある

散布図の縦軸・横軸の解釈は、分析者がおこなう必要があります。各項目の位置関係から各軸が示す意味を推測することで、より適切に関係性を把握することができます。しかし、場合によっては合理的な解釈をすることが難しいこともあります。その場合、専門家やステークホルダーと相談しながら追加の分析などをすることで、解釈をより深めていく必要があります。

次元縮約の結果、こぼれ落ちてしまう情報がある

他の次元削減手法などと同様に、コレスポンデンス分析は、元の情報が一部失われてしまうという特徴を持ちます。先ほどの散布図を参照すると、中央寄りの「伝統的な」や「環境にやさしい」といったイメージは、価格やデザイン性といった各軸で解釈した観点とはあまり結び付きません。実際に、「伝統的な」の回答数が多いブランドAとD、および「環境にやさしい」が多いブランドF、H、Iはそれぞれプロット上では遠くに位置しています。これは元データから情報がこぼれ落ちてしまった例と捉えることができます。情報がこぼれ落ちていることを前提に、散布図だけから判断することなく、元の集計表やその他の分析手法を組み合わせて、実状に合った考察をすることが重要です。

情報ロスの例

表頭項目と表側項目をプロット上で単純比較するのは危険

クロス集計表の上側、列見出しの部分を「表頭(ひょうとう)」、左側、行見出しの部分を「表側(ひょうそく)」といいます。コレスポンデンス分析は、表頭項目は表頭項目、表側項目は表側項目でそれぞれの成分のスコアを計算し、その結果を同一平面上もしくは空間上にプロットします。そのため、表頭項目と表側項目のプロット上の距離には数理的な意味はなく、散布図上の表頭項目と表側項目の距離を直接比較すると判断を誤る可能性があります。

先ほどの例では、ブランドAは「洗練された」と最も距離が近く、洗練されたイメージが最も強いと考えがちですが、元の集計表を確認すると「洗練された」が60に対して「高級感がある」という項目が85と、実際には「高級感がある」というイメージの方が支持されていることが分かります。

表頭項目と表側項目の比較例

また、各ブランド同士を階層クラスタリングを用いて分類し、2次元の散布図と対応させて図示してみます。下の散布図では、ブランドEとGは「品質が良い」および「実用的な」に近く、ポジショニングが似たブランドだと判断できますが、クラスタリングの結果を見ると、ブランドGはブランドH,Iと同じクラスターに属しています。このように、次元縮約の影響もあって、散布図上は距離が近くても、全ての表頭項目を用いておこなった階層型クラスタリングとは直感的に異なる結果を示すことがあります。散布図はあくまでイメージを掴むためのものであって、より厳密な分析には適さないとも言えます。

階層クラスタリングとの組み合わせ
あわせて読みたい
クラスター分析とは?わかりやすく解説! データマイニング手法のひとつでもある「クラスター分析」は、ペルソナの分析や競合分析などマーケティングの分野などビジネスの現場で多く活用される分析手法の一つで...

まとめ

今回はコレスポンデンス分析について解説いたしました。

コレスポンデンス分析は、クロス集計表に代表される2つのカテゴリ変数群からなるデータを低次元に縮約することで可視化することができる分析手法です。解釈における注意点はあるものの、ブランド×イメージ、消費者属性×商品カテゴリなど、行列形式で表される多様なデータから各要素の関係性を簡潔に把握することができるので、幅広い業界で活用することができます。

コレスポンデンス分析の特性や注意点を踏まえた、一歩深い分析の役に立てれば幸いです。

研究記事も執筆しています

データアナリティクスラボ
空飛ぶコード – Pythonでドローンを自在に操る! | データアナリティクスラボ IndexはじめにPCからドローンへの通信接続「モノ」とインターネットがつながる仕組み「ドローン」と「IoT」の関係いよいよプログラミングでドローン操作!アプリでの操作プ...
データアナリティクスラボ
日本語LLMにおけるトークナイザーの重要性 | データアナリティクスラボ Indexはじめに日本語LLMについてJapanese StableLM AlphaELYZA-Japanese-Llama-2-7bモデル評価本記事で取り上げるポイントトークナイゼーションとはトークナイゼーションの...
データアナリティクスラボ
Llama2の動かし方 | データアナリティクスラボ Indexはじめに調査の概要調査の目的調査レポートセットアップ手順1. ローカルにダウンロードして使う方法2. HuggingFace経由で使う方法テキスト生成結果の比較まとめ参考...
よかったらシェアしてね!

この記事を書いた人

Data Analytics Magazine 編集部です!
ビジネスとデータサイエンスをつなぐメディアとして、日々情報発信いたします!

目次