システムリニューアルに伴いログインIDのパスワードを再設定ください。

システムリニューアルに伴いログインIDのパスワードを再設定ください。

立ちはだかる疑似相関の壁と対策

公開日:2023年1月30日

  • 山根宏彰氏(富士通)

テキスト情報を分析することで個人の属性や思想は明らかになる?

ここまでfMRI、ニューラリンクのN1など心を知るための様々なデバイスが登場したことを述べた。もっと身近なツールで、人の内面を知ることはできないだろうか?

TwitterやFacebookなどのSNSデータから個人の属性や思想を丸裸にする技術がある。Kosinskiら(PNAS 2013)はFacebookの「いいね!」を使って、性的指向、民族性、宗教的・政治的見解、性格特性、知能、幸福度、中毒性物質の使用、親離れの有無、年齢、性別など、非常にセンシティブな個人属性を、自動的にかつ正確に予測できることを報告している。得られた成果は驚くべきことであるが、このテキスト情報は、因果ではなく相関関係を扱っていることに注意する必要性がある。

相関関係とは、互いの値に関係はあるが、必ずしも「出来事の起こる順番は関係なく」、「お互いに影響がなく、因果関係があるとは限らない」ことだ。もっと具体的に見てみよう。

警察官の数が多い地域ほど犯罪の発生件数が多い、つまり警察官の数と犯罪の件数の間に相関があるという例がある。この場合に「警察官の数が多いから犯罪が増える」と考えてしまうのが逆の因果関係であり、順番を誤っている例である。

「お互いに影響がなく、因果関係がない例」をみてみよう。「年収が高くなると血圧が高くなる」である。

年齢を...

この記事の続きを読むには定期購読にご登録ください

月額

1,000

円で約

3,000

記事が読み放題!