テキスト情報を分析することで個人の属性や思想は明らかになる?
ここまでfMRI、ニューラリンクのN1など心を知るための様々なデバイスが登場したことを述べた。もっと身近なツールで、人の内面を知ることはできないだろうか?
TwitterやFacebookなどのSNSデータから個人の属性や思想を丸裸にする技術がある。Kosinskiら(PNAS 2013)はFacebookの「いいね!」を使って、性的指向、民族性、宗教的・政治的見解、性格特性、知能、幸福度、中毒性物質の使用、親離れの有無、年齢、性別など、非常にセンシティブな個人属性を、自動的にかつ正確に予測できることを報告している。得られた成果は驚くべきことであるが、このテキスト情報は、因果ではなく相関関係を扱っていることに注意する必要性がある。
相関関係とは、互いの値に関係はあるが、必ずしも「出来事の起こる順番は関係なく」、「お互いに影響がなく、因果関係があるとは限らない」ことだ。もっと具体的に見てみよう。
警察官の数が多い地域ほど犯罪の発生件数が多い、つまり警察官の数と犯罪の件数の間に相関があるという例がある。この場合に「警察官の数が多いから犯罪が増える」と考えてしまうのが逆の因果関係であり、順番を誤っている例である。
「お互いに影響がなく、因果関係がない例」をみてみよう。「年収が高くなると血圧が高くなる」である。
年齢を...