中国語のソーシャルメディアのビッグデータを分析した結果、中国政府は団体行動を監視し検閲していることがわかったそうです。
中国政府は人手で検閲しています。一つ一つの投稿を読んで、削除するかどうかを決めています。数十万人という大人数で行っているとはいえ、人手で検閲しているため、時間がかかります。削除される前のデータをダウンロードして分析したそうです。
その結果わかったことが、人を扇動したり、抗議行動に駆り立てたり、他人をコントロールしようとする発言が削除されているということです。政府に感謝するために集まろうという呼びかけも削除されるそうです。
非常に興味深い結果だと思います。政治体制や政府に対する批判、1989年の天安門の事件だけでなく、集まろうという呼びかけが消されているということです。人が集まり、だんだん大きくなり、政治運動にまで発展することを怖れているようです。
このように、ビッグデータでは予想外のことがわかります。よく知られている例として、おむつとビールの例があります。子供のいる家庭では、母親はかさばる紙おむつを買うように父親に頼み、父親はついでに缶ビールを買うことが多いというものです。この2つを並べて置いたところ売上が上昇したということで知られています。
JR東日本がSuicaのビッグデータを売ろうとして失敗しました。利用者の反発を買ってしまいました。しかし、Suicaのデータからおもしろいことがわかるかもしれません。
全国でSuicaが使えるようになり、Suicaを持っている人も増えました。お土産をSuicaで買う人も多いと思います。
すると、どのお土産は、どこの地域の人がよく買うということがわかるかもしれません。どこの地域の人かは、よく乗り物に乗る区間でわかります。
いままで、販売していない地域であれば、新たな出店を考えるべきかもしれません。地元でも買えるとなるとお土産に買う人は減るかもしれませんが、全体の売上は伸びるはずです。
統計分析を行えば、ビッグデータによる分析は不要だという意見を聞いたことがありますが、それは間違いです。上記の例でいえば、住んでいる地域を示すデータとお土産を買ったというデータが結びついていることからくだせる判断です。
統計分析では、お土産の売り上げと住んでいると思われる地域の相関関係しかわかりません。ビッグデータの良いところは、個別のデータ間の結びつきがわかるので、単なる相関係数以上のことがわかります。
ビッグデータ分析は、思いもよらない新発見をもたらすものです。