O-Lab +Ossan Laboratory+

Ossanの研究所です。

Suicaの情報提供停止記事への違和感と、その記事へのコメントの違和感。

何となく俺の認識とか含めて書いておく。

Suicaのデータ販売中止騒動、個人特定不可なのになぜ問題? ビッグデータの難点 (Business Journal) - Yahoo!ニュース
http://zasshi.news.yahoo.co.jp/article?a=20130823-00010002-bjournal-bus_all


なんか結構ズレてるなぁと。
例えば、ここに書かれてる事例で、

「35歳・男性・公務員」

って、カードIDが無くても、
駅の乗降データと結合させると、かなり人数が絞られてしまう。


例えば、朝の7時前後にA駅で乗ってB駅で降りた
「35歳・男性・公務員」って感じの情報があったとして。
駅によっては、かなり対象人数が絞られると思いませんか?


個人情報を扱った経験のある人ならば、直感的に危機感があると思います。
でも、この記事を書いた人物は何も感じない。


最後の「公務員」という職業が結構クセモノ。
「会社員」ならば、かなりパイがでかくなるので、
個人絞り込みのハードルはかなり上がるだろうけど。
(もちろん、それも駅によりけり。)


「職業」の情報って、結構、絞り込みに役立ってしまいます。


もっとも、提供されるデータに職業情報はないと思いますが。
(定期券購入時でも職業とか書かないよね、多分。。。)

しかし、長期的にひとつのIDのデータを追いかけることはできないようになっているというから、
個人の行動を特定することはできないようだ。


A駅、B駅、C駅、と3つしか駅がない世界で、
100万人が乗降した場合、特定はかなり困難でしょう。


でも、Suicaが使われている範囲って駅が多い。
通勤や通学のためにいつも同じ時間に
ある駅で乗って、ある駅で降りる、という行動を行う人って、
確率的にかなり低く、結果的に絞られて行くような気が。


例として、分かりやすい説明をすると、あなたがよく使う駅で、
ある高校の制服を着た学生さんが同じ時間帯に集中したとして、
その人数は一番多くて、どの程度でしょう?
同じ制服を着た学生さんが同じ時間帯に100人単位で存在しますか?


駅によっては100人単位でなんて、いませんよね?
という事は、年齢と乗降時間でその学生さんは
その精度で絞り込まれる状況にある、という事です。


これは年齢が学生さんでなくても同じです。


もちろん、色々な状況がある。
年寄りが多い街の駅では若者は絞り込まれやすいだろうし、
その逆ももちろんある。


駅の立地によってリスクが高い状況に置かれている
人物が変動すると考えたほうが良い。


駅が多ければ多いほど、組み合わせの数が増えるので、
結果的に特定の駅で乗降を行っている人物が絞られていくはず。


俺の認識、間違ってます?


本当に特定が困難で安全な状況にある人って、
主要ターミナル駅で乗って、主要ターミナル駅で降りる人だけではないかと。


あと認識しておくべきなのは、
「現在の技術で正しく取り扱っている場合は特定は困難に近い。」
というだけだという事でしょうか。
それに加えて、
これらのデータの提供を受けた企業が常に誠実でいつも嘘を付かない企業ならば。
という条件も付いてくる。
だが、それらはSuica利用者には精査出来ないし、将来も問題がないかは分からない。


データ販売先の企業が「あのデータも欲しい」「このデータも欲しい」
と、提供するデータ範囲の拡張を要望したら?
それは利用者に知らされるのでしょうか?そんな事は今は分かりません。


情報提供先企業で想定外の情報漏洩が発生して、
別の場所で想定外の手法によって結合されるかもしれない。
そういうリスクがあります。で、そのリスクに同意した利用者はいたのか?
という話がこの記事では凄い勢いでスルーされてる。

Facebookのコメントへの違和感。

Facebookからのコメントに、

そんなに心配したって貴様等なんぞの個人情報に興味ないだろ(;O;)っていってあげたいなぁ~


というのがあったけども、これが一番危険な認識。


twitterやら何やらで炎上して困った事になった人の大半は、
「俺の個人情報なんて誰も興味持たないっしょおおおおおお!!」
という認識でWeb上に個人情報をせっせとupしていて、
想定外のタイミングで想定外の人物達の手によって、
想定外の情報結合を行われて、個人特定されてしまっているのであって。


個人情報ってのは、いつ、どのタイミングで、
どのような人物に興味を持たれて、どのような形で使用されるのか、
全く分からないのですよ。


あなたが、未来が見えるノストラダムスならば問題ないですが。



あと、他にも、

個人情報について誤解している人が多いことを示す記事,かな。
大学も病院も,この「個人情報について誤解し,無駄に騒ぎ立てる人」には手を焼いている。
お陰で余計な仕事も増えている。
いやぁ,正しい情報,教育って大事ですよねw


う〜ん、この方が関わっている大学も病院も、
もうちょっと個人を絞り込まれる確立の高さと、
その危険性への認識が進むと良いですね。


あまりにお花畑な主張で残念です。


もしくは、この方が関わっている学校の学生さんや病院の患者さんは、
いつも同じ年齢の方々が集団で登下校、通院をされているのでしょうか。
それならば、とてもとても安全だと思います。

どちらにしろ、いずれデータは活用されるべきだが。

個人的にはそれら「ビッグデータ」を使用して、
様々な経済活動に活用される事は賛成の立場だ。


しかしながら、前述のFacebookの各コメントのように
個人が絞り込まれる確立を過小評価している人が多い上に、
「一般人の個人情報なんて価値はない」と勘違いして、
どう取り扱ってもさして問題はない、という認識が、
世間的にも改善されないまま活用されるのは間違いなく危険であると私は考える。


データを取り扱うのは結局は「人間」であり、
情報提供者側、情報利用者側、双方が、
危険性への認識が低い状況で運営されてしまえば、
結果的に各サービスを利用している方々へ
「想定外のリスク」を背負わせる形で跳ね返ってくる。


さて、それらを踏まえて、
Suicaビッグデータに関係している各企業の態度は正しかったのだろうか?
と。


となると、結局重要なのは「情報提供者」の同意だわな。


・企業側が誠実に詳細に活用範囲を説明して、それらに同意をもらう。
・企業は説明した活用範囲から逸脱した利用を絶対に行わない。


この程度の事も省略するようでは。。。