卒業率が大きく向上
キング牧師生誕の地から1キロ余り、米アトランタのジョージア州立大学構内で会った4年生アミラ・シェーク(21)はスピーチコミュニケーション専攻の学生らしく、よく通る声で語った。「予定通り5月に卒業の見通しです」
エチオピア難民を両親に持つシェークは約2年前、州内の別の公立大学から編入した。吃音症を長年患う父の苦労を見て、「スピーチセラピーのクリニックを地元アトランタやエチオピアで開きたい」と夢を膨らませたためだ。
とはいえ以前の専攻は生物学と、全くの畑違い。万が一の留年を避けるには──。そんな不安を吹き飛ばすように、編入するや「アドバイザー」が事細かに助言してきた。「難しい講義ばかり取っていたら、やさしい講義も組み合わせるよう勧めてきた。最初は戸惑ったけど、卒業計画も練ってくれて安心できた」。シェークは晴れやかな表情だ。
この大学には今、全米や国外の大学からの視察が絶えない。ビッグデータによる予測分析で、2003年に32%だった卒業率を17年、54%へと伸ばしたためだ。特にアフリカ系やヒスパニック、低所得者層の向上が著しいという。
大学の過去10年の学生について、成績や履修状況、入学時の記録など約14万件をコンピューターにかけ、中退または落第の予兆となる800以上の「リスク要因」をはじき出した。該当した学生が出れば、学内に150人以上いるアドバイザーがパソコンなどで警告を受け取り、48時間以内に学生に連絡をとって相談に乗る。これまでに20万回以上、「出動」したという。
アフリカ系やヒスパニックが多い同州は、米国勢調査局によると貧困率が16%と全米平均を上回る。同州のSAT(大学進学適性試験)の平均点は州別で、全米でも最低水準だという。データ活用に至ったのは、各学生に助言者を雇う予算などなかったためでもある。
「使うのはどの大学にもあるデータだけ。人種・民族や世帯収入、図書館にいつ行ったといったプライバシーに立ち入るデータは予測には用いていない」と副学長のティモシー・レニック(58)は強調する。データ追跡を拒んだ学生は過去に2人ほどいたが、多くは「他の学生に知られるならともかく、大学が把握する分には気にしない」(女子学生)といった反応だ。
将来、学生の選別に使われる懸念はないだろうか。レニックは「政府でも企業でも悪用リスクはつきまとう。でも、もはや紙と鉛筆の世界には戻れない。学生サポートという良い目的のため、データ保護に最善を尽くしていく」と語った。
ネトフリに集まる大量の視聴データ
データ活用は日々の暮らしのあらゆる場面に組み込まれている。フェイスブックを開けば、学歴や職歴などのデータに基づき「知り合いかも」と他のユーザーを示す画面が現れ、アマゾンでは注文履歴に応じて「おすすめニューリリース」などの商品が並ぶ。交通データに基づく都市計画は自治体などで進み、東日本大震災の避難や混乱などのデータを防災に生かす取り組みも注目された。
DVD郵送レンタルから始まった米動画配信大手ネットフリックスは、今や大予算のオリジナル作品も製作・配信、世界で約1億1758万人の会員を擁する。原動力の一つが視聴データだ。
「何を見たかだけでなく、時間をかけて見たか5分でやめたか、未来の話か歴史物か、そうしたデータも『マシンラーニング』にかけてオススメを示している。作品をより多く見てもらうほど精度は上がる」と同社の製品担当統括責任者、トッド・イェリンは言う。活用データはあくまで作品視聴に関わるものだという。「以前は会員の性別や年齢も参照していたが、8年ほど前にやめた。不健全だし、意味もないとわかったためだ」
一方、こうしたデータ活用が広がるにつれリスクが膨らむ可能性も出ている。
米国は司法の場でもビッグデータの活用が進む。被告の学歴や家庭環境、犯罪歴などをもとに再犯の危険性を予測する「COMPAS」で、複数の州が判決や更生プログラムの決定に利用している。米調査報道メディア「プロパブリカ」は、黒人の被告に再犯リスクが高く出る傾向が出ている、と警鐘を鳴らしている。
スノーデンが理事長を務める「報道の自由財団」(米サンフランシスコ)の共同創設者で弁護士のトレバー・ティム(33)は指摘する。「データに基づくサービスは社会に根づき、多くはそれなしでは暮らせない状況になっている。でも大統領がオバマからトランプに代わったように、活用側のトップが今とは全く違う考え方の人物になればどうなるか。最悪の事態に備えた制度やシステム構築は必要だ」(藤えりか)
AI時代、プライバシーはなくなるのか。
私的空間や個人的な情報をどう守るか、という「伝統的」なプライバシーの課題の一方で、デジタルの世界では、プライバシーについての考え方そのものも変わってきている。
スマホからは、ネットの閲覧履歴や購買履歴、位置情報といった様々なデータが取り出せる。こうしたデータは、より便利なサービスを生む原動力。AIが進化してスマホの音声検索や自動翻訳といった機能が使いやすくなるのは、多くの人がデータを送り込んでいるからだ。
また、フェイスブックやツイッター、インスタグラムといったSNSでは、あえて自分の情報を公開したり、友人と共有したりしている人もいるだろう。こうしてネットの世界には、結果として大量のプライバシーの「かけら」が流れ込んでいる。
こうした情報の断片も、集めて分析すれば人の好みや行動を推測できる。「プロファイリング」という技術だ。
コンピューターの性能向上でビッグデータと呼ばれる大量のデータを分析できるようになり、「Aを買う人には、Bも買う人が多い」といった様々な行動パターンが見つかってきた。
これらを組み合わせると、プロファイリングによって「あなたはこんな人物」と評価・分類できる。それを生かしているのが、買い物サイトに出てくる「あなたへのオススメ」広告だ。情報があればあるほど、推測の精度は上がる。
プライバシーの権利は「自分の情報をコントロールする権利」とも言われる。人にはいろんな「顔」がある。家での顔、会社での顔が違うことは珍しくない。それでも「どの顔をどこで見せるかは、自分で決める権利がある」という考え方だ。では、AIがあなたの「顔」を勝手に決め、みんなが見るようになったらどうすればいいだろう。
プライバシーを守りたいからといって「かけら」の流通を完全に止めるのはもはや不可能に近い。経済活動にも影響を与える可能性があり、どこまでが守るべきプライバシーかの線引きも難しい。そんな時代にどう向き合うかが、新しい課題だ。
(文中敬称略)