ルイス・フォン・アン 「ネットを使った大規模共同作業」
(クリックすると公式サイトで動画を視聴できます)あなたはインターネットでチケット購入などをする際に、ぐにゃっと歪んだ文字を入力したことがありますか? じつは、この文字入力が世界の書物の電子化に貢献しているんです。
歪んだ文字を読み取らせることで人間かどうかを識別し、自動化プログラムやボットによる不正を防ぐ。それと同時に、光学文字認識では読みとれなかった古書の文字を、人力で入力する。一見、意味のない単純作業を、人類に役立つ事業に転換したのが「reCAPTCHA」というプロジェクトです。
このすばらしいシステムを考案したのが、コンピュータサイエンスの研究者、ルイス・フォン・アンさん。ルイスさんはほかにも、2人のユーザーに同じ画像を見せ、連想する言葉が一致するかどうかを競う「ESPゲーム」を開発したことでも知られています。このゲームでは、多く集まった回答例をタグ付けすることで、画像検索の精度を向上させる仕組みも構築されているのです。ひとりの小さな行為を、100万人規模で集めることにより、大きなことを達成する。そんな斬新なアイデアで世界規模のプロジェクトを次々と生みだしていくルイスさんの思考に、茂木健一郎さんがせまります。
コンピュータが好きで、じっとしていられない子ども
茂木健一郎(以下、茂木) ルイスさん、お会いできてとても光栄です。
僕は「reCAPTCHA」を、人間とコンピュータのすばらしい共生だと考えています。コンピュータと人間を正確に識別するテストを行ってスパムを防止する「CAPTCHA」の時点ですばらしい発明だったのに、さらにそのテストでの文字入力をクラウドソーシングで書籍の電子化に活かすとは! 「reCAPTCHA」では、日々1億語を超える語句が解読されているそうですね。これは本当にユニークなアプローチだと思います。
ルイス・フォン・アン(以下、ルイス) ありがとうございます。
茂木 いったいどのようにして、このような着想を得たのでしょうか?
ルイス うーん、具体的にどうやって思いついたかは説明できません。でも、思いついたときの状況ならお伝えできます。私はワシントンD.C.から大学のあるピッツバーグまで、長距離運転をしていました。ものすごく退屈だったんです。そこで、「CAPTCHA」の膨大なユーザーのことを考えはじめました。そのとき「CAPTCHA」では毎日2億回も入力が行われていたんです。入力には毎回10秒ほどの時間がかかる。つまり人類全体として、毎日50万時間もこのイライラする文字入力に費やしていたわけです(笑)。
茂木 イライラするってわかってたんですね(笑)。
ルイス さすがに申し訳ない気持ちになりましたよ(笑)。だから、ただ文字を入力するのではなく、その労力をなにか意義あることに活かせないかと考えはじめたんです。それから数カ月後、書籍を電子化するという発想にいたりました。書籍の電子化は、一度デジタル画像としてスキャンしたページを、光学文字認識(OCR)で読みとるという手順を踏んでいます。でもOCRは完璧ではなく、かすれた文字や古くて紙が変質した本の文字は読みとれない。それを、人間の力で入力しているのが「reCAPTCHA」です。
茂木 いやあ、すばらしい。あなたはこの認証システムで、数えきれないくらいのユーザーを、彼らの知らない間に意義あるプロジェクトに参加させている。こんなことに成功したのは、もしかしたらあなたのプロジェクトが初めてなのではないでしょうか。
ルイス 私が知るかぎりではそうですね。でも、そもそも私達は目的を隠しているわけではないんですよ。「reCAPTCHA」の入力欄の近くには“learn more(もっと知る)”というリンクがあるんですけど、ほとんどの人がクリックしないだけです(笑)。「reCAPTCHA」の役割を知った人は、とても喜んでくれますよ。
茂木 あなたは中央アメリカのグアテマラ生まれですよね。小さな頃はどんな子どもでしたか? コンピュータは昔から使っていましたか?
ルイス 8歳からコンピュータに親しんでいました。
茂木 つまり「オタク」だったわけですね。
ルイス まあ、オタクでしたね。でもそれが一番の特徴だったかといわれたら、そうではない気がします。