2015/06/29

ルイス・フォン・アーンのCAPTCHAプロジェクトと、クラウドソーシングの本当の可能性


ルイスフォンアーンのCAPTCHAプロジェクトの話って、あまり知られてないのかな。


この間、打ち合わせしてた時に話の流れでCAPTCHAの話をしたんだけど「へえー」って感心されて、それがちょっと意外だった(はいはい、何か聞いたことありますー的なリアクションを想像してた)のと、あのプロジェクトの「仕組みの美しさ」を自分用の備忘録として書きます。


◆CAPTCHAってなに?
ここで詳細を書くよりも、wikipediaのページを読んだほうがわかりやすいし詳しいのでこちらを。
https://ja.m.wikipedia.org/wiki/CAPTCHA


アレです、ネット上で何かの登録するために申込フォームに入力してると、一番最後に文字が「ぐにゃーっ」と曲がったのが出てきて、この文字を入力して下さい。ってでるやつ。


それを打ち込む事で「私はロボットでできたスパムでは無いですよ」って事を認証するあの仕組みです。

これを作ったのが、当時カーネギーメロン大学にいたルイス・フォン・アーン達なんですけど、あれって

<課題>
・ネット上のスパム行為(ロボットで巡回して自動でメール送ったり)をどうにかしたいなー

<解決アプローチ>
・ロボットじゃ無理だけど生身の人間なら誰でもできるプロセスって何かないかな
・勿論、その場で完結できる方法(ハガキを送って返送、とかじゃダメ×)
・仕組みがバレても易々とプログラムで突破されて無力化しないもの

となって、
<この時点での結論>
・人ってちょっと汚く書かれた文字を画像で出されて「これって何て読む?」って聞かれても楽勝で読めるよね。だけどプログラムだと無理だよね。よしこの方法でいこう。

\         /
「CAPTCHA誕生」
/         \


んで、この仕組みは一般的に普及したんだけど、多分大半の人がこの仕組みを見た時「手続き上必要なのはわかるけどさあ、入力めんどくせえなあ、文字も読みづらいし」って思った気がすんの。


俺は思った。たまに読みづらすぎて入力ミスるし。


実は同じ事をルイス・フォン・アーンも思っていた、というかこの仕組みのせいで
「画像の文字読んで入力するっていう”新しい手間”をこの世に産んじゃったなー」と思ったらしい。


◆「手続き上しょうがない手間」じゃなくて「活用するリソースにしちゃおうぜ」

彼は、この「ちょっと崩れた文字でもだいたい読める」という当たり前の事象を「なにかに活かせないかな」と考えた。
当たり前の事象を凄いやつが捉えると、世の中にある課題にとって「とても素晴らしい解き方」になる。


<解決アプローチ>
・入力フォームに生身の人が文字を入力するたびに「この読みづらい文字はこう読むんだよ」のデータが収集できる

<世の中にある課題>
・なんか、読みづらい文字だけどその読み方がわかると世の中にとって「いいもの」ってなんかあるっけ

・あ、世界中の図書館にさ、電子データにして後年に残すべき文献って腐るほどあるよね

・でもさー全部をアルバイトさん雇ってデータ入力の仕事にしたら、膨大な時間がかかるしお金もかかるよねえ



「(あっ!)ピコーーン!」


◆古い文献を画像データにして、それを「この文字何て読む?」って世界中の登録フォームに入力してもらったら、有効な電子データがどんどん生成されるじゃん!

これが、後にグーグルに売却された「ReCAPCHA」の仕組みです。
https://ja.m.wikipedia.org/wiki/ReCAPTCHA


実際、ReCAPCHAはニューヨークタイムズの膨大な記事アーカイブのうち20年分を約3ヶ月間くらいで電子データにしちゃったらしい。
でも僕はこのプロジェクトの本質は「電子データを生成する速さ」じゃない別のところにあると思う。


◆ルイスフォンアーンはクラウドソーシングの天才
ルイスフォンアーンは今はDUOLINGOという語学のスタートアップを起業していて、
この間もWIREDに取材が掲載されていた
その時のタイトルが、クラウドソーシングの天才・ルイスフォンアーンというもの。


そうなんだよな、このプロジェクトの凄いところは「発注されてもいないのに、参画している意識も本人たちには無い、それなのに世界中の人がプロジェクトに参加して目標の達成に向けて動いているところ」なんだよな。



いきなりバカっぽい例え話になるんだけど、このブログ読んでるみなさんって人生で一度くらいは「このいま漕いでいる自転車のペダルがなんかのエネルギーにならないかなー」とか
「やべえ、ノートパソコンの充電切れちゃう。このタイピングの打撃エネルギーでバッテリーがちょっと長持ちになったりしないのか!?しないよな」
みたいな

日常のなんでもない作業が、もっと何かに活用する仕組みにならないかな、みたいなこと考えたことないですか?

僕はいつもそればっかり考えてる。(いつも、は言いすぎだけど)


世の中、クラウドの仕組みとかシェア文化とかで色々実現できることも多くなったし、技術の発展も目覚ましいんだけど、なんだろう個人的に釈然としないのが

・クラウドソーシングもクラウドファンディングも、結局ギブ&テイクの間口が拡大した話で本当に「一体どこから?!」みたいな仕組みじゃないよなーとか

・周囲の共感を得て協力者を募ったり、ユーザー自身がコミュニティを運営する的なサービスも、「長くいるとそいつが居場所を主張し始めて、サービス側にとって悩みのタネになる」とか

・「これだけ素晴らしい活動がある!広めよう!参加しよう!」みたいなのって、結局誰かのリソースの犠牲があって、その上に成り立ったりしてるだけだな

とか、なんかそういうことを人からいろんな話を聞くたびにモヤモヤすることがある。

ギブ&テイクが明確すぎるものって、お互いの信頼関係でなあなあでやるか、ガッチガチに契約でやるか、まずは共感とかマインドとかありきで盛り上がる時はいいんだけど、継続性に欠けるものだったりする。


CAPTCHAに文字を入力したことのある人ってさ、自分が入力した文字がどの古い文献のどの部分の電子データになるのに活かされたのかとか、たぶん知らないし興味ないじゃん。

「えっ!そんな事に使われてたの?だったら入力した俺にもなんか報酬よこせ!」ってならないじゃん。
(言うやついるかもしれないけど、少数派だよな)


自分がいま関わってつくろうとしているプロジェクトとかも、もちろんクラウドソーシングで仕事してもらってるし、「共感頂いて協力してくれる人達」のありがたさとか、素晴らしい活動だって言ってくれて俺がいないとこでも広めてくれる人いて、それは本当に感謝してるのですが


なんか、こういう仕組みでやるべきだと思うのだよな。
悩みがあって、それを解決する人が解決して、はいリターン(報酬)です。じゃなくて


課題を解決するってことは、大体別の課題を生み出している。
それを課題だとか「しょうがないよね」ってするんじゃなくて、「あれに活かせちゃうじゃん」って別のものに繋げる。

ブログにまとめながら、こういうことを考えて色々取り組もうと思った次第。