Sociologia dei nuovi media» Blog Archive » reCAPTCHA e Duolingo, il nuovo crowdsourcing

reCAPTCHA e Duolingo, il nuovo crowdsourcing

Oggigiorno, chiunque navighi sul web non ha potuto fare a meno di riempire dei moduli di sicurezza in cui veniva chiesto di identificare una sequenza di caratteri distorti, al fine di verificare che voi siate realmente umani e non un programma malevolo scritto per inviare quello stesso modulo milioni di volte. Questa tecnologia, ormai nota a tutti gli Internauti, è chiamata CAPTCHA e al giorno d’oggi si contano milioni di pagine web che ne implementano una versione.

Nel 2008 Luis von Ahn professore di Computer Science presso la Carnegie Mellon University, prende atto che, ogni giorno, più di 200 milioni di CAPTCHA vengono digitati dalla gente in tutto il mondo. Partendo da questa constatazione, egli decise di sviluppare un sistema, chiamato reCAPTCHA, il quale potesse rendere produttivi quei pochi secondi impiegati per risolvere l’immagine aiutando di fatto a digitalizzare libri. La digitalizzazione di testi rimane un problema ancora molto aperto, poiché la tecnologia sottostante (OCR, Optical Character Recognition) non sempre riesce a identificare le parole corrette, soprattutto in testi molto datati. Ciò che fa reCAPTCHA è prendere tutte quelle parole che il computer non riesce a riconoscere e far si che le persone le leggano mentre digitano un CAPTCHA su Internet. Per esempio, su Facebook, ogni volta che aggiungete un amico o fate un poke a qualcuno, aiutate a digitalizzare un libro. E i dati parlano chiari: da quando il progetto è stato lanciato, sono stati digitalizzati circa 2,5 milioni di libri all’anno, e tutto una parola alla volta.

Luis von Ahn, tuttavia, non si accontenta e, nel 2011, decide di lanciare una nuova sfida: tradurre il Web in tutte le principali lingue gratuitamente. Naturalmente, esistono già dei sistemi di traduzione automatica, ma il problema principale è che essi non sono molto accurati e, probabilmente, non lo saranno per i prossimi 15-20 anni. Si potrebbe pensare di assumere dei traduttori professionsti: beh, facendo qualche rapido calcolo, il tradurre “solo” Wikipedia dall’inglese allo spagnolo costerebbe almeno 50 milioni di dollari (per non parlare del tempo che ci vorrebbe). Al giorno d’oggi, vi sono più di 1,2 miliardi di persone nel mondo che imparano una lingua straniera: per esempio, negli Stati Uniti, ci sono più di cinque milioni di persone che hanno pagato più di 500$ in software per imparare una lingua.

Nel 2012, Luis von Ahn lancia Duolingo: l’idea di base è che la gente impara una nuova lingua gratuitamente mentre contemporaneamente traduce il Web. Duolingo funziona nel seguente modo: se si è principianti, il sistema dà delle frasi molto semplici da tradurre (nel web ci sono tantissime frasi semplici) con associato il significato di ciascuna parola; man mano che si migliora la complessità delle frasi, naturalmente, aumenta. L’aspetto che, a mio avviso, va sottolineato è che con Duolingo si impara facendo e, soprattutto, si impara con contenuti reali (e non con le classiche frasi pre-costruite). E la cosa più sorprendente è che le traduzioni ricevute dagli utenti (anche principianti) sono accurate quanto quelle di traduttori professionisti.

Infine, la cosa che più colpisce di Duolingo è che fornisce un corretto modello di business per l’apprendimento delle lingue straniere: ripensando a quanto detto prima, il 95% della popolazione mondiale non ha 500 o più dollari da investire in software per l’apprendimento di una lingua, il che è estremamente ingiusto nei confronti dei poveri e completamente sbilanciato a favore dei ricchi. In Duolingo, al contrario, poiché la gente crea valore mentre impara, non deve pagare con denaro, bensì con il proprio tempo.

Nicolò Alabastro

This entry was posted on mercoledì, Maggio 15th, 2013 at 11:28 and is filed under crowd. You can follow any responses to this entry through the RSS 2.0 feed. Both comments and pings are currently closed.

Sociologia dei nuovi media

reCAPTCHA e Duolingo, il nuovo crowdsourcing

Pagine

Articoli recenti

Archivi

Categorie

Copyleft