Traduzir a web inteira
Entrevista Luis Von Ahn
Hoje entendemos em horas coisas que levariam anos
Traduzir a web inteira é o objetivo do professor de ciência da computação que criou os projetos recaptcha e duolingo
Natasha Felizi | Folha de S. Paulo
Quando criança, Luis von Ahn imaginou uma academia onde, em vez de se cobrar mensalidade, a energia gerada pelo esforço físico das pessoas fosse vendida a companhias elétricas.
Hoje, como professor de ciência da computação na Universidade Carnegie Mellon e empresário, von Ahn não perdeu a ideia de vista.
Ele é o homem por trás dos projetos reCaptcha, o sistema de verificação que exige que digitemos os caracteres em uma imagem, e Duolingo, um programa de ensino de idiomas gratuito, ambos com o objetivo de "traduzir a web inteira".
No Duolingo, materiais que precisam ser traduzidos são fragmentados e distribuídos entre os exercícios dados aos alunos. Quando o documento estiver completamente traduzido, é devolvido ao dono, que paga pela tradução (clientes como a Wikipédia recebem o serviço de graça).
No caso do reCaptcha, as imagens de letras distorcidas são trechos de livros e documentos mal reconhecidos por scanners no processo de digitalização, de modo que, ao digitá-los, o usuário "contribui" para a digitalização de livros e documentos.
A verificação de ambos é baseada no crowdsourcing, ou seja, na contribuição de várias pessoas que digitam a mesma imagem --ou fazem o mesmo exercício-- e geram um padrão de erros e acertos.
Luis von Ahn também foi o primeiro a usar o termo "computação humana", que descreve a combinação entre habilidades exclusivamente humanas e a capacidade de processamento dos computadores.
A Folha o entrevistou durante o evento WWW2013, que aconteceu no mês passado no Rio.
Você disse que precisamos traduzir toda a web. Por que é mais difícil fazer isso em algumas línguas que em outras?
A desigualdade é imensa. Mais de 50% da web é em inglês, mas menos de 25% das pessoas que usam a web falam inglês. Para os computadores, a dificuldade das línguas depende da quantidade de informação que existe. Então inglês é relativamente fácil porque há muitos dados, enquanto línguas com menos dados são mais difíceis.
Projetos como o Duolingo podem ter impacto positivo na educação em países em desenvolvimento?
A maioria dos métodos de aprendizado de línguas exige que você tenha dinheiro, e a maioria das pessoas que quer aprender não tem. Eu queria inventar um jeito de ensinar línguas de graça, em que a energia mental das pessoas fosse usada para fazer algo de valor: traduzir a web. A CNN pagava tradutores profissionais para traduzir seu site, e agora paga a nós. Cobramos de algumas empresas para traduzir, então de certa maneira eles estão pagando para que pessoas aprendam línguas. Eles nos pagam, e damos às pessoas o ensino de graça.
Como você desenvolveu o método do Duolingo?
Há três anos, não sabíamos nada sobre o ensino de línguas. Então lemos alguns livros e fomos atrás de especialistas. Agora que temos 1 milhão de usuários, fazemos tudo com base nos dados. Por exemplo, se quero saber se devo ensinar adjetivos antes dos advérbios, metade dos próximos 50 mil usuários vai aprender em uma ordem, e a outra metade em outra ordem. Aí medimos qual grupo teve melhores resultados. O método é totalmente baseado em dados, estatística, e não em uma filosofia.
Observamos muitas coisas com esses experimentos. Por exemplo: notamos um leve decréscimo no desempenho de pessoas com 20 anos em relação a pessoas de 10. Também descobrimos que mulheres italianas aprendem inglês 10% mais rápido que homens italianos, mas não tenho ideia do porquê.
A quantidade de dados de que dispomos hoje e a capacidade de processá-los podem mudar o modo como fazemos ciência?
Acredito que sim. Há 20 anos, o ensino de língua funcionava com um professor e 20 alunos. Não dá para saber muito sobre como ensinar melhor com 20 alunos, porque 20 é pouco. Talvez depois de 20 anos você possa inferir algo. Agora, podemos observar 2 milhões de pessoas aprendendo uma língua ao mesmo tempo e conseguimos entender as coisas em horas, em vez de anos. O cientista tenta entender, e o engenheiro só tenta fazer. No meu caso, estou tentando fazer, mais do que entender.
Hoje entendemos em horas coisas que levariam anos
Traduzir a web inteira é o objetivo do professor de ciência da computação que criou os projetos recaptcha e duolingo
Natasha Felizi | Folha de S. Paulo
Quando criança, Luis von Ahn imaginou uma academia onde, em vez de se cobrar mensalidade, a energia gerada pelo esforço físico das pessoas fosse vendida a companhias elétricas.
Hoje, como professor de ciência da computação na Universidade Carnegie Mellon e empresário, von Ahn não perdeu a ideia de vista.
Ele é o homem por trás dos projetos reCaptcha, o sistema de verificação que exige que digitemos os caracteres em uma imagem, e Duolingo, um programa de ensino de idiomas gratuito, ambos com o objetivo de "traduzir a web inteira".
No Duolingo, materiais que precisam ser traduzidos são fragmentados e distribuídos entre os exercícios dados aos alunos. Quando o documento estiver completamente traduzido, é devolvido ao dono, que paga pela tradução (clientes como a Wikipédia recebem o serviço de graça).
No caso do reCaptcha, as imagens de letras distorcidas são trechos de livros e documentos mal reconhecidos por scanners no processo de digitalização, de modo que, ao digitá-los, o usuário "contribui" para a digitalização de livros e documentos.
A verificação de ambos é baseada no crowdsourcing, ou seja, na contribuição de várias pessoas que digitam a mesma imagem --ou fazem o mesmo exercício-- e geram um padrão de erros e acertos.
Luis von Ahn também foi o primeiro a usar o termo "computação humana", que descreve a combinação entre habilidades exclusivamente humanas e a capacidade de processamento dos computadores.
A Folha o entrevistou durante o evento WWW2013, que aconteceu no mês passado no Rio.
Você disse que precisamos traduzir toda a web. Por que é mais difícil fazer isso em algumas línguas que em outras?
A desigualdade é imensa. Mais de 50% da web é em inglês, mas menos de 25% das pessoas que usam a web falam inglês. Para os computadores, a dificuldade das línguas depende da quantidade de informação que existe. Então inglês é relativamente fácil porque há muitos dados, enquanto línguas com menos dados são mais difíceis.
Projetos como o Duolingo podem ter impacto positivo na educação em países em desenvolvimento?
A maioria dos métodos de aprendizado de línguas exige que você tenha dinheiro, e a maioria das pessoas que quer aprender não tem. Eu queria inventar um jeito de ensinar línguas de graça, em que a energia mental das pessoas fosse usada para fazer algo de valor: traduzir a web. A CNN pagava tradutores profissionais para traduzir seu site, e agora paga a nós. Cobramos de algumas empresas para traduzir, então de certa maneira eles estão pagando para que pessoas aprendam línguas. Eles nos pagam, e damos às pessoas o ensino de graça.
Como você desenvolveu o método do Duolingo?
Há três anos, não sabíamos nada sobre o ensino de línguas. Então lemos alguns livros e fomos atrás de especialistas. Agora que temos 1 milhão de usuários, fazemos tudo com base nos dados. Por exemplo, se quero saber se devo ensinar adjetivos antes dos advérbios, metade dos próximos 50 mil usuários vai aprender em uma ordem, e a outra metade em outra ordem. Aí medimos qual grupo teve melhores resultados. O método é totalmente baseado em dados, estatística, e não em uma filosofia.
Observamos muitas coisas com esses experimentos. Por exemplo: notamos um leve decréscimo no desempenho de pessoas com 20 anos em relação a pessoas de 10. Também descobrimos que mulheres italianas aprendem inglês 10% mais rápido que homens italianos, mas não tenho ideia do porquê.
A quantidade de dados de que dispomos hoje e a capacidade de processá-los podem mudar o modo como fazemos ciência?
Acredito que sim. Há 20 anos, o ensino de língua funcionava com um professor e 20 alunos. Não dá para saber muito sobre como ensinar melhor com 20 alunos, porque 20 é pouco. Talvez depois de 20 anos você possa inferir algo. Agora, podemos observar 2 milhões de pessoas aprendendo uma língua ao mesmo tempo e conseguimos entender as coisas em horas, em vez de anos. O cientista tenta entender, e o engenheiro só tenta fazer. No meu caso, estou tentando fazer, mais do que entender.
Nenhum comentário:
Postar um comentário
Fique a vontade para compartilhar informações, comentários e links.
Mas seja gentil. :)