Psitt, Google vous utilise à votre insu pour numériser des livres

Posted on octobre 18th, 2011 in Informatique by obi3fr

Depuis son lancement en décembre 2004, Google Books a numérisé plus de quinze millions de livres, plus que tout le catalogue de la BNF. C’est aujourd’hui, et de loin, la plus grande bibliothèque numérique du monde. Une tâche titanesque que n’accomplit pas seul.

Tout commence en 2009, lorsque Google achète reCaptcha, une start-up spécialisée dans les captchas, ces petites images utilisées sur de nombreux sites, qu’il faut déchiffrer et qui servent à distinguer les ordinateurs des humains (pour empêcher le spam, par exemple).

Plus de 100 000 sites ont implémenté le système, qui est utilisé quotidiennement par près de 30 millions d’utilisateurs, qui passent chacun une poignée de seconde à résoudre le captcha. Des centaines d’heures perdues ? Pas pour Google, qui a décidé d’utiliser cette technologie pour poursuivre son travail de numérisation.

Dans chaque captcha proposé par le service, le premier mot est un mot « test », celui qui est utilisé pour savoir si oui ou non vous êtes un humain. Le second, c’est un mot contenu dans un livre numérisé, que Google n’est pas parvenu à déchiffrer. Ce mot est soumis à de nombreux utilisateurs : au bout de plusieurs réponses identiques, le mot est « appris » par l’algorithme de Google, qui pourra mieux le reconnaître dans le futur et qui l’insère dans le texte numérisé.

C’est ainsi que des milliers d’internautes contribuent bien involontairement à numériser des livres pour Google Books ou de vieilles éditions du quotidien américain The New York Times.

Une goutte d’eau ? Loin de là. En 2008, selon le magazine américain Science, si on mettait à profit toutes les captchas utilisées sur , on pourrait retranscrire… 160 livres par jour.

Source Rue89


Et le film le plus piraté de tous les temps sur BitTorrent est…

Posted on octobre 18th, 2011 in Cinéma by obi3fr

En se basant sur des compilations listes tirées de différents sites de téléchargements illégaux via le protocole BitTorrent, TorrentFreak est parvenu à établir ce qu’il considère comme le top 10 des films les plus piratés de tous les temps.

C’est en réponse à la liste des films les plus loués de tous les temps récemment publiée par Netflix que TorrentFreak a dressé ce bilan bien moins glorieux, établi a partir de statistiques recueillis depuis 2006 auprès de trackers BitTorrent publics. Sans grande surprise, on trouve en premier place Avatar avec environ 21 millions de téléchargements, preuve s’il le fallait que la 3D n’a pas été un argument suffisant pour limiter le piratage du dernier film de James Cameron. Reste que le film a tout de même rapporté 2,8 milliards de dollars à travers le monde.

La suite du classement se compose de :

  • Batman: The Dark Knight (19 millions)
  • Transformers (19 millions)
  • Inception (18 millions)
  • Very Bad Trip (17 millions)
  • Star Trek (16 millions)
  • Kick-Ass (15 millions)
  • Les Infiltrés (14 millions)
  • L’Incroyable Hulk (14 millions)
  • Pirates des Caraïbes : Jusqu’au bout du Monde (14 millions)

TorrentFreak fait remarquer qu’à l’exception d’Inception et des Infiltrés, aucun des autres films du top 10 ne se trouvent dans le classement de NetFlix. Reste que cette liste ne se limite qu’aux téléchargements par BitTorrent et exclu de facto le direct et par l’intermédiaire d’autres logiciels, qui pourraient sans doute faire augmenter un peu plus les compteurs s’ils étaient comptabilisés.

Source Clubic