Ceci est une proposition
Le site "The Pirate Bay" est régulièrement down, la recherche est de mauvaise qualité et simpliste, pourquoi pas en écrire un clone ?
On pourrait faire un hackathon dont de but est d'utiliser un dump de leur db pour en faire quelque chose de mieux et en profiter pour tester toutes les technologies hypes du moment.
T'as envie de faire une one-page webapp immutable en React et Flux ? D'écrire un backend à mille dépendances en NodeJs ? De faire du bigdata™ sur 7 millions de torrents en Rust (Il parait qu'on peut faire du web en rust aussi) ? D'utiliser une db NoSQL hype comme RethinkDB ou Mongo (berk) ? D'écrire un site web real-time avec WAMP et asyncio ? De faire du data mining et du NLP sur les descriptions et des commentaires ? De faire du deep learning pour faire des recommandations ? T'as une autre techno hype à tester ? C'est le moment de te lâcher.
Note : T'as juste envie de coder une petite application en ligne de commande pour chercher un torrent ? Ca marche, tu peux venir aussi :) (à condition que tu y caches un poney quelque part)
Il existe quelques dumps assez anciens (2013) , il faudrait voir si on sait en trouver des nouveaux ou écrire un crawler qui récupère les 3-4M torrents qui ont été uploadés depuis.
Ce serait peut-être aussi sympa de faire un workshop web avant ça.