Kaggle, le site qui transforme la science des données en sport

« Matthieu Scordia a présenté, mercredi 11 décembre à Paris, ses « trucs » pour gagner. L’actuel numéro un français sur Kaggle, un site de concours de « big data » (de traitement de gros volumes de données, en français), expliquera à se collègues comment il compte améliorer Yandex, le Google russe, en « tunant » des algorithmes récupérés sur une librairie participative.

Pour ce concours, organisé par Yandex lui-même ainsi que d’autres moteurs de recherche (Yahoo! et Bing), 104 équipes de toutes nationalités sont déjà inscrites, avec deux mois pour réfléchir et un prix de 9 000 dollars (6523 euros) à la clé.

« Nous transformons la science des données en sport », clame Kaggle. Sur le site de la start-up californienne, on parle Python, Ruby, Matlab, autant de langages de modélisation, de programmation et de visualisation. L’entreprise californienne, créée par l’économiste australien Anthony Goldbloom en 2010, présente le traitement des données scientifiques et la modélisation prédictive comme la promesse « de fortune, de gloire et de plaisir ».(…)

Comment fonctionne Kaggle ? Institutions et entreprises viennent déposer sur le site les données et l’énoncé de leur problème, en sciences, finances, énergie ou commerce. Matheux et statisticiens du monde entier se battent ensuite pour les résoudre. De General Electric à Tesco, en passant par Microsoft ou la Nasa, les entreprises sollicitent les milliers de doctorants et chercheurs en sciences quantitatives inscrits sur la plateforme.(…) »