Une ethnographie des jeux de données
From Algolit
par Algolit
Un élément qui semble négligé dans le transfert de biais du niveau sociétal vers la machine est l'ensemble de données comme étape intermédiaire dans la prise de décision : les paramètres par lesquels un environnement social est cloisonné sont déterminés par divers facteurs. Dans la création d'ensembles de données, qui constituent la base sur laquelle les modèles informatiques fonctionnent, les conflits et les ambiguïtés sont négligés au profit d'une réalité calculable. La collecte de données est politique, mais sa politique est rendue invisible dans la manière dont elle est présentée et visualisée. Les ensembles de données ne sont pas une version distillée de la réalité, ni simplement une technologie en soi. Mais comme toute technologie, les ensembles de données encodent leur but, leur finalité et la vision du monde de leurs fabricants.
Dans le cadre de ce travail, nous examinons les ensembles de données les plus couramment utilisés pour la formation des spécialistes de l'apprentissage automatique et des spécialistes des données. De quel matériau sont-ils constitués ? Qui les a recueillis ? Quand ? Pour quelle raison ?
Concept, code, réalisation: Cristina Cochior