Vous connaîtrez un mot par la compagnie qu'il tient
From Algolit
Type: | Algoliterary exploration |
Données: | Frankenstein FR, AnarchFem, WikiHarass FR, Apprendre de l'apprentissage automatique, Tristes Tropiques |
Technique: | plongement lexical |
Développé par: | word2vec de Google Tensorflow, Algolit |
Vous connaîtrez un mot par la compagnie qu'il tient est une série de 5 paysages basés sur différents ensembles de données. Chaque paysage comprend les mots «collectif», «être», «social» en compagnie de différents groupes sémantiques. L'intuition que les distances au sein du graphique sont liées à la similarité sémantique des mots est l'un des fondements de word2vec.
Les graphiques sont le résultat d'une étude de code basée sur un script de tutoriel de plongement lexical existant word2vec_basic.py. Dans une pratique d'apprentissage automatique, ces graphiques fonctionnent comme des outils de validation pour voir si un modèle commence à avoir du sens. Il est intéressant de voir comment ce processus de validation est alimenté par la compréhension sémantique individuelle des groupes et des mots.
Comment pouvons-nous utiliser ces paysages sémantiques comme outils de lecture?
graphique 1: Ensemble de données Frankenstein
Inclut le livre Frankenstein, ou le Prométhée Moderne de Mary Shelley.
graphique 2: Ensemble de données Anarch Feminist
Inclut 3 livres (...)
graphique 3: Ensemble de données Claude Levi-Strauss
Inclut le livre Tristes Tropiques de Claude Lévi-Strauss.
graphique 4: Ensemble de données manuels d'apprentissage profond
Inclut les livres (...).
graphique 5: Ensemble de données commentaires harcelants
Inclut des exemples de harcèlement sur les commentaires de la page Talk de Wikipedia.