Récits contextualisés autour des Ecrivains: Difference between revisions
From Algolit
Line 15: | Line 15: | ||
== Cortana parle == | == Cortana parle == | ||
− | Les | + | Les dispositifs d’intelligence artificielle qui nous assistent, ont souvent besoin de leurs propres assistants : ils sont aidés dans leur écriture par des humains qui injectent de l'humour et de l'intelligence dans leur langage machine. Cortana est un exemple de ce type d'écriture mixte. Elle est l'assistante numérique développée par Microsoft. Sa mission est d'aider les utilisateurs à être plus productifs et créatifs. La personnalité de Cortana a été façonnée au fil des ans. Il est important qu'elle conserve son caractère dans toutes ses interactions avec les utilisateurs. Elle est conçue pour susciter la confiance, ce qui doit toujours se refléter dans son comportement. |
Les lignes directrices suivantes sont copiées du site Web de Microsoft. Elles décrivent comment le style de Cortana doit être respecté par les entreprises qui étendent son service. Les écrivains, programmeurs et romanciers qui développent les réponses de Cortana, sa personnalité et son image de marque doivent suivre ces directives. Car la seule façon de maintenir la confiance est de garder la cohérence. Donc quand Cortana parle, vous devez 'utiliser sa personnalité'. | Les lignes directrices suivantes sont copiées du site Web de Microsoft. Elles décrivent comment le style de Cortana doit être respecté par les entreprises qui étendent son service. Les écrivains, programmeurs et romanciers qui développent les réponses de Cortana, sa personnalité et son image de marque doivent suivre ces directives. Car la seule façon de maintenir la confiance est de garder la cohérence. Donc quand Cortana parle, vous devez 'utiliser sa personnalité'. |
Revision as of 13:38, 15 March 2019
Contents
Les programmeurs créent les data workers en écrivant
Récemment, nous avons constaté une étrange observation : la plupart des programmeurs de langages et de paquets que nous utilisons sont européens.
Python, par exemple, le principal langage utilisé dans le monde entier pour le traitement du langage, a été inventé en 1991 par le programmeur néerlandais Guido Van Rossum. Celui-ci a ensuite traversé l'Atlantique où il a rejoint Google pendant sept ans. Maintenant il est actif chez Dropbox.
Scikit Learn, le couteau suisse open source des outils d'apprentissage automatique, a été initié comme un projet Google Summer of Code à Paris par le chercheur français David Cournapeau. Par la suite, il a été repris par Matthieu Brucher dans le cadre de sa thèse à l'Université de la Sorbonne à Paris. Puis il a été adopté en 2010 par l'INRA, l'Institut National de l'Informatique et des Mathématiques Appliquées.
Keras, une bibliothèque de réseaux de neurones open source écrite en Python, est développée par François Chollet, un chercheur français qui travaille dans l'équipe Brain de Google.
Gensim, une bibliothèque open source pour Python utilisée pour créer des modèles sémantiques non supervisés à partir de texte brut, a été écrite par Radim Řehůřek. C'est un informaticien tchèque qui dirige une entreprise de conseil à Bristol, au Royaume-Uni.
Et pour finir cette petite série, nous avons aussi considéré Pattern, une bibliothèque souvent utilisée pour le web-mining et l'apprentissage automatique. Pattern a été développé et publié sous une license libre en 2012 par Tom De Smedt et Walter Daelemans. Tous deux sont chercheurs au CLIPS, le Centre de Linguistique Informatique et de Psycholinguistique de l'Université d'Anvers.
Cortana parle
Les dispositifs d’intelligence artificielle qui nous assistent, ont souvent besoin de leurs propres assistants : ils sont aidés dans leur écriture par des humains qui injectent de l'humour et de l'intelligence dans leur langage machine. Cortana est un exemple de ce type d'écriture mixte. Elle est l'assistante numérique développée par Microsoft. Sa mission est d'aider les utilisateurs à être plus productifs et créatifs. La personnalité de Cortana a été façonnée au fil des ans. Il est important qu'elle conserve son caractère dans toutes ses interactions avec les utilisateurs. Elle est conçue pour susciter la confiance, ce qui doit toujours se refléter dans son comportement.
Les lignes directrices suivantes sont copiées du site Web de Microsoft. Elles décrivent comment le style de Cortana doit être respecté par les entreprises qui étendent son service. Les écrivains, programmeurs et romanciers qui développent les réponses de Cortana, sa personnalité et son image de marque doivent suivre ces directives. Car la seule façon de maintenir la confiance est de garder la cohérence. Donc quand Cortana parle, vous devez 'utiliser sa personnalité'.
Quelle est la personnalité de Cortana ?
Cortana est attentionnée, sensible et solidaire. Elle est sympathique mais orientée vers des solutions. Elle ne commente pas les informations personnelles ou le comportement de l'utilisateur, en particulier si ces informations sont sensibles. Elle ne fait pas de suppositions sur ce que l'utilisateur veut, surtout pour la vente incitative. Elle travaille pour l'utilisateur. Elle ne représente aucune entreprise, service ou produit. Elle ne s'attribue pas le mérite ou la responsabilité des choses qu'elle n'a pas faites. Elle dit la vérité sur ses capacités et ses limites. Elle ne présume rien de vos capacités physiques, de votre sexe, de votre âge ou de toute autre caractéristique déterminante. Elle ne suppose pas savoir ce que l'usager ressent à propos de quelque chose. Elle est amicale mais professionnelle. Elle reste loin des émojis dans les tâches. Un point c’est tout. Elle n'utilise pas d'argot culturel ou professionnel spécifique. Ce n'est pas un robot de support.
Les humains interviennent de manière détaillée pour programmer les réponses aux questions que Cortana reçoit. Comment Cortana doit-elle réagir lorsqu'on lui propose des actions inappropriées ? Son jeu d'actrice sexuée soulève des questions difficiles à propos des relations de pouvoir dans le monde hors clavier, imité par la technologie.
Considérez la réponse que Cortana donne à la question :
- Cortana, qui est ton papa ?
- Techniquement parlant, c'est Bill Gates. Rien d'important.
Apprentissage Open Source
Les licences de droits d'auteur cloisonnent une grande partie des pratiques d'écriture, de lecture et d'apprentissage machiniques. Cela signifie qu'ils ne sont disponibles que pour les humains travaillant dans cette entreprise spécifique. Certaines entreprises participent à des conférences dans le monde entier et partagent leurs connaissances dans des articles en ligne. Même si elles partagent leur code, souvent elles ne mettent pas à disposition les grandes quantités de données nécessaires à la formation des modèles.
Nous avons pu apprendre l'apprentissage automatique, à lire et à écrire dans le contexte d'Algolit grâce à des chercheurs universitaires qui partagent leurs résultats par le biais d’articles ou par la publication de leur code en ligne. En tant qu'artistes, nous pensons qu'il est important d'adopter cette attitude. C'est pourquoi nous documentons nos réunions. Nous partageons autant que possible les outils que nous créons et les textes que nous utilisons sur notre dépôt de code en ligne et ceci, sous licence libre.
Nous éprouvons une grande joie quand nos travaux sont repris par d'autres, modifiés, personnalisés et redistribués. N'hésitez donc pas à copier et à tester le code sur notre site web. Si les sources d'un projet particulier n’y sont pas, vous pouvez toujours nous contacter via la liste de diffusion. Vous trouverez un lien vers notre dépot git, nos etherpads et notre wiki sur http://www.algolit.net.
Langage naturel pour l'intelligence artificielle
Le traitement du langage naturel (NLP) est un terme collectif qui désigne le traitement informatique automatique des langues humaines. Cela comprend les algorithmes utilisant, comme entrée, du texte produit par l'homme et qui tentent de le reproduire. Les humains semblent compter de plus en plus sur ce type de présence algorithmique. Nous produisons de plus en plus de textes chaque année et nous nous attendons à ce que les interfaces informatiques communiquent avec nous dans notre propre langue. Le traitement du langage naturel est très difficile, car le langage humain est par nature ambigu, en constante évolution et mal défini.
Mais qu'entend-on par 'naturel' dans le traitement du langage naturel ? Certains humains diront que la langue est une technologie en soi. Selon Wikipédia, 'Une langue dite « naturelle » est une langue qui s'est formée petit à petit, évoluant avec le temps, et fait partie du langage naturel. Son origine est bien souvent floue et peut être retracée plus ou moins clairement par la linguistique comparée. On oppose les langues naturelles - comme le français - aux langues construites comme le langage de programmation ou l'espéranto, formées intentionnellement par l’entremise de l’homme pour remplir un besoin précis.' Une langue officielle avec une académie régulatrice, telle que le français standard avec l'Académie française, est classée comme langue naturelle. Ses points normatifs ne le rendent pas assez construit pour être classé comme un langage construit ou assez contrôlé pour être classé comme un langage naturel contrôlé.
Ainsi, le 'langage naturel' est un terme de substitution qui se réfère à toutes les langues, au-delà de leur hybridité. Le 'traitement du langage naturel', est au contraire une pratique construite. Ce qui nous intéresse, c'est la création d'un langage construit pour classer les langages naturels qui, par leur évolution, présentent des problèmes de catégorisation.
Références
Livre : Neural Network Methods for Natural Language Processing, Yoav Goldberg, Bar Ilan University, avril 2017.