-
Précédent   Bas de page   Suivant   Signaler cette page   Version imprimable

2. Identités visuelles

Article
Publié : 22 janvier 2009

Montages signifiants : les icônes d’Apple iPhone entre texte et image


Simone Morgagni, Doctorant, LIAS-IMM, Ecole de Hautes Etudes en Sciences Sociales (EHESS) Paris – Dipartimento di Discipline della Comunicazione, Università di Bologna

Résumé

Les nouveaux objets numériques invitent la théorie sémiotique à se recentrer sur le couple formé par l’usager et l’interface, entendue comme lieu où se déploient et se manipulent des contenus via des contacts répétés avec une surface sensible. Les « pratiques » qui s’y développent, envisagées sous l’angle matériel, gestuel et sémiotique, acquièrent ainsi un rôle central, s’éloignant des théories qui voyaient le sens comme le produit d’une corrélation pour s’approcher de celles qui l’expliquent en termes de processus de co-constitution entre ces divers ordres. Il sera ainsi question dans cet article d’analyser l’émergence contextuelle du sens lors de l’utilisation de l’interface haptique d’Apple iPhone. Plus précisément, nous nous concentrerons sur ses icones, analysées à travers les manipulations et le faisceau d’interactions qui s’établit entre objet et usager. Selon une perspective sémiotique interprétative attachée aussi bien à la matérialité du texte qu’à la sémioticité de l’objet d’usage, on cherchera à rendre compte du rôle prépondérant assumé par les propriétés iconiques et fonctionnelles de l’interface. Le niveau élevé de cohérence interne atteint permettra alors l’élaboration dans le temps d’ « habitudes » qui constituent la base de la compréhension et des actions des usagers.

Abstract

As far as semiotic theory is concerned, new digital objects emphasize the need to refocus on the intimate connection between the user and the interface, considered as a space where deploying and manipulating contents through repeated contacts with a sensitive area. The "practices" that are here developed, taken in their materiality, their gesture, their semioticity acquire a new and central role, moving away from theories that explained sense as a product of correlation to approach it in the terms of a co-constitution process between all these different levels. My purpose here is to analyze the emergence of contextual meaning that takes place in the haptic interface of Apple iPhone. In particular, through the analysis of the manipulations and the interactions established between the object and its user, I will try to describe how iPhone icons work. Taking into account the Peircean semiotic theory and paying attention to the semiotic value of the object and to its text materiality, I will show the central role assumed by iconic and functional properties of the digital interface. The high level of internal consistency achieved will allow the user to create customized habits, which will be the basis for his further actions and understanding processes.


Table des matières

Texte intégral

Présenté par Apple au cours du mois de janvier 2007, iPhone dispose d’une interface que l’entreprise décrit comme révolutionnaire. La virtualisation progressive des fonctions objectales, rendue possible par les avancées technologiques, nous met en présence d’une interface haptique, où l’usager dialogue avec un dispositif virtuel par le biais de ses actions directes. Avec ces nouveaux dispositifs numériques, on assiste à un recentrement de l’activité interactive qui ne peut qu’amener la théorie sémio-linguistique à se reconfigurer, notamment dans la façon dont elle envisage les rapports entre les activités propre au dire et celles propre au faire, avec l’acquisition d’une place plus centrale de ces dernières. Au fil des années on assiste ainsi à la continuation d’un parcours qui, selon Alessandro Zinna (Zinna, 2002 et 2004), est du à deux évolutions différentes de l’aspect objectal et de l’aspect textuel des dispositifs sémiotiques. D’une part l’évolution technologique implique une intervention toujours plus grande des machines dans les processus de création et reproduction des formes textuelles, ce qui semble réduire de plus en plus la contribution humaine à celle d’un simple usager. D’autre part la progressive technologisation du plan de l’expression contribue à relier indissolublement l’univers du discours avec celui des objets, en rendant évidente la carence des sciences du langage qui avaient jusqu’à là eu tendance à exclure des analyses les fonctions propre à l’objet d’usage (Zinna, 2004 : 291). Il devient ainsi nécessaire d’élaborer des nouvelles formes d’analyse capables de rendre compte des processus co-constitutifs et des montages texte-image que la numérisation engendre et dans lesquels la priméité de l’un et de l’autre semble être substituée par leur rôle commun : être le support perceptif d’une série d’actions. Une analyse des différents plans, pris singulièrement, serait aujourd’hui difficile à justifier et, au contraire, il devient nécessaire d’élaborer un nouveau procédé capable de rendre compte de tout élément qui entre en rapport avec l’action développée par l’usager. Dans ce cadre, l’identité visuelle, les modalités interactives et narratives d’un objet numérique semblent être toujours plus dépendantes de la position des composants iconiques, des formes plastiques et des couleurs de l’interface. Ces éléments, agissant dans le cadre d’un champ perceptif global et suivant une dialectique gestaltiste de type fond/figure (Rosenthal & Visetti, 1999), seront ainsi les principaux responsables de l’émergence sémiotique entre l’objet et son usager.

Nous nous proposons ici d’analyser comment l’interface d’iPhone est capable de construire toute une série de régularités internes aidant au développement de parcours d’action subjectifs. Nous chercherons à montrer les contraintes et les régularités capables d’orienter l’action (Rastier, 1987 et 1991) et d’identifier les lignes d’émergence (Visetti & Cadiot, 2001 et 2006) qui conduisent au développement des actions des usagers. Dans cette perspective, le développement dans le temps d’une « habitude » (Peirce, 1931-58 ; Paolucci, 2007) joue un rôle fondamental dans la description des éléments qui peuvent apparaître « intuitifs » (Norman, 1988, 1998 2004) pour l’usager. Nous identifierons des cas où le texte est utilisé afin d’expliquer une icône et d’autres où c’est la position de l’icône qui donnera un rôle aux textes voisins,  mais souvent les deux éléments se lieront l’un à l’autre selon des processus de « diagrammatisation » plus ou moins latents, plus ou moins différenciés, capables de négocier le maintien d’une cohérence globale de l’interaction.

Dans le cadre d’une étude récente (Morgagni, 2008) sur l’interface multitouche d’Apple aujourd’hui utilisée pour iPhone et iPod touch, trois notions principales ont été identifiées comme structurant de l’interaction entre objet et usager : métaphores, icônes et rythmes. Si les métaphores peuvent être utilisées afin d’établir une structuration primaire de l’espace interactif, les icônes semblent jouer un rôle complémentaire de stabilisation, ensuite renforcé par les rythmes physiques et temporels d’interaction, qui contribuent à l’établissement de l’isotopie première servant de base à la constitution et la gestion des habitudes signifiantes constituées.

La naissance de l’interaction moderne avec l’interface graphique est souvent datée 1984, année de publication des première Guidelines d’Apple (Apple Computer Inc., 1984). La théorie interactionnelle présentée dans ce texte semble faire directement référence aux théories cognitives développées dans la même période par Lakoff et Johnson (Lakoff & Johnson, 1980, 1999). Dans les interfaces graphiques, nous constatons ainsi une large utilisation des métaphores dont le rôle serait double : insérer plus facilement l’usager dans le contexte d’usage1 et l’aider à travers une réutilisation des actions qu’il peut normalement accomplir dans sa vie quotidienne. Cette approche mettant les métaphores au centre de l’analyse semble toutefois être fondamentalement remise en cause aujourd’hui. La critique principale s’attaque à sa tendance à imposer une activité de construction des scénarios trop stricte (Cf., entre autres, Benyon & Imaz, 2007 ; Nielsen, 2000 ; Norman, 1998 ; Rohrer, 1995 ; Turner & Fauconnier, 2002). Comment expliquer le maintien d’une cohérence globale alors que l’interface d’un ordinateur est meublée de fenêtres qui n’ont pas les propriétés des fenêtres réelles, qu’on trouve la corbeille sur le bureau (Turner & Fauconnier, 2002 : 341 ; Benyon & Imaz : 111) alors que dans la réalité elle serait plutôt en dessous ou encore qu’on peut gérer des fichiers ou surfer sur la toile en effectuant la même action ? Une conception forte de la métaphore, comme celle de Lakoff & Johnson ne semble pas pouvoir rendre compte d’une cohérence globale entre ces différentes parties apparemment incohérentes, et ne permet pas la renégociation des valeurs, car elle ne peut nous donner qu’a posteriori une solution complète et stable de l’action.

Les interfaces étant des lieux où tout se résout dans l’action, où des changements toujours inattendus provoquent une modification continuelle de l’activité perceptive et cognitive, une approche de ce type n’est évidemment pas satisfaisante. Cela ne signifie nullement que des structures incarnées ne soient pas à la base de la structuration catégorielle, ni que les métaphores soient inutiles à la construction de nouvelles pratiques d’usage. Au contraire, cela pourrait signifier qu’il faut insérer ces structures dans un cadre prévoyant aussi une dynamique interne au modèle, capable d’expliquer comment cette structure peut se redéployer en fonction de changements externes, comment elle peut changer et être réutilisée à un niveau local et comment elle peut être réutilisée pour des activités qui, alors qu’elles sont au départ imprévisibles, deviennent possibles dans le continuum temporel de l’usage et des pratiques. Il nous paraît ainsi difficile de pouvoir comprendre les métaphores dans les interfaces graphiques sans se pencher aussi sur les problématiques liées à la représentation iconique. C’est précisément  sur ces représentations que nous nous concentrerons dans ce texte.

En effet, dans les nouvelles formes de textualité numérique, les deux structures ne peuvent qu’être intimement liées. Une métaphore ne pourra qu’être représentée à travers un processus de reconstruction visuelle qui s’élabore autour d’éléments réels. Les interfaces virtuelles se présentent alors comme des formes textuelles syncrétiques2 où une reconstruction visuelle est nécessaire pour donner lieu aux propriétés d’un objet qui ne sera constitué de rien d’autre que de ses propriétés iconiques et fonctionnelles. Ses propriétés en constituent le sens et permettent aux usagers de le rapprocher d’un second objet appartenant au monde réel, auquel il fait référence. L’icône de la corbeille dans un ordinateur, par exemple, est perceptible comme ayant la fonction d’une corbeille seulement parce qu’elle possède toute une série de caractéristiques fonctionnelles et perceptives qui la rapprochent, au moins en partie, d’une corbeille du monde réel. Ce qui apparaît évident dès le début, en analysant les propriétés constitutives des icônes, est le risque d’appliquer trop strictement les théories métaphoriques. En effet, combien de fois s’est-on retrouvé devant des icônes totalement cryptiques alors qu’on utilisait un ordinateur ; combien de fois devant une icône inconnue n’avons-nous pas été capables de comprendre quelle en était la signification ou même avec quel logiciel l’ouvrir ? Cette difficulté, connue par tout usager des interfaces graphiques, est due à la croyance des concepteurs qu’il est suffisant de montrer une image quelconque présentant une caractéristique commune avec son objet ou sa fonction, pour faire comprendre d’emblée à l’usager l’effet qu’il pourrait obtenir en la sélectionnant. Pour quelqu’un qui n’aurait jamais utilisé OpenOffice, il ne serait toutefois pas évident de comprendre la fonction de la petite icône avec une feuille blanche, trois lignes et deux mouettes. La même critique pourrait être faite non seulement à ce qu’on a l’habitude de considérer comme les vraies icônes des interfaces graphiques mais, de façon plus générale à toute composante graphique qui apparaît sur l’écran.

Reprenons maintenant la définition que Peirce donnait de l’icône alors qu’il la distinguait de l’indice et du symbole dans sa typologie des signes. Une icône, disait Peirce, n’est pas un dessin quelconque mais :

« Un signe qui se réfère à l’objet qu’elle dénote tout simplement grâce à ses caractéristiques propres […] elle est une icône de quelque chose dans la mesure où elle est similaire à cette chose et elle est utilisé en tant que signe de cela ». (CP 2247)

Au contraire, la plupart des icônes élaborées depuis la création des interfaces graphiques n’établissent qu’une relation exclusivement conventionnelle avec les objets auxquels elles font référence. Pour Peirce elles devraient, par cette relation qu’on considère comme établie, être plutôt considérées comme des symboles. Mais les icônes, heureusement, n’existent pas hors d’un contexte plus vaste, hors d’une nécessité pragmatique, d’une pratique qui peut en expliquer la signification : il faudra alors distinguer deux types d’icônes différents en ne se basant pas sur des propriétés qui leurs seraient propres, mais sur des propriétés qu’elles acquièrent dans leurs environnements de perception et d’usage. Il sera alors question d’icônes connues et d’icônes inconnues.

Les icônes inconnues ont besoin d’être introduites dans nos pratiques. Pour cela, nous chercherons à en comprendre le sens en établissant des liens de similarité entre elles, leur référent ou des icônes similaires dont nous avons déjà eu connaissance. Les icônes connues, au contraire, ne posent aucun problème pour ce qui concerne leur utilisation : elles font déjà partie de nos connaissances établies. Le seul souci qu’elles peuvent poser concerne notre capacité à les retrouver rapidement sur l’écran afin de maximiser leur utilité et de ne pas rompre le rythme d’interaction établi avec l’objet.

Dans le premier cas, il faut avant tout apporter une clarification : pour Peirce, comme le dit très bien Eco (Eco, 1997 : 300), l’icônisme entendu comme « moment perceptif » n’existe pas. Pour parler d’un signe iconique comme ceux que nous retrouvons dans les interfaces, il faudrait parler d’hypoicônes comme d’un type de signe qui contient aussi une composante symbolique conventionnelle. Ce type de signe serait en quelque sorte similaire à son référent. Il serait le produit d’une subrogation minimale des stimuli impliquant un degré élevé de réalisme. Cette similarité serait toujours, selon Eco, construite à partir d’un point de vue bien déterminé qui, dans les conditions optimales, offrirait les informations nécessaires à la reconnaissance de l’objet réel qu’on voulait reproduire. Les interfaces graphiques, avec le contrôle complet de l’aspect visuel qu’elles offrent, semblent ainsi être le lieu idéal pour développer un processus de ce genre. La relation qui s’établit entre l’hypoicône présentée sur écran et l’objet réel auquel elle fait référence comporte un troisième élément fondamental à la médiation qui bâtira le processus de sémiose. Ce troisième élément était le « type » pour le Groupe μ (Groupe μ, 1970, 1992) qui cherchait à construire une rhétorique générale de la perception et qui traitait également de la nécessité d’un agent médiateur entre référent et signifiant, tout comme dans le processus de reconnaissance visuelle. Selon cette approche, l’hypoicône ferait référence à un modèle culturel en utilisant certaines de ses composantes. Dans le même temps, le modèle culturel déterminerait la sélection des éléments pertinents de l’objet réel pour en dégager une sorte d’image fonctionnelle à l’activité de reconnaissance. En bref, l’activité de design ayant lieu sur une surface pour en dégager une hypoicône ne devrait pas chercher reproduire l’objet réel, mais à reproduire le type de cet objet réel qui est propre, dans un moment historique donné, à une culture donnée. Ce qui semble insuffisamment mis en avant par la position du Groupe μ3 est la possibilité que l’utilisation d’un certain type de représentation iconique puisse réellement changer et modifier en profondeur le type, en effectuant une opération inverse à celle que le type effectue sur l’hypoicône. En ce sens, les premières représentations iconiques utilisées pour les interfaces graphiques (ou les premières dont on a fait l’expérience), deviendraient fondamentales pour les activités de reconnaissance ultérieures. Les habitudes (Peirce, 1931-58) qu’on peut développer, au niveau de l’action et de la perception constitueraient ainsi la base la plus importante pour l’établissement d’une cohérence globale dans un cadre de création visuelle des fonctions et des possibilités d’action. Le fait d’apparaître comme des représentations d’objets est la seule forme qu’une icône peut avoir sur la surface d’un écran mais son interprétation et surtout son efficacité ne dépendent pas du rapport qu’elle peut établir avec cet objet, mais du processus de sémiose qui indique que cette image est susceptible de déclencher une action dans le sens du but que nous cherchons à atteindre. L’efficacité de la représentation dépendra alors de la pratique d’usage qui a conduit l’usager à la faire passer du statut d’icône inconnue à celui d’icône connue, et le « type » culturel auquel elle fait référence sera crée dans les pratiques interprétatives d’un contexte bien défini.

Afin de vérifier la validité de la théorie qu’on vient d’exposer nous allons étudier l’exemple de l’interface multitouche d’Apple. Nous pouvons en effet y retrouver des icônes difficilement reconductibles à un modèle culturel établi a priori et relativement stable dans le temps. La boussole qui représente le logiciel Safari pour l’utilisation d’Internet ne fait absolument pas partie des notions qui constituent le noyau culturellement établi de ce réseau. Elle semble faire d’avantage référence à l’activité plus vaste  de « navigation » qui, entendue en sens métaphorique, peut être appliquée à l’utilisation de ce service. De même, l’icône avec la flèche verticale dirigée vers le bas et entourée par un cercle ne semble pas faire référence à un modèle préexistant faisant directement référence au logiciel iTunes. La problématique serait la même avec l’icône de la météo, des réglages de l’objet ou des icônes que l’usager peut ajouter selon ces besoins et envies comme celle des applications proposées par Velib’ ou la RATP. On s’aperçoit tout de suite de la difficulté principale liée à ces icônes : elles doivent renvoyer à des applications, à des logiciels, à des complexes d’actions qui, souvent, n’ont pas de correspondant fixes dans le monde réel ou en ont plusieurs, interchangeables entre eux. Les icônes inconnues cherchent à se présenter immédiatement comme ayant une relation avec la corporéité du support qui accueille l’ensemble des fonctions qu’elles représentent. Mais elles ne deviennent compréhensibles que dans le cadre des pratiques d’usage, alors que les usagers forment des habitudes interprétatives à partir d’abductions qui sont autant de paris sur les actions activables dérivant de l’interprétation des données qui sont fournies par l’image iconique et le texte sous-jacent. Une fois établie une connaissance, au moins partielle, de l’environnement d’action, la priméité visuelle et perceptive de l’icône assure un rôle de première importance. En effet, dès lors que l’on connaît les fonctions auxquelles on peut accéder à travers les icônes, les données perceptives seront souvent les seules à être sélectionnées par l’usager afin de diminuer sa charge cognitive. On peut ainsi dire que les icônes sont utilisées bien différemment par un usager novice et par un usager expert, le premier cherchant des indices sur les possibles conséquences de ses actions, le second cherchant la représentation visuelle lui permettant de compléter une action déjà préfigurée.

Deux indications empiriques4 semblent conforter cette position : d’une part les difficultés de reconnaissance d’icônes ayant le même rôle mais une organisation visuelle différente dans des interfaces distinctes et, d’autre part, certaines recherches récentes en sciences cognitives appliquées (Bar, 2004 ; Queen, 2006). Les usagers semblent en effet avoir des difficultés à retrouver, lors du passage d’une interface Windows à une interface MacOs, l’icône de la corbeille, nonobstant le fait que l’icône de la corbeille MacOs soit plus « iconique » que celle de Windows. Cette difficulté pourrait être expliquée en postulant, comme on le disait ci-dessus, la construction de la signification en acte, à travers un processus reliant une série d’interprétation orientées par l’action à un certain nombre de traits visuels. En changeant ces traits, les liens établis seraient évidemment rompus, même si les nouveaux traits visuels restent fidèles à l’objet du monde réel auquel on voulait faire référence à l’origine. Les recherches de Moshe Bar sur la reconnaissance des objets et celles de Matt Queen sur les icônes des ordinateurs semblent ajouter une signification plus profonde à ces comportements des usagers. Selon Bar les fréquences spatiales visuelles participent de manière considérable à notre activité de reconnaissance des objets. En particulier, les fréquences basses joueraient un rôle de première importance dans le processus de recherche d’un objet, en véhiculant une perception globale permettant d’extraire très rapidement les informations essentielles présentées sur l’écran. En utilisant des icônes dont les fréquences spatiales basses se différencient fortement entre elles, et en préconisant une activité de reconnaissance des icônes connues basée sur les indices visuels, on devrait arriver à des réactions temporelles sensiblement plus rapides que la norme. Les résultats obtenus par Queen, en analysant les icônes d’ordinateurs le confirment : une réponse brève si les fréquences utilisées ne se différencient pas beaucoup entre elles, une réponse plus rapide si elles sont plus éloignées l’une par rapport à l’autre. Si nous ne savons pas exactement ce que nous cherchons, nous utiliseront le contexte, la cohérence métaphorique et nos attentes d’actions pour chercher le point d’action dont nous avons besoin : une fois cette activité achevée, nous utiliserons les données visuelles dans leurs pures qualités iconiques pour retrouver un point d’action connu et nous dédier simplement à l’interaction qui en résulte.

Cette activité nous semble accompagnée, dans le cas de l’interface multitouche d’Apple, par l’utilisation d’icônes faciles à distinguer entre elles dans l’écran d’accueil, et par le lien entre leur gestion et la constitution d’une série d’actions stéréotypées de l’usager dans l’environnement d’action des applications (Morgagni, 2008 : 80-81). Ainsi, l’activité de reconnaissance visuelle ne se constitue et ne se limite pas à une activité mentale construite en dehors de l’espace d’interaction, mais elle résulte de cet espace et a lieu non seulement pour les icônes de l’interface proprement dite, mais pour toute composante visuelle de l’interface qui participe activement à cette construction et à cette immédiateté perçue. Au delà des icônes on trouvera ainsi comme composante visuelle construisant l’action, la barre d’état en haut de l’écran, la barre des fonctions en bas, la barre rétractable utilisé pour l’insertion des adresses Internet et le nombre variable de petits points blancs qui indiquent les pages disponibles à consulter et permettent de passer directement de l’une à l’autre. À l’intérieur d’un espace interactionnel où les contenus deviennent l’interface on assistera ainsi à une utilisation comme fonds perceptifs de toute composante sur laquelle des actions sont possibles. Ce fond perceptif n’existera pas comme reproduction d’un objet réel, mais comme résultat de son propre processus d’émergence et des pratiques qu’il déclenche et auxquelles il donne sens pour son usager.

On a pu commencer à apercevoir quelques unes des principales différences entre une interface virtuelle, entendue comme structure sémiotique complexe, et les formes textuelles traditionnellement appréhendées par les théories narratives. Ici plus qu’ailleurs, l’activité perceptive joue un rôle clé, qui semble destiné à prendre encore plus d’importance au vu des évolutions actuelles qui, étant donné que la dimension haptique ne constitue qu’une partie d’un parcours, permettront probablement à terme une superposition complète de la présentation du contenu et des possibilités d’action. L’interface, entendue au sens d’un texte, semble prévoir dès sa conception une activité interprétative hyper-personnelle, se construisant autour de la sphère la plus privée de l’usager, comme un corrélat de sa vie intime. Dans notre analyse nous voulons considérer un espace interactionnel plus vaste englobant les pratiques d’usage et les actions développées par l’usager. Cette activité d’interprétation semble être reliée à trois dimensions principales pour l’usager, ce que soutient aussi Emiliano Pintori (Pintori, 2006). Il s’agit ainsi de : a) la quotidienneté de l’usage et des pratiques construites autour des interfaces virtuelles (surtout en ce qui concerne les interfaces nomades) ; b) la possibilité de relier et de faire communiquer ces objets avec d’autres objets, construisant ainsi de nouvelles pratiques inter-objectales ; c) la possibilité de traduire et d’augmenter la mémoire et, au moins en partie, l’activité cognitive des usagers via le matériel expressif de leurs interfaces graphiques. Cela conduirait à la création d’un espace cognitif plus vaste, capable de relier les actualisations de la matrice narrative5 du logiciel avec les pratiques interprétatives de l’usager, et de constituer des espaces globaux d’action et cognition. Cette constitution peut avoir lieu parce que la représentation expressive, qui se développe sur l’écran, est constituée d’unités sémantiques minimales qui seront ensuite insérées par les pratiques des usagers dans une isotopie globale (Rastier, 1987), elle-même définie par l’activité perceptive et l’action des sujets. Pour permettre le développement de cette forme d’interaction textuelle particulière, une certaine cohérence et une compréhensibilité des éléments est nécessaire. Pour garantir cette cohérence, les structures gérant l’interface respectent une certaine permanence, qu’illustrent par exemple la construction et le maintien d’un nombre restreint de métaphores locales et globales, des rythmes d’interaction, des icônes et plus généralement des éléments visuels.

L’interface doit, toutefois, permettre d’identifier non seulement les permanences, mais aussi les lignes de changement et de différenciation progressive. L’interface multitouche d’Apple propose par exemple quatre icônes différentes pour envoyer un message électronique. Beaucoup de designers et d’experts ont parlé de ce choix multiple comme d’une erreur qui nuit à la cohérence qu’on aurait pu obtenir en utilisant une seule icône par action prévue pour toutes les applications développées pour l’interface. Comment expliquer cette incohérence apparente du design de l’interface ? Etait-ce une simple erreur due à un développement partiellement inabouti visant à faire entrer le produit sur le marché le plus tôt possible ou était-ce un choix basé sur des motivations réelles ? On retrouve ces quatre icônes dans les contextes suivants :

Image1Touche « composer ». Cette touche, représentée par un carré sur lequel est dessiné un instrument d’écriture, est située en bas à droite de l’écran des sections qui composent l’application de courrier électronique et de celle qui permet l’envoi des messages6. L’icône qui permet de partager un message apparaît à gauche de la première, seulement lorsque le message en question est visualisé à l’écran. Ainsi, une fois le message tapé, on pourra l’envoyer ou le partager avec d’autres personnes.

Image2Icône « enveloppe ». Dans l’application « Notes », cette icône en forme d’enveloppe apparaît en bas de page, à gauche de l’icône de la corbeille. Elle permet d’envoyer par courrier électronique la note qu’on était en train de visualiser.

Image3Icône « utiliser photo ». Cette icône à forme rectangulaire avec une flèche qui en sort vers le haut apparaît en bas à gauche de l’écran lors de la visualisation des photos. Elle est une sorte d’image inversée de l’icône qui permet de partager un message. Elle permet d’envoyer la photographie sélectionnée par courrier électronique.

Image4Icône « partager adresse ». Il est possible de partager une adresse Internet ou une vidéo YouTube par courrier électronique. Il suffit pour cela de cliquer sur l’icône « partager », présent sur l’écran d’information de la vidéo qu’on vient de visionner, ou encore de cliquer sur l’icône des signets en bas au centre pour envoyer l’adresse choisie par courrier électronique.

Toutes ces activités semblent renvoyer à un même type d’action, bien qu’on y accède par des icônes assez différentes, voire contradictoires. En réalité on s’aperçoit assez rapidement qu’écrire un courriel est une action qui, pour l’usager, est bien différente de celle d’envoyer une des ses notes en utilisant Internet. Dans le premier cas il s’agit d’une activité importante et indépendante, alors que dans le second cas, il s’agit plutôt d’une opération collatérale par rapport à l’action principale. Pour cela elle nous semble pouvoir être interprétée différemment, comme une possibilité de s’envoyer à soi-même une brève note sur un autre support ou comme une modalité de communication avec d’autres, qui aura toujours besoin d’un second support pour être comprise. Un discours du même genre peut être tenu sur le partage de photographies et d’adresses. Nous pouvons, en conclusion, identifier trois types d’action distincts : l’écriture d’un message, la réutilisation d’un matériel personnel à partager avec des amis, et le partage d’une adresse Internet avec d’autres. Si on suit cette typologie on s’aperçoit que la seule réutilisation du même élément ou d’éléments similaires dans le design des icônes ne suffit pas à créer une cohérence globale, mais qu’il est également nécessaire de pouvoir différencier les éléments qui, tout en présentant des similitudes, doivent rester différents. Comme l’explique aussi Edward Tufte (Tufte, 1990, 2008), il est aussi inévitable de comparer les éléments qui se trouvent dans d’un même champ visuel (on appellera cette activité discernement visuel), tout comme les éléments qui se retrouvent à l’intérieur des mêmes champs d’action (faisant ainsi référence à un discernement pratique). Pour cela les icônes présentées peuvent être regroupées au sein de trois catégories générales, capables de rendre les actions présentées cohérentes dans tous les cadres que nous avons évoqués. Elles ne constituent pas une perte de cohérence globale, mais elles aident à la construire, car elles sont à la fois cohérentes avec l’application (donc avec le design de l’écran où elles apparaissent) et avec le rythme du toucher et les actions rendues possibles par l’interface. Un autre exemple est celui de la modification des icônes des messages, des courriels et des appels alors qu’une nouvelle communication a eu lieu. Dans les trois cas on assiste à une modification de l’icône de base, à laquelle se superpose une seconde icône indiquant le nombre de messages ou d’appels reçus. Cela permet à l’usager de percevoir, à travers une mutation visible de la couleur utilisée et l’ajout d’un nombre, le changement qui a eu lieu, sans qu’il ait besoin d’un raisonnement complexe, mais simplement en voyant la modification de la partie visuelle ou textuelle de l’icône7.

Un autre élément de première importance est celui lié à l’adaptation progressive de l’aspect perceptif de l’interface à son usager, la création d’une forme particulière et située de l’interface qui est déterminée à travers l’usage et les pratiques développées dans le temps par le propriétaire de l’objet. Cette interface semble presque imposer à l’usager une utilisation personnelle, construite dans le temps mais toujours changeante selon le degré de connaissance des possibilités offertes et la création d’habitudes que l’usager considère plus au moins adaptées à ses caractéristiques et ses nécessités. Cette activité a lieu selon un processus qui se veut continuel et qui limite au maximum les interventions qui peuvent rompre l’impression de dialogue prototypique que l’usager construit avec l’interface. Il n’est pas du au hasard qu’aucun livret d’information ne soit fourni avec le produit : cette interface veut se « faire apprendre » en acte. Pour limiter au maximum les risques d’interruption de ce dialogue, il est très rare d’assister à la visualisation de messages métacommunicatifs (messages d’information, d’erreurs etc.) qui seraient une rupture de l’illusion de réalité récrée lors de l’interaction. On assiste plus souvent à des propositions visant à rectifier les actions de l’usager, comme on peut le voir avec le dictionnaire qui aide à la composition des courriels ou pendant l’écriture des adresses Internet. L’interface n’a recours à la métacommunication que dans le cas d’une erreur grave de système ou lorsqu’une action ne peut pas être menée à terme : s’il y a plusieurs options possibles pour résoudre le problème elle les propose afin que l’usager puisse choisir immédiatement et reprendre l’interaction normale. Si cela n’est pas possible, l’interface permet seulement d’accepter la réponse proposée et, en bloquant toute autre possibilité, renvoie l’usager à la page visualisée précédemment. Toujours conformément au refus de principe de contraindre l’utilisateur à une forme d’interaction obligée, l’interface ne nous demande pas de suivre des programmes obligatoires et nous permet, au contraire, d’établir et de fixer nos choix habituels, permettant ainsi la création de voies et de méthodes personnelles pour la gestion des contenus. Pour regarder le site Internet du journal Le Monde, nous pouvons choisir d’ouvrir le browser Safari et de taper directement l’adresse pour voir apparaître le contenu dans l’écran. Mais il est aussi possible de sauvegarder8 l’adresse dans les signets et un simple clic permettra à l’avenir pour visualiser le site. On peut enfin ajouter une icône directement sur l’écran d’accueil si on sait qu’on visitera assez fréquemment une adresse spécifique, ce qui constitue un troisième parcours possible pour accomplir la même action. Si dans cette interface la simplification et l’immédiateté étaient encore plus importantes, vu la nécessité pragmatique de limiter l’activité d’insertion de données de la part de l’usager due à la dimension et à la mobilité du support, les modalités prévoyant une plus grande liberté dans les comportements et les habitudes interprétatives liées aux actions semblent être une réponse bien fonctionnelle. L’usager n’est pas conduit par la main sur un parcours qui serait meilleur que les autres, mais  la possibilité de revenir en arrière en remontant son parcours lui est laissée, de même que les outils pour apprendre continuellement et pour réussir dans ses actions lui sont fournis. C’est la seule sanction9 qu’une interface de ce type semble vouloir donner à ses usagers : une sanction positive qui consiste dans la réussite et qui constitue probablement la partie la plus importante de la gratification que les usagers reçoivent en l’utilisant. L’interface se pose ainsi comme une forme externe de support vis à vis de ses usagers. Elle mémorise les actions qui ont déjà eu lieu, mais se limite à nous proposer des raccourcis tout en nous permettant toujours de changer notre modalité d’usage. Elle construit dans le temps ce que Rastier (1991) considérait comme une image de l’usager en évolution, capable de s’enrichir un peu plus à chaque intervention. En même temps elle n’arrive pas à modifier, à déplacer, à intervenir au niveau des habitudes d’interaction de manière autonome, en montrant de manière visible et évidente la nouvelle conception de l’innovation discrète. Il s’agit d’un modèle conceptuel utilisé depuis quelques années qui consiste à substituer des changements massifs et globaux éloignés dans le temps, avec des changements continuels de moindre importance qui s’insèrent à l’intérieur des pratiques d’usage déjà constituées. Cela permet de maintenir une présentation constante de l’interface, et son amélioration progressive intervient de manière non intrusive au niveau des processus qui constituent la véritable valeur des produits, plus que leur composante matérielle. Ce nouveau type d’intervention et d’amélioration continuelles, né sur le modèle organisationnel de Toyota, puis développé dans le domaine du logiciel libre, est présent et utilisé dans cette interface. Cela signifie qu’il est possible d’exploiter véritablement, pour la première fois de façon massive, d’une part les usages et les connaissances acquises par les usagers et d’autre part, à travers la virtualisation des ses fonctions permettant l’élimination de la partie objectale10, d’apporter des modifications sur le produit déjà vendu, en allongeant son temps de vie et en multipliant ses possibilités d’interaction.

En conclusion, l’analyse des nouvelles formes de textualité numérique, dans lesquelles s’insère de plein droit l’analyse des interfaces graphiques d’ordinateur, nous semble évoquer, du moins sous certains aspects non négligeables, la nécessité d’arriver à réunir dans une même théorie l’activité perceptive et l’activité cognitive. Dans le cas que nous avons étudié cela semble se révéler particulièrement évident en ce qui concerne la stricte coordination entre l’aspect visuel et l’aspect langagier qui se retrouvent jouer ensemble le rôle de support d’une série d’actions pragmatiques. Nous avons proposé de lire l’espace interactionnel qui permet le développement des pratiques des usagers comme un champ d’action suivant les modèles gestaltistes (Rosenthal & Visetti, 1999) et microgénétiques (Rosenthal 2004 et 2005) qui permettent d’y inscrire des déterminations pratiques et culturelles destinées à se développer en cours d’action. Il deviendrait ainsi possible d’indexer théoriquement les relations se constituant entre perception et cognition sur l’hypothèse de formations sémiotiques hybrides, qu’on pourrait appeler, en reprenant à nouveau une terminologie peircéenne, de « diagrammatiques ». Cela amènerait par la suite à pouvoir théoriser les différents états de phase qui, dans des situations données, peuvent donner à une forme un statut plus ou moins générique, plus ou moins défini de son interprétation. Il s’agit là d’une tentative pour développer, à terme, une théorie dynamiciste et constructiviste des pratiques culturelles et des formes symboliques cherchant à rendre compte de la complexité de l’émergence sémiotique sans se rabattre sur un schématisme formel ou sur la classique perspective binaire entre perception et action (Visetti & Cadiot, 2001 et 2006). En quelque sorte une icône (mais comme on a eu occasion de le dire, une forme visuelle quelconque prise dans un processus spécifiquement sémiotique) serait le lieu du processus de diagrammatisation plus ou moins latents, plus ou moins différenciés, selon sa condition de fruition11. Ainsi il n’y aurait aucun besoin de sortir du champ sémiotique afin d’expliquer l’apparente immédiateté propre à l’interaction avec les objets et en particulier avec les interfaces virtuelles. Face à une perspective comme celle qui vient d’être esquissée, le concept même d’affordance comme information qu’on peut percevoir sans besoin d’une appréhension spécifique (Norman, 1988, 1998, 2004), souvent cité afin de rendre compte de l’interaction entre homme et machine, pourrait être expliqué comme résultat d’une pratique cognitive complexe constituée par les habitudes perceptive et cognitives développées par un usager dans un présent épais (Rosenthal, 2005). Dans ce cadre, chaque élément appartenant au monde ne peut que s’insérer dans un système de pratiques et de connaissances capables de préfigurer un horizon d’action situé et spécifique. Ce sont ces pratiques qui permettent, en même temps que l’activité perceptive se développe, l’émergence d’un certain nombre de signifiés qui peuvent assurément être considérés comme directs, mais qui ne sont pas pour autant immédiats comme le voudrait Norman. En proposant une approche de ce type il apparaît alors clair que les affordances des objets et des icônes visualisées sur écran ne sont rien d’autre qu’une manifestation d’un processus bien plus vaste, qui doit donc être approché de manière plus générale par une théorie sémiotique globale.




Liste des références bibliographiques

Apple, Computer Inc. (1984) Macintosh Human Interface Guidelines, Reading (MA) : Addison-Wesley

Bar, Moshe (2004) Visual objects in context, Nature Reviews: Neuroscience, n.5, 617-629

Benyon, David & Imaz, Manuel (2007) Designing With Blends, Cambridge Massachusetts : MIT Press

Bettetini, Gianfranco (1996) L’audiovisivo, Milano : Bompiani

Calabrese, Omar (1985) Il linguaggio dell’arte, Milano : Bompiani

Eco, Umberto (1994) Mac Vs Dos, in La bustina di Minerva, (2000), Milano : Bompiani

Eco, Umberto (1997) Kant e l’ornitorinco, Milano : Bompiani

Eco, Umberto (2007) La soglia e l’infinito, in Paolucci, Claudio Studi di semiotica interpretativa, Milano: Bompiani

Fabbrichesi Leo, Rossella (1983) La polemica sull’iconismo, Napoli : Edizioni Scientifiche Italiane

Fauconnier, Gilles & Turner, Mark (2002) The Way We Think: Conceptual Blending and the Mind's Hidden Complexities, New York : Basic Books

Floch, Jean-Marie, sous la direction de (1983) Sémiotiques syncrétiques, « Actes sémiotiques », VI, 27

Groupe µ (1970) Rhétorique générale, Paris : Larousse

Groupe µ (1992) Traité du signe visuel, Paris : Seuil

Lakoff, George & Johnson, Mark (1980) Metaphors we live by, Chicago, Chicago University Press

Lakoff, George & Johnson, Mark (1999) Philosophy in the flesh, Chicago, Chicago University Press

Morgagni, Simone (2008) Pratiques d’émergence sémiotique : une analyse de l’interface multitouche d’Apple, Mémoire de Master Recherche, Ecole des Hautes Etudes en Sciences Sociales, Paris

Nielsen, Jacob (2000) Designing Web Usability: The Practice of Simplicity, Indianapolis: New Riders Publishing (trad. It. (2000) Web Usability, Milano : Apogeo)

Norman, Donald (1988) The Psychology of Everyday Things, New York : Basic Books (trad. It. (1990) La caffettiera del masochista. Psicopatologia degli oggetti quotidiani, Firenze : Giunti)

Norman, Donald (1998) The Invisible Computer, Cambridge (Mass.) : MIT Press

Norman, Donald (2004) Emotional Design Why we love (or hate) everyday things, New York : Basic Books

Paolucci, Claudio (2007) Studi di semiotica interpretativa, Milano: Bompiani

Peirce, Charles Sanders (1931-58) Collected Papers, Cambridge (Mass.) : Harvard University Press

Pintori, Emiliano (2006) Design delle interfacce. Forme di ibridazione semiotica, in Ocula n. 7, juin 2006, depuis le site web :

http://www.ocula.it/files/pintori07_design_interfacce_%5B403,169Kb%5D.pdf

Queen, Matt (2006) Icon Analysis, Boxes and arrows :

http://www.boxesandarrows.com/view/icon_analysis

Rastier, François (1987) Sémantique interprétative, Paris : PUF

Rastier, François (1991) Sémantique et recherches cognitives, Paris : PUF

Rohrer, Tim (1995) Metaphors we compute by : bringing magic into interface design, depuis le site web : http://philosophy.uoregon.edu/metaphor/gui4web.htm

Rosenthal, Victor (2004) Perception comme anticipation : vie perceptive et microgenèse, in L’anticipation à l’horizon du présent, Sock, Rudolph & Vaxelaire, Béatrice (éds.), Liège : Mardaga

Rosenthal, Victor (2005) Formes, sens et développement : quelques aperçus de la microgenèse, in Texto !, mars 2005

Rosenthal, Victor & Visetti, Yves-Marie (1999) Sens et temps de la Gestalt, Intellectica : revue de l’Association pour la Recherche COgnitive, n. 28, 147-229

Tufte, Edward (1990) Envisioning information, Chesire : CO Graphic Press

Tufte, Edward (2008) IPhone Video, depuis le site web :

http://www.edwardtufte.com/bboard/iphone-video.adp

Vandi Claudio (2007) Beyond metaphors and icons, (presented at the Design Semiotics in Use Conference, June 2007, Helsinki)

Visetti, Yves-Marie & Cadiot, Pierre (2001) Pour une théorie des formes sémantiques, Paris : PUF

Visetti, Yves-Marie & Cadiot, Pierre (2006) Motifs et proverbes, Paris : PUF

Zinna, Alessandro (2002) Décrire, produire, comparer et projeter. La sémiotique face aux nouveaux objets de sens, Nouveaux Actes Sémiotiques, n. 73/74/75, Limoges : PULIM

Zinna, Alessandro (2004) Le interfacce degli oggetti di scrittura, Roma : Meltemi

Notes de bas de page


1 Grâce à la réutilisation dans le cadre de l’interface des simulacres des objets provenant du monde réel.
2 Pour une première approche des formes de syncrétisme textuel voir « Sémiotiques syncrétiques » (Floch 1983)
3 Le débat sur l’icônisme reste en tout cas bien plus vaste que l’exploration minimale qu’on vient d’esquisser et mériterait d’être développé de manière plus vaste et complète dans une recherche indépendante. Pour le moment nous nous limitons à signaler trois ouvrages qui reprennent les débats ayant eu lieu dans les années ’70 (Bettetini, 1996 ; Calabrese 1985 ; Fabbrichesi, 1983) et les deux récentes contributions d’Umberto Eco (Eco, 1997 et 2007).
4 Les deux exemples repris ici sont issus de discussions qui ont eu lieu avec Claudio Vandi sur ses recherches actuelles sur l’interface MacOs (Vandi, 2007) : j’en profite pour le remercier chaleureusement.
5 Par « matrice narrative », nous entendons une structure capable de produire d’innombrables occurrences textuelles, toujours différentes les unes les autres. Les interfaces, comme les jeux vidéo, par exemple, ne seront pas considérés comme des textes au sens traditionnel du terme, en premier lieu parce qu’un texte doit être stable dans sa substance alors que la partie variable de la matrice d’une interface peut changer de façon sensible suivant les pratiques d’usage et, en second lieu, parce qu’un texte traditionnel existe au delà de l’éventuelle utilisation d’un usager alors que l’interface ne n’existe réellement que dans l’action. La conclusion devient tout de suite évidente ; il ne faut pas considérer l’interface en tant que texte établi mais la voir comme une « machine narratrice », comme un dispositif de production de différentes occurrences textuelles, a priori indépendantes l’une de l’autre. On se retrouve ici face à une matrice reconnaissable en tant qu’agglomérat sémiotique surabondant qui précède la formation d’un texte et qui doit déjà contenir les ressources nécessaires pour ses développements ultérieurs.
6 Dans ce second cas elle est située, au contraire, en haut à droite de l’écran.
7 Un second signal indiquant l’arrivé d’un ou plusieurs message est constitué par une diminution du volume du son du lecteur mp3 ou de l’appel téléphonique qui permettent à l’usager d’en venir à connaissance sans pour cela interrompre l’activité dans laquelle il était immergé.
8 L’interface en tout cas nous proposera les adresses utilisées auparavant et commençant de la même façon que celle qu’on est en train de taper (adresses récupérés dans les sites visités lors des navigations antérieures) sous la barre d’adresse.
9 Les interfaces classiques des ordinateurs, au contraire, ont encore tendance à bloquer assez souvent l’usager, en ne lui donnant pas, dans la plupart de cas, la possibilité de refaire son parcours en sens inverse. En lisant cela comme des formes de sanction négative, on peut ensuite comprendre l’insatisfaction et la rupture du rythme interactionnel qui en dérivent. On retrouve ici deux idéologies différentes du processus interactif, celui qu’on considère normalement être proposé par Apple et celui proposé par Windows. Umberto Eco (1994) en parle brièvement, mais les études, les documents, les vidéos et jusqu’aux spots publicitaires sont innombrables et souvent assez amusants.
10 Dont la structure matérielle était forcement figée sur des fonctions particulières qui ne pouvaient être modifiés et qui devient caduque au moment où on passe à une modalité d’action qui est exclusivement haptique.
11 Je remercie Yves-Marie Visetti pour ses précieuses suggestions sur le sujet.



Pour citer cet article


Morgagni Simone. Montages signifiants : les icônes d’Apple iPhone entre texte et image. Signes, Discours et Sociétés [en ligne], 2. Identités visuelles, 22 janvier 2009. Disponible sur Internet : http://www.revue-signes.info/document.php?id=715. ISSN 1308-8378.




GSU   Ovidius   Turku   Nantes   Agence universitaire de la Francophonie
Revue électronique internationale publiée par quatre universités partenaires : Galatasaray (Istanbul, Turquie), Ovidius (Constanta, Roumanie), Turku (Finlande) et Nantes (France) avec le soutien de l'Agence universitaire de la Francophonie (AUF)
ISSN 1308-8378