Semaine 3

Activité 1

Le centre d’attention, les modes et interfaces multimodales

Sommaire

Centre d’attention
Concepts de modes et d’interfaces multimodales
IHM multimodales (IHM3)
Propriétés des IHM3

Centre d’attention [1]

Lors de l’étude de la conscience, nous avons fait allusion à « l’attention ». Nous aurions dû, en fait, utiliser le terme « centre d’attention ». Le centre d’attention joue un rôle très important dans la conception d’interfaces puisqu’il permet à l’usager d’accomplir des tâches sans se tromper. Or, il est important de définir ce qu’est le centre d’attention. Nous pouvons définir le centre d’attention comme étant le point central de notre conscience. Notre conscience peut être occupée par plusieurs choses; par contre, le centre d’attention ne peut porter sur plus d’un objet à la fois. Il est important de distinguer l’expression « centre d’attention » du mot « focus ». L’utilisation de l’expression « centre d’attention » permet d’éviter l’utilisation du mot « focus » (facilitant l’utilisation du verbe « focuser ») qui sous-tend une action. Nous voulons ici insister sur le fait que le centre d’attention est une propriété et non une action. Formellement, le mot « focus » est un anglicisme et « focuser » est une impropriété qui signifie porter son attention sur quelque chose. Par exemple, si je vous demande de penser à la dernière lettre du sigle du cours; le sigle du cours passera dans votre conscience et la dernière lettre sera votre centre d’attention.

Le centre d’attention a des répercussions très intéressantes pour l’étude de la conception d’interfaces. En fait, plusieurs exemples démontrent qu’une mauvaise utilisation du centre d’attention ou une concentration très grande sur ce dernier peut causer de graves accidents. Par exemple, selon les rapports d’un comité d’enquête sur les catastrophes aériennes, la concentration du pilote d’un avion et de son équipage sur le remplacement d’une lumière défectueuse a causé l’écrasement de l’avion après que le système de pilotage automatique ait été désactivé par inadvertance, et ce, malgré la panoplie d’alarmes présentes dans le poste de pilotage de l’avion.

Il est possible, comme avec la conscience, de diriger notre centre d’attention. Cela nous permet de travailler! Mais des événements externes peuvent aussi modifier notre centre d’attention. Par exemple, lorsque j’échappe une craie…

Mais alors, quelle est l’incidence du centre d’attention sur la conception d’interfaces? Un exemple simple : si une interface devient très difficile à opérer, le centre d’attention change et devient le problème à résoudre et non la tâche à exécuter. En fait, on oublie la tâche qu’on doit effectuer. De plus, le stress et la fatigue sont des facteurs qui réduisent la capacité de l’usager à modifier son centre d’attention. C’est un effet néfaste de la concentration. Il faut donc apprendre à faire une bonne utilisation du centre d’attention.

Utilisation du centre d’attention

Un changement de contexte ou de centre d’attention peut prendre jusqu’à 10 secondes (selon la répétition et la fréquence de la tâche). Le CanonCat était un ordinateur qui permettait de tirer profit de cette propriété. Une image de l’écran était sauvegardée sur le bloc 0 de la disquette et était chargée à l’écran dès que l’ordinateur était allumé. Par la suite, le reste de l’information était chargé pendant que l’utilisateur prenait connaissance de l’avancement de sa dernière tâche exécutée et commençait à taper au clavier. De cette façon, l’usager n’avait aucune conscience que le chargement de l’information pouvait prendre jusqu’à 10 secondes. De plus, on devrait toujours retourner l’utilisateur là où il était en train de travailler. Ce qui nous conduit à utiliser la méta-information pour aider l’utilisateur. Enfin, il faut trouver des techniques pour permettre à l’utilisateur de continuer à travailler même lorsqu’on veut l’informer d’un événement.

Concepts de modes et d’interfaces multimodales [1]

Modes et interface modale :

Les modes dans les interfaces sont souvent la cause d’erreurs. Mais qu’est-ce qu’un mode ou, plutôt, qu’est-ce qu’une interface modale? Pour définir ce qu’est une interface modale, il faut tout d’abord définir les termes mode et geste.

Mode : un mode est défini par la constance dans sa réaction à une action.
Geste : un geste est un ensemble d’actions effectuées par un humain qui complète une commande déjà amorcée.
Interface modale : une interface est modale en fonction d’une action si les deux critères suivants sont présents :

l’état de l’interface n’est pas le centre d’attention de l’usager;
l’interface peut exécuter différentes fonctions répondant à un geste dépendamment de l’état du système.

Attention : la conformité aux standards n’est pas un critère pour les modes.

Quelques exemples :

Backspace n’est pas un mode;
Italique n’est pas un mode;
Gras est un mode;
Caps Lock est un mode.

Le pour et le contre des modes

Le problème principal des interfaces modales, c’est qu’elles désorientent l’usager. Effectivement, le centre d’attention de l’usager n’est pas le mode mais l’action. Ainsi, l’usager pourra poser deux fois la même action sans que la réponse du système soit la même. On désoriente donc l’usager.

L’identification des modes dans une interface peut faciliter grandement l’amélioration de l’interface.

En effet, il suffit de modifier l’interface en identifiant clairement l’état du système (au centre d’attention) ou en introduisant un quasi-mode afin de réduire grandement le risque d’erreur. Par exemple, changer le curseur de la souris.

Effectivement, l’introduction de quasi-modes (activation d’un mode à l’aide d’une touche – par exemple <ctrl> et click) permet de réduire le risque d’erreur de mode puisque l’appui sur une touche du clavier envoie un signal au cerveau pour signifier la présence d’une pression. De cette façon, on évite que le mode soit caché à l’usager. Ce dernier devra l’activer consciemment.

Recommandation pour l’utilisation d’interfaces modales

On devrait utiliser le plus souvent des modes temporaires pour une exécution pas à pas (« one shot »). Une fois l’action exécutée, l’interface revient au mode standard.
On devrait représenter graphiquement le mode.
On devrait éviter les préférences pour les items fréquemment utilisés.
On devrait remplacer les modes par des fonctions différentes.
On devrait éviter les boutons poussoirs. Utiliser des boutons radio pour sélectionner une action différente.
Les modes ne causeront pas de problèmes s’ils sont au centre d’attention ou dans la mémoire à court terme.
On devrait utiliser la formulation « Nom – verbe » en lieu de « verbe-nom ». Il est préférable, par exemple, de permettre une sélection puis une action plutôt que l’inverse. Cela fait en sorte que l’action demeure le centre d’attention. Certaines situations, comme les palettes, ne donnent guère de choix, en raison de leur façon d’être. Il faut, dans ce cas, utiliser le curseur pour indiquer l’action.

IHM multimodales (IHM3) [2]

Les IHM3 sont présentes dans plusieurs types de systèmes : systèmes de navigation, systèmes destinés aux handicapés, systèmes de contrôle, etc. Les interactions dans ce type d’IHM offrent une grande flexibilité à l’utilisateur et facilitent l’utilisation de ces systèmes. En contrepartie, leur caractère concurrent rend leur conception et leur analyse complexes. Elles nécessitent la mise au point de nouveaux modèles permettant de raisonner sur ce type de systèmes interactifs.

Plusieurs travaux ont été effectués pour spécifier les concepts de base des IHM3 et définir des espaces de conception et les propriétés d’utilisabilité connexes.

Concepts de base

Plusieurs concepts liés aux IHM3 ont été définis, mais un consensus sur leur définition n’a pas encore été établi. Ainsi, le concept de modalité est défini dans (Nigay et al., 1995) par la paire « média, langage d’interaction », où « média » désigne le dispositif physique utilisé pour acquérir ou fournir les informations et où « langage d’interaction » définit un ensemble d’expressions bien formées et significatives de symboles résultant d’actions sur les dispositifs physiques. Martin et al. (1996) définissent la modalité comme la manière d’utiliser un média. Ainsi, le média stylo électronique peut être utilisé selon plusieurs modalités : écriture, geste de dessin, geste de commande. La modalité, dans ce cas, résulte d’un processus d’analyse ou de synthèse défini en fonction d’ensembles de données d’entrée et de sortie. Nigay et al. (1996) présentent une synthèse et une mise au point sur la terminologie et sur les référentiels applicables à la conception d’IHM3. Le concept de multimodalité est lié à la multiplicité des modalités. Un système est dit multimodal s’il dispose d’au moins deux modalités pour un sens donné (en entrée ou en sortie). Puisque les actions sont produites par plusieurs modalités, il faut parfois les composer de manière à permettre la formation d’une commande plus complexe. L’opération qui réalise cette composition est appelée fusion; elle est utilisée en général pour les interactions en entrée (de l’utilisateur vers le système). L’opération qui consiste à décomposer une commande en plusieurs actions de modalités différentes est appelée fission; elle est utilisée en général pour les interactions en sortie (du système vers l’utilisateur).

Espaces de conception

Les espaces de conception permettent de caractériser les systèmes en termes utiles au concepteur de logiciels. Ils se fondent sur un ensemble de critères combinés pour offrir un guide de conception ergonomique. Bellik (1995) définit l’espace de conception selon les trois critères suivants : production des énoncés (séquentielle ou parallèle), usage des modalités (exclusif ou simultané) et nombre de modalités par énoncé. Un énoncé correspond à une tâche élémentaire (p. ex., placement d’un modèle d’objet géométrique de base comme un cube, cylindre ou autre) réalisée par une ou plusieurs actions interactives de base que l’utilisateur exécute selon une ou plusieurs modalités (clic de la souris, commande vocale, etc.). Les tâches utilisateurs plus complexes sont réalisées par la composition séquentielle ou parallèle de ces énoncés. Ainsi, la tâche de conception d’un modèle d’objet géométrique complexe composé de plusieurs modèles de base (cylindre, cube, etc.) est réalisée à l’aide des énoncés correspondant aux placements de ces objets de base. Selon cet espace de conception, les IHM3 sont classées en sept types.

− Exclusif : une seule modalité est utilisée par énoncé et la production des énoncés est séquentielle.

− Alterné : plusieurs modalités peuvent être utilisées alternativement pour produire un énoncé. Les énoncés sont produits de manière séquentielle.

− Synergique : les énoncés sont produits de manière séquentielle mais plusieurs modalités peuvent être utilisées dans un même énoncé et de manière parallèle.

− Parallèle exclusif : plusieurs énoncés indépendants peuvent être produits en parallèle. Une seule modalité est utilisée pour chaque énoncé et, à un instant donné, une seule modalité est active.

− Parallèle simultané : plusieurs énoncés indépendants peuvent être produits en parallèle. Une seule modalité est utilisée pour chaque énoncé mais, à un instant donné, plusieurs modalités peuvent être actives en même temps.

− Parallèle alterné : plusieurs énoncés indépendants peuvent être produits en parallèle. Plusieurs modalités peuvent être utilisées dans un même énoncé, mais une seule est active à un instant donné.

− Parallèle synergique : plusieurs énoncés indépendants peuvent être produits en même temps. Plusieurs modalités sont utilisables pour un même énoncé et plusieurs modalités peuvent être actives en même temps.

Nous utilisons l’espace de conception décrit ci-dessus pour paramétrer notre modèle formel. Par ailleurs, dans le contexte de ce modèle, et à des fins de modélisation générique, nous définissons la modalité comme un type d’événement de base. Cette définition permet de concevoir une modalité comme une abstraction de toutes les définitions de la notion de modalité proposées par la communauté des chercheurs dans le domaine des IHM3.

Propriétés des IHM3

Un ensemble de propriétés permettant de caractériser et de vérifier l’utilisabilité d’une IHM3 a été défini dans Coutaz et al. (1995). Ce sont les propriétés CARE : Complémentarité, Assignation, Redondance et Équivalence. Ces notions ont été introduites initialement dans l’espace de conception TYCOON (Martin et al., 1994) qui fournit une étude sur l’usage de la multimodalité. Ces propriétés peuvent être appliquées aux dispositifs physiques, aux langages d’interaction ou aux tâches. Nous définissons chacune de ces propriétés pour une tâche T donnée et définie par un état initial et un état final. À titre d’illustration, nous considérons la tâche consistant à dessiner un cercle en précisant deux points à l’écran. Le premier point désigne le centre du cercle et le second point désigne un point périphérique.

− Les modalités d’un ensemble M sont dites complémentaires si elles doivent toutes être utilisées pour réaliser la tâche T et si aucune modalité de l’ensemble M ne suffit à elle seule à réaliser la tâche T. Par exemple, si l’utilisateur précise le premier point du cercle avec un clic de la souris et le second point en prononçant la phrase « périphérique x,y », où x,y sont les coordonnées du point périphérique, la voix et la manipulation directe avec la souris sont dites complémentaires pour la réalisation de la tâche de dessin du cercle.

− Les modalités d’un ensemble M sont dites équivalentes si chacune d’elle permet de réaliser la tâche T. Par exemple, la voix et la manipulation directe sont dites équivalentes si le système permet à l’utilisateur de dessiner le cercle avec la souris et avec la voix. Avec la souris, l’utilisateur clique sur la commande cercle dans le menu par exemple, puis désigne deux points sur l’écran. Le premier point correspond au centre et le second correspond à un point périphérique. Avec la voix, l’utilisateur prononce la commande « cercle de centre x,y périphérique t,z », où x,y désignent les coordonnées du centre du cercle et t,z les coordonnées d’un point périphérique.

− Les modalités d’un ensemble M sont dites redondantes si elles sont équivalentes et sont toutes utilisées, en parallèle ou en séquence, pour réaliser la tâche T. Si l’utilisateur active les deux commandes équivalentes, présentées précédemment, de manière parallèle, les deux modalités voix et manipulation directe sont dites redondantes pour la tâche de réalisation du cercle. L’intérêt de cette propriété apparaît surtout dans les interactions en sortie. Si on alerte l’utilisateur par un message affiché et sonore, cela augmente l’insistance de l’IHM3. Cette propriété permet également d’offrir des dispositifs d’interaction alternatifs (handicap, p. ex.).

− Une modalité est dite assignée à la tâche T si elle est l’unique modalité permettant de réaliser cette tâche. Si le système permet de dessiner le cercle qu’avec une manipulation directe utilisant la souris, on dit que la manipulation directe est assignée à la tâche de dessin du cercle. Ces propriétés, lorsqu’elles sont formalisées et évaluées, permettent de mesurer la qualité et l’ergonomie d’une IHM3.

Exemples pratiques

– Atl-F4 dans Windows.

Si une fenêtre est activée, elle sera fermée. Si aucune fenêtre n’est activée, un dialogue apparaîtra pour offrir de fermer l’ordinateur.

– CD-ROM avec un autorun.

Il n’existe aucune indication visuelle du type de CD-ROM. Un double-clic de la souris sur l’icône du CD peut soit démarrer l’autorun, soit ouvrir une fenêtre pour naviguer dans les dossiers.

Autre exemple

– Le clic de la souris, plus précis pour indiquer un endroit sur l’écran, peut être combiné de manière séquentielle avec la parole pour lancer une commande.

Exemple :

Clic
“Ouvrir le logiciel Y”
Clic

Bibliographie :

Bouchard, F. (2007) IFT515 – Interfaces et multimédia, License Creative Commons
Kamel, N. & Ait Ameur, Y. (2002). Mise en œuvre d’IHM multimodale dans un système CAO. Une approche fondée sur les méthodes formelles. Revue internationale de CFAO et de l’informatique graphique. https://iihm.imag.fr/nigay/ENSEIG/RICM5/IHM/

À PROPOS DU COURS

APPRENTISSAGE