Stratégies de dialogue
Introduction
Nous partons d’une modélisation formelle du dialogue à partir de la théorie des jeux, pour donner ici quelques compléments concernant le calcul des gains et la mise en œuvre des stratégies.
Considérant que le dialogue est un « jeu interactionnel » nous avons opté pour la théorie des jeux [1] pour modéliser les intérêts que nous avons à dialoguer plus que les buts à atteindre (disons plutôt que les buts à atteindre sont précisément déduits des intérêts ou des gains à acquérir). Elle permet de surcroît de traiter les dialogues répétés et les dialogues à connaissances incomplètes ce que ne permettent pas les autres théories, qui mettent en avant des cadres cognitifs ou sociaux trop rigides. De plus un jeu peut s’auto-construire et s’adapter ce qui est aussi le propre du dialogue qui construit ses propres règles au cours du temps et est fonction de l’arrivée ou du départ des participants en cours de dialogue.
Un dialogue est alors
formalisable de la manière suivante :
Dialogue D = (I, C, F, G(I), J)
- I = ensemble des interlocuteurs {i} engagés dans le dialogue ;
- C = cadre pragmatique défini plus loin ;
- F = ensemble des actes de dialogue {FA, FF, FS, FFS, FD, FP} ;
- Gi = ensemble des gains de l’interlocuteur i avec les sous-notations
- GEi = gain espéré par i,
- GAi = gain effectivement acquis par i à un moment donné du jeu ;
- J = type de jeu (répété ou non, à connaissances complètes ou incomplètes, à somme nulle ou non, etc.) selon la nomenclature en théorie des jeux
- I = ensemble des interlocuteurs {i} engagés dans le dialogue ;
- m = modes d’interaction par exemple parole, geste, postures, etc. ;
- Monde M = comprenant les mondes d’arrière-plan Mi et la situation au temps t, xt ;
- Le dialogue se déroule peut-être autour d’une tâche ou d’une activité notée T dans laquelle les interlocuteurs ont peut-être un rôle R.
![]() |
| Boucle de dialogue |
Le dialogue s’arrête lorsque les gains acquis sont en équilibre ou qu’il n’y en a plus à espérer de nouveaux.
Vu d’un participant le dialogue se déroule de manière
répétitive et bouclée. Il estime un gain qu’il peut obtenir (gain espéré GE),
opte pour une stratégie d’intervention σ et en prépare son déroulement, prend
la parole et énonce sa contribution Fp, puis il en mesure l’effet produit en
termes de gain acquis GA suite à la réaction des autres locuteurs.
Estimation des gains acquis à partir des relations de discours
A chaque tour de parole nous
supposons que les locuteurs interprètent les énoncés des autres locuteurs dont
ils tirent des informations leur permettant de savoir si les gains qu’ils ont espérés
se réalisent ou non. Sur un plan formel nous pouvons décrire ce mécanisme de la
manière suivante :
A chaque acte produit par i est
attaché un gain espéré par lui, GEi et une réponse de
l’un des interlocuteurs attendue pour que ce gain espéré se réalise. Au tour de
parole suivant trois cas peuvent se présenter :
- (1) aucun acte dans ce tour ne constitue une réponse à l’acte de i : i met en attente son espoir de gain GEi pour le tour suivant ou relance immédiatement sa demande,
- (2) un acte répond totalement à son attente : alors son gain acquis est égal à son gain espéré, GAi = GEi, il peut relancer son intérêt pour la discussion en se donnant un nouveau gain espéré ou la quitter,
- (3) un acte répond partiellement à son attente : alors il a le choix entre ignorer cet acte et garder son gain espéré en réserve ou prendre le gain acquis avec une perte sachant que GAi < GEi et abandonner son gain espéré,
- (4) un acte contrecarre son attente : alors GAi = 0 ou i emploie une stratégie de détour,
- (5) un acte contredit irrémédiablement ou dénie son attente : alors le gain acquis devient négatif GAi = - GEi, c’est une perte.
Voici quelques
exemples intuitifs (la flèche dénote l’acte suivant produit par B en réaction à
l’acte courant de A) :
FFA p → FAB
q
●
q = p : délégation d’action conforme, B fait
l’action demandée par A, gain acquis
●
q ~ p : délégation d’action partielle ou
incomplète, gain non totalement acquis
FFA p → FSB
q
●
q = ¬p : déni de p, B ne fait pas l’action
demandée par A, perte pour A ou gain nul
●
q
≠ p : incidence de B qui fait autre chose que p, gain mis en attente pour
A
On voit sur ces deux exemples que selon le type d’acte
de langage F de contenu propositionnel p et des répliques suivantes il est
possible d’évaluer le gain acquis. Il
suffit donc de considérer toutes les paires possibles de relations, ce que l’on
peut trouver dans une théorie sémantique du discours telle que la SDRT [2] [3] [4],
pour en déduire les gains à l’aide de la règle suivante :
Pour FA p → FB q
considérer si
●
q = p, réponse totale (gain égal au gain espéré)
●
q = ¬p, réponse contraire (perte égale au gain espéré)
●
q ~ p, réponse partielle (gain inférieur au gain
espéré)
●
q
≠ p, incidence (gain mis en attente)
puis se reporter dans le tableau 1, qui précise les 36 relations rhétoriques des actes pris deux à deux. Par exemple le cas n°10, FFA p → FAB q, donne bien la relation attendue RAP si p = q ou PRAP si q ~ p (délégations d’action totale ou partielle).
Tableau 1 : liste des relations rhétoriques dialogiques avec les notations,
(a) Sur l’axe épistémique et son subordonné
- Les questions-réponses notées QAP : Question Answer Pair, PQAP (Partial QAP) et IQAP (Indirect QAP). Ces questions-réponses sont sur l’axe principal,
- Les questions subordonnées Q-Sub : Question Subordination, sont des demandes d’explicitation à propos des connaissances mutuelles. Les demandes de clarifications, corrections, reformulations, précision, etc. sont dans cette classe. On les notera Q-Sub:clarification, etc.
- Les élaborations de connaissances notées Elab : Elaboration, sont des apports de connaissances mutuelles construites au cours du dialogue. Elab:clarification, Elab:explication, Elab:correction, Elabq questions constructives,
(b) Sur l’axe transactionnel et son subordonné
- Les délégations d’action notées RAP : Request Answer Pair, est une demande d’action. PRAP réponse-action partielle, et IRAP indirecte,
- Les élaborations de plan notées P-Elab : Plan Elaboration, est une contribution à la construction d’un plan conjoint – ce plan devient le cadre d’action qui conduit à la résolution du but,
- Les élaborations de question Q-Elab : Question Elaboration, contributions à la construction d’un plan par une question,
- Les élaborations de but R-Elab : Action Elaboration, est une contribution à la construction d’un but – ou à la mise en perspective de ce but s’il est déjà posé. Cette transaction sur le but est sur l’axe subordonné,
(c) Sur les axes divergents : incidences et répliques
- Les incidences notées I : On distingue les incidences avec retour ou détour et les incidences sans retour, les insultes par exemple. Les détours sont en général des actes constructifs, mais indirectement et non médiatement, pour l’arrière-plan du dialogue,
- Les répliques notées R : se comportent comme des coordinations fermantes. En effet on ne peut enchaîner que sur une réponse à la réplique ou par un échappatoire. Les répliques permettent cependant de changer les règles du dialogue, de réguler la prise de tour de parole, de contester les rôles, etc. Leur effet est de modifier les engagements des interacteurs.
(d) Les continuations notées C : sont des actes qui continuent le discours dans le même topique.
- Les phatiques et métadiscours n’engendrent pas de relations rhétoriques intéressantes pour le dialogue. Les acquiescements sont des phatiques qui ont pour rôle soit de maintenir le fil du dialogue (comme mmh, ouais, etc.) soit de fermer une suite d’énoncés sous un même topique. Les acquiescements ne sont pas des réponses oui/non à des questions.
- La reformulation et la répétition sont éliminées à l’analyse car elles sont considérées comme des reprises.
Exemples de gain calculé sur une demande d’information par rapport aux réponses possibles
Réponses possibles :
FSB : p = Elle est au fond de ce couloir (QAP) => GAA = GEA
~p = Dans un autre bâtiment (PQAP) => GAA < GEA
~p = A côté de la salle Rouge (IQAP) => GAA < GEA
≠p = Le plan des salles est dans le hall (P-Elab) => GAA = 0
¬p = Je ne suis pas le concierge (R) => GAA = -GEA
C’est bien la salle de réunion ? (Q-Sub:clarification)
Est-ce vous qui l’avez réservée ? (Q-Sub:incidence)
Quel général ? (R) => GAA = -GEA
FFB : Vous allez au fond de ce couloir (QAP) => GAA = GEA
Vous allez dans l’autre bâtiment (PQAP) => GAA < GEA
Vous allez à côté de la salle Rouge (IQAP) => GAA < GEA
Demandez au concierge (R-Elab) => GAA = 0
FAB : Venez, je vous emmène avec moi (QAP) => GAA = GEA
Suivez-moi au début du chemin (PQAP) => GAA < GEA
Je n’ai pas le temps, je m’en vais (R) => GAA = -GEA
FDB : Vous devez d’abord passer au contrôle (R-Elab)
FPB : Vous montez là ou vous prenez l’ascenseur (P-Elab) => GAA = 0
Stratégies de dialogue
Les actes Fp sont produits à chaque tour de parole par un agent en considérant qu’il ajuste son processus d’intervention à un moment opportun du dialogue, ce qui peut être modélisé par :
- Choisir le moment de sa prise de parole,
- Choisir sa stratégie en tenant compte de la stratégie des autres locuteurs et du contexte, c’est-à-dire se donner un but dialogique à atteindre et des moyens pour y parvenir,
- Produire un acte de dialogue (c’est la finalité du but dialogique) le plus approprié possible à la situation et au gain espéré, et bien évidemment au matériau linguistique à sa disposition (compétence et performance linguistique), c’est-à-dire construire le contenu propositionnel p qui dénote le mieux le gain espéré.
En quelque sorte c’est planifier
au mieux son acte dialogique, en tenant compte des conditions de succès et de satisfaction
de cet acte [5].
Illustrons ceci par un exemple intuitif : supposons que le gain espéré soit GE = prix minimum pour un client qui est dans une situation de marchandage. Il peut tenter diverses stratégies pour faire baisser le prix, c’est-à-dire qu’il peut produire l’un des six actes qu’il a à sa disposition, soit :
- FA agir conditionnel (je l’achète si vous baissez)
- FF ultimatum (c’est à prendre ou à laisser)
- FD menace, intimidation (je ne prends cet article qu’à ce prix)
- FS prix maximum (je ne peux pas mettre davantage)
- FFS baisse prix (qu’est-ce qui vous empêche de baisser le prix ?)
- FP chantage (si vous me faites un prix je vous en prends deux)
Ainsi on voit que pour un même gain espéré, le client a le
choix entre diverses stratégies pour atteindre ses fins, qui sont par exemple
ici de convaincre ou de forcer le marchand.
Les types de stratégies
Compte-tenu de l’ajustement de la direction des buts dialogiques entre deux agents, les stratégies possibles sont seulement au nombre de cinq [6]. On peut en effet définir une stratégie comme la manière de gérer un échange pour atteindre et satisfaire un but dialogique (qui vise gain à acquérir par le dialogue) c’est-à-dire d’ajuster son but par rapport au but en cours dans le dialogue. Dans ce cas la combinatoire des directions d’ajustement des buts donne 5 stratégies possibles considérant bA le but de A et bB celui de B, B étant un autre locuteur dont le but est en cours. Nous avons
- Stratégie « réactive » : abandon de bA au profit de bB ; A est dit réactif il adopte pour un temps le but bB [noté par la direction d’ajustement (bB <- bA)
- Stratégie « directive » : imposition de bA à B ; A est dit directif, il impose son but [noté par la direction d’ajustement (bA -> bB)
- Stratégie « coopérative » : partage des buts ; A, B sont coopératifs en tentant de concilier leurs buts respectifs, |noté par la direction d’ajustement (bA <-> bB)
- Stratégie « de négociation » : par recherche d’un compromis ; A, B négocient et s’accordent sur un but b’ dit de compromis [noté par la direction d’ajustement (bA -> b’<- bB)
- Stratégie de détour « constructif » : A, B font une incidence constructive c’est-à-dire mettent leurs buts entre parenthèses en cherchant une autre solution dérivée ou différente ou un complément d’information, avant d’yrevenir après ce « détour » [noté par la direction d’ajustement (bA -> Ø <- bB)
Ce qui se traduit en termes clairs par :
● Stratégie réactive : consiste pour un agent A à déléguer l’initiative à un autre agent B. Le déroulement du dialogue se fait alors :- en maintenant son but bA en réserve, et en poursuivant le but bB,
- en abandonnant son but bA ou en le faisant passer sous la dépendance de B pour que celui-ci le résolve.
Cette stratégie rend A disponible et adaptable.
- en maintenant son but et en gardant l’initiative,
- en imposant son but bA comme but courant,
- en ignorant éventuellement le but courant bB, qui est donc en quelque sorte considéré comme inexistant
Cette stratégie rend A dominant.
● Stratégie constructive (ou du détour) : consiste à déplacer le but courant momentanément afin de provoquer un détour (espéré constructif) qui n’est pas nécessairement une incidence, par exemple pour faire remarquer un oubli, une erreur, faire une citation, rappeler un fait ancien, une expérience, etc. :
- le but courant est mis en attente, ainsi que le but bA,
- un nouveau but b’ provisoire est posé,
- l’initiative de la continuation peut être partagée.
Contrairement à une incidence, un détour ne ramène pas nécessairement à l’échange initial, il peut laisser la conversation en suspens ou conduire à un autre détour. Cette stratégie vise à ménager les susceptibilités.
- cela amène à dérouler un processus complexe — évaluer la situation, présenter une explication, éventuellement des exemples, des aides ou des arguments pertinents et offrir un choix fermé en maximisant l’espace de concession,
- en procédant par recherche d’un optimum dans un espace de possibles,
- en accompagnant l’interlocuteur jusqu’à la solution,
- en élargissant le but si nécessaire.
- évaluer les rapports de pouvoir,
- évaluer les enjeux s’il y en a (et les relations sociales),
- tenter d’imposer son but ou accepter un compromis en fonction du degré de résistance de l’interlocuteur et de ses préférences,
- tenter de modifier les croyances de l’interlocuteur (sur soi et sur le but)
- minimiser les concessions,
- pousser la négociation le plus loin possible jusqu’à un but acceptable bfinal, ou une solution de rechange.
Cette stratégie est souvent utilisée pour résoudre des conflits.
Les connaissances
Le schéma suivant résume les
catégories de connaissances que deux locuteurs peuvent avoir dans une situation
de dialogue.
Ces connaissances sont notées CAp pour A et CBp pour B, elles comprennent les connaissances d’arrière-plan et les connaissances sur la situation ainsi que les connaissances des interlocuteurs les uns sur les autres. Selon le type de jeu de dialogue à connaissances complètes ou incomplètes il est possible ou non de les expliciter. Dans le cas de dialogues entre personnes qui ne se connaissent pas quelques connaissances d’arrière-plan sont seulement supposées, notamment sur un niveau de compétence et de performance de langage eu égard à la situation. C’est le cas par exemple si l’on demande son chemin à une personne passant dans la rue, elle est supposée habiter la ville et connaître le quartier, mais elle peut répondre « je suis touriste comme vous ». Il est donc difficile voire impossible de mettre en œuvre un modèle de connaissance général dans le dialogue. On peut seulement supposer que les connaissances évoluent au cours du dialogue (ce qui n’est d’ailleurs pas toujours le cas [7]) puisque d’une part la situation évolue et que d’autre part les agents apprennent à mieux se connaître.
Notre approche par les
connaissances sera donc très peu exigeante. Nous supposerons seulement que les
agents ont un stock de connaissances qu’ils sont capables de modifier ou de
mettre à jour au cours du dialogue de manière minimalement rationnelle [8]
et consistante. Mais cela suffit pour expliciter les principes formels des
stratégies. Les règles de consistance sont tirées de la logique
épistémique :
Cp ˄ C(p É q) É Cq croire aux conséquences de ses croyances,
C(¬q) ˄ C(p É q) É C(¬p)
Cp É ¬C(¬p) ne pas croire le contraire de ce qu’on croit,
Cp É C(Cp) croire ses propres croyances,
¬Cp É C(¬Cp) croire qu’on ne croit pas
¬Cp É ¬C(Cp) ne pas croire ce qu’on ne croit pas
Formalisation des stratégies
Une stratégie comprend :
- · Une règle de déclenchement de ladite stratégie,
- · Une règle d’opportunité de prise de parole,
- · Des règles de planification d’un comportement ad hoc. (ou un algorithme de planification).
La mise en œuvre de la stratégie consiste à prendre la parole et à adopter le comportement ainsi planifié.
Nous n’allons pas donner ici les cinq schémas des cinq stratégies puisque tous les détails peuvent être trouvés dans [6]. Nous donnons simplement à titre d’illustration les règles de la stratégie réactive qui est la plus simple et de la stratégie de négociation qui est la plus complexe.
Exemple 1 : illustration des stratégies pas à pas entre un client C et un agent hôtelier A. Les stratégies sont notées en abrégé : R (réactive), D (directive), C (coopérative), N (négociation), K (constructive)
C : Bonjour madame FP (phatique) D
Je voudrais une chambre pour 2 nuits FF (x) : chambre(x) Ù durée(x,2) D
A : oui, pour quand ? FFS (y) : jour(y) C
A : voulez-vous une chambre avec bain ? FFS (x) : chambre(x) Ù bain(x) K
A : j’ai une chambre à 50 € FP (x) : prix(x,50) N
A : non tout est complet FS (impossible) N
C : bon… eh bien, d’accord FF (accord) N
A : c’est facile, c’est en face de la gare FS (z) : lieu(z,gare) C
C : oui bien sûr, voici ma carte VISA FS (v) : carte-visa(v) Ù numéro(v) R
Quelques exemples de dialogues
Ayant maintenant développé tous les éléments de notre modèle, nous pouvons l’illustrer avec les quelques exemples suivants :
Exemple 2 : dialogue entre un
passant (P) et un mendiant (M) rencontré fortuitement dans la rue. Ce dernier
tend une coupelle, le passant s’arrête et reste inflexible aux sollicitations du
mendiant.
M : GEM = monnaie ; (stratégie = D) É FFp(x) : pièce(x) Ù obtenir(x)
M : une pièce s’il vous plaît
P : GEP = 0 ; (stratégie = K) É FD(travailler(M)) Ù ØFAp(x)
P : tu ferais mieux de travailler que de mendier
M : GAM = 0 ; (stratégie = K) É FS(histoire)
M : j’étais au chômage et je n’ai pas trouvé de travail
P : (stratégie = K) É FS(Øhistoire) Ù ØCPM
P : ouais… moi aussi j’ai été au chômage…
M : (stratégie = N) É FS(expressif)
M : alors vous me comprenez…
P : (stratégie = D) É FS(Øp(x))
P : va te faire voir avec ta pièce !
M : GEM = 0 ; (stratégie = D) É FS(expressif)
M : bon ça va !
Fin : sortie avec GAM = 0 et GAP = 0
Exemple 3 : Vendeur (V) et
cliente (A) sur le marché de plein air. On est ici dans un jeu répété :
hier le vendeur a vendu des aubergines à sa cliente qui revient sur le marché
vers le même marchand. Un autre jeu se joue dès lors en entrelacement du
marchandage, celui de la fidélisation.
V : x : courgettes(x) ; GEV = marge(x) ; (stratégie = C) É FS(phatique) ᴧ Fp(x) ᴧ CM(fidèle(A))
V : alors la petite dame comment ça va aujourd'hui ? J'ai de belles courgettes, toutes fraîches
C : GEA < GEV ; (stratégie = N) É FS(phatique) ᴧ FFS(prix(x)) ᴧ FFS(qualité(x))
C : ça va bien et vous ? Combien vos courgettes ? C'est pas trop de saison ça dites-moi...
V : GEV = marge(courgettes) – ristourne ; (stratégie = N) É FS(ristourne) ᴧ FS(expressif)
V : c'est pas cher pour vous, je vous fais un prix, vous êtes belle comme tout aujourd'hui !!
C : GAA = GEA ; (stratégie = N) É FS(phatique) ᴧ FA(achat(x))
C : merci, vous êtes gentil [acte d'achat].
C : GEA = 0 ; (stratégie = D) É FP(promissif)
C : A demain.
V : GAV = marge(courgettes) – ristourne ; (stratégie = R) É GEV = 0 ; FP(promissif)
V : A demain
Fin : sortie avec GAA > 0 et GAV > 0 ᴧ CV(fidèle(A))
Exemple 4 : Deux tables proches au restaurant : un couple A
et B, une personne seule C. Il s'agit d'une situation courante de deux tables
proches au restaurant, un couple A+B doit choisir sur le menu tandis qu'une
autre personne C, seule est déjà servie et est en train de manger. C rentre
dans la conversation quand le couple choisit son menu.
A : GEA = CA(plat(B)) ; (stratégie = C) É FFSx : plat(x)
A#B : qu'est-ce tu as choisi ?
B : GEB = CB(plat(C)) ; (stratégie = C) É FS(Øx) ᴧ FSy : plat(y)
B#A ; je sais pas… mais le plat de notre voisine me parait sympa
A : GAA = 0, GEA = GEB
C se sent interpelée : (stratégie = R) É FS(goût(y))
C#B : oui en effet, c'est très bon
B : GAV = GEV ; (stratégie = D) É FS(phatique)
B#C : merci
B : GEB = plat(y) ; (stratégie = K) É FPy
B#A : alors je vais prendre la même chose
A : GEA = GEB ; (stratégie = R) É FSy
A#B : moi aussi
Le dialogue se poursuit…
Exemple 5 : A, B et C discutent des prochaines élections à
la cafétéria d’une entreprise. Il s'agit ici d'une discussion conviviale à
propos des prochaines élections entre 3 collègues A, B et C. Au début du
dialogue, c’est A qui a l’initiative. Il mène le dialogue en posant ses
arguments, et B joue le contradicteur. Puis B prend le leadership : il neutralise
l’argumentation de A et acquiert un gain de position. C reste cependant allié à
A.
A : GEA = CA(influence(A)) ; (stratégie = D) É FPx : vote(x) ᴧ écolo(x)
A : je vais voter écolo
B : (stratégie = K) É FFS(x)
B ; pourquoi ?
A : (stratégie = K) É FS(x)
A : parce que pour la planète c’est important
C : GEC = CC(allié(A)) ; (stratégie = C) É FS(accord)
C : il a raison
A : GAB = CA(influence(C))
B : (stratégie = D) É FFØx
B : oui mais il n’y a aucun candidat écolo
C : (stratégie = R) É FS(expressif)
A : GAA = ØCA(influence(B)) ; GEA = 0 ; (stratégie = R) É FSØx
C : ah bon ?
A : tant pis on attendra les prochaines élections
C : GAC = CC(allié(A))
B : GAB = CB(Øinfluence(A)) ; (stratégie = D) É FFØx
B : en attendant faites comme moi…
Fin : sortie avec GAA = garde influence sur C, GAB = leadership de position, GAC = allié de A, la prochaine discussion partira de ce constat
Conclusion
Notre modèle de dialogue montre (a) d’une part qu’une
légère extension de la notion d’intérêt permet de faire entrer le dialogue dans
un cadre opératoire souple et bien connu de la théorie des jeux et que d’autre
part (b) aucune hypothèse sur un modèle social, éthique ou cognitif de
l’individu en tant qu’être engagé dans le dialogue, n’est nécessaire. Il s’agit
seulement de chercher un équilibre entre tous les gains qui dénotent l’intérêt
des locuteurs à participer au dialogue. Nous traitons donc le dialogue comme un
jeu dont les « coups » sont des actes de dialogue.
Le calcul des gains se fait au fur et à mesure de l’avancée
du dialogue par traitement des paires d’actes de dialogue et de leur contenu
propositionnel sans faire appel à un quelconque niveau d’intentionnalité ou
d’états mentaux : il s’agit de mettre en place une stratégie de production des
actes en espérant un gain puis d’évaluer ce ou ces gains acquis dans une boucle
qui tend vers un équilibre général ou par abandon d’un gain espéré.
Le modèle ne présuppose pas de but a priori du dialogue autre que lui-même : les interactants peuvent
agir de manière spontanée, sans intention particulière dans un cadre quelconque.
Les buts dialogiques se forment au cours du dialogue pour alimenter la
production des actes de manière stratégique et opportuniste. Nous ne faisons
pas non plus d’hypothèses sur les connaissances partagées des interlocuteurs. Nous supposons seulement que les agents sont
minimalement rationnels et consistants.




