1 L’interaction verbale
L’identité co-construite dans l’interaction sociale, résulte de « façons de faire, de procédés, d’ “ethno-méthodes” mobilisées par les acteurs sociaux pour rendre intelligible leur appartenance à une ou plusieurs catégories » (Greco et al., 2014 : 7). C’est pourquoi l’approche interactionniste de l’identité s’inspire de la démarche ethnométhodologique (Ibid.). D’autant plus en interactions numériques au cours desquelles la construction identitaire des interactants repose sur leur capacité à se rendre visibles et rendre intelligibles leurs productions et les activités dans lesquelles elles s’inscrivent. Le sens de l’ethnométhodologie tient dans l’appréhension de la construction de l’intelligibilité par les acteurs sociaux.
1.1 À l’origine de l’interactionnisme, la démarche ethnométhodologique
L’ethnométhodologie forme une approche complexe à la définition délicate. D’autant plus que, comme le rappelle Coulon, « davantage qu’une théorie constituée, elle est une perspective de recherche, une nouvelle posture intellectuelle. » (1987 : 3). Néanmoins, Quéré parvient à la résumer en ces termes :
« [L’ethnométhodologie] cherche à analyser le monde social non pas tel qu’il est donné mais tel qu’il est continuellement en train de se faire, en train d’émerger, comme réalité objective, ordonnée, intelligible et familière. »
(Quéré, 1990 : 75).
L’un des principaux fondateurs de cette approche et inventeur du terme « ethnométhodologie », Harold Garfinkel, a rédigé un ouvrage devenu la référence dans le domaine : Studies in ethnomethodology (1967). Il y définit l’ethnométhodologie comme une démarche qui « analyzes everyday activities as members’ methods for making those same activities visibly-rational-and-reportable-for-all-practical-purposes, i.e., “accountable”, as organizations of commonplace everyday activities. »[1] (1967 : vii). Garfinkel précise par ailleurs qu’il recourt à la démarche ethnométhodologique « to refer to the investigation of the rational properties of indexical expressions and other practical actions as contingent ongoing accomplishments of organized artful practices of everyday life » (1967 : 11).
Ces définitions laissent ainsi apparaître une double orientation des études ethnométhodologiques (Mondada, 2006 : 117). D’une part, l’analyse de l’indexicalité (« haecceity ») rappelle la spécificité particulière du contexte dans lequel s’inscrit l’interaction, résultant du travail situé des membres au moment de leur action. D’autre part, l’ethnométhodologie se donne comme objet d’analyse non pas cette spécificité en tant que telle mais plutôt les procédures ou méthodes par lesquelles elle se réalise et par lesquelles les pratiques sociales s’organisent — pratiques qui sont pourvues de régularité et d’invariance dans leur contexte d’apparition. En outre, effectuer une analyse au travers d’une démarche ethnométhodologique implique la connaissance de concepts clés propres à cette discipline, que nous définissons ci-après.
Le concept sous-tendant l’ensemble de cette démarche, l’« accountability », renvoie au fait que « la (re)connaissabilité, l’intelligibilité, la descriptibilité sont des propriétés essentielles de l’action » (Mondada, 2006 : 117). Les propriétés pertinentes du contexte, ainsi que les propriétés organisationnelles de l’action rendue reconnaissable, permettent aux membres de rendre leur pratique intelligible entre eux afin d’y participer, s’y engager, s’y coordonner. Ce concept d’accountability issu de l’ethnométhodologie de Garfinkel a par la suite fait écho dans les travaux en analyse des interactions suite à son emprunt par Sacks (en outre, Garfinkel et Sacks collaboreront dans la rédaction d’un article sur le phénomène d’indexicalité, en 1970). Antaki rappelle que « “Accountability” is a term which usefully crystallises the notion of normative responsibility, first articulated for the social sciences in Garfinkel’s ethnomethodology (1967), and taken up expressly by Sacks in his early lectures » (2005 : 2). Cette approche apporte en effet un éclairage nouveau à l’analyse des interactions, en ce qu’elle cherche à élucider la façon dont les comptes rendus, ou les descriptions d’un événement, d’une relation ou d’une chose (« accounts »), sont produits en interaction, de telle sorte qu’ils parviennent à un statut méthodologique clair (Zimmerman, 1976 : 4). Comme le rappelle Ten Have et Psathas, l’ethnométhodologie et l’analyse conversationnelle « share a foundational position with regard to the effort to discover/ describe/ analyze everyday, naturally occurring activities, by preserving their in situ order and organization as phenomena of study » (1995 : xvii).
Il s’agit donc d’étudier les « accounts », i.e. les explications ou descriptions que les interactants font de leur action permettant la reconnaissance par les participants de ce en quoi consiste cette action (Heritage, 1988 : 128). Ce dernier ajoute que ces descriptions sont elles-mêmes des actions. Coulon illustre la notion d’accounts en ces termes : « rendre visible le monde, c’est rendre compréhensible mon action en la décrivant, parce que j’en donne à voir le sens par la révélation des procédés par lesquels je la rapporte » (1987 : 43). Il ne s’agit pas de décrire le monde, mais d’en montrer en permanence la construction. Cette analysabilité du monde social se révèle dans les actions pratiques des acteurs, dans leurs interactions. En effet, c’est au cours de leurs interactions que les locuteurs « implicitly display their understanding and analysis of what is happening as it happens » (Heritage, 1988 : 129).
Le caractère situé des interactions implique le phénomène d’« indexicalité » qui renvoie à toutes les déterminations qui s’attachent à un mot, à une situation. Cette notion rappelle que bien qu’un terme ait un sens trans-situationnel, il présente aussi une signification distincte dans toute situation particulière dans laquelle il est usité (exemples d’expressions indexicales : « cela », « je », « vous »,… parfois nommés déictiques) (Coulon, 1987 : 29). Ces expressions indexicales ne prennent leur sens complet qu’en fonction du contexte où elles sont émises, que si elles sont « indexées ». Garfinkel et Sacks caractérisent les expressions indexicales comme des « utterances whose sense cannot be determined without reference to the person talking, the time and place of talk, or more generally the occasion of speech or its « context » » (1970 : 348).
Cette indexicalité suppose une « réflexivité » de la part des participants. La réflexivité désigne « les pratiques qui à la fois décrivent et constituent un cadre social. C’est la propriété des activités qui présupposent en même temps qu’elles rendent observables la même chose. » (Coulon, 1987 : 37). Ces descriptions deviennent, dès qu’elles sont exprimées, des parties constitutives de ce qu’elles décrivent. Ainsi, la réflexivité désigne l’équivalence entre la description et la production d’une interaction, entre la compréhension et l’expression de cette compréhension. Pour Garfinkel l’account est le support qui véhicule cette équivalence.
Enfin, la notion de « membership » ne renvoie pas au fait d’appartenir à une communauté mais plutôt de maîtriser un langage naturel commun. Garfinkel et Sacks expliquent que « les gens, du fait qu’ils parlent un langage naturel, sont en quelque sorte engagés dans la production et la présentation objectives du savoir de sens commun de leurs affaires quotidiennes en tant que des phénomènes observables et racontables » (1970 : 339).
Notons en outre que les études ethnométhodologiques « focus on interactional phenomena, i.e., the “local” accomplishment of order, and the “methods” or “procedures” used in that accomplishment » (Ten Have & Psathas, 1995 : ix). Ainsi, les membres disposent de certaines « méthodes » pour organiser leurs interactions. L’ethnométhodologie désigne donc « la méthodologie pratiquée par les membres d’une société dans l’accomplissement de leurs activités ; c’est grâce à cette méthodologie que la réalité social et l’ordre social sont produits. » (Gülich, 1990 : 74). De même, Ten Have et Psathas expliquent que « talk-in-interaction is embedded in and constitutive of the setting » (1995 : xvii).
L’approche ethnométhodologique accorde une place prépondérante à la configuration de l’activité en cours rappelant que différentes ressources sont mises à profit afin de réaliser une activité. Goodwin a par ailleurs théorisé le concept de « système d’activité située » qu’il définit comme « the range of phenomena implicated in the systematic accomplishment of a specific activity within a relevant setting » (1997 : 115). En outre la compréhension de la structuration de l’échange entre les membres, et de ses composantes réside dans « the relevance of that specific category system to the activity they are engaged in » (Goodwin, 1997 : 134). Ainsi la signification et la pertinence de ce qui est dit et fait au cours de l’interaction ne sont saisissables que si elles sont circonscrites dans l’activité en cours de réalisation.
La configuration de l’interaction se trouve alors conditionnée par les participants et leur définition de l’échange en cours. Goffman (1991), dans son analyse des conversations ordinaires, introduit la notion de cadrage. Le cadre constitue le « dispositif cognitif et pratique d’organisation de l’expérience sociale qui nous permet de comprendre ce qui nous arrive et d’y prendre part » (Joseph, 1998 : 123). Le cadre structure autant « la manière dont nous définissons et interprétons une situation que la façon dont nous nous engageons dans un cours d’actions » (Ibid.). L’intérêt d’une approche ethnométhodologique des cadres d’interaction repose sur la saisie des règles opérant effectivement dans la conduite des acteurs et organisant l’échange ; « on peut ainsi voir ce qui est pertinent, pour eux, dans la conduite de l’interaction » (Gardella, 2007 : 5). En effet, en s’engageant progressivement dans l’interaction, les participants s’assurent qu’ils partagent le même cadre, la même interprétation, se conforment à des conventions et ajustent leurs comportements et rôles en fonction du cadre qu’ils supposent (Berry, 2008 : 2). Un cadre d’accords normatifs (Goffman, 1987) est mis en jeu, bien qu’implicite et tacite, et il revient au chercheur de le reconstituer par « les activités régulatoires qui l’accomplissent » (Gardella, 2007 : 2). Pour autant, les interactions ne se constituent pas nécessairement d’un seul cadre ; plusieurs cadres peuvent s’emboîter. Le cadre primaire correspond au sens immanent et sous-jacent à l’interaction et renvoie à l’activité qui se joue immédiatement. Pour Goffman, est dit primaire « un cadre qui nous permet, dans une situation donnée, d’accorder du sens à tel ou tel de ses aspects, lequel autrement serait dépourvu de significations » (1991 : 30). En l’absence des règles pratiques — action régulière — un trouble s’instaure dans l’intelligibilité et le sens de l’interaction (Gardella, 2007 : 7). L’interaction se modifie, elle subit une transformation. Cette dernière peut être de deux types : modalisation (l’activité déjà pourvue d’un sens dans un cadre primaire se transforme en une autre activité prenant la première pour modèle mais considérée comme sensiblement différente par les participants), ou fabrication (la modification de l’expérience en cours est cachée à l’interlocuteur et constitue une tromperie). L’opération de transformation conduit les interactants d’un cadre primaire à un cadre secondaire. Le sens des interactions se révèle ainsi altérable et instable, sujet aux comportements et régulations des interactants.
Il en découle que l’activité et le contexte forment des éléments qui s’élaborent et se déterminent mutuellement dans une équation simultanée que les acteurs passent leur temps à résoudre afin de définir la nature de leur interaction (Heritage, 1991 : 105). C’est alors au sein de cette interaction, que s’expriment les identités par la configuration de l’action et de l’organisation séquentielle ; dans la forme de chaque intervention – chaque action, chaque tour, chaque mot ou geste – le co-participant « s’aligne, voire s’affilie, avec le locuteur, et ratifie, accepte ou résiste, rejette, conteste son positionnement et son identité » (Greco & al., 2014 : 12).
1.2 La notion d’interaction
La notion d’interaction recouvre cependant des définitions plus ou moins restreintes en fonction de l’attitude portée à son égard. Goffman, linguiste et sociologue figurant parmi les fondateurs de l’analyse des interactions, explique que :
« Par interaction (c’est-à-dire l’interaction face à face), on entend à peu près l’influence réciproque que les partenaires exercent sur leurs actions respectives lorsqu’ils sont en présence physique immédiate les uns des autres ; par une interaction, on entend l’ensemble de l’interaction qui se produit en une occasion quelconque quand les membres d’un ensemble donné se trouvent en présence continue les uns des autres ; le terme « une rencontre » pouvant aussi convenir. »
(Goffman, 1973 : 23).
Kerbrat-Orecchioni précise, quant à elle, que pour qualifier une situation d’interaction « il faut et il suffit que l’on ait un groupe de participants modifiable mais sans rupture, qui dans un cadre spatio-temporel modifiable mais sans rupture, parlent d’un objet modifiable mais sans rupture » (1990 : 216). Dans une acception plus large, Vion affirme que le terme interaction « intègre toute action conjointe, conflictuelle et/ou coopérative mettant en présence deux ou plus de deux acteurs. » (1992 : 17). Joseph, dans une orientation sociologique, définit l’interaction comme :
« un système interactif comportant au moins quatre composantes : un ensemble d’unités qui interagissent les unes avec les autres ; un code ou un ensemble de règles qui structurent aussi bien l’orientation de ces unités que l’interaction elle-même; un système ou un processus ordonné de l’interaction ; enfin un environnement dans lequel opère le système et avec lequel ont lieu les échanges systématiques »
(Joseph, 1998 : 27).
Que l’interlocuteur soit immédiatement physiquement présent ou non, l’activité de parole implique nécessairement une adaptation à son auditoire correspondant au recipient design principle. Ce concept implique que « tout au long de son travail de production l’émetteur tient compte projectivement de l’interprétation qu’il suppose que l’auditeur va faire de ses propos » (Kerbrat-Orecchioni, 2005 : 16). En développant cette notion de recipient design, Sacks Schegloff et Jefferson font référence aux multiples ressources, visibles dans le tour de parole d’un locuteur, qui témoignent d’une orientation manifeste vers les coparticipants. Ce procédé s’inscrit dans la sélection des unités lexicales et thématiques, dans la manière d’ordonner les séquences, et également dans les obligations et alternatives retenues pour ouvrir et clore une interaction (Sacks et al., 1974 : 727). L’ensemble de ces procédés interactionnels permet aux participants d’assurer une coordination continue durant l’échange en s’orientant manifestement vers leurs partenaires, projetant une action coordonnée de leur part. Ces procédures locales, « bien qu’hétérogènes et mobilisées en des niveaux très divers de la structure interactionnelle, participent dans leur ensemble d’un procédé d’organisation générale de l’échange » (Denouël, 2008 : 107). Le principe de recipient design permet aux interactants de structurer leurs ressources linguistiques de manière à créer un foyer d’attention conversationnel commun, construire et contrôler conjointement le cours de l’interaction, garantir l’intelligibilité des éléments qui leur semblent pertinents et préserver la stabilité du lien interactionnel (Ibid.).
Néanmoins, les coparticipants n’occupent pas nécessairement la même position dans l’interaction selon qu’il s’agisse d’une interaction symétrique ou d’une interaction complémentaire (Maingueneau, 1996 : 19). Dans le premier cas, les participants à l’interaction se positionnent de façon égale. Dans le second, une différence entre eux est fortement marquée ; l’un des participants occupe la position haute et l’autre la position basse. Cette différence de position dans l’interaction complémentaire peut être imposée par la nature du genre de discours ou faire l’objet de négociations (Ibid. : 20). Une interaction complémentaire n’est pas nécessairement inégalitaire. Le face work (Goffman, 1974) au cours de l’interaction permettra ou non de sauver sa face et celle des autres participants. Cette notion de face introduite par Goffman (1974) est réinterprétée par Brown et Levinson (1978) qui distinguent la face négative (« territoire » : corps, biens, espace privé, information intime, parole) de la face positive (« façade » : image positive que l’on s’efforce de donner de soi). Au cours de l’interaction, quatre faces sont alors en jeu et sont menacées par les actes verbaux et non verbaux. Brown et Levinson parlent de Face Threatening Acts (actes menaçants pour la face) dont les FTA pour la face positive de l’énonciateur et celle du coénonciateur et les FTA pour la face négative de l’énonciateur et celle du coénonciateur. L’énonciateur doit donc faire en sorte de ménager les faces de son partenaire pour ne pas menacer les siennes propres (Maingueneau, 1996 : 41). Ces ménagements conduisent à de subtiles et constantes négociations dans l’interaction (Ibid.). Kerbrat-Orecchioni ajoute que « si de nombreux actes de langage sont en effet potentiellement menaçants pour les faces des interlocuteurs, il en est qui sont plutôt valorisants pour ces mêmes faces, comme le compliment ou la congratulation, le remerciement ou le vœu » (2005 : 196). À ce titre, Kerbrat-Orecchioni introduit dans le modèle théorique de Brown et Levinson le pendant positif des FTA : les Face Flattering Act (FFA : actes flatteurs pour les faces). Tout acte de langage peut se trouver être un FTA, un FFA ou un acte mixte (Ibid.).
Tous ces procédés induisent des positions spécifiques à chaque locuteur au cours de l’interaction qui sont négociées en temps réel.
1.3 Le cadre participatif de l’échange
Goffman argumente que « l’énonciation ne découpe pas le monde autour du locuteur en précisément deux parties, récipiendaires et non-récipiendaires, mais ouvre au contraire tout un éventail de possibilités structurellement différenciées, posant ainsi le cadre participatif au sein duquel le locuteur dirige sa production » (1987 : 147). Concernant le locuteur, Goffman distingue trois niveaux :
– L’animateur est la machine parlante, l’individu qui tient activement le rôle de producteur d’énonciations.
– L’auteur est celui qui sélectionne les sentiments qu’il souhaite exprimer ainsi que les mots pour les encoder.
– Le responsable représente le rôle social dans lequel l’individu agit.
Ce format de production révèle que ces différents niveaux peuvent ne pas être tous en corrélation avec un même individu au même moment mais au contraire être liés à d’autres individus. Cette complexification du traditionnel modèle dyadique locuteur-auditeur se révèle également dans l’étude des participants à l’échange. Aussi Goffman rappelle-t-il avant tout que les participants à l’échange ne doivent pas seulement être physiquement présents mais aussi « en état de parole ouvert » dans le sens où ils « sont dans l’obligation de maintenir une certaine absorption dans ce qui se dit » (1987 : 140). Il distingue alors différentes positions au sein des auditeurs que l’on peut résumer par le schéma suivant :
Format de réception à partir de Goffman (1987)
Précisons qu’un participant ratifié est un individu auquel on attribue un statut officiel de participant à la rencontre. Différents éléments posturo-mimo-gestuels en plus des indices linguistiques permettent de réguler le cadre participatif dans lequel s’inscrit l’interaction en cours (regard, orientation du corps dans l’espace,…). Reste que le cadre participatif n’est pas statique mais dynamique et complexe. L’ensemble des différents statuts de participants peut prendre la forme d’un continuum rendant complexe l’analyse du cas de figure précis à un instant précis (Kerbrat-Orecchioni, 2010 : 339). L’étude du cadre participatif permet néanmoins d’appréhender les positions que peuvent prendre les participants dans l’échange.
L’organisation de la structure de l’interaction entre les participants est également régie par les choix de dénomination des interlocuteurs entre eux : ce que Kerbrat-Orecchioni (2010) théorise sous le terme de « formes nominales d’adresse ». Ces dernières jouent « un rôle important dans le fonctionnement des interactions, entre autres pour marquer la relation interpersonnelle et construire l’espace social de l’interaction : ce sont de puissant « relationèmes » » (Kerbrat-Orecchioni, 2010 : 8). La forme nominale d’adresse (FNA) se définit comme « une forme linguistique désignant explicitement l’allocutaire (ou « destinataire direct », en anglais addressed recipient ou addressee) » (Ibid. : 9). Les FNA fonctionnent comme des « relationèmes » en ce sens qu’elles marquent un certain type de relation interpersonnelle, qu’elles peuvent confirmer et consolider voire reconfigurer (Ibid. : 356). Elles construisent les identités contextuelles des interactants en rendant saillantes certaines de leurs facettes (Ibid.).
C’est dans l’interaction que ces syntagmes nominaux deviennent véritablement des formes d’adresse. Ces FNA sont alors susceptibles de désigner l’allocutaire (valeur allocutive), le délocuté (valeur délocutive), et le locuteur lui-même. Quelle que soit sa valeur, la FNA est sémantiquement chargée et permet d’exprimer des valeurs sociales et relationnelles fines et diversifiées. Il est possible de distinguer sept formes de FNA : nom personnel (« Jean »), forme Monsieur/Madame/Mademoiselle, titre (« capitaine »), nom de métier/de fonction (« Garçon ! »), terme relationnel (« maman »), label (« les gars »), terme affectif (« chéri ») (Ibid. : 21-22). Elles peuvent assurer une fonction organisationnelle, relationnelle ou intermédiaire (entre organisationnel et relationnel).
Ainsi, il nous sera possible d’étudier les FNA utilisées par nos participants pour se dénominer eux-mêmes et dénominer leurs interlocuteurs. Elles peuvent être plus saillantes au cours des ouvertures et clôtures d’interaction. Ces dernières forment en effet des séquences primordiales dans la définition des identités des interactants. Aussi allons nous, dans ce qui suit, porter notre attention sur l’organisation séquentielle des interactions.
1.4 L’organisation séquentielle de l’interaction
Il est possible de distinguer dans les interactions verbales, une structure globale et une structure locale. La première fait référence, à un niveau macro, aux unités hiérarchisées de l’interaction et la seconde renvoie à un niveau micro — celui des tours de parole.
1.4.1 Construction globale
L’organisation de l’interaction peut être conçue en terme de rangs. L’analyse interactionnelle en rangs consiste alors à définir l’interaction comme « une structure constituée d’unités hiérarchisées » (Traverso, 1999 : 35). Il possible de distinguer trois rangs d’unités dialogales : l’échange, la séquence, l’interaction. L’échange correspond à la plus petite unité dialogale et représente l’unité fondamentale de l’interaction. Il se compose d’au moins deux interventions produites par des locuteurs différents. L’intervention du locuteur initial — intervention initiative — contraint l’intervention de l’interlocuteur — intervention réactive. S’observent ainsi des échanges essentiellement à structure ternaire (question-réponse-évaluation, offense-excuse-acceptation, …), si ce n’est pas le cas, il s’agit d’une troncation. L’agencement syntaxique des échanges peut être linéaire — échange coordonné — ou hiérarchique — échange subordonné. La séquence, plus complexe à délimiter, se compose d’un ou plusieurs échanges liés entre eux au niveau thématique ou pragmatique voire aux deux niveaux. Enfin, l’interaction, précédemment définie, constitue l’unité de rang supérieur et correspond à l’ensemble des interventions des locuteurs de leur entrée en contact à leur séparation (Traverso, 1999 : 37-38).
Au sein de l’interaction, cette entrée en contact ainsi que cette séparation des locuteurs font l’objet de rituels. La première constitue l’ouverture et la seconde la clôture de l’interaction, et ces deux séquences entourent le corps de l’interaction. L’ouverture comprend nécessairement les salutations des interactants et peut faire l’objet d’autres actes facultatifs (manifestation de cordialité, expression du plaisir éprouvé à cette rencontre,…). Les salutations consistent notamment à confirmer l’apparition des participants à l’interaction à venir. Kendon définit en effet les salutations comme « that unit of social interaction often observed when people come into one another’s presence, which includes a distinctive exchange of gestures or utterances in which each person appears to signal to the other, directly and explicitly, that he has been seen » (1990 : 153). Kendon (1990) distingue par ailleurs, au sein de la sous-séquence de salutations : une pré-phase de regard et décision de saluer ou non, les phases de salutation distante, d’approche et de salutation rapprochée, et une post-phase de transition vers le corps de l’interaction. La séquence d’ouverture joue un rôle déterminant dans l’interaction globale qu’elle prépare. C’est au cours de cette séquence que les interactants opèrent une prise de contact physique et psychologique et une première mais décisive définition de la situation d’interaction (Kerbrat-Orecchioni, 1996 : 37). Il est possible de distinguer une séquence préalable à l’ouverture : la pré-ouverture (pre-opening Mondada, 2008 ou pre-beginning Schegloff, 1979) notamment dans les interactions mobiles entre inconnus (demande d’itinéraire, …). Il nous semble que les phases constituantes de la pré-ouverture en interaction mobile pourraient être appliquée à l’introduction d’une rencontre en ligne. Mondada (2008) distingue quatre phases de pré-ouverture : le choix et l’identification de l’autre comme futur partenaire de l’interaction à venir, l’organisation de la convergence avec l’interlocuteur imminent (regard, posture), la construction d’un espace interactionnel commun, la reconfiguration de l’espace interactionnel en fonction de l’activité à venir. La pré-ouverture forme une séquence au cours de laquelle les participants exposent leurs attentes concernant les activités, catégories et identités impliquées dans l’interaction à venir et commencent à s’aligner sur elles (Mondada, 2008 : 1983). Le corps de l’interaction fait suite aux séquences de pré-ouverture et ouverture. Le corps renferme des séquences au nombre et à la longueur variables. Si l’organisation de l’ouverture et de la clôture est plus de nature pragmatique, celle du corps de l’interaction est généralement de nature thématique avec des glissements d’un thème à l’autre (Traverso, 1996 : 19).
La clôture de l’interaction fait figure de fermeture de la communication menant à la séparation des interactants. Il s’agit d’annoncer et d’organiser de manière harmonieuse la fin de la rencontre notamment au moyen d’échanges à fonction « euphorisante » (évaluation positive de la rencontre, excuse et justification du départ, remerciement, vœux, salutations et promesses de se revoir,…) (Kerbrat-Orecchioni, 1999 : 37). Au même titre que l’ouverture, la clôture peut être précédée d’une séquence préalable : la pré-clôture. La séquence de pré-clôture permet, si la conversation n’est pas relancée, de mener à la clôture de l’interaction. Elle se réalise par des indicateurs verbaux (conclusifs tels que « enfin », « bon », « ben j’vais y aller ») ou posturo-mimo-gestuels (faire mine de se lever,..) (Traverso, 1996 : 32). La séquence de pré-clôture cherche à répondre au problème de la clôture : « how to organize the simultaneous arrival of the coconversionalists at a point where one speaker’s completion will not occasion another speaker’s talk, and that will not be heard as some speaker’s silence » (Schegloff & Sacks, 1973 : 295). En effet, la clôture nécessite un aménagement dans la mesure où les participants mettent fin à l’interaction et par là même à leur relation immédiate. Cette rupture du lien interactionnel induit alors un allongement de la séquence final, la pré-clôture pouvant être réitérée autant de fois que nécessaire jusqu’aux salutations finales afin de ménager les faces de chacun des interactants (Traverso, 1996 : 75). Ainsi, ouverture et clôture forment des moments particulièrement délicats de l’interaction en ce qu’elles impliquent un risque de menace pour les faces des participants, « menace territoriale quand on entre en interaction, menace pour la face positive du partenaire quand on met un terme à l’échange » (Kerbrat-Orecchioni, 1994 : 45). C’est pourquoi au cours de ces séquences, les interactants usent de procédés rituels verbaux et posturo-mimo-gestuels dédiés à la valorisation des faces.
1.4.2 Construction locale
A un niveau plus local, l’interaction fait également l’objet d’une structuration spécifique. Rappelons en effet que selon Sacks, Schegloff et Jefferson la conversation repose sur une organisation structurelle faite d’une succession de « tours de paroles » : « it has become obvious that, overwhelmingly, one party talks at a time, though speakers change, and though the size of turns and ordering of turns vary. » (Sacks et al., 1974 : 699).
Cette structuration repose sur une règle claire ; chacun parle à son tour. Les interactants recherche la « minimisation des silences et des chevauchements » (Traverso, 1999 : 31). D’une part, les interlocuteurs évitent de parler l’un sur l’autre, le chevauchement constituant une violation des règles conversationnelles. La survenue d’un chevauchement oblige l’un des interlocuteurs à s’interrompre rapidement. En effet, « if two parties find thmeselves talking at the same time, one of them will stop prematurely, thus repairing the trouble » (Sacks et al., 1974 : 701). D’autre part, les interlocuteurs évitent qu’aucun d’entre eux ne parlent. Les pauses inter-tour doivent être les plus courtes possible. Sacks et al. précisent que « transitions (from one turn to a next) with no gap and no overlap are common. Together with transitions characterized by slight gap or slight overlap, they make up the vast majority of transitions. » (Ibid. 1974 : 701).
Afin d’éviter les situations de chevauchement ou de pause, existent des techniques de base qui servent à gérer la construction des tours de parole. L’allocation du tour au locuteur suivant et la coordination du transfert sont donc construites. En effet, « turn allocation techniques are obviously used. A current speaker may select a next speaker (as when he addresses a question to another party) ; or parties may self-select in starting to talk.» (Sacks et al., 1974: 701). En d’autres termes, il peut s’agir d’hétéro-sélection (sélection par le locuteur en cours) ou d’auto-sélection (sélection par le locuteur suivant). Différents types d’unités peuvent être utilisés pour permettre aux interlocuteurs de construire un tour de parole. Les tours sont ainsi constitués d’unités flexibles, dynamiques, produites en temps réel et négociables en temps réel, que sont les « Turn Constructional Unit » (TCU). La production et donc la reconnaissance des TCU se fonde sur une pluralité de ressources, souvent mobilisées ensemble : syntaxique, phonétique, prosodique, pragmatique, gestuelle, visuelle, etc. Elles ne sont cependant pas prédéterminées mais reconnaissables par les interlocuteurs. Ces TCU donnent lieu à des moments de prises de parole potentielles : les « Transition Relevance Place » (TRP). Sacks, Schegloff et Jefferson expliquent que « the first possible completion of a first such unit constitutes an initial transition relevance place. Transfer of speakership is coordinated by reference to such transition-relevance places, which any unit-type instance will reach. » (1974 : 703).
Par ailleurs, les tours de parole se succèdent de façon cohérente au moyen de paires adjacentes. Un échange est en effet usuellement constitué d’une paire adjacente, à savoir « deux énoncés contigus, produits par des locuteurs différents, fonctionnant de telle sorte que la production du premier membre de la paire exerce une contrainte sur le tour suivant » (Traverso, 1999 : 33). Il existe un principe de dépendance entre la First Pair Part (FPP) — première partie de la paire — et la Second Pair Part (SPP) — seconde partie de la paire qu’elle anticipe (pour exemple une question appelle une réponse, une requête une réalisation ou un refus, un reproche une excuse, etc.) (Schegloff, 1990 : 59). En outre, un système de préférence contraint la nature de la SPP. Cette dernière est dite préférée dans le cas où elle est plus courante, de structure plus simple et de production plus rapide (« tu viens toujours ? Oui. »). Au contraire si la SPP se trouve produite avec difficulté, hésitation, justification, elle est alors non préférée (« tu viens toujours ? Euh… bah… en fait… je vais pas pouvoir parce que… »).
Une paire adjacente peut également faire office de préliminaires (ou presequence Schegloff, 1990) soit des « sequences initiated by turn-types built to be specifically preliminary to some other turn-type, whose subsequent occurrence is projected to occur contingent on the response which the interlocutor gives to the presequence’s first pair part. » (Schegloff, 1990 : 60). La réponse obtenue à la FFP préliminaire détermine alors la production de la FPP de la paire adjacente suivante (« Tu es fatigué ? Non. On sort ? Oui. »). Les préliminaires peuvent induire des négociations, des ménagements de face, des gestions de thèmes conversationnels, etc. elles aménagent la suite de l’interaction. À des fins de clarification de l’échange, la paire adjacente peut aussi faire l’objet d’expansions : « preexpansion before the FPP, insert expansion between the FPP and SPP, and postexpansion after the SPP » (Schegloff, 1990 : 50). Au sein des Insert Expansions (IE), il est possible de distinguer les postfirst dédiée à clarifier la FPP des presecond visant à évaluer les SPP alternatives (Ibid. : 64). La production de paire adjacente apparaît donc soumise à des contraintes de co-construction des tours par les interactants.
L’ensemble de ces ressources conversationnelles nous renseigne sur l’activité que les participants façonnent depuis la paire adjacente à la structure globale de l’interaction afin d’en définir le contenu, la forme et les identités mises en jeu. C’est donc au moyen d’une approche interactionniste à partir des travaux initiés par Goffman, et par Sacks, Schegloff et Jefferson et poursuivis par Kerbrat et Traverso que nous analyserons les productions langagières de nos participants.
1.5 Technologie discursive
Si l’analyse des interactions se fonde initialement sur les échanges en face-à-face physique en co-présence immédiate des participants (excepté l’analyse des conversations téléphoniques), un grand nombre d’interactions sociales se déroule désormais par les technologies numériques et à distance. Proposant de faire émerger un champ d’ « analyse du discours numérique », Paveau introduit la notion de « technologie discursive », à savoir « l’ensemble des processus de mise en discours de la langue dans un environnement technologique. C’est un dispositif au sein duquel la production langagière et discursive est intrinsèquement liée à des outils technologiques en ligne ou hors ligne (ordinateurs, téléphones, tablettes, logiciels, applications, sites, blogs, réseaux, plateformes, etc.). La technologie discursive implique une nature composite des productions langagières. » (Paveau, 2015[2]). Cette nature composite tient au fait que les productions des locuteurs sont constituées d’un assemblage entre du langagier et du technique formant un tout hybride. Émergent alors des formes technolangagières : du technomot (mot cliquable) au technogenre de discours (genres de discours natifs du web et relevant du composite discursif) en passant par le technosigne (segment iconique ou verbo-iconique cliquable permettant la diffusion et le partage de technodiscours, l’expression d’affect, la demande d’affiliation, etc.) (Ibid.).
La co-construction du langagier et du technique est constitutive des « discours natifs du web », ceux-ci se distinguent des discours électroniques. Les premiers se trouvent produits en contexte numérique sur appareil connecté au sein des écosystèmes d’écriture disponibles (sites web, réseaux sociaux numériques, blogs, plateformes et outils numériques). Les seconds sont issus des traitements de textes, messagerie hors ligne, outils de traitement automatique du langage, principalement les appareils non-connectés (traités notamment par la CMO (Communication médiée par les ordinateurs)) (Ibid.). La production native du web relève du geste de « technécriture », lequel par son hétérogénéité discursive introduit une délinéarisation du fil du discours – autant dans la production langagière que dans sa réception. Se manifeste par ailleurs une « imprévisibilité technodiscursive » en ce que le geste de production peut donner lieu à un produit de forme divergente notamment de par l’intervention des algorithmes de la plateforme dans le processus scriptural (Paveau, 2013).
Aussi l’analyse des technodiscours ne doit pas être logocentrée – porter son attention sur les seuls observables verbaux écrits – mais doit prendre pour objet l’ensemble de l’environnement technodiscursif plurisémiotique (Paveau, 2013). Il s’agit d’intégrer, dans leur étude, leur nature hybride. L’analyse du discours numérique a pour vocation de « réunir ce qui est séparé, penser le composite et l’hybride, s’engager dans une pensée postdualiste » (Ibid. : 5). L’approche postdualiste repose sur un rejet des binarismes (linguistique / extra-linguistique ; humain / non-humain ; en ligne / hors ligne ; réel / virtuel ; etc.). Cette critique du dualisme est corrélée à celle de la CMO perçue comme décontextualisée en ce qu’elle procède principalement « par extraction des énoncés présentés sous forme de liste ou d’énoncé individuel, leur matière verbale étant seule prise en considération. Ce type de présentation est adopté quel que soit le support de la publication, papier ou électronique » (Paveau, 2015 : 4). Or la technique ne relève pas du simple « support » de production verbale mais constitue un composant structurel des discours. Aussi le postdualisme « pense-t-il l’humain comme articulé à ce qui n’est pas à lui » (Paveau, 2013 : 5).
Bien que cette proposition d’analyse du discours numérique ne relève pas formellement de l’analyse des interactions, elle nous semble particulièrement pertinente dans notre étude de par son approche hybride et holistique et en ce qu’elle constitue une alternative à la CMO. Nous aurons donc recours aux outils analytiques proposés. Une analyse des interactions numériques logocentrée paraît en effet inenvisageable. Dès lors, « décrire la conversation en ligne » revient à décrire « la frontière entre nouvelles pratiques et structures normatives, et l’appropriation par les acteurs humains à la fois des outils et des pratiques discursives ou sémiotiques qu’ils induisent » (Develotte et al., 2011 : 19). Les contributeurs à l’ouvrage « décrire la conversation en ligne » s’inscrivent également dans un renouvellement des analyses traditionnelles centrées sur le texte, et proposent d’identifier et d’adapter les méthodes d’analyse des interactions en intégrant leur multimodalité – voco-posturo-mimo-gestualité – et leur plurisémioticité – notamment le graphisme, l’audio, la vidéo. Des conditions de possibilité de l’analyse des interactions numériques sont ainsi énoncées par Develotte et al. (2011). En premier lieu les cadres d’analyse doivent souligner « l’interrelation entre les composantes du discours et la matérialité de l’environnement » (notamment les affordances communicatives). En deuxième lieu, les cadres doivent se fonder sur une théorie du discours n’attribuant pas les effets de sens à la seule linguistique mais intégrant également un rôle dans la semiosis aux conditions de production, distribution et design de l’environnement numérique. Enfin, les cadres doivent, par une théorisation des actes des usagers, rendre compte des « valeurs et représentations à travers lesquels ils vivent l’espace numérique » (Develotte et al., 2011 : 25). Émergent désormais de ces fondements, des recherches sur les interactions multimodales par écran (IMPEC)[3] visant à appréhender de manière pluridisciplinaire les « expériences écraniques » des usagers à partir de comportements observables (captures d’écran dynamiques, enregistrements vidéo, etc.).
Cherchant à nous inscrire dans cette démarche, nous proposons dans la suite de ce parcours théorique de porter notre attention sur le caractère multimodal des interactions sociales tant hors écran que par écran.
[1] « Les études ethnométhodologiques analysent les activités de tous les jours comme des méthodes que les membres utilisent pour rendre ce mêmes activités visiblement-rationnelles-et-rapportables-à-toutes-fins-pratiques, c’est-à-dire descriptibles (« accountable »), en tant qu’organisation ordinaire des activités de tous les jours » (traduction par Coulon 1987 p.38)
[2] L’ensemble des définitions est issu du dictionnaire d’analyse du discours numérique en cours de production en ligne (Paveau, 2015)
[3] Par l’impulsion du groupe de recherche IMPEC (au sein du Laboratoire ICAR) et l’organisation de séminaires et colloques internationaux sur ce nouvel objet de recherche