Au cours de ce parcours théorique, il est apparu que l’identité dans la rencontre avec l’altérité se construit de manière située, procédurale et itérative. Elle se trouve co-construite dans et par le verbal, le corps et la technique par les sujets qui cherchent à prendre existence, donner du sens à l’interaction sociale, et définir les rôles et statuts de chacun des acteurs impliqués. Aussi avons-nous avons proposé d’aborder la question des modalités de l’intersubjectivité en interaction hors et par écran au moyen d’une approche interdisciplinaire phénoménologique et linguistique mettant en exergue les enjeux de la rencontre et définissant l’interaction comme une mise en espace-temps de l’intersubjectivité par des ressources multimodales. Nous avons impliqué que sa transposition à l’écran inférait une modification de l’essence de ces quatre pôles : intersubjectivité, espace, temps, modalité. Nous nous proposons de reprendre ici de manière synthétique les conceptualisations développées dans ce parcours théorique.
L’intersubjectivité, en présentiel, se définit en opposition à la subjectivité — une conception autoréférentielle du sujet — comme une nécessité pour le Soi de se construire par rapport à un Autre (Mead, 1934). L’interaction entre Soi et l’Autre constitue alors le lieu où « un étant rencontre un étant, donc chaque étant se rencontre lui-même » (Marcel, 1935 : 9). Le numérique engage un niveau supplémentaire de subjectivité, celui de la technique. Technique qui a toujours existé car pour qu’un Autre apparaisse à un Soi une médiation technique est nécessaire quelle qu’en soit la forme. Voirol (2013) distingue alors trois niveau : usager-technique, usager-technique-usager, collectivité d’usagers. L’écran fait ainsi varier le degré d’aura phénoménologique — à distinguer du degré d’existence — de l’usager en ligne (Vial, 2013) en fonction des modes utilisés. L’intersubjectivité ne fonctionne donc pas ex nihilo, elle nécessite la présence de supports tant symboliques que physiques (Coutant & Stenger, 2010).
L’espace, dans l’interaction, a jusqu’alors été perçu comme immédiat et commun aux interactants pour la bonne conduite de l’échange (Goffman, 1973) car il n’est de discours ni pratique social qui ne se produisent hors espace physique, historique et social (De Saint Georges, 2004). Or l’espace se révèle à l’horizon des perceptions du sujet (Merleau-Ponty, 1945), il est un « regard vécu » (Chabert, 2012). Et l’écran ouvre un « espace intermédiaire » (Jauréguiberry, 2000) qui a autant vocation de protection – l’écran fait écran et protège – qu’il a vocation d’ouverture – fenêtre sur le monde (Chabert, 2012). Denouël (2008) parle alors de « coprésence à distance » à savoir « un accomplissement pratique lié à l’organisation située de ressources sociotechniques » favorisant ainsi l’échange à distance.
Le temps ne constitue pas un flux en soi que le sujet se contenterait d’observer, au contraire il naît du rapport du sujet avec son environnement. Cette conception est celle de l’être et du temps qui communiquent du dedans (Merleau-Ponty, 1945). Et si l’interaction sociale est qualifiée, par les chercheurs en analyse des interactions, de « modifiable mais sans rupture » (Kerbrat, 1990), et constituée de séquences ordonnées (Sacks et al., 1974 : 727), la temporalité des échanges en ligne s’avère plus morcelée de la synchronie (visio) à la quasi-synchronie (tchat) et l’asynchronie (forum). L’outil technique prend part à l’allocation des tours de parole et provoque un décalage plus ou moins significatif entre la production du message et sa réception effective par l’interlocuteur réduisant ainsi les possibilités de copilotage de l’interaction (Garcia et Jacobs, 1999). Par ailleurs plusieurs interactions simultanées sont rendues possibles par les divers plans de l’écran (fenêtres), la perception (canal visuel, auditif) et la temporalité, donnant lieu à une polyfocalisation. L’accès à plusieurs systèmes sémiotiques simultanés peut libérer ou contraindre l’usager qui répondra, en fonction de ses compétences, par de nouvelles adaptations (Lamy, 2008).
Les modalités d’échange se font aussi bien « par le langage que par des expressions du corps, des sentiments devinés, une observation du comportement de l’autre » (Husserl, 1980). Ainsi les interactions sont considérées comme étant par nature des interactions de corps à corps (Cosnier, 2004). Et les gestes du corps remplissent des fonctions énoncives, énonciatives et de copilotage de l’échange (Ibid.). De même le visage du sujet, son épiphanie, est déjà discours, il s’exprime (Levinas, 1961). Tout comme le regard des interactants qui marque l’engagement dans l’interaction. D’où la crainte de la disparition du corps en ligne. Or les adaptations possibles de l’image de soi projetée à l’écran (photo, avatar, émoticône, séquence animée, etc.) participent d’une « présence corporelle assistée par ordinateur » (Casilli, 2012). Si bien que l’interaction par écran met en présence trois substances : le technique, l’intellectuel et le sensitif ; l’artefact, le conceptuel, le corporel (Frias, 2004). Un nouveau régime de métaphores corporelles se met en place et la corporéité d’aujourd’hui se vit dans l’aller-retour entre technologie et chair (Casilli, 2009).
L’analyse interactionnelle de la construction identitaire et de ses modalités intersubjectives ne peut donc se suffire ici d’une étude verbale des interactions. L’appréhension de l’hybridité des échanges par écran nécessite une approche multimodale et phénoménologique des apparitions des sujets et des espaces-temps de leur manifestation. C’est l’entreprise menée dans la seconde partie de notre recherche, le parcours empirique.