Swiss Philosophical Preprint Series # 4 Olivier Massin Philippe Poncet Illusion et Depiction: La Surface Invisible added 10/11/2008 ISSN 1662-937X © Olivier Massin, Philippe Poncet 1 Illusion et depiction : la surface invisible Olivier Massin, Université Grenoble II massinolivier@wanadoo.fr Philippe Poncet, Université Aix-Marseille I ph.poncet@infonie.fr NB : Ceci est une ébauche provisoire, non corrigée et inachevée, tous les commentaires sont les bienvenus. Nous défendons la thèse selon laquelle les images sont phénoménalement transparentes : nous ne voyons (quasiment) jamais leur surface mais seulement ce que les images dépeignent, ce qui implique que notre expérience des images est fondamentalement une illusion. Cette thèse s'oppose à celle de R. Wollheim, qui fait aujourd'hui figure de position standard, selon laquelle nous percevons la surface et le depictum. Une même expérience perceptive, selon nous, ne peut avoir deux objets ou deux aspects. En ce sens, nous sommes plus proche de la position de E.H. Gombrich : nous percevons soit la surface, soit le depictum, mais jamais les deux. Nous cherchons toutefois à la radicaliser en soutenant qu'il est finalement très rare de percevoir la surface de l'image. I. Description phénoménologique : que voit-on quand on regarde une image ? 1.1. Importance de la description Pour comprendre comment il se fait que les images nous apparaissent telles qu'elles le font, nous devons d'abord nous entendre sur la façon dont les images nous apparaissent. L'explication d'un phénomène nécessite qu'on en ait, au préalable, donné une description satisfaisante. Faute d'un accord concernant ce qui est à expliquer, on risque de prendre pour des divergences concernant l'explanans des désaccords qui concernent en fait l'explandum, c'est-à-dire de considérer comme un désaccord dans l'explication ce qui est en fait un désaccord dans la description de ce dont on veut rendre compte. Cette description préalable, en ce qui concerne les phénomènes mentaux (dont relève la perception des images) pose un problème épistémologique délicat. L'instance ultime, à laquelle nous nous référons dans ces cas, est notre expérience interne1. Or celle-ci est subjective dans le sens où nul n'a accès à l'expérience interne d'un autre. La question qui se pose est de savoir si les désaccords peuvent être surmontés. Si Paul et Julie disent ne pas voir la même chose lorsqu'ils regardent une image, ne faut-il pas en conclure qu'ils ne voient pas la même chose ? Comment Paul pourrait-il prétendre en effet corriger la description que Julie donne de son expérience puisqu'il n'a pas accès à cette expérience ? L'affirmation selon laquelle la différence entre les descriptions impliquerait une différence entre les expériences est cependant erronée, pour trois raisons au moins. 1 Brentano distingue l'expérience interne de l'introspection, la seconde étant une faculté spécifique qui prendrait pour objet nous actes de perception (notamment), la première étant une propriété de réflexivité de nos actes perceptifs, qui dispense d'introduire une faculté distincte de connaissance de nos phénomènes mentaux. Reste que le problème qui nous préoccupe ici, la validité épistémologie des données « en première personne » touche autant l'introspection que l'expérience interne, ce que Brentano admet. 2 Premièrement, l'expérience que nous avons des images est complexe et leur description est malaisée. Nous pouvons oublier certains aspects de notre expérience et en privilégier d'autres, notamment pour des raisons lexicales : certains aspects de notre expérience se laissent mieux nommer que d'autres, et tendent donc à être décrit en premier. Deuxièmement, nos expériences perceptives se présentent rarement seules : elle sont souvent accompagnées de croyances immédiates causées ou justifiées par notre perception. Ainsi sommes-nous souvent enclins à confondre les croyances issues de la perception avec la perception elle-même, à prendre ce que nous inférons pour quelque chose que nous percevons. Brentano écrit ainsi : « L'expérience interne est clairement le seul arbitre qui peut résoudre les disputes concernant la similarité ou la différence de la référence intentionnelle. Mais chacun de nos opposants cite également sa propre expérience interne. Quelle est l'expérience qui doit avoir la priorité ? [...] Les gens font des erreurs d'observation, par inadvertance ou parce que les caractéristiques qui sont inférées ou atteintes à travers le raisonnement sont confondues avec ce qui a été observé. Mais si d'autres appellent notre attention sur ce point, nous reconnaissons, en particulier en observant une seconde fois, les erreurs que nous avons faites2 ». La troisième raison pour laquelle il ne faut pas désespérer de trouver un point d'accord dans la description de notre expérience interne est que les divergences peuvent n'être que terminologiques : il se peut que Paul et Julie aient des expériences tout à fait similaires, mais ne mettent pas les mêmes phénomènes derrière les mêmes mots. A nos yeux, les approches « non illusionnistes » de la depiction qui ont le mérite de prendre au sérieux la nécessité d'une description phénoménologique, ont cependant tendance à commettre les deux derniers types d'erreurs mentionnées : elles confondent ce qui est consciemment perçu avec ce qui n'est qu'inféré, et maintiennent certains malentendus concernant l'usage des termes. Plus précisément, elles considèrent que la surface plane de l'image est directement et consciemment perçue alors que selon nous, dans la grande majorité des cas, elle est inférée. Par ailleurs, elles reposent sur un emploi factif des verbes de perception, trop contraignant, et ne distinguent pas toujours assez ce qui est effectivement vu dans l'image (le depictum) de ce qui devrait l'être (le modèle). Dans la mesure où la confusion entre l'inféré et le perçu trouve en partie sa source dans des problèmes terminologiques, il nous faut pour commencer, éclaircir ces définitions. 1.2. Définitions 1.2.1. Emploi phénoménologique et ontologique des verbes de perception Le premier point problématique concerne l'emploi des verbes de perception. « S voit p » peut en effet s'entendre en deux sens distincts. Selon le premier sens, phénoménologique, on peut paraphraser « S voit p » par « S a l'impression que p ». Nous ne faisons alors que 2 P. 200. 3 décrire ce qui semble à S, indépendamment de tout engagement sur l'existence ou la nonexistence de ce qu'il voit, p. Dans le second sens, « S voit p » doit être paraphrasé par « S a l'impression que p et p existe ». Il y aurait, dans l'emploi des verbes de perception, un import existentiel. Ce second sens peut être dit factif ou ontologique.3 Nous retiendrons ici l'usage phénoménologique, non factif, des verbes de perception : dire que Julie voit une tache rouge n'implique pas que cette tache rouge existe (Julie peut être victime d'une hallucination et être dite néanmoins percevoir). Un tel usage est requis par la description de notre expérience interne : si nous voulons décrire la façon dont les choses nous apparaissent, nous devons pouvoir le faire sans avoir à nous demander si les choses sont bien telles qu'elles nous apparaissent. L'emploi ontologique est trop contraignant, dans la mesure où il nous conduit à courir deux lièvres à la fois : d'une part décrire les apparences et de l'autre nous engager sur leur statut ontologique. Ces deux tâches sont trop lourdes pour être accomplies simultanément. Donc, lorsque nous disons que S perçoit x, nous entendons rester neutre sur la nature du x en question : cela n'implique ni que x existe, ni, s'il existe, qu'il existe physiquement ou mentalement. La description phénoménologique est neutre du point de vue ontologique. Cependant, si l'emploi factif des verbes de perception paraît trop naturel et spontané pour pouvoir être révisé, alors il suffira d'entendre « semble percevoir » chaque fois que nous emploierons « percevoir ». 1.2.2. Image, depictum et modèle L'autre point terminologique sur lequel il importe de s'entendre concerne l'image. Nous nous en tiendrons, dans un premier temps, à cette définition minimale : une image est un objet physique constituée de formes colorées couchées sur une surface plane. L'image doit être distinguée de son depictum : comme son nom l'indique, le depictum est ce que l'image semble dépeindre, c'est-à-dire ce qu'elle présente, représente, ou dénote apparemment. Ce qui détermine le depictum d'une image est donc notre appréhension de celle-ci. Dans une optique conventionnaliste, cette appréhension du depictum relève d'un processus de décodage, de lecture, ou d'inférence, sur la base de la perception immédiate de l'image. Dans une optique perceptiviste, (également dite « naturaliste ») le depictum est vu dans, par l'intermédiaire de, à travers, devant ou derrière l'image (ie : la surface colorée). Nous admettons ici la thèse perceptualiste : nous considérons que l'accès au depictum est perceptif (contrairement à Black ???ou Goodman ???). Dès lors, le depictum est ce qui est perçu (phénoménalement) lorsque nous regardons une image, outre la perception de l'image elle-même si celle-ci a lieu. En regardant dans la direction d'une image, nous voyons une tasse : la tasse est de ce fait le depictum de l'image (alors qu'il n'y a devant nous qu'un plan 3 Bien que l'emploi non factif ait eu tendance à être préférence par les partisans de théories indirectes ou phénoménalistes de la perception, alors que l'emploi factif ait en général la faveur des réalistes directs , il n'est pas certain qu'il y ait là un lien nécessaire. Ainsi F. Jackson (1977 :4) soutient-il une théorie indirecte de la perception tout en retenant non seulement l'usage ontologique des verbes de perception (en soutenant que ceuxci font un « import existentiel), mais en disqualifiant en outre l'emploi purement phénoménologique de ces verbes comme dénué de sens. Parmi les partisans d'un emploi strictement factif des verbes de perception, on trouve également Sellars (1992, 1963 : 42sqq), Ryle (concept of mind). Parmi les partisans d'un emploi non factif des verbes de perception on trouve notamment Crane (« The nonconceptual content of experience », 137n), Ayer,, The Fondation of empirical Knowledge, chap. 1 : pas sûr : si je vois x, ça implique que le sense-data existe). D'autres auteurs admettent deux sens des verbes de perception comme Chisholm (1957, dernier chapitre, Person and Object : 135), Dretske (Seeing and knowing). 4 teinté de différents niveaux de gris). Le depictum d'une image est donc ce que nous voyons en plus de cette image lorsque nous l'avons sous les yeux. Outre l'image et son depictum, il convient de distinguer un troisième terme que l'on appellera le modèle de l'image4. Le modèle d'une image est ce que l'image est censée faire voir, sans forcément y arriver. Il convient de bien distinguer le modèle du depictum : ce que l'on voit dans une image (le depictum) n'est pas nécessairement ce que l'on devrait y voir (le modèle, que ce dernier soit un objet réel ou fictif). Si le depictum d'une image est déterminé par la perception du spectateur, son modèle, en général, est déterminé par les intentions de son producteur (le peinture, le dessinateur, le photographe...)5. L'exemple suivant permet de se faire une idée de la distinction : Paul et Julie jouent au Pictionnary. Paul n'est pas parvenu à faire deviner le mot « chat » à Julie, qui s'exclame : « C'est un chat ça ? On jurerait un dromadaire ! ». Le dromadaire est pour Julie le depictum de l'image, alors que le chat est son modèle, ce que l'image était censée montrer. Il convient de faire trois remarques au sujet de cette distinction entre le modèle et le depictum. La première concerne leur statut ontologique : celui-ci n'est pas spécifié par les définitions proposées, qui restent neutres sur ce point. La nature ontologique du depictum 4 La distinction que nous opérons ici entre l'image, le depictum et le modèle nous paraît rejoindre en extension celle que Lopes (1996 : 3-4) introduit entre l'image, son contenu et son sujet. Cependant le terme de « sujet » est susceptible d'introduire une confusion avec le sujet percevant l'image. C'est pourquoi nous préférons le terme « modèle ». La notion de « contenu » nous semble pour sa part délicate à saisir (pour une critique de la pertinence de cette notion en philosophie la perception cf Dokic ( ?????)). Selon Lopes, une image représente le monde comme possédant certaines propriétés : le contenu consiste précisément dans ces propriétés que l'image attribue au monde. Le contenu de toute représentation (pictorial, linguistique...) consiste ainsi dans les propriétés qu'elle représente comme appartenant au monde. Ainsi défini, le contenu se rapproche bien de ce que nous appelons le depictum, mais risque de s'éloigner de ce que l'on entend habituellement par contenu : celui-ci, depuis Twardowski au moins, n'est normalement pas vu mais présente ce que nous voyons sous un certain mode. Dire que le contenu est représenté, revient à en faire ce qui est vu, plutôt que ce par quoi l'on voit. Enfin, si nous sommes d'accord avec Lopes sur le fait que le sujet (notre modèle) est une entité du monde réelle, il nous semble erroné de dire que l'image représente le sujet, comme il le fait. L'image ne peut représenter et le sujet et le contenu. Le sujet, selon nous, n'est pas représenté dans l'image : la seule chose qui le soit est le contenu (le depictum), qui peut se trouver, par ailleurs, ressembler ou correspondre au sujet (le modèle). 5 Parfois, le modèle est déterminé par l'intention du peintre ou du dessinateur : celui-ci voulait dessiner une surface bleue derrière une surface rouge. Le modèle est le pendant, éventuellement réel du depictum.. Bien que le modèle soit en général déterminé par l'intention du producteur, ce n'est peut-être pas nécessairement le cas. Il y a au moins trois autres possibilités qu'on ne peut exclure. (i) Ce qu'est censé représenter une image peut être déterminé par sa fonction biologique : ainsi, dans le cas de l'image rétinienne, ce qui détermine tel modèle plutôt qu'un ordre est sa pertinence adaptive. Telle image rétinienne, ou telle succession d'images rétiniennes est censée représenter un stimulus distant de deux mètres. Mais il se peut qu'étant données d'autres information, ou l'influence de processus de plus haut niveau, l'organisme voit dans cette image un depictum distant de dix mètres. (ii) Le modèle d'une image peut être également en partie déterminé par sa fonction artefactuelle : ainsi considère-t-on souvent les photographies comme nous informant des états de choses qui les ont causés. (iii) Enfin le modèle d'une image peut être déterminé par le spectateur lui-même : c'est le cas peut-être des images naturelles (les plaques de paesine, les nuages, les différentes couleurs de l'eau...) : nous voyons un depictum dans ses images, mais nous pouvons aussi leur attribuer l'intention de depeindre autre chose que ce que nous y voyons. Par exemple, nous pouvons dire en regardant un nuage que c'est un cheval mal fait. L'attribution d'intention par le spectateur peut valoir aussi pour des images artefactuelles, dans ce cas, il y a peut-être une distinction à faire entre le modèle effectif de l'image (celui de l'artiste) et le modèle que lui attribue le spectateur (qui reste bien distinct de son depictum). Par exemple, Julie peut dire que ceci est une mauvaise image de Mickey (elle voit un personnage dans l'image, c'est le depictum, et attribue à l'image la prétention de lui en faire voir un autre, c'est le modèle attribué), alors que c'était en fait une image de Dingo. 5 dépend en grande partie de la théorie de la perception que l'on adopte par ailleurs. Un partisan des sense-data tendra à l'identifier à un objet mental ou dépendant de l'esprit. Un partisan du réalisme direct cherchera à en faire un objet physique. Un adverbialiste cherchera à éviter toute réification du depictum. Le statut ontologique du modèle n'est pas non plus déterminé : en particulier, il serait erroné de supposer, comme cela se fait parfois, que le modèle est nécessairement physique. Un peintre peut chercher à produire l'image d'un paysage, mais il peut également chercher à produire une image d'Astérix, où d'une hallucination qu'il sait avoir. En particulier, le depictum comme le modèle peuvent être des ficta. Enfin, le statut ontologique du depictum et celui du modèle est logiquement indépendant. L'un peut être physique l'autre pas, les deux physiques, ou les deux non physiques. La deuxième remarque concerne leur statut phénoménologique, que nous voulons préciser ici. L'exemple du Pictionnary est approximatif car il mêle la reconnaissance conceptuelle et la perception proprement dite. Il se peut que, par maladresse, Paul n'ait pas réussi à réaliser le dessin qu'il voulait, en conséquence de quoi ni Julie ni Paul lui-même ne voient dans le dessin ce que Paul voulait qu'on y voit (le depictum ne correspond pas au modèle). Mais il se peut également que Paul ait parfaitement réussi son dessin, qu'on y voit ce qu'il voulait qu'on y voit, et que pourtant Julie échoue à deviner le mot « chat ». Cela peut arriver pour deux raisons distinctes. Soit Paul confond le concept de chat (disons, la forme prototypique du chat) avec le concept du dromadaire (la forme prototypique du dromadaire)6. Soit c'est Julie qui confond ces deux concepts. Ce qui est important est que dans les deux cas, Julie voit vraisemblablement dans le dessin de Paul ce que Paul voulait qu'elle y voit (telle forme) ; mais ne dit pas ce que Paul voulait qu'elle dise. Autrement dit, l'échec n'incombe pas à la perception puisque le depictum correspond bien au modèle, mais à la catégorisation ou à la reconnaissance conceptuelle. Ces remarques nous conduisent à souligner que ni le depictum ni le modèle ne sont de nature conceptuelle. En particulier, ce que nous voyons dans une image n'est pas adéquatement décrit par « un chat » ou par « Bertrand Russell » : de telles descriptions supposent qu'une reconnaissance ait lieu. Or il est possible de voir le depictum de l'image sans en avoir le concept, c'est-à-dire, sans reconnaître Bertrand Russell. Comment caractériser alors le depictum d'une image ? Suivant Clark ( 2000) nous admettons que ce qui est vu consciemment, au niveau le plus élémentaire, consiste en des qualités localisées dans notre espace perceptif (feature-placing). Ce que nous voyons est du type « appareance de la qualité Q à la region R ». Dans l'optique de Clark, les places, ou localité, sont les individus phénoménaux. Voici l'hypothèse générale. Le fait de sentir procède par le recrutement de régions de l'espace-temps [place-times] et la caractérisation des qualités qui y apparaissent. C'est là une variété primitive de représentation mentale -probablement la plus primitive. Les mécanismes qui expliquent le caractère spatial de l'expérience sensorielle ont une fonction référentielle ou proto-référentielle. Ils fonctionnent à peu près comme les termes singuliers. Les mécanismes qui servent à caractériser les qualités qui apparaissent à ces localisations ont une fonction prédicative ou proto-prédicative. Ces proto-prédicats ne sont que des valeurs déterminées le long des différentes dimensions de variations qualitatives dans la modalité en question. De telles caractéristiques ou qualité sensorielles peuvent avoir de multiples instances simultanées : elles servent d'universaux caractérisant ou de termes généraux. 6 Pour être complet, il conviendrait encore de distinguer entre le concept de chat et le mot chat, les deux n'étant pas nécessairement identique. Paul ou Julie peuvent maîtriser l'un sans maîtriser l'autre. 6 La distinction entre les composants spatio-temporels et qualitatifs de la variation dans l'apparence phénoménale imite la distinction entre la référence et la prédication. Mais ces dernières sont des phénomènes linguistiques, alors que nous sommes en train de parler de leurs analogues sensoriels. C'est pourquoi j'utiliserai parfois les termes « proto-référentiel » et « proto-prédicatif ». (Clark 2000 : 74-5) Dans la mesure où les dimensions de variation des places phénoménales et des qualités sont de grain plus fin que notre schème conceptuel, il est commode de désigner ces qualités localisées à l'aide d'une description indexicalisée de la forme: « telle nuance est ici » ou mieux « ici est ainsi » (nous empruntons là une suggestion de Dokic, 2000). Enfin, l'espace dans lequel les qualités visuelles sont localisées est égocentré dans la mesure où nous percevons ces qualités à une plus au moins grande distance de nous. Paul estime avoir réussi son dessin s'il voulait qu'on y voit par exemple une forme grise déterminé devant un fond blanc, et que c'est bien ce qu'on y voit. Il se peut ensuite que ce dessin ne provoque pas la réponse verbale attendue, pour des raisons d'incompétence conceptuelle de Paul ou Julie, mais cela est un autre problème. Ceci conduit à la troisième remarque, qui concerne les conditions de réussite ou de vérité des images. Il y a au moins trois façons de rater (et donc de réussir) une image. La première, que nous venons d'évoquer, et qui ne concerne pas directement notre propos, se produit lorsque l'image ne permet pas de reconnaître son depictum, de le subsumer sous le concept approprié. La seconde façon de rater une image se produit lorsque son depictum ne ressemble pas à son modèle. Par exemple, je voulais représenter une ligne rouge qui passait devant un rond gris, mais celle-ci semble finalement passer derrière le rond gris. Nous disons qu'une image est fidèle lorsque son depictum ressemble à son modèle. La troisième et dernière façon de rater est très rare : elle se produit lorsque nous ne parvenons même pas à produire une image. Dans l'exemple du Pictionnary, Paul a mal dessiné le chat mais il a néanmoins réussi à produire une image, d'autre chose que d'un chat, peut importe quoi. Mais il aurait pu également ne même pas réussir à produire d'image et à marquer le papier d'une empreinte qui ne conduise pas à distinguer entre différents plans. Remarquons pour finir qu'il n'y a pas de relation d'implication entre une image qui ne permet pas la reconnaissance de son depictum, et une image dont le depictum n'est pas fidèle au modèle. Ainsi on peut rater une image dans le second sens sans la rater dans le premier : une mauvaise image de Droopy peut malgré tout permettre de reconnaître Droopy. Cela est dû en partie au fait que la reconnaissance met en jeu des mécanismes d'inférence qui lui donnent une certaine flexibilité. A l'inverse, une image peut être fidèle à son modèle mais ne pas permettre sa reconnaissance : une image fidèle d'une chaise vue de dessous ne permettra pas forcément l'identification de cet objet de la part du spectateur. En résumé, l'image est une surface physique plane, le depictum est ce qu'on y voit, éventuellement en plus de la surface elle-même, et le modèle ce que l'on devrait y voir. Le problème qui va nous occuper dorénavant concerne la relation phénoménale qu'entretiennent l'image et le depictum : dans quelle mesure percevoir l'une suppose-t-il de percevoir l'autre ? Peut-on percevoir l'une sans l'autre ? 1.3. Voir l'image, voir son depictum 7 Une des divergences centrales dans la description de notre perception des images provient du fait que lorsque nous regardons une image, nous semblons voir deux choses : l'image, surface plane diversement colorée d'une part, et ce que l'image montre, son depictum de l'autre. Indiquant la surface colorée, nous pouvons tout aussi bien dire « c'est une photo » que « c'est un chat ». Voir une image serait alors voir deux choses : l'objet matériel qui constitue l'image et l'objet dépeint par l'image. Ici apparaissent les premiers désaccords dans la description phénoménologique de notre perception des images. Pour certains, nous ne pouvons pas voir deux choses à la fois mais alternativement l'une ou l'autre : nous voyons tantôt la surface de l'image, tantôt son depictum, mais jamais les deux en même temps. C'est la position qu'a défendue E.H. Gombrich : «Mais comment pourrons-nous « voir » en même temps le cheval de bataille et la surface plane ? (...) il s'agit là d'une exigence impossible à satisfaire. Comprendre le cheval de bataille, c'est oublier pendant un moment la surface plane. Leur présence simultanée est impossible ». (Gombrich 2002 : 236) Dans la mesure ont nous percevons soit les constituants matériels de l'image, soit le depictum, mais jamais les deux simultanément, cette conception sera appelée disjonctiviste. Gombrich explique sa position en faisant référence à des figures telles que le lapin-canard ou le cube de Necker, qui peuvent être perçues sous deux aspects différents. Nous ne pouvons pas voir à la fois le lapin et le canard, ni le cube dans un sens et dans l'autre. Selon Gombrich, il en va de même pour les images et leur depictum. La solution opposée consiste à dire que nous percevons à la fois la surface de l'image et ce qu'elle dépeint. Cette position a été défendue par Richard Wollheim7 en opposition à Gombrich mais également par I. Rock8, J. J. Gibson9, C. Peacocke10, Schier11, Blinder12, D. Lopes13, J. Pelletier14, K. Walton15. 7Citation Wollheim. 8 « Ce dernier point nous amène à l'essence même de la perception des images : la conscience double que nous en avons lorsque nous les regardons. Lorsque nous regardons de l'art figuratif –c'est-à-dire de l'art cherchant à représenter des objets ou des scènes de manière réaliste-, nous percevons l'objet ou la scène représentée, généralement de façon tridimensionnelle, et en même temps nous percevons les lignes, les marques ou les couleurs de la peinture elle-même et sa surface bidimensionnelle. Le philosophe Michael Polanyi faisait référence à notre conscience des caractéristiques de la surface de la peinture comme "conscience subsidiaire", opposée à notre "conscience focale" des objets représentés. On peut, bien entendu, renverser cet état de fait en se concentrant sur les coups de brosses et les marques. Il est important de garder en tête cette dualité si nous voulons comprendre la nature de la perception des images ». (Rock, 2001 : 98) Notons que la distinction introduite entre conscience subsidiaire et conscience focale affaiblit le conjonctivisme que défend Rock en le rapprochant, modérément, du disjonctivisme. 9 « L'image est à la fois une scène et une surface, et la scène est paradoxalement derrière la surface. Cette dualité de l'information est la raison pour laquelle l'observateur n'est jamais très sûr de la façon dont il doit répondre à la question "que voyez-vous ?", car il peut parfaitement répondre qu'il voit un mur ou une pièce de papier. [...] Une image est à la fois une surface par elle-même est une présentation [display] d'information de l'autre. Le spectateur ne peut pas s'empêcher de voir les deux, et pourtant c'est un paradoxe car les deux formes de conscience sont divergents »(Gibson, 1979 : 281-2, je souligne) 10 « La silhouette [de la cathédrale de Salisbury sur un mur] est et est expérimentée à la fois comme une surface plane, ou au moins comme occupant un plan : toute description de l'expérience qui omet ce point est incomplète » (Peacocke 1987 : 386). Cependant, Peacocke semble nuancer quelque peu cette affirmation un peu plus loin en reconnaissant que dans certains cas, comme lors de la projection d'une diapositive ou d'un film sur un écran : « Dans les cas de cette seconde sorte, on ne perçoit pas la surface de l'écran comme une surface, bien qu'évidemment le trajet de la lumière réfléchie ou émanant de l'écran cause notre expérience » (Peacocke, 1987 :394). 11 La réfutation la plus simple de la thèse de l'illusion en alternance est qu'elle est qu'elle n'établit aucun contact avec l'expérience picturale. Bien sûr, il est vrai que je peux voir un Canaletto comme une phantasmagorie 8 C'est une grave erreur de supposer qu'aucune image ne peut être expérimentée simultanément comme une surface colorée, marquée et texturée comme ce qu'elle représente. Certaines images, comme le Velazquez supportent certainement la conception de Gombrich au sujet des expériences picturales, d'autres ne le font clairement pas. [...] Wollheim a raison d'insister sur le fait que la conscience simultanée du contenu d'une image et de son design est au coeur de l'expérience de nombreuses images. [...] Une expérience qui est simultanément celle du design et du contenu est ce que Wollheim appelle "double" [...] Ce caractère double est un fait. Que la théorie de l'illusion s'avère être incompatible avec ce caractère double montre qu'elle opère avec une conception erronée de l'expérience des images. Lopes, 1996 : 40. Dans la mesure où nous percevons le support matériel et le depictum, cette position peut être appelée conjonctiviste (Pelletier 2000 : 173, 175 parle de de « thèse d'inséparabilité »). Plusieurs variétés de conjonctivisme sont possibles. Selon une première variante, le conjonctivisme consiste à dire que nous avons toujours simultanément deux expériences, l'une de l'image, l'autre du depictum. Bien qu'il ait défendu un temps une position de ce type16, Wollheim a désormais adopté une position distincte : son conjonctivisme consiste à admettre non deux expériences, mais une seule expérience qui a deux aspects, l'un rendant compte de la perception de l'image (ce que Wollheim appelle la « configuration » de la toile), l'autre de la perception du depictum (ce qu'il appelle son contenu représentationnel). Dans tous les cas, en dépit de ces différences importantes, le conjonctiviste soutient que nous voyons toujours et l'image et le depictum, qu'il s'agisse là de deux expériences distinctes ou d'une seule qui a deux aspects. Pour le conjonctiviste, la perception des images est essentiellement duale (twofold). Ajouter distinction Conjonctivisme fort/ faible chez Lopes. Bien que les débats aient eu tendance à se centrer sur l'alternative entre conjonctivisme et disjonctivisme, il est important de remarquer que deux autres options sont logiquement ouvertes : la première consiste à dire que nous ne percevons que la surface plane mais pas son depictum ; la seconde consiste à dire que nous ne percevons que le depictum, mais pas la surface plane. Ces options refusent donc l'idée que percevoir une image serait rectangulaire de couleur de tâches de peintures colorées à la place d'une image du Grand Canal, et il est important de caractériser cette différence. Cependant, comme l'a souligné Wollheim, l'analogie du lapin-canard ne peut éclairer la différence parce qu'alors qu'il n'est pas possible de voir la figure du lapin-canard que comme un lapin ou un canard, mais jamais comme les deux, il est certainement possible de voir le Canaletto comme à la fois une image de Venise et comme une surface peinte plate et rectangulaire. » Schier, 1986 : 9-10. 12 « La singularité de la représentation picturale repose dans le fait que le réseau optique venant d'une image contient une information double : des invariants qui spécifient les caractéristiques de sa propre surface (toile ou papier, acrylique ou huile) et des invariants qui spécifient les caractéristiques de la scène qu'elle dépeint. L'opacité de l'image permet de voir ce dont elle est faite. Le fait que l'image puisse produire un réseau optique similaire à ce que la scène réelle produirait permet au "monde" d'apparaître dans l'image. Ensemble, ces faits nous amènent à conclure que les images sont aussi différentes des textes qu'elles sont différentes des fenêtres. » Blinder, 1986 : 27. 13 « la dualité [twofoldness] est sans aucun doute une caractéristique des images » Lopes, 1996 : ref. 14 « Il ne s'agit pas de nier que l'on voit des objets particuliers dans une image, ni même que, d'un point de vue phénoménologique, les deux aspects de cette expérience du "voir dans" possèdent une spécificité réelle. » Pelletier, 2000 : 167. 15 Walton 1990 (cf Pelletier p. 171). 16 Richard Wollheim, Painting as an Art , (London: Thames and Hudson, 1987), p.360n. 9 percevoir deux choses, soit alternativement (disjonctivisme), soit concurremment (conjonctivisme). Selon elles, une seule chose est perçue lorsque nous regardons une image : la première soutient que seule est vue une surface bidimensionnelle diversement colorée ; la seconde que seul est vu ce que l'image dépeint. Nous avons donc au total quatre options : regarder une image c'est (i) voir l'image ou (exclusif) son depictum (ii) voir l'image et son depictum (iii) voir seulement l'image (iv) voir seulement le depictum. Nous voulons défendre ici cette dernière position : le plus souvent, nous n'avons pas l'impression de voir une surface plane mais de voir le depictum de l'image. Contre le conjonctivisme, nous pensons qu'il est faux que nous percevons toujours l'image et le depictum : au contraire nous ne percevons en général que le depictum. Le disjonctivisme nous semble plus acceptable, mais fait une part trop grande à la possibilité de percevoir les images. Bien nous admettons avec lui qu'il soit possible de voir la surface et non plus le depictum en nous approchant très près d'elle, en la regardant de côté, ou dans des conditions d'éclairage particulières, nous considérons ces cas comme exceptionnels. Selon nous, les images sont phénoménalement transparentes : nous ne les voyons pas, mais voyons seulement leur depictum. En définissant l'illusion visuelle comme l'expérience de quelque chose qui n'existe pas dans l'environnement immédiat du sujet, nous sommes donc amenés à défendre une théorie de l'illusion. Ce qui existe dans notre champ visuel, quand nous regardons une image, est une surface plane. Ce que nous voyons en la regardant est une scène visuelle étalée en profondeur. Voir un depictum dans une image, c'est par conséquent être victime d'une illusion perceptive. Précisons ce point. Nous avons décrit suivant Clark les objets de l'expérience visuelle comme consistant en des qualités (des couleurs) localisées. L'erreur perceptive peut porter soit sur les qualités (comme dans le cas du daltonisme) soit sur les localités (lorsqu'on louche). Dans le premier cas nous avons une illusion qualitative, dans le second une illusion spatiale. L'illusion, dans le cas de la perception des images, est une illusion spatiale (il peut également y avoir une illusion qualitative, mais c'est là un fait contingent). Plus précisément, dans la mesure où l'espace visuel est égocentré, la perception des images consiste en une illusion de profondeur : deux tâches rouges se situent ontologiquement sur le même plan, mais nous avons l'impression que l'une est devant l'autre, c'est-à-dire plus proche de nous que l'autre.. Il y a une différence de profondeur entre les différents éléments du depictum mais pas entre les différents éléments de l'image. L'image est plane, son depictum ne l'est pas. Toute image, selon la théorie de l'illusion, cause telle illusion de profondeur : certaines couleurs nous apparaissent illusoirement plus près de nous que d'autres. Par ailleurs, dire que le depictum est le produit d'une expérience illusoire n'implique là encore aucune décision concernant son statut ontologique. Tout dépend de la théorie de l'illusion que l'on adopte par ailleurs. On peut simplement tenter de dissoudre la question ontologique en disant que le depictum est ce que nous aurions vu si nous avions eu une expérience véridique. On peut dire que le depictum est un sense-data, un objet meinongien. On peut même essayer de le réduire physiquement : s'il n'existe pas où il apparaît, il existe ailleurs, mais est projetée de façon erronée dans l'espace : il serait une entité physique mal placée. Ces questions sont importantes, essentielles certainement, mais elle se pose à quiconque admet une distinction entre perception véridique et perception illusoire. 10 Un dernier mot enfin sur la ressemblance. La théorie de l'illusion peut s'en passer. Elle ne requiert pas qu'il y ait une ressemblance phénoménale entre l'image et le depictum, au contraire. Pour qu'une ressemblance soit perceptible, il faut que ses deux termes soient donnés. Or, selon la théorie de l'illusion, l'image est invisible. Goodman affirme à juste titre qu'une image ressemble davantage à une autre image qu'à son référent. Du point de vue descriptif donc, la ressemblance n'a aucun rôle essentiel à jouer. Elle devient essentiel, pourtant, dès lors que nous cherchons à décrire les relations entre le depictum et le modèle : on l'a dit, une image est dite fidèle lorsque son depictum ressemble à son modèle. Une image a pour finalité de causer des expériences dont les objets intentionnels (les depicta) ressemblent au modèle à son modèle17. Enfin, la ressemblance peut sans doute être utile dès lors que nous passons de la description à l'explication de notre perception des images. Alors seulement, nous pouvons nous interroger sur une éventuelle relation de ressemblance entre l'image et son depictum. En particulier, il se peut que les images soient phénoménalement transparentes parce ce que certaines relations de projection géométrique les relient à leur depictum Il se peut que l'image « préserve » certaines propriétés topologiques de son depictum. Enfin, la spécification d'une relation de ressemblance entre l'image et le depictum peut être utile au peintre. En résumé, la ressemblance peut entrer en jeu de trois façon dans la dépiction : sur le plan de la description, il y a certainement une relation de ressemblance entre le depictum et le modèle dans le cas des images fidèles. Sur le plan de l'explication des apparences il y a peut être une ressemblance complexe entre les propriétés de l'image et celles du depictum et/ou du modèle. Sur le plan de la production, la connaissance de cette relation de ressemblance complexe permet de produire des images fidèles. Mais l'essentiel est qu'il n'y a aucune ressemblance apparente entre l'image et le depictum. Celle-ci est, par hypothèse, impossible. 2. Défense d'une théorie de l'illusion 2.1. Confusions qui conduisent à considérer la théorie de l'illusion comme peu plausible 2.1.1. Confusion entre croyance et perception : « Les images ne nous trompent pas » A première vue, l'idée que la perception des images est une illusion peut sembler absurde. En effet, sauf dans le cas singulier des trompe-l'oeil, les images ne nous abusent pas. Contrairement à ce que rapporte Pline, les oiseaux n'ont certainement jamais becqueté les raisins de Zeuxis. Mais cela n'est un argument contre la théorie de l'illusion que si l'on confond « illusoire » et « trompeur ». Il convient de bien distinguer les percepts et les croyances ou les actions qu'ils causent ou justifient. Nous pouvons avoir une perception illusoire, savoir qu'elle l'est, sans pour autant que l'illusion disparaisse. Nous avons beau savoir que les lignes de Müller-Lyer sont de même taille, l'impression qu'elle sont de taille différente demeure incorrigible. Dans notre optique, une illusion consistant à voir une profondeur là où il n'y en a pas, ce que nous voyons dans un miroir constitue le cas paradigmatique de l'illusion. Or, l'image spéculaire est rarement trompeuse : nous ne cherchons jamais à saisir la brosse à dents qui apparaît derrière le miroir. L'illusion n'est donc pas nécessairement trompeuse, bien qu'elle puisse l'être. Déjouer une illusion n'est pas la dissiper. Deux types de facteurs conduisent à déjouer l'illusion : les facteurs perceptifs et les facteurs cognitifs. Un facteur perceptif (nous 17 nous nous rapprochons sur ce point de la position de Peacocke (réf). 11 en examinerons d'autres) est par exemple la perception du cadre du miroir ou du tableau. Un autre, dans le cas des images, est l'absence de parallaxe de mouvement lorsque nous nous déplaçons en les regardant. Un facteur cognitif est par exemple la connaissance qu'il ne peut y avoir un tigre dans mon salon. Mais ce que nous croyons n'influence pas ce que nous voyons. La connaissance du fait que l'objet réel n'est pas situé derrière le miroir n'empêche pas que je perçoive néanmoins son reflet. 2.1.2. Confusion entre dualité et dualité perceptive : « Il faut bien rendre compte de la dualité de l'image » La théorie de l'illusion semble heurter trop frontalement notre intuition que toute image a un caractère double : elle est un objet matériel montrant d'autres objets que luimême. Mais la théorie de l'illusion ne conduit nullement à abandonner cette dualité. Elle récuse seulement que cette dualité soit donnée dans la perception visuelle des images. Que l'image ne soit pas vue n'implique pas qu'elle ne soit pas connue autrement que par la perception visuelle immédiate : elle peut être inférée, connu par une expérience passée, objet d'une croyance, ou expérimentée par une autre modalité (le toucher). Qui soutient que nous voyons immédiatement le depictum à travers l'image peut maintenir que c'est l'image ellemême qui est inférée sur la base de la perception du depictum. Dire que nous ne voyons que le depictum et non la surface n'implique donc pas de renoncer à l'intuition que les images ont un caractère double : si nous distinguons bien la surface colorée de ce qu'elle dépeint, ce n'est pas parce que l'une et l'autre nous sont données d'un même point de vue, soit simultanément, soit alternativement en changeant la focalisation de notre attention. C'est parce que nous savons que l'objet que nous regardons se trouve être, en réalité, une surface plane bien qu'il ne nous soit pas présenté ainsi. Nous avons plusieurs façons de le savoir : soit que l'objet dépeint que nous voyons se comporte bizarrement quand nous bougeons (auquel cas nous inférons qu'il doit être dépeint par une surface), soit que nous sachions qu'il n'y a pas de tel objet dans notre environnement immédiat (il n'y pas de montagne derrière ce mur, qui n'est d'ailleurs pas troué), soit que nous ayons auparavant manipulé l'image (nous l'avons pincée entre nos doigts, nous avons vu son verso...). Reste qu'aussi convaincu que nous soyons qu'il n'y a là qu'une surface plane, lorsque nous la regardons à une distance adéquate par rapport à sa taille, nous ne voyons pas cette surface mais ce qu'elle dépeint. K. Walton introduit la comparaison suivante, qui nous permet de préciser ce point : « Etre transparent n'est pas nécessairement être invisible. Nous voyons les photographies elles-mêmes quand nous voyons à travers elles [...] Il n'y a rien d'étrange à cela : on entend à la fois la cloche et le son qu'elle émet, et l'on entend l'une par le fait d'entendre l'autre ». (Walton 1986 : 252) Toute la question cependant est de savoir lequel, du dessin et du depictum, est la cloche, et lequel est le son. Pour Walton, et sans doute pour une majorité de conjonctivistes, l'image doit être rapprochée du son, et le depictum de la cloche. L'image est ce que nous percevons le plus immédiatement, et nous dérivons de cette perception immédiate de l'image son depictum. Selon nous, c'est au contraire le depictum, et non l'image, qui doit être rapproché du son : ce que nous voyons le plus immédiatement est le depictum, et c'est seulement par le fait de voir le depictum que nous inférons l'image, ou, si l'on veut, que nous 12 la « voyons » indirectement. (Dans la mesure où nous préférons ne pas appeler « perception » ce qui est inféré consciemment même à un très bas niveau, nous disons que nous ne voyons pas l'image. Mais qui accepte la notion d'une perception indirecte consciente peut formuler adéquatement notre thèse en disant que nous ne percevons directement que le depictum, l'image n'étant perçue qu'indirectement). De façon générale, il nous semble que la thèse selon laquelle l'image est ce qui est vu le plus immédiatement, le depictum n'étant quant à lui qu'inféré, provient d'une confusion entre la description phénoménologique de ce que nous avons l'impression de voir et la description ontologique des processus physico-physiologiques qui causent cette expérience. Il est clair en effet qu'au niveau physique c'est l'image, et non le depictum, qui est à proprement parler l'origine causale -c'est elle qui réfléchie la lumière et non le depictum. Cela implique que notre système visuel doit reconstituer le depictum sur la base d'informations provenant de l'image. Physiologiquement il y a donc un sens dans lequel notre système visuel « part » de l'image pour arriver au depictum. Mais cela se fait sans nous : l'inférence, pour autant qu'il soit besoin d'y recourir, est inconsciente. Dire que nous voyons l'image parce qu'elle est ce qui cause le plus immédiatement notre expérience revient à faire la même erreur que ceux qui soutiennent que nous percevons notre image rétinienne. Il est clair que nous n'avons jamais l'impression de la voir, bien qu'elle soit causalement plus proche de nous que ce qu'elle nous permet de voir. En résumé, au niveau physiologique (si l'on admet l'hypothèse de Helmholtz), l'image est la prémisse et le depictum la conclusion d'une inférence inconsciente. Par contre, au niveau phénoménal, c'est le depictum qui est la prémisse et l'image la conclusion. C'est parce que le depictum se comporte bizarrement que nous inférons que nous devons être en train de regarder une image, et non l'inverse. La perception du depictum est causalement indirecte mais phénoménalement directe18. 2.1.3. Confusion entre le depictum et le modèle : « Quand je regarde une caricature de Brigitte Bardot, je n'ai pas l'impression d'avoir Brigitte Bardot en face de moi » Comme le remarque Schier (1986 : ??) personne ne confond une caricature de M. Thatcher avec M. Thatcher. Ce fait ne contredit toutefois pas la théorie de l'illusion : l'illusion ne consiste pas à voir Thatcher mais à voir un visage devant soi, sur un plan distinct de la surface où il est ontologiquement. L'argument repose sur une confusion entre le depictum et le modèle. Il suffit, pour qu'une image cause une illusion, que nous voyons son depictum, c'est-à-dire, que nous voyons une distinction entre deux plans au moins. Il peut se faire que l'image nous donne seulement l'impression de voir autre chose qu'elle (son depictum), mais que son depictum soit identique à son modèle : un portrait très ressemblant de Brigitte Bardot endormie pourrait donner l'impression d'avoir Brigitte Bardot devant soi. Mais la 18 Sur ce point, il nous semble y avoir une tension chez Monnoyer : bien qu'il affirme que « De l'objet, nous avons une perception indirecte, mais nous avons aussi une perception directe de l'image photographique dont la manifestation seconde nous fournit une occasion supplémentaire de le faire exister » (1999 : 12), il soutient ensuite que certaines photographies nous présentent leur objet en demeurant transparentes (1999 : 24sqq). Mais comment, si l'image est transparente, pouvons-nous la percevoir directement ? Tout ceci serait cohérent si Monnoyer parlait ici de transparence causale ainsi que du processus causal qui conduit à la perception. Mais les termes qu'il utilise (« manifestation », « présente ») sont clairement phénoménologiques. Dès lors, il ne nous semble pas acceptable de dire que ce que nous avons l'impression de voir directement est transparent. Malgré ces désaccords, nous devons à Jean-Maurice Monnoyer l'intuition qui fonde notre théorie de l'illusion, selon laquelle les images sont phénoménalement transparentes. 13 ressemblance entre le depictum et le modèle,on l'a vu, n'est nullement essentielle à la depiction. 2.1.4. Confusion entre le sens ontologique et le sens phénoménologique des verbes de perception : « Si l'image est dans mon champ visuel, je la vois » Enfin, d'aucuns pourraient déclarer la théorie de l'illusion, et du même coup le disjonctivisme, trivialement faux. Leur argument serait le suivant : à partir du moment où nous avons l'image sous les yeux, qu'elle est suffisamment éclairée et que notre système perceptif est en bon état, nous la voyons nécessairement. Cette objection repose sur une confusion entre l'emploi phénoménal et l'emploi ontologique des verbes de perception. En effet, tant que l'emploi de ces verbes fluctue, un disjonctiviste ou un illusioniste peut accepter la phrase « nous voyons toujours l'image et son depictum », pour peu qu'il l'interprète ainsi « nous voyons toujours ontologiquement l'image et phénoménologiquement son depictum ». Autrement dit « nous avons toujours l'image sous les yeux et avons l'impression de voir son depictum ». Nous refusons pour notre part la possibilité de voir phénoménalement la surface et le depictum en même temps, et nous refusons, dans la plupart des cas, que la surface soit perceptible. Ces confusions potentielles, qui pourraient amener à rejeter la théorie de l'illusion se de mauvaise bases étant dissipées, il reste à motiver positivement son adoption. 2.2. En faveur d'une théorie de l'illusion. La description de « ce que nous voyons quand nous regardons une image » fournit deux arguments centraux en faveur d'une théorie de l'illusion. Le premier est que, si la description est adéquate, la surface de l'image est invisible. Le second est qu'il y a une continuité entre notre perception ordinaire et notre perception des images. On en déduira un troisième argument, qui est cette fois physiologique : la perception des images ne semble pas relever d'une voie physiologique distincte de la perception ordinaire. 2.2.1. L'image invisible D'après la théorie de l'illusion, si nous sommes dans une position relativement à l'image qui nous permet de voir son depictum, alors nous ne pouvons pas voir sa surface, c'est-à-dire l'image elle-même (« voir » étant toujours employé dans son sens non factif, phénoménologique). Or la thèse conjonctiviste standard semble admettre que nous voyons la surface. Cette conception, comme en atteste les citations des conjonctivistes19, paraît s'imposer à eux avec une certaine évidence : « Bien sûr, il est vrai que je peux voir un Canaletto comme une phantasmagorie de taches colorées de peinture au lieu de la voir comme une image du Grand Canal, et il est important de caractériser cette différence. » (Schier, 1986 : 10) Si Schier voulait simplement dire qu'en nous approchant de la peinture, en collant notre nez à sa surface, nous ne voyons plus que des taches colorés sans depictum, sa position serait peut-être défendable. Mais il semble qu'il veuille aller plus loin en laissant entendre que, du même point de vue, nous pouvons voir le depictum et/ou l'image. Il n'est pourtant pas 19 voir notes x-xx. 14 si facile, en regardant le tableau, de ne pas voir la scène dépeinte mais de ne voir que des aplats de couleur. Pour tout dire, cela nous semble impossible. Peut-on vraiment parvenir à voir le ciel à côté de la coupole, sur le même plan qu'elle ? Dès lors que nous voyons la coupole, nous la voyons « devant » le ciel. Et si nous voulons désigner, parmi les trois gondoles du premier plan, la première, nous disons spontanément « celle de devant », plutôt que celle d'en bas. Bref, lorsque nous essayons de voir la phantasmagorie de tâches colorées dont parler Schier, nous sommes irrémédiablement rendus au Grand Canal. Il est vrai que nous savons que le Grand Canal n'est pas derrière cette surface, de sorte que les croyances que nous serions enclins à former sur la base de notre perception sont, pour ainsi dire, disqualifiées d'avance. Reste qu'une fois le tableau sous nos yeux, la surface plane s'efface pour laisser place à la profondeur. Si nous voyions effectivement l'image plane, nous devrions voir des taches de couleurs juxtaposées, sans aucune différence de plan entre elles, tel un costume d'Arlequin20. Mais nous n'y parvenons pas. Cette invisibilité de la surface est encore plus flagrante dans le cas des photographies. Ainsi est-il difficile de ne pas voir là une différence entre des plans : [photo philippe du salon] Les herbes paraissent être devant le mont et celui-ci devant le ciel. Là encore, nous ne parvenons pas à voir la montagne sur le même plan que les herbes et le ciel, en dépit de notre conviction qu'ontologiquement, ces tâches de couleur se situent sur le même plan. Qui soutient, comme Goodman, que seule la surface est vue, mais pas son depictum, est donc dans une position délicate. Mais la position du conjonctiviste est encore plus inconfortable : non seulement ces remarques affectent également sa thèse (puisqu'il soutient aussi que la surface est perçue), mais en outre son affirmation que nous percevons aussi le depictum conduit à une description peu vraisemblable de notre expérience. Il faudrait, dans son optique, que la même tache rouge soit à la fois expérimentée devant un fond bleu et à côté de lui. Qu'une même entité puisse apparaître en deux endroits à la fois est une absurdité pour qui prend au sérieux l'idée vraisemblable selon laquelle les propriétés spatiales ont un rôle important à jouer dans l'individuation des entités perçues. Ce qui distingue un objet visuel d'un autre est certainement, en partie au moins, le fait qu'il occupe une place distincte dans l'espace visuel. 2.2.2. La continuité phénoménale entre la perception des images et la perception ordinaire La théorie conjonctiviste implique que la perception visuelle des images est un mode de perception particulier, différent de la vision ordinaire. En effet, si la perception des images est toujours une perception duale et que la perception ordinaire ne l'est pas, il s'agit là, sur le plan phénoménal, de deux genres distincts de perception. Cependant, cette implication entre la position conjonctiviste et la rupture entre deux types de « voir » (un « voir » ordinaire et un « voir » des images) a été contestée. Ainsi Pelletier (2000) cherche-t-il à concilier conjonctivisme et continuité entre perception des images et perception ordinaire. Il reproche au conjonctivisme de Wollheim, de conduire à une séparation forte entre la perception ordinaire et la perception des images : en effet, dans la mesure où la dualité est une propriété 20 Wollheim dit ainsi clairement que l'aspect configurationnel d'une image est analogue à la perception d'une image plane, sans rien voir en elle (même s'il souligne aussitôt les limites de cette analogie car pour lui l'aspect configurationnel est inséparable de l'aspect représentationnel), citation de Pelletier, p. 166. 15 essentielle de la perception des images, celle-ci semble inconciliable avec la perception ordinaire qui n'est pas duale : Il importe de mettre en doute la thèse de Wollheim sur l'incommensurabilité de la vision impliquée dans ce type d'expérience avec la vision ordinaire. Il faut pour cela une théorie de l'expérience du "voir-dans" qui maintienne une continuité avec la vision ordinaire et qui, ce faisant, réduirait la part d'obscurité inhérente aux observations de Wollheim. » (Pelletier, 2000 : 167) Une telle conciliation nous semble cependant difficile : à mesure qu'il insiste sur la continuité entre perception ordinaire et perception des images, Pelletier semble implicitement abandonner l'idée que nous pouvons percevoir la surface de l'image21. Mais, rétorque le conjonctiviste, pourquoi devrait-on admettre une continuité entre la perception ordinaire et celle des images ? Après tout, ne faisons-nous pas facilement la distinction entre la perception d'une image et celle d'un objet réel ? Une telle continuité, à la limite, ne vaudrait que pour la perception des images et celles des trompe-l'oeil. Contrairement aux images, les trompe-l'oeil ne laisseraient pas percevoir leur surface. Ainsi le conjonctiviste peut-il concéder, comme Wollheim, que la théorie de l'illusion s'applique aux trompe-l'oeil -mais aux trompe-l'oeil seulement souligne-t-il. Il nous semble cependant peu crédible d'introduire une telle discontinuité entre la perception des images et la perception des trompe-l'oeil. En effet, qu'avons-nous vraiment l'impression de voir quand le trompe-l'oeil cesse d'être vraisemblable, comme lorsque nous nous éloignons de son centre de projection, ou qu'une variation de la lumière rend son depictum visuellement incohérent avec son environnement ? Certes, la cohérence du trompel'oeil avec l'environnement est rompue, et en ce sens, le trompe-l'oeil n'est plus vraisemblable. Mais il est clair, pour commencer, qu'il ne cesse pas pour autant de dépeindre : les anges, les colonnes et les arches représentés dans le plafond de Pozzo à l'église San't Ignazio ne disparaissent pas lorsque nous sortons du rond de marbre indiquant son centre de projection. Si les colonnes dépeintes ne semblent plus alignées avec les colonnes réelles de l'église, c'est précisément parce qu'elles sont encore vues22. Le trompe-l'oeil cesse en ce sens de nous tromper : nous voyons alors un bâtiment tordu et disproportionné, et savons que ce n'est pas le cas. Mais il ne s'ensuit nullement que nous percevons la surface pour autant. Si nous prenons le conjonctiviste à lettre, aussitôt que nous sortons du repère de marbre nous devrions voir une surface plane surgir entre nous et le depictum. Ce n'est pas ce qui se passe : ce qui se produit dans ce cas n'est pas une soudaine apparition de la surface, mais un comportement étrange du depictum qui nous conduit à inférer que nous devons avons sous les yeux une image. Ce qui change n'est pas ce que nous voyons mais ce que nous croyons, nous passons d'une illusion trompeuse à une illusion non-trompeuse, mais nous restons dans l'illusion car nous ne voyons toujours pas la surface. 21 Il finit ainsi par écrire : « L'expérience des images représentationnelles est une expérience récognitionnelle ordinaire bien qu'à la différence de l'expérience de vision ordinaire, cette expérience ne donne pas un accès perceptuel aux objets reconnus dans l'image mais à la surface de l'image » (2000 : 182). Pour bien comprendre cette phrase, il faut préciser que Pelletier emploie les verbes de perception dans leur sens factif : percevoir x implique que x existe (contrairement à ce que nous faisons ici). C'est le terme « expérience » qui décrit ici le donné phénoménal de la perception des images, or Pelletier semble suggérer ici que nous ne faisons l'expérience du depictum et non de l'image elle-même, bien que sur le plan ontologiquement nous percevons -avons sous les yeux- l'image. 22 Une photographie des déformations induites par le changement de point de vue est présenté dans Rock (réf). 16 2.2.3. La continuité physiologique entre notre perception des images et notre perception ordinaire Pour Alberti, un tableau doit tendre à ressembler au plus près à une section de la pyramide visuelle : l'idée est au fond que le tableau doit causer le même stimulus proximal, ou la même image rétinienne, que celui ou celle que causerait son depictum s'il était là. En d'autres termes, une image de x cause le même pattern de stimuli que x si elle est vue à partir de son centre de projection. Ce fait souvent remarqué a été récemment réaffirmé par D. Gilman, sur la base d'observations neurobiologiques. « En ce qui concerne les mécanismes neuronaux de la vision spatiale de bas niveau, un dessin en perspective (ou une image, une photographie) peut fournir exactement le même stimulus que la scène qu'il représente. » (1994 : 91)23 Rappelons ici que la scène représentée par une image, ce que nous appelons son depictum, est distincte de son modèle. Si nous voyons une image de licorne, le stimulus que cause l'image est le même que celui qu'aurait causé une licorne si elle avait été là. Si nous voyons un mauvais dessin de Mickey, le stimulus proximal que cause le dessin est le même que celui qu'aurait causé Michey-tordu s'il avait été là. Encore une fois, le modèle n'explique en rien pourquoi nous voyons dans l'image : il n'intervient éventuellement qu'après notre vision dans l'image, afin de nous permettre de juger, par exemple de la fidélité du depictum par rapport à lui. L'argument de la continuité physiologique consiste alors à dire qu'il n'y pas de raison de penser que des activations rétiniennes similaires fasse l'objet d'un traitement spécifique et causent des expériences distinctes. Considérant que nous voyons les images avec les mêmes yeux que ceux avec lesquels nous voyons notre environnement, pourquoi devraient-elles alors nous apparaître autrement ? Si l'on prend soin de ne pas commettre les confusions précisées plus haut, et que l'on admet (i) que la surface d'une image est en général invisible, (ii) qu'il n'y a pas de discontinuité phénoménologique entre une image et un trompe-l'oeil, et (iii) que la perception des images s'opère par les mêmes voies physiologiques que la perception de l'environnement, nous avons de bonnes raisons d'adopter une théorie de l'illusion. Mais cette théorie soulève d'importantes difficultés, qu'il nous faut maintenant examiner. 2.3. Examen des difficultés Les arguments avancés jusqu'ici peuvent sembler bien faibles au regard des difficultés auxquelles se heurte la théorie de l'illusion. Trois objections principales peuvent être formulées à son encontre (on les retrouve notamment dans les critiques que Wollheim adresse à Gombrich). L'objection de la diversité des points de vue, l'objection des propriétés esthétiques des images, et l'objection de la diversité des images. 23 Voir également Rock ( : 104) « il y a beaucoup de similarité entre la projection rétinienne de l'imag eet celle de la scène qu'elle représente ». Blinder (1986 : 27) « Le fait que l'image puisse produire un réseau optique similaire à ce que la scène réelle produirait permet au "monde" d'apparaître dans l'image. ». Ce qui permet à Blinder de maintenir malgré cela une position conjonctiviste est qu'il considère qu'il y a d'autres invariants qui spécifient non les propriétés du depictum, mais celles de la surfaces qui entre en jeu. Nous traitons ce point lors de l'examen des difficultés pour la théorie de l'illusion. 17 2.3.1. Tourner autour d'une image. Une objection forte à l'encontre de la théorie de l'illusion consiste à remarquer qu'en nous déplaçant devant une image, le changement de point de vue ne permet pas la perception de parties de l'objet jusqu'alors invisibles, ni le déplacement relatif des plans. Autrement dit, la parallaxe de mouvement est inopérante dans le cas des images. Casati note par exemple : « Le miroir et la fenêtre sont très différents du tableau du fait de la parallaxe visuelle. Si vous vous déplacez à droite ou à gauche devant une fenêtre ou un miroir, votre relation avec les différents éléments de la scène que vous voyez change. La fleur qui semblait être à droite de l'épée semble être maintenant à gauche. Devant un tableau, votre déplacement ne modifie pas ces relations (tout au plus changent les conditions de bonne visibilité : vous ne pouvez vous mettre trop de côté). » Casati (2002 : 217). Si l'on bouge face à une image, son depictum ne se comporte pas comme un objet tridimensionnel : l'illusion, soutient l'objection, cesse alors de fonctionner. Une première réponse, par défaut, consiste à faire remarquer que nous n'avons pas pour autant l'impression de voir une surface plane. Nous déplacer par rapport à l'image ne nous conduit pas à voir des tâches colorées sur le même plan, c'est-à-dire, telles qu'elles sont. Cela suffit à une théorie de l'illusion. Mais une description plus positive de ce que nous voyons reste requise. Une solution assez simple pour l'illusionniste consisterait à dire qu'en nous déplaçant devant une image nous avons plusieurs expériences distinctes, et que chacune d'elle est illusoire. A chaque nouveau point de vue, nous expérimenterions un nouveau depictum. Cependant, une telle description, si elle est compatible avec la théorie de l'illusion, se heurte à deux objections importantes. La première est qu'elle néglige le caractère dynamique de la perception : nous ne pouvons pas découper l'impression que nous avons en tournant autour d'un objet ou d'une image en une somme d'instantanés, d'impressions statiques atomiques. Nous concèderons ici ce point, en faisant néanmoins remarquer que la prise en compte de l'aspect dynamique de la perception implique de rendre compte du problème de l'individuation de nos expériences. En effet, si l'on passe à la limite, nous ne faisons qu'une expérience visuelle dans notre vie, qui va des premières couleurs que nous voyons à notre naissance aux dernières que nous voyons à notre mort. Une telle solution ne paraît pas acceptable : l'expérience visuelle de la dinde du 24 décembre 1993 est une expérience distincte de celle de la mouche qu'est s'est posée sur une vitre le 2 juin 2003. Remarquons que si l'on choisit de dire que ces expériences ne sont que des parties d'une expérience globale qui va de la naissance à la mort, le défenseur de la théorie de l'illusion peut en tirer que chaque nouveau point de vue sur le tableau est une partie illusoire de l'expérience globale du tableau -il semble n'y avoir là qu'une révision terminologique inoffensive de sa description initiale. Nous nous intéresserons plus en détail à la seconde objection. Selon elle, l'illusionniste ne peut pas dire qu'à chaque point de vue un nouveau depictum est expérimenté, tout simplement parce que ce n'est phénoménalement pas vrai : la plupart du temps, nous voyons toujours la même chose en nous déplaçant par rapport à l'image. Le depictum ne change ni de forme ni de lieu. La photographie d'un ballon de foot vue de côté ne donne pas l'impression de voir un ballon de rugby. Le psychologue M. Kubovy affirme ainsi qu'il y a une « robustesse de la perspective » : même si une image n'est censée avoir qu'un 18 centre de projection, il apparaît pourtant qu'elle se laisse regarder, sans déformations, d'un grand nombre de points de vue. « En général, il n'est pas nécessaire de voir une image de son centre de projection pour voir une version non déformée de la scène qu'elle représente. » (Kubovy, 2003 : 43) Dire que nous avons un nouveau depictum pour chaque point de vue ne semble donc pas être un recours acceptable pour l'illusionniste. Il peut alors abandonner la thèse « un point de vue, un depictum » pour adopter celle de la constance : nous percevons toujours le même depictum à travers l'image, mais jamais l'image. Ceci est parfaitement compatible avec la théorie de l'illusion. Mieux, cela semble constituer un nouvel argument en sa faveur : si ce que nous voyons demeure constant lors de nos déplacements autour de l'image, c'est que nous devons voir autre chose que la surface, car celle-ci devrait nécessairement se déformer. Cette considération met la position conjonctiviste dans l'embarras, car elle l'obligerait à dire que la même tache rouge est perçue à la fois comme ne changeant pas de forme en tant qu'elle est vue comme le depictum, et comme changeant de forme en tant qu'elle est vue comme une propriété de la surface. De même qu'il semble difficile de dire qu'un même objet phénoménal apparaît en deux endroits à la fois, il paraît délicat de maintenir qu'il semble à la fois constant et changeant. La nécessité d'une compensation Cependant, si la constance perceptive du depictum constitue une difficulté pour la théorie de l'illusion, c'est pour une raison plus subtile : c'est que, maintient Wollheim, la constance du depictum implique que la surface soit vue également. Pourquoi ? L'idée de Wollheim est que si le sujet ne voyait pas la surface de l'image, alors il ne serait pas en mesure de compenser les déformations de la projection rétinienne provoquée par son déplacement. Autrement dit, c'est parce que le sujet voit aussi l'image qu'il ne prend pas ces déformations à la lettre, et les corrige afin de maintenir une constance du depictum. C'est ce qu'on appelle une théorie de la compensation. Notons pour commencer que cette explication de la constance du depictum conduit à une modification sensible de la théorie de Wollheim. Selon sa thèse conjonctiviste, les deux aspects (configurationnel et représentationnel) qui assurent la dualité du « voir-dans » ont un statut comparable : aucun ne prime sur l'autre. Pourtant, l'argument issu de la constance du depictum conduit à dire que le voir configurationnel est une condition du « voir-dans ». L'argument tend vers l'idée que la perception du depictum est inférée sur la base de la perception de l'image. C'est effectivement ainsi que le conçoivent les psychologues qui ont avancé cette hypothèse. Mais cela implique que Wollheim admette une certaine primauté de l'aspect configurationnel sur l'aspect représentationnel, ce qui n'est pas forcément dans ses intentions. Ensuite, le partisan d'une théorie de l'illusion peut donner une réponse assez simple à l'argument de Wollheim. L'argument entend placer l'illusionniste face à un dilemme : s'il admet que nous percevons la surface de l'image, il doit alors renoncer à la constance du depictum, qui paraît pourtant être un fait établi. Mais alors, le partisan de la théorie de l'illusion peut simplement choisir la première branche du dilemme en précisant que rien n'impose que les propriétés de l'image soient consciemment perçues. : même si l'on admet en effet que seule une intégration des informations venant de la surface de l'image permet d'expliquer la constance, rien n'oblige à admettre que ces informations sont consciemment accessibles, que la surface est, à proprement parler, perçue. Comme le remarquent Lopes 19 (1996 : 49) et A. Tüscher (date), la constance du depictum ne suffit pas à étayer la thèse conjonctiviste, car elle est aussi bien expliquée si les propriétés de l'image sont traitées à un niveau subpersonnel. De fait, dans sa version originale introduite par Pirenne (1970) la théorie de la compensation est censée décrire un processus inconscient : « Quand la forme et la position de l'image peuvent être vues, un processus intuitif inconscient de compensation a lieu, qui restaure la perspective correcte lorsque l'image est regardée de la mauvaise position. » (Pirenne 1970 : 99, cité également par Cutting 1987 : 325) Afin de concéder le plus possible au conjonctiviste, admettons cependant que la théorie de la compensation implique que la surface est nécessairement vue consciemment. La théorie de l'illusion n'en serait pas invalidée pour autant : d'une part, parce que d'autres explications ne faisant pas appel à la perception de l'image permettent d'expliquer les phénomènes de constance ; d'autre part, parce que la constance du depictum est en définitive sujette à caution. Commençons donc par présenter un peu plus en détail la théorie de la compensation telle qu'elle a été développée par les psychologues. Le problème que cherchent à résoudre les théories de la compensation est donc que nous ne voyons pas dans les images vue d'un autre point que le centre de projection ce que nous devrions y voir. Ce diagnostic est établi sur la base des deux hypothèses suivantes : (i) nous voyons le depictum tel que nous l'aurions vu si nous avions été situé sur le centre de projection -parfois appelé point de composition. (hypothèse de constance). (ii) Nous devrions voir le depictum déformé (hypothèse de déformation attendue). La façon dont nous devrions voir le depictum peut être déterminée soit par des procédures géométriques, généralement fondées sur le Traité de perspective linéaire de J. de La Gournerie (1859)24 ; soit sur des procédures algorithmiques, telles que celle proposée par Cutting (1987). Sur le fond, cette dernière repose sur l'idée intuitive que pour savoir ce que nous devrions voir dans une image vu de biais, nous faisons une image-copie de cette image originale, cette image-copie ayant pour centre de projection de point de vue latéral. En gros, pour savoir comment nous devrions voir la photographie A du point p, distinct de son centre de projection, prenez une photographie B de la photographie A à partir du point p. L'hypothèse de la constance remarque que paradoxalement, ce que nous voyons du point p est le depictum de la photographie A et non celui de la photographie B. La théorie de la compensation cherche à expliquer cette constance en soutenant que notre système visuel compense le décalage entre p et le centre de projection afin de nous présenter le depictum de l'image tel qu'il nous apparaîtrait si nous nous trouvions sur ce centre. Cette explication a été initialement formulée par M. H. Pirenne : les déformations arrivent selon lui « quand le spectacteur n'est pas capable de voir la surface peinte en tant que surface » (1970 : 84). Elle est notamment reprise, avec certaines modifications, par J. Hochberg (1972 : 55) I. Rock (2001,1984 : 97 sqq), ainsi que par M. Kubovy (2003, chapitre 7). L'hypothèse générale est que seule l'intégration d'informations concernant l'image permet de compenser la déformation de l'image rétinienne due au déplacement. Kubovy introduit ainsi cette théorie : 24 La Gournerie propose une solution pour reconstruire l'espace dépeint par le tableau à partir du seul tableau. En quelque sorte, alors qu'Alberti propose des solutions aux peintres, La Gournerie propose des solutions aux architectes. A l'aide de transformations afinnes, il est ainsi possible de reconstruire l'espace que devrait voir un sujet qui se situerait ailleurs que sur le centre de projection. 20 « Nous allons explorer ici les fondements de la robustesse de la perspective, et nous allons voir pourquoi le phénomène ne se produit pas à moins que la surface de l'image ne soit perceptible. En d'autres termes, nous allons découvrir que la fenêtre d'Alberti diffère de toutes les autres en ce qu'elle fonctionne correctement seulement si elle n'est pas complètement transparente : nous devons percevoir la fenêtre afin de percevoir le monde. » (Kubovy, 2003 : 61) T. Yang et M. Kubovy proposent la définition suivante : « Selon la théorie de la compensation, la surface d'une image est soit visible, soit ne l'est pas. Nous pouvons résumer la théorie à l'aide de deux propositions : (a) Quand la surface de l'image est invisible, les observateurs ne compensent pas du tout, et l'espace perçu subit autant de transformation que ce que la géométrie prédit. (b) Quand la surface de l'image est visible, les observateurs compensent totalement leur changement de point de vue. » (Yand & Kubovy, 1999 : 8) Dès lors, les partisans de la théorie de la compensation, qu'il s'agisse de Wollheim, de Kubovy ou de Rock introduisent une distinction forte entre les images ordinaires et les trompe-l'oeil, qui ne sont, selon eux, pas du tout traités de la même façon. L'explication de la constance a donc un coût : il faut admettre une discontinuité entre la perception ordinaire et la perception des images. Ce coût est d'abord phénoménologique, comme nous l'avons fait remarquer plus haut, nous devrions voir une surface surgir entre nous et le trompe-l'oeil lorsque nous nous éloignons de son centre de projection. Par ailleurs, même si l'on accorde qu'il y a une constance du depictum dans la mesure où les déplacements par rapport à l'image sont raisonnables, les partisans de la théorie de la compensation reconnaissent cependant que dans des positions extrêmes l'image apparaît bien déformée. La seule existence des anamorphoses atteste ce fait. Toute la question est de savoir comment la théorie de la compensation peut expliquer de telles compensations latérales : dans la mesure où la surface demeure visible, le depictum ne devrait jamais se déformer (voir T. Busey, N. Brady & J. Cutting, 1990 : 10). De surcroît, même si une explication de ces déformations extrêmes pouvait être donnée dans le cadre de la théorie de la compensation, il resterait néanmoins à expliquer pourquoi ces déformations ne nous apparaissent pas brusquement. En effet, si une constance totale est assurée lorsque nous tournons disons, jusqu'à 45° de part et d'autre du rayon central (lequel, pour reprendre l'expression d'Alberti est constitué par la ligne qui passe par le point de projection et coupe perpendiculairement l'image), tandis qu'au delà de 45° nous commençons à voir le depictum tel que nous devrions le voir sans compensation, il s'ensuit que le depictum doit faire un « saut », en passant d'un coup, par exemple, d'une forme carrée à une forme trapézoïdale assez prononcée. En outre, comme le remarque Cutting (1987 : 326), la théorie de la compensation a également un coût cognitif élevé : le spectateur regarde d'abord l'image, la rectifie ensuite selon un processus complexe qui fait débat, puis elle lui apparaît enfin telle qu'il la verrait s'il était sur le centre de projection. « Un tel processus, écrit-il, semble redondant, encombrant d'un point de vue computationnel, et plus difficile que la perception normale des images. Que la perception des images soit directe ou non, il semble plus parcimonieux de dire que la perception des images orientées et non orientées procède de la même façon ». La théorie de l'illusion, on l'a vu, n'a pas à assumer une telle rupture entre perception ordinaire et perception des images. Mais la contrepartie en est, selon les conjonctivistes 21 (partisans de la théorie de la compensation) qu'elle ne peut rendre compte de la constance du depictum. Il s'ensuit que les difficultés que rencontre la théorie de la compensation nous laissent dans l'attente d'une nouvelle explication de la constance. Cutting (1987) ainsi que Busey & al. (1990) proposent une explication au moins partielle de ce phénomène de constance. En s'attaquant à l'hypothèse (ii) de la théorie de la compensation selon laquelle nous devrions voir le depictum déformé, ces auteurs montrent que pour des déplacements latéraux de magnitude moyenne (+22° par rapport au rayon central) les images reconstruites par le procédé algorithmique sont indiscernables. Autrement dit, dans le cadre de ces déplacements, « les distorsions dans l'image sont sous le seuil [de différentiation], ou peutêtre dans les limites de l'acceptabilité ». Ils montrent aussi concurremment, contre la théorie de la compensation, que l'introduction d'indices sur l'orientation de la surface (l'orientation du cadre) n'introduit pas de différences significatives. En résumé, dans une limite de plus ou moins 22°, les déformations que nous devrions voir dans le depictum sont trop faibles pour que nous puissions diagnostiquer l'absence de leur perception. Une autre stratégie à l'encontre de la théorie de la compensation, consiste à modérer sa première hypothèse, selon laquelle le depictum est perçu de façon constante. C'était déjà l'idée de Gombrich (197225), qui, pour défendre sa propre théorie de l'illusion, tentait de soutenir que des déformations apparaissent lorsque nous nous déplaçons devant les images. Nous avons déjà remarqué que cela n'est vrai qu'en ce qui concerne les positions extrêmes. Mais il se pourrait que la constance ne soit pas aussi incontestable, même pour des variations de point de vue d'une amplitude plus réduite. Cela a conduit Kubovy, en collaboration avec Yang (1999), à nuancer sa théorie de la compensation. Ils maintiennent cependant une théorie faible de la compensation, fondée sur l'observation que les sujets ne compensent pas totalement la déformation du depictum, comme la théorie forte le prédisait, mais que d'un autre côté, la variation perçue du depictum est moindre que celle que le procédé géométrique de La Gournerie le laisserait attendre. Enfin, il est important de prendre en compte un phénomène général dans la perception des portraits : le depictum semble nous suivre des yeux lorsque nous bougeons devant l'image. Ceci est manifeste dans les images suivantes : [image de la fille qui tend les bras dans Rock p. 103] [image d'une route qui arrive dans les pieds ( ?)] Goldstein (1987) a baptisé ce phénomène « effet de rotation différentiel »26, Kubovy par le de l'illusion de « suivi » (2003 : 47). Il est important de comprendre que cet effet, comme le reconnaît Kubovy, contredit la constance et la robustesse de la perspective. Si la théorie de la compensation était vraie, et si, plus généralement la constance était absolue, nous devrions quitter les bras de la jeune femme en nous éloignant du centre de projection. Or cette impression de suivi vaut pour tous les angles sous lesquels nous regardons l'image, même ceux pour lesquels la constance serait la plus attestée. En définitive, les deux hypothèses d'où naissait le problème que cherchent à résoudre les théories de la compensation semblent devoir être fortement nuancée. D'une part, le depictum tourne en suivant le sujet, et, comme l'admettent par ailleurs Yang et Kubovy, la constance est loin d'être totale. D'autre part, comme le montrent les travaux de Cutting, il 25 Cité par Hochberg, p. 55. 26 Mentionné par Cutting (1988 : première page). 22 apparaît que pour beaucoup de points de vue latéraux, la déformation du depictum que nous devrions voir n'est pas suffisamment significative pour être prégnante. Notre intuition est dès lors la suivante : il n'y a peut-être pas de problème. Si l'on combine la prise en compte de la rotation, des déformations du depictum et le fait que certaines déformations sont indiscernables, nous parvenons peut-être à rendre compte de l'apparence du depictum à chaque point de vue. Sans doute le rôle de la rotation apparente du depictum, qui est plus forte pour les lignes proches du rayon central, a-t-il été sous-estimé. C'est en tout cas une explication possible de la persistance d'une même illusion à partir des différents point de vue d'un tableau : nous avons l'impression que le depictum (ou certaines de ses parties) tourne avec nous, comme si sa position dépendait de la notre. 2.3.2. L'objection des propriétés esthétiques Un des arguments de Wollheim en faveur du conjonctivisme (et donc de la twofoldness) est que lui seul permet de rendre compte des propriétés esthétiques des images. Selon lui, lorsque nous regardons un tableau impressionniste ou pointilliste, nous avons une impression distincte de celle que nous aurions en regardant seulement l'objet peint, ceci parce que nous voyons les propriétés de la surface. Schier (1986 : 9) pense qu'une pêche vue directement ne produit pas le même frisson esthétique qu'une pêche vue dans une image. Mais selon nous, c'est simplement parce que ce n'est pas la même pêche qui est vue ! Si le depictum du tableau était indiscernable de la pêche réelle (le modèle, dans l'intention du peintre), alors nous aurions nécessairement le même frisson devant l'une et l'autre. Plus généralement, dans la mesure ou les images sont phénoménalement transparentes, on soutiendra le principe suivant : Toute propriété de l'image (c'est-à-dire de la surface) apparaît comme une propriété du depictum. Nous ne voyons pas les pointillés qui représentent un lapin, mais un lapin en pointillés. Les propriétés de l'image sont perceptivement « projetées » ou « attribuées » au depictum. Nous ne les voyons jamais comme des propriétés de la surface. On peut objecter que certains artistes cherchent à rendre la surface manifeste. A cela deux réponse. Tout d'abord, qu'il faille se donner du mal pour rendre la surface apparente est un phénomène qui va clairement dans le sens d'une théorie de l'illusion telle que nous la défendons : normalement, dans la très grande majorité des cas, nous ne percevons pas l'image. Deuxièmement, la plupart du temps, Mais alors, pensons-nous, ils échouent à dépeindre. Ainsi dans ce tableau de Seurat, ce qui est vu est une scène en discontinue, ou floue, mais pas une surface tachetée : Image Seurat 2.3.3. L'objection de la diversité des images Un requisit pour toute théorie de la depiction est de rendre compte des images dans leur diversité. Notre concept d'image inclut tout autant les peintures de la Renaissance que les photographies, les dessins d'enfants, les tableaux pointillistes de Signac, les bandes-dessinées, les peintures rupestres. Une théorie de la depiction qui n'aboutirait à ne considérer comme des images que les peintures figuratives classiques et les photographies serait problématique. Bien qu'il soit envisageable, dans l'absolu, de réviser notre concept d'image, il est préférable que ces révisions soient aussi marginales que possible. Le risque serait en effet d'introduire une 23 discontinuité là où il n'y en a pas, de considérer comme relevant de genres différents des phénomènes qui relève en fait du même genre. Selon nous, une condition nécessaire pour que x soit une image est que son depictum n'ait pas les mêmes propriétés spatiales que sa surface. Autrement dit, selon la théorie de l'illusion, rien ne peut être une image s'il ne cause pas d'illusion (ou s'il n'a pas le pouvoir de causer une illusion). Cette condition semble au premier abord être une contrainte beaucoup trop forte : de nombreuses choses comptent comme des images et ne semblent pas pour autant être cause d'illusion. Une telle définition paraît au premier abord ne s'appliquer qu'aux trompe-l'oeil, et, à la limite, à la peinture figurative et hyperréaliste ou à certaines photographies, à condition qu'elles soient vues dans des conditions appropriées très spécifiques. Mais l'illusion, au sens où nous l'avons définie et distinguée de la croyance, est un phénomène généralisable. Tous les types d'images que nous avons mentionnés, à l'exception de certaines peintures abstraites, doivent être considérées comme des causes d'illusion. Si cela n'est pas le cas, c'est parce que l'on présuppose souvent implicitement qu'une image ne peut donner une impression de profondeur qu'à la condition de satisfaire certaines lois de la perspective. Or la perspective n'est ni le seul, ni le principal indice nous donnant l'impression d'une profondeur. Il se peut même qu'elle soit tout autant un outil destiné à garantir une ressemblance entre le depictum et le modèle qu'une méthode visant à créer une impression de profondeur. Dans tous les cas, elle n'est pas nécessaire à créer une impression de profondeur. L'impression minimale de profondeur que nous pouvons avoir consiste à distinguer un premier plan d'un arrière plan. Cela suffit clairement à ce qu'il y ait illusion : sur l'image, les taches colorées se situent sur le même plan, mais sont vues comme étant localisées sur des plans différents. Or cette impression minimale de profondeur peut être produite par des images très rudimentaires, qui ne font aucun usage de la perspective. Il suffit qu'une figure se détache d'un fond pour qu'elle ait lieu, la différentiation figure-fond est une condition suffisante de l'impression de profondeur. Cette distinction a été initialement introduite par le psychologue danois Edgar Rubin (1915, 1921), elle sera reprise par les psychologues gestaltistes (en particulier Koffka, Köhler et Wertheimer) et semble fondamentale dans de nombreux cas de perception. La notion de bord ou de frontière est essentielle dans cette optique : toute la question est en effet de savoir, lorsque deux régions se distinguent par leur couleur, à laquelle va être attribuée le bord. Ainsi, dans l'exemple suivant : 24 Soit nous attribuons le bord à la région noire, auquel cas, nous voyons un rond noir sur un fond blanc. Soit nous attribuons le bord à la région blanche, auquel cas nous voyons une surface blanche percée d'un trou rond. Le point essentiel est que nous ne parvenons pas à voir du blanc à côté du noir, sur le même plan que le noir : quel que soit l'aspect que nous retenons, le noir est soit devant, soit derrière le blanc. L'importance de l'attribution des frontières est soulignée par J. E. Cutting et M. Massironi (1998 : 151) : « Il est probable que les éléments picturaux les plus importants soient les lignes qui produisent une ségrégation entre des régions, ce qui était l'intuition fondamentale de Rubin (1915). C'est-à-dire que la présence d'une ligne peut rendre la région se trouvant de l'un de ses côtés fondamentalement différente de celle qui se trouve de l'autre côté. [...] Ce type de ligne est un bord [edge]. La ligne-comme-bord crée l'image d'un objet en représentant ses contours, et elle indique qu'une région est plus proche de l'observateur que l'autre dans l'espace dépeint. La ligne appartient typiquement à la région de l'objet, composant ses frontières [borders]. » Outre la distinction figure fond, un autre indice tout aussi puissant que rudimentaire de la profondeur est l'occlusion ou interposition. Dans la figure suivante, la bande verticale paraît être devant la bande horizontale : L'interposition semble être tout à faire fondamentale pour comprendre la profondeur apparente des images. Elle serait plus prégnante que d'autres indices de profondeur, en particulier la stéréoscopie (Rock : 77sqq ; Gregory : 1998 : 193). (L'interposition participe peut-être de la distinction figure-fond, dans la mesure où une figure occlue une partie du fond. Il conviendrait d'examiner l'explication selon laquelle notre système visuel ferait toujours l'hypothèse que les objets vus sont opaques). L'interposition et la différentiation figure-fond constituent donc respectivement deux indices suffisants de profondeur : l'une et l'autre peuvent apparaître dans des images où aucune perspective n'est clairement exploitée. Ainsi, la différentiation figure-fond permet de comprendre pourquoi, dans des dessins simples comme celui-ci, le personnage semble être devant le fond : [image kid paddle] [shadok] Par ailleurs, la présence de phénomènes d'interposition suffit à affirmer qu'une peinture ou une partie de peinture est dépictive. C'est le cas pour ce tableau de Mondrian bien qu'il semble au premier abord douteux qu'il puisse compter comme une image, dans la mesure où aucune profondeur n'y est décelée, [tableau Mondrian] 25 Nous pensons que ce tableau de Klee, présente, à certains endroits au moins, des apparences de profondeur qui autorisent à le classer dans la catégorie des images : [tableau Klee] On pourrait cependant refuser au tableau de Klee le statut d'image en considérant que l'impression de relief est trop locale. Nous ne trancherons pas ici sur ce point : le fait est seulement que si nous voulons distinguer les images des non-images, une condition nécessaire est que deux plans au moins apparaissent sur l'image. Cette distinction de plan s'applique aussi bien à des images très rudimentaires qu'à des photographies. Cependant, cette réponse à l'objection de la diversité des images pose un nouveau problème : si même les images les plus rudimentaires causent des illusions, selon quel critère pouvons-nous les distinguer des images très réalistes ? S'il suffisait de dessiner des figures sur un fond, pourquoi Alberti aurait-il pris la peine de formuler certains règles complexes de perspective centrale ? Notre réponse est qu'il y a différents degrés d'illusion (qu'il ne faut pas confondre avec les différents degrés de plausibilité d'une image, c'est-à-dire la mesure dans laquelle une image est trompeuse en causant des croyances fausses). Nous avons défini une illusion comme étant l'expérience de quelque chose qui n'existe pas dans l'environnement immédiat du sujet. Il nous faut affiner cette définition, afin d'introduire la notion de degré d'illusion. « Ce qui est vu », avons-nous dit suivant Clark, consiste en des qualités localisées, et doit être décrit de la façon suivante « telle couleur ici », ou mieux « ainsi ici ». L'illusion, dans le cas de la perception des images, concerne le « ici », c'est-à-dire la localisation des qualités -elle peut également concerner le « ainsi », comme pour les photographies en noir et blanc, mais contrairement à l'erreur de localisation, l'erreur quant à la qualité n'est pas essentielle à la dépiction. Plus précisément, l'illusion concerne la localisation des différentes régions colorées : certaines sont vues devant d'autres, c'est-à-dire plus près de nous que d'autres, alors qu'elle sont en fait toutes sur le même plan. A ce stade, deux degré d'illusions peuvent déjà être distingués. D'une part, une illusion parfaite nous donne l'impression de la localisation absolue d'une surface colorée par rapport à nous. Ainsi, le sujet qui regarde un hologramme ou un stéréogramme situé à cinquante centimètres de lui peut dire : « cette tache rouge est à trois mètres ». Une illusion imparfaite ne nous donne l'impression que d'une localisation relative des différents plans de l'image : nous percevons que le rond noir est devant le fond blanc, mais nous ne percevons pas la distance absolue qui les sépare entre eux, ni la distance entre le rond est nous. Nous percevons simplement que le rond est plus près de nous que le fond. J.E. Cutting et M. Massironi (ref) écrivent ainsi : « Localement, les lignes et les régions semblent dépeindre deux et seulement deux distances implicites par rapport à l'observateur. Nous les appellerons la profondeur [depth] A (la plus proche) et la profondeur B (la plus éloignée). Ainsi, la profondeur locale spécifiée autour d'une ligne est toujours ordinale [...] ; c'est-à-dire que l'on ne peut jamais savoir (et nous ne devrions même pas nous attendre à savoir) de combien est la distance entre la profondeur A et la profondeur B, mais seulement que la première est dépeinte comme étant plus proche de l'observateur. » Cela semble être le cas pour la plupart des images, qui ne mettent en oeuvre ni la parallaxe binoculaire, ni la parallaxe kinesthésique : elles ne permettent pas d'évaluer la 26 distance absolue des depicta par rapport au sujet, mais seulement leur distance relative ou ordinale. Cette remarque est confirmée par le fait que nous sommes tentés de tendre la main lorsque nous regardons un stéréogramme ou un hologramme, mais pas lorsque nous regardons une photographie, une peinture ou un dessin. A ce stade, deux degrés d'illusion peuvent donc être distingués : d'une part les illusions où nous avons l'impression d'une distance absolue entre nous et le depictum, ainsi qu'entre les différents plans du depictum ; d'autre part les illusions où nous avons seulement l'impression d'une distance relative entre nous et le depictum. C'est le cas de la plupart des images telles que les peintures ou les photographies. Reste à différencier les peintures réalistes, respectant la perspective centrale, des images qui ne le font pas ou ne s'appuient que sur la distinction figure-fond ou sur l'occlusion. Nous avançons la solution suivante : l'occlusion et la distinction figure-fond permettent à elles seules de déterminer que des plans sont situés devant d'autres plans, c'est-àdire que certains plans sont plus proches du spectateur que d'autres. Mais ces indices ne spécifient rien de plus : il faut nécessairement avoir recours à la perspective pour dire que deux plans sont plus proches l'un de l'autre que deux plans distincts. Alors que la perspective permet de comparer les distances relatives entre les plans, la distinction figure-fond et l'occlusion nous permettent seulement de dire quels plans sont situés devant quels autres plans -la perspective nous semble être une condition suffisante pour percevoir la distance relative entre les plans, nous laissons ouverte la question de savoir si elle est une condition nécessaire. Ces arguments justifient l'idée qu'il existe différents degrés d'illusion dans la localisation des couleurs en profondeur. Dans le cas le plus fort (comme dans les stéréogrammes), une surface colorée est vue à une distance absolue de l'observateur alors qu'elle n'y est pas. Un degré plus faible d'illusion (qui vaut pour la plupart des photographies, et pour les images en perspective) est celui où seule est perçue la distance relative entre les plans et l'observateur (si l'observateur est à une distance x de la gondole de devant, alors il est à une distance, disons, 30x, de la coupole). Enfin, un degré minimal d'illusion (qui apparaît dans certaines photographies, peintures ou bandes-dessinées) est celui où nous percevons simplement des plans les uns devant les autres, sans être capables de voir si la distance relative entre deux plans est plus au moins grande que celle entre deux autres. Dans tous les cas il y a bien illusion, car nous voyons au minimum des différences de profondeur là où il n'y en a pas. Nous ne prétendons pas ici à l'exhaustivité : on peut sans doute distinguer d'autres degrés d'illusion, corrélés à la présence ou à l'absence d'autre indices de profondeur, comme la parallaxe de mouvement. Nous avons uniquement voulu montrer que nous pouvions maintenir une définition forte de l'illusion perceptive tout en distinguant certains degrés en elle. L'illusion causée par les peintures respectant les règles de la perspective est certainement plus forte que celle causée par les images qui n'en font pas usage, mais les unes comme les autres causent des expériences illusoires dans le sens fort du terme : nous expérimentons de la profondeur là où il n'y en a pas. Une dernière remarque s'impose. Au regard de ce qui vient d'être dit, nous soutenons seulement que le décalage entre des plans, c'est-à-dire l'impression minimale de profondeur, est une condition nécessaire pour que x soit une image. Nous ne disons pas qu'il s'agit là d'une condition suffisante. Notre objectif était ici de répondre à l'objection que rencontre potentiellement la théorie de l'illusion : celle de ne valoir que pour une classe très restreinte d'images. Mais il demeure que tout ce qui cause une illusion de profondeur n'est pas une 27 image : il faut restreindre cette classe. Nous ne chercherons pas à le faire ici, mais mentionnons pour finir deux critères qui permettraient de le faire. Le premier serait qu'une image doit être un artefact produit dans le but de causer une illusion. Le second qu'une image doit permettre non seulement une illusion, mais aussi une reconnaissance, même erronée, de son depictum. Le premier critère fait écho à l'intuition selon laquelle les phénomènes naturels comme les formes que prennent les nuages ou les lignes qui apparaissent sur les plaques de paesine ne sont pas des images de plein droit, pas plus que les traces que nous laissons fortuitement en marchant dans le sable, qui pourraient donner à un parachutiste l'impression de voir une forme de cheval. Le second critère soutient pour sa part l'intuition qu'il doit être possible non seulement de voir quelque chose dans une image, mais aussi d'y reconnaître quelque chose. Une forme purement abstraite qui se découperait d'un fond blanc ne serait pas suffisante pour faire de l'objet en question une image. Nous tendons à préférer le second critère , ce qui nous conduit à proposer, à titre d'hypothèse, la définition suivante : x est une image si et seulement si (i) x cause des illusions spécifiques chez les sujets qui le regardent (ii) x est un artefact produit dans ce but. 3. Testabilité de l'hypothèse Argument 2 : les illusions de profondeur incorrigibles Le premier argument consiste à remarquer que certaines illusions incorrigibles de profondeur sont causées par la perception des images. Ainsi en va-t-il dans cet exemple donné par I. Rock : Photo converture ROck (reproduite dans le livre). Le point important, en faveur de la théorie de l'illusion, est que l'apparente différence de taille entre les deux lignes est incorrigible : si nous pouvions voir la surface plane, cette différence apparente devrait disparaître. Or nous n'arrivons pas à voir les deux lignes de la même taille. Cependant, cet argument n'est concluant qu'à condition d'admettre que l'apparente différence de taille des deux lignes est une illusion due au traitement de la profondeur. Or l'illusion en question, l'illusion de Ponzo, semble persister dans des cas où l'impression de profondeur n'est plus présente (voir Rock 2001 : 164sqq). Cela suggère au moins un moyen de tester notre hypothèse. S'il existe une illusion clairement due à un traitement de la profondeur, alors soit cette illusion persiste toujours sur une image, auquel cas la théorie de l'illusion est validée, soit elle peut être corrigée en regardant l'image, auquel cas elle est falsifiée. En résumé, si l'on ne voyait pas de profondeur dans les images, on ne pourrait pas les utiliser pour présenter des illusions dûes à la profondeur. (ii) Peindre des photos Objection 8 : si on voyait véritablement le depictum à travers l'image, alors il devrait être aussi difficile de peindre un photographie d'un paysage que de peindre le paysage (sous l'hypothèse que le depictum correspond ici au modèle). Or ce n'est pas le cas. Réponse : ce n'est pas le cas parce que (i) l'image permet une saisie unitaire plus large que l'oeil : la zone de netteté et la profondeur de champ sont en général bien plus grande dans une image que lors de la perception d'une scène d'un point de vue fixe. (ii) en peignant une image, la parallaxe de mouvement et binoculaire est neutralisée, ce qui facilite grandement le travail du peintre. 28 Nous ne pensons pas autant que, ces deux facteurs étant neutralisés, les propriétés perspectivales des objets soient plus évidentes sur une image. Conclusion : Remarque : on a l'impression qu'il faudrait nécessairement choisir en les deux termes de l'alternative suivante : soit nous voyons les bords de la route qui part vers l'horizon converger, et alors nous voyons un triangle plat face à nous, soit nous voyons les deux lignes parallèle et nous voyons la profondeur. Nous refusons l'alternative : nous voyons les lignes se couper à l'horizon et la profondeur. Il y a un raisonnement fallacieux la dessous qui repose sur l'idée (sans doute) que nous devons voir les images planes, or que celle-ci représente les lignes sécantes. Les cartes ne sont pas des images : il y a ressemblance mais pas depiction. Ajouter le miroir dans la diversité des images (en plusd es hologrammes et stéréogrammes). Conclusion : reste à expliquer la transparence phénoménale des images. Une hypothèse est proposée par Heider : les images sont des fixations du milieu. Or les milieux sont transparents. Bibliographie BLACK, Max, « How do Pictures Represent ? », Art, Perception and Reality, Baltimore, The Johns Hopkins University Press, 1994 (1972). BRENTANO, Franz, Psychology from an empirical standpoint, London, Routledge, 1995. BLINDER, David, « In Defense of Pictorial Mimesis », The Journal of Aesthetics and Art Criticism, 1986. BUSEY Thomas A., BRADY Nuala P., CUTTING James E., « Compensation is Unnecessary for the Perception of Faces in Slanted Pictures », Perception and Psychophysics 48 (1), 1990. CASATI, Roberto, La découverte de l'ombre, traduction P.-E. Dauzat, Paris, Albin Michel, 2002 (2000). CLARK, Austen, A Theory of Sentience, Oxford University Press, 2000. CUTTING James E., « Rigity in Cinema Seen From the Front Row, Side Aisle » Journal of Experimental Psychology : Human Perception and Performance, 1987, n°3, 323-334. 29 -« Affine Distortions of Pictorial Space : Some Predictions for Golstein (1987) That La Gournerie (1859) Might Have Made », Journal of Experimental Psychology : Human Perception and Performance vol. 14, no 2, 1988. CUTTING James E. et MASSIRONI, Manfredo, « Pictures and Their Special Status in Perceptual and Cognitive Inquiry », Perception and Cognition at Century's End, San Diego, Academic Press, 1998. GIBSON, James J., The Ecological Approach to Visual Perception, Hillsdale, Lawrence Erlbaum Associates, 1986. GILMAN, Daniel, « A New Perspective On Pictorial Representation », in Australian Journal of Philosophy, Vol. 70, 1992. -« Pictures in cognition », Erkenntnis, vol. 41, 1994, p. 87-102. GOMBRICH, E. H., L'art et l'illusion, psychologie de la représentation picturale, traduction G. Durand, Paris, Phaïdon, 2002 (1960). GOODMAN, Nelson : Langages de l'art, traduction J. Morizot, Nîmes, Jacqueline Chambon, 1990 (1968). GREGORY, Richard L., Eye and Brain, Oxford, Oxford University Press, 1998. HOCHBERG, Julian, « The Representation of Things and People », Art, Perception and Reality, Baltimore, The Johns Hopkins University Press, 1994 (1972). HEIDER, Fritz, « On Perception and Event Structure and The Psychological Environment », Psychological Issues vol.1 no 3, New-York, International Universities Press, 1959. HOPKINS, Robert, « Explaining Depiction », The Philosophical Review vol. 104, 1995. KÖHLER, Wolfgang, Psychologie de la forme, Gallimard, 2000. KUBOVY, Michael, The Psychology of Perspective and Renaissance Art, New York, Cambridge University Press, 1986. LOPES, Dominic : Understanding Pictures, Oxford, Clarendon Press, 1996. MONNOYER, Jean-Maurice, Walter Benjamin, Carl Einstein et les arts primitifs, Pau, Publications de l'Université de Pau, 1999. PEACOCKE, Christopher, « Depiction », The Philosophical Review, XCVI, N°3, 1987. PELLETIER, Jérôme, « Voir un fictum dans une image », De la perception à l'action, Paris, Vrin, 2000. PIRENNE, M. H., Optics, Painting and Photography, Cambridge, Cambridge University Press, 1970. 30 ROCK, Irvin, La perception, traduction Daniel Mestre, Paris, De Boeck Université, 2001 (1984). SCHIER, Flint, Deeper into Pictures, Cambridge, Cambridge University Press, 1986. TÜSCHER, Anne, « The Seeing-in Theory of Depiction and the Psychophysics of Pictures Perception », http//jean Nicod.ccsd.cnrs.fr. WALTON, Kendall L., « Transparent Pictures : On the Nature of Photographic Realism », Critical Inquiry, n°11, The University of Chicago, 1984. WOLLHEIM, Richard, « Seeing-as, Seeing-in, and Pictorial Representation », in Art and Its Objects, Cambrige University Press 1980, p. 205-226. YANG, Tyrone , KUBOVY, Michael, « Weakening the Robustness of Perspective : Evidence for a Modified Theory of Compensation in Picture Perception », Perception and Psychophysics, 1999.