La symétrie de jauge comme sonde philosophique Alexandre Guay In Soazig Le Bihan (éd.), Précis de philosophie de la physique, Vuibert, 2013, p. 295-308 Introduction On constate, depuis un peu plus d'une décennie, un nouvel intérêt en philosophie pour l'étude des théories modélisant les interactions fondamentales. Je pense ici à des théories comme la relativité générale ou l'électrodynamique quantique. Il est possible que cette résurgence soit le produit d'une certaine lassitude du débat philosophique à propos des questions classiques de la philosophie de la physique comme, par exemple, celle de l'interprétation de la mécanique quantique. Bien que l'on ait enregistré un progrès certain sur ces questions au cours des dernières années, elles ont montré au fil du temps une remarquable résistance à toute tentative d'élucidation. En se concentrant sur des théories particulières, on espère renouveler la discipline à partir de sa base. Lorsque l'on tourne son attention vers ces théories fondamentales, on remarque que, dans leur présentation usuelle, elles exhibent toutes une structure de jauge. Elles partagent toutes une certaine structure mathématique que je décrirai dans la section suivante.1 Dans ce court essai, je vais montrer que l'analyse de cette structure peut nous servir de porte d'entrée vers une multitude de questions philosophiques qui concernent tout aussi bien l'objectivité, la causalité ou les aspects pragmatiques de la construction théorique. Mon objectif ne sera pas de donner un panorama exhaustif ou même de présenter des exemples détaillés mais bien de montrer comment on peut utiliser cette structure de jauge comme matériel pour la réflexion philosophique. Cet essai comportera quatre parties. Dans un premier temps, j'expliquerai ce que sont la symétrie de jauge et la structure de jauge. Dans un second temps, je discuterai des arguments qui nous font considérer la symétrie de jauge comme étant formelle. Elle ne relierait que des descriptions équivalentes d'un même état physique. Cette discussion me permettra d'aborder les questions de représentation et d'objectivité dans le discours théorique. La troisième partie sera consacrée à la notion d'interaction. À la lumière de ce que nous aurons vu dans la section précédente, je montrerai certaines conséquences surprenantes de cette notion. En effet, clarifier le concept d'interaction est une étape essentielle de tout projet visant à naturaliser la notion de causalité. Finalement, dans la 1 Le lecteur qui après la lecture de cet essai désirerait en savoir davantage sur la symétrie de jauge est invité à consulter Martin (2003) et pour une approche plus historique, O'Raifeartaigh (1997). 1 quatrième section, j'aborderai le rôle de la symétrie de jauge dans la procédure nous permettant d'obtenir une théorique quantique à partir d'une théorie des champs classique. Ceci me permettra de tirer quelques leçons quant à la pragmatique de la construction théorique. Qu'est-ce que les symétries de jauge? Une théorie de jauge exhibe ce que l'on appelle la liberté de jauge. Cette dernière consiste en une ambiguïté de la représentation mathématique des états physiques. En d'autres mots, plusieurs descriptions correspondent apparemment à la même situation physique. À première vue, rien d'étonnant à cela, à une même température peuvent correspondre plusieurs descriptions, par exemple, l'une utilisant l'échelle Celsius, l'autre l'échelle Fahrenheit. Ce qui fait la spécificité de la liberté de jauge est que cette dernière persiste même lorsqu'un cadre de représentation est choisi. Pour reprendre notre exemple, une fois l'échelle Celsius choisie, la symétrie impliquerait que plusieurs nombres distincts correspondent à la même température physique. L'un des exemples les plus simples d'une telle théorie est l'électromagnétisme classique lorsque l'on choisit de représenter le champ électromagnétique à l'aide du potentiel de jauge. Dans un tel cadre, une situation physique peut être décrite en spécifiant la position et le mouvement des charges et en spécifiant la valeur du potentiel de jauge A x  , un quadri-vecteur où μ réfère aux composants du vecteur et où x est un point de M la variété2 représentant l'espace-temps. Cette description est ambigüe car on aurait tout aussi bien pu décrire la même situation physique à l'aide du potentiel suivant A x ∂  x  , où α(x) est une fonction scalaire quelconque définie sur la variété M. En effet, il est généralement considéré que toutes les descriptions référant au même tenseur électromagnétique F   x =∂ A−∂ A sont physiquement équivalentes.3 La transformation permettant de passer d'une description à une autre équivalente est appelée transformation de jauge. Notez que dans ce contexte, comme dans tous les cas de liberté de jauge, le groupe de transformations associé est un groupe de Lie de dimension infinie dont les membres peuvent être caractérisés à l'aide d'un nombre fini de fonctions arbitraires sur toutes les variables indépendantes. C'est ce que l'on appelle dans la littérature un groupe de symétrie local. Par contraste, les transformations formant un groupe de symétrie global peuvent être caractérisées par un nombre fini de paramètres. Voyons quelques exemples pour clarifier ces définitions. Les transformations du groupe des translations dans l'espace 2 Une variété est un espace topologique qui est localement euclidien. M est une variété à quatre dimensions qui représente l'espace-temps. En conséquence, x réfère donc à une position spatio-temporelle dans un certain cadre de référence. 3 A x  et A x ∂  x décrivent le même tenseur F   x car ∂ ∂−∂∂x=0 . 2 peuvent être caractérisées dans un certain système de coordonnées par trois paramètres, soit les trois composantes des vecteurs de translation. Si ces transformations constituaient une symétrie, on aurait affaire à un groupe de symétrie global. De manière contrastée, si le système étudié demeurait inchangé sous des translations qui varient continument et de manière différentiable d'une région à l'autre de l'espace, nous ferions face ici à un groupe de symétrie locale, car les transformations du groupe de symétrie seraient caractérisées par trois fonctions, chacune donnant l'un des composants du vecteur de translation pour chaque point de l'espace. De façon plus formelle, si Φ est l'espace de toutes les histoires possibles des champs (ou autres entités de la théorie) sur l'espace-temps4, l'invariance de jauge implique l'existence, sur Φ, d'un ensemble de flux reliant les descriptions équivalentes. Ces flux peuvent être représentés par un ensemble de champs vectoriels sur Φ ne s'annulant nulle part. L'espace Φ est donc décomposable en sous-espaces, appelés orbites de jauge, pour lesquels les flux sont tangents. En conséquence, Φ peut-être appréhendé comme un fibré principal dont les fibres sont les orbites et la base les variables indexant les orbites. Chaque théorie de jauge possède sa propre structure de jauge et ainsi divise son espace associé d'histoires Φ de manière spécifique.5 À cette étape, on note à nouveau que l'ambiguité de description, qui est le produit de la symétrie de jauge, structure de manière spécifique l'espace des descriptions possibles prévues par la théorie et que cette ambiguité est indépendante du choix d'un système de coordonnées. Ce dernier point m'incite à affirmer que les théories de jauge exhibent un surplus descriptif, c'est-à-dire qu'elles contiennent, de manière implicite, des variables non physiques. Comme nous le verrons dans les sections qui suivent, l'identification de ces variables et la production d'une formulation de la théorie qui soit indépendante de jauge n'est généralement pas une tâche aisée. Unification ontologique Dans la section précédente, j'ai suggéré qu'une transformation de jauge pouvait être interprétée de manière passive, c'est-à-dire comme un changement de représentation, une recoordination, de la même situation physique. Cette affirmation a pu paraître suspecte au lecteur car, généralement, on considère que les transformations associées aux symétries internes (celles qui n'impliquent pas un changement de variables spatio-temporelles) n'admettent qu'une interprétation active, c'est-à-dire 4 Cet espace comprend les histoires qui satisfont et qui ne satisfont pas les équations du mouvement. 5 Pour plus de détails sur la structure de Φ, voir Dewitt (2003, chapitres 2 & 24) et Belot (2003). 3 qu'elles associent des états équivalents, selon un certain aspect, mais tout de même ontologiquement distincts.6 Voyons un exemple. Les lois de l'électrodynamique sont invariantes sous la conjugaison des charges. En d'autres mots, il n'y a aucune conséquence observable si toutes les charges positives se transforment en charges négatives et inversement. Cette transformation définit donc une symétrie des lois. Nous sommes tout de même peu enclins à associer une interprétation passive à cette symétrie car des conséquences fâcheuses en découlent. Par exemple, cela impliquerait que les électrons et les positrons sont une seule et même particule. Dans le contexte de l'électrodynamique classique, cette conclusion est indéfendable. Le même type d'argument s'applique à toutes les autres symétries internes, c'est-à-dire celles qui n'impliquent pas un changement de variables spatiotemporelles. Dans ce contexte, quelles raisons avons-nous de soutenir une interprétation passive des symétries de jauge? J'en vois deux principales: 1) les transformations de jauge ne semblent pas directement observables, ce qui prive l'interprétation active d'une motivation importante (Brading & Brown, 2004). 2) Les symétries de jauge, du fait qu'elles sont locales, impliquent une indétermination qui suggère l'unification ontologique de manière à éviter l'indéterminisme de la théorie. En effet, pour les théories qui peuvent être représentées à l'aide d'un Lagrangien, le second théorème de Noether affirme que la présence d'une symétrie locale implique qu'une suite d'identités tient entre les équations du mouvement dérivées de l'action (les identités de Bianchi généralisées). De ces identités, on peut tirer la conclusion que la théorie exhibe toujours une indétermination apparente, c'est-à-dire qu'il y a toujours davantage d'inconnues que d'équations du mouvement indépendantes.7 Une telle indétermination qui, je le rappelle, n'a aucune conséquence empirique directe, laisse à penser que la théorie possède un surplus de variables descriptives. Cependant, nous n'avons pas ici affaire à un argument final car la mise en évidence de conséquences empiriques indirectes pourraient nous amener à reconsidérer la question. Cette forme d'argument est exactement ce qui est à l'oeuvre dans le fameux argument du trou en relativité générale (Earman & Norton, 1987). Les lois de la relativité générale sont invariantes sous les difféomorphismes de M, la variété qui représente l'espace-temps (un groupe de transformations locales). La théorie exhibe une symétrie de jauge. En conséquence, pour éviter l'indéterminisme, deux trajectoires dans M, qui ne diffèrent que d'un difféomorphisme (qui sont dans la même orbite de jauge), se doivent d'être identifiées. Il en résulte qu'un substantialisme des points de l'espace6 Cette thèse est si commune que M. Redhead (1988, p. 16) ne prend pas la peine de la justifier. 7 Pour plus de détails sur les théorèmes de Noether, voir Kosmann-Schwarzbach (2004). 4 temps semble insoutenable car les points n'ont pas d'identité indépendante de jauge. Une fois convaincu de l'existence d'un surplus descriptif, il est tentant de reformuler la théorie de manière à éliminer ce surplus et ainsi obtenir une formulation indépendante de jauge. Une telle formulation de la théorie, en étant plus parcimonieuse dans ses moyens de représentation, serait plus conforme à l'objet physique. Elle serait en quelque sorte plus objective. Pour illustrer cette démarche, reprenons le cas de l'électromagnétisme classique. Dans ce contexte, il existe au moins deux façons de reformuler le champ d'interaction de manière indépendante de jauge: 1) à l'aide du tenseur de force local F   x ou encore grâce aux facteurs non-locaux ∮ A xdx qui correspondent à l'intégration du potentiel de jauge sur des courbes fermées de l'espace-temps. On préfère généralement la première formulation pour deux raisons: 1) les applications expérimentales sont plus faciles à expliquer à l'aide d'un porteur local de force. 2) Si l'énergie est conservée localement, le tenseur local semble plus approprié comme porteur énergétique. Ce dernier point tient au fait que l'on considère le principe de conservation locale de l'énergie (et implicitement une certaine conception locale de l'interaction) comme étant plus fondamental que tout engagement ontologique envers des entités particulières. En effet, si le choix entre les formulations 1 et 2 semble somme toute négociable, l'abandon du principe local de conservation de l'énergie ne l'est pas. Ceci est un point qui mérite d'être élaboré. L'histoire de la physique nous a donné maints exemples où la description d'une même entité, par exemple l'électron, a radicalement changé. De façon synchronique, on a souvent de multiples descriptions d'une même entité qui ne semblent pas nécessairement impliquer les mêmes propriétés (par exemple les deux formulations ci-dessus du champ électromagnétique). Ces deux observations tendent à relativiser tout engagement ontologique que l'on pourrait avoir en physique envers des entités particulières. Il n'en est pas de même pour les principes de conservation (conservation de l'énergie, conservation de la charge, etc.). Ces derniers demeurent remarquablement inchangés une fois qu'ils ont été formulés. Cette robustesse est telle, que l'on dérive souvent un critère d'existence à partir d'eux. Par exemple, existe physiquement ce qui est porteur d'énergie. Comment identifier ces porteurs? Ce sont les entités qui garantissent la validité des principes de conservation. Dans ce contexte, une entité définie localement comme le tenseur de force semble d'avantage appropriée pour rendre compte de la conservation locale de l'énergie durant les interactions électromagnétiques. Pour plusieurs théories de jauge, ce principe de localité nous permet de choisir parmi les formulations invariantes de jauge. Néanmoins, pour d'autres théories, comme la relativité générale 5 ou les les théories de Yang-Mills (les théories qui sont à la base de la modélisation de l'interaction nucléaire forte et faible) aucune réduction locale ne semble plausible. En d'autres mots, les descriptions associées à l'identification de chaque orbite de jauge dépendent de variables qui correspondent à plus d'un point de la variété M. Aucune formulation de la théorie qui soit à la fois indépendante de jauge et qui n'impliquerait que des entités attribuant des propriétés aux seuls points individuels de l'espace-temps ne semble possible. Si un champ est défini comme une variable dynamique (scalaire, vectorielle, etc.) pour un système continu dont les points sont indexés par les points de l'espace-temps, alors nous n'avons pas affaire à des théories de champs à proprement parlé. Dans ce contexte, comment choisir? Une réflexion plus fine sur la notion d'interaction est nécessaire. Nous poursuivrons ce point dans la section suivante. Cette courte discussion montre bien que derrière la symétrie de jauge, les variables indépendantes de jauge posent des problèmes ontologiques importants. Les théories de Yang-Mills classiques sont-elles essentiellement nonlocales? Dans le contexte de la relativité générale, l'espace, le temps ou même le concept plus général d'évolution sont-ils invariants de jauge?8 Résumons-nous. Les théories de jauge exhibent un indéterminisme bien particulier, car il n'affecte apparemment pas l'évolution des quantités directement observables, c'est-à-dire invariantes de jauge. Cet indéterminisme apparaît au niveau classique sans que l'on ait affaire à un effet quantique. On interprète cet indéterminisme comme l'indice qu'il y a un surplus descriptif dans la théorie, surplus qui pourrait être potentiellement éliminé. À première vue, cette unification ontologique semble trivialiser la notion d'indéterminisme. Cependant, le recours au second théorème de Noether nous permet de bien caractériser ce domaine par rapport à la classe générale des théories indéterministes. Seul l'indéterminisme engendré par une symétrie locale des lois (Lagrangien) est a priori l'indice d'un surplus descriptif. On peut donc constater dans cette courte discussion l'amorce d'une réflexion sur l'objectivité dans le cadre d'une description physique. La part objective d'une théorie est non seulement ce qui est indépendant du cadre de référence (ou du système de coordonnées) mais aussi ce qui est invariant de jauge au sens donné ci-haut.9 Ce point est important. Souvent le philosophe réaliste rencontre des difficultés lorsqu'il s'agit de préciser ce sur quoi nous devrions être réalistes dans la théorie. Tout élément du discours théorique ne peut référer à des entités en soi.10 Il faut bien circonscrire la part potentiellement objective du discours. La discussion qui précède montre de manière concrète que ce que l'on entend par conventionnel va bien au-delà du système de coordonnées et implique quelque chose de bien plus complexe et difficile à saisir, le 8 Cette dernière question réfère à ce que l'on appelle le problème du temps en relativité générale (Earman, 2002). 9 Pour une réflexion dans la même veine, voir Earman (2004). 10 Je mets ici de côté la défense que Quine fait de cette question, car ce débat nous entraînerait ailleurs. 6 choix de jauge. Ce cas particulier pourrait enrichir la réflexion philosophique sur la notion d'objectivité en général. La notion d'interaction Nous avons vu dans la section précédente qu'en électromagnétisme classique le recours à un principe local de conservation de l'énergie semble dissiper adéquatement l'ambiguïté entre descriptions indépendantes de jauge. Cette solution n'est cependant pas universelle. Plutôt que d'aborder la question en général, je vais discuter d'un cas particulier: la théorie de Yang-Mills abélienne. Cette théorie de champs classique est celle qui est la base classique de l'électrodynamique quantique. Elle occupe donc une place importante dans la physique théorique actuelle. La densité lagrangienne11 de cette théorie peut être divisée en trois parties: LEDQ=LD  x  , mLM F  x−L I e ,x , A  x 1 La première partie correspond au Lagrangien d'une théorie de champs de Dirac libre, où ψ est un champ de fermions de masse m. C'est ce champ qui représente la matière chargée, comme par exemple les électrons. La seconde partie représente un champ de photons libres et peut s'écrire en fonction du seul tenseur F  . C'est cette partie qui modélise la propagation libre du champ électromagnétique. Enfin, la dernière partie représente l'interaction entre la matière chargée et le champ électromagnétique. Elle prend la forme d'un couplage minimal qui fait intervenir ψ, le potentiel de jauge A et la charge des fermions e. À première vue, nous avons ici un cas analogue à celui de l'électromagnétisme classique, où un potentiel de jauge agit apparemment localement sur, non pas directement des charges, mais un champ de Dirac. Nous n'aurions donc qu'à affirmer que c'est F  qui agit sur ψ et que A n'apparaît dans le terme d'interaction que pour une raison pragmatique ayant à voir avec les contraintes du formalisme lagrangien. Soutenir cette solution est une erreur car ici la symétrie de jauge ne concerne pas que la représentation du champ électromagnétique mais aussi celle du champ de Dirac. En effet, la densité lagrangienne (1) est invariante sous la transformation combinée suivante:   xei x  x , A A− 1 e ∂ x 2 où α est une fonction quelconque sur M.12 L'ambiguïté de représentation ne porte donc plus 11 Si on intègre cette densité sur les trois dimensions de l'espace, on obtient la fonction du temps qu'est le Lagrangien. Dans la cadre du calcul des variations, cette fonction encode l'ensemble des équations du mouvement de la théorie et , par conséquent, toute l'information dynamique de la théorie. 12 Pour simplifier, j'appelle ce groupe associé de transformations groupe de jauge et non pas groupe de jauge propre comme je devrais le faire pour tenir compte de la possibilité que d'autres transformations laissant le Lagrangien invariant, et qui ne proviennent pas de symétries globales, existent. 7 strictement sur le champ d'interaction mais bien sur le couple matière/champ électromagnétique. Comment comprendre l'interaction dans ce contexte? Plusieurs approches intéressantes ont été proposées. Puisque l'on peut réécrire le Lagrangien de manière à ce que le potentiel de jauge ait le rôle d'une connexion dans une dérivée covariante, il semble potentiellement fructueux d'envisager que l'interaction électromagnétique a une interprétation géométrique. Une telle approche s'est d'ailleurs révélée des plus fructueuses pour comprendre l'interaction gravitationnelle dans le contexte de la relativité générale. Dans un fibré principal où M est la base et où les fibres associées à chaque point sont isomorphes au groupe de jauge global, A représente bien la connexion permettant de passer d'une fibre à l'autre. On peut même interpréter la transformation de jauge passivement comme une recoordination des fibres, ce qui entraîne la transformation (2) de ψ et de A . Dans ce contexte, une transformation de jauge correspondrait à un changement du système de coordonnées de la fibre en chaque point de M. Malheureusement, cette structure géométrique n'est pas exempte d'un surplus descriptif. Un automorphisme vertical des fibres peut être compris comme une version active de la transformation de jauge (Choquet-Bruhat et al., 1982). Cette transformation correspond aussi à (2). Cette solution n'est donc pas complètement satisfaisante. Une autre possibilité, qui est défendue par Richard Healey (2007), est d'interpréter cette théorie en termes d'holonomies, c'est-à-dire en termes des quantités suivantes: H C =e −i∮ C A dx  3 où C est une courbe fermée dans M. En conséquence, à chaque courbe dans M, la variété qui représente l'espace-temps, on associe une phase qui ne dépend que du résultat de l'intégration du potentiel de jauge sur cette même courbe. L'usage du terme géométrique d'holonomie est ici justifié car le potentiel de jauge joue le rôle d'une connexion géométrique. Notez que les H sont invariants de jauge car ∮C ∂ xdx =0 .13 On peut démontrer qu'en passant aux H, on ne perd pas d'information indépendante de jauge que le potentiel possèderait. Quant au champ de Dirac, Healey lui-même se doit d'avouer que nous n'avons pas de représentation satisfaisante pour le moment. On ne sait pas encore comment l'intégrer naturellement aux holonomies. Ce n'est peut-être qu'une question de temps et d'ingéniosité. 13 Du moins dans la théorie de Yang-Mills abélienne, dans le cas non abélien, l'expression invariante demande que l'on prenne la trace de l'holonomie, voir Peskin & Schroeder (1995, chapitre 15). 8 Mais pourquoi choisir cette représentation non locale plutôt qu'une autre? Contrairement au cas de l'électromagnétisme classique, nous n'avons pas, pour cette théorie, d'application classique pour orienter notre choix ontologique. La densité lagrangienne (1) n'a, à ma connaissance, été utilisé que dans le cadre de l'électrodynamique quantique. Il y a cependant un modèle sur lequel nous pouvons réfléchir: l'effet Aharonov-Bohm (Aharonov & Bohm, 1959). Cet effet quantique (en fait semiclassique car le champ électromagnétique n'y est pas quantifié) exhibe la même symétrie que la théorie précédente si on interprète ψ comme la fonction d'onde d'un boson chargé (ou à tout le moins d'un fermion chargé, comme un électron, dont on néglige le spin), qui interagit avec un potentiel A classique. L'effet Aharonov-Bohm est un effet purement quantique dans la mesure où il n'implique qu'un changement de phase et donc aucun transfert d'énergie entre le champ électromagnétique et les particules chargées. Il consiste en une variante de l'expérience des deux fentes en mécanique quantique non relativiste. Un flux magnétique B est placé entre les fentes, perpendiculairement au plan où se déplacent les particules chargées. En pratique, ce flux est isolé de façon à ce que les particules ne puissent pénétrer dans la zone où F ≠0 . Malgré cela, on constate que la présence du flux modifie la phase des particules frappant un écran au-delà des fentes. Cette différence de phase se mesure en constatant la translation de la figure de diffraction que forment les impacts des électrons sur un écran entre les cas avec ou sans champ magnétique confiné. Voir Figure 1.14 14 Pour une synthèse des recherches à propos de ce type de phénomènes, voir Olariu & Popescu (1985). 9 Si on désirait se servir de cet effet comme base de réflexion sur ce qu'est l'interaction en physique quantique, il nous faudrait au préalable résoudre de nombreux problèmes philosophiques sur la nature des entités quantiques. Ce n'est pas ce que nous ferons ici. L'effet Aharonov-Bohm nous sert de cas pour réfléchir sur l'interaction classique dans le cadre de la théorie de Yang-Mills abélienne décrite plus haut. Cette approche, qui utilise l'effet Aharonov-Bohm pour interpréter la théorie classique, se retrouve aussi chez des auteurs comme Healey ou Belot (1998). Si on analyse la structure de l'interaction électromagnétique dans le contexte semi-classique, on constate qu'elle se caractérise à l'aide de facteurs de phases non intégrables, qui correspondent aux H (éq. 3) calculés pour des courbes quelconques (Wu & Yang, 1975). Dans le cas de courbes ouvertes dans M, le facteur de phase n'est pas invariant de jauge car en général ∫C ∂ x dx ≠0 pour une courbe C qui ne forme pas une boucle. De manière étonnante, dans le cas spécifique de l'effet AharonovBohm, seuls les facteurs de phases associés à des courbes fermées contribuent à l'effet. Seules contribuent à l'effet les différences de phase entre trajectoires se terminant au même point sur l'écran et qui englobent le flux magnétique.Par exemple, dans le cas illustré par la Figure 2, cette différence de phase reviendrait à calculer H(q1-q2), soit une holonomie. La notion d'holonomie semble donc jouer un rôle clef ici. Pour construire un argument plus général en faveur des holonomies qui dépasserait le seul cas de l'effet Aharonov-Bohm, il nous faut, par exemple, nous placer dans le contexte de la quantification par intégrale de chemins ou fonctionnelle de Feynman. Dans ce cadre, le phénomène quantique est le produit de l'addition des phases associées aux trajectoires (ou histoires) possibles des particules. 10 La différence de phase entre les contributions de deux trajectoires, qui est strictement le produit de l'interaction électromagnétique, est exactement proportionnelle à H(C) (3), où C est la trajectoire fermée formée par la combinaison de ces deux mêmes trajectoires. Si on calcule H(C), on constate que sa valeur ne dépend que du flux électromagnétique franchissant la surface dont C est la frontière (Guay, 2004, chapitre 5). En d'autres mots, l'interaction électromagnétique ne modifie la phase associée à chaque trajectoire q dans l'espace-temps que par un facteur de phase H(q). Étant donné que le phénomène quantique dépend de la somme des contribution de chaque trajectoire, il en résulte que ce sont les différences de phase qui comptent physiquement. Ces différences dues à l'interaction électromagnétique correspondent aux H(C) pour des courbes C fermées dans M. On peut donc conclure que la notion d'holonomie est constitutive de l'interaction électromagnétique dans le contexte semi-classique. Nous n'avons cependant pas de raison de croire que cette notion épuise ce même concept d'interaction. En s'appuyant sur l'effet Aharonov-Bohm, on obtient une conception nuancée de l'interaction dans la théorie de Yang-Mills abélienne. Lorsque l'interaction n'implique pas de transfert d'énergie (comme dans le cas de l'effet Aharonov-Bohm), on peut soit l'interpréter comme le produit de nouvelles propriétés non locales représentées par les H(C), soit comme l'action à distance de F  (ou directement des charges qui l'ont engendré). Puisque ce type d'interaction n'implique pas un échange énergétique, je ne vois pas de raison de choisir la première plutôt que la seconde solution. L'appel à un principe de localité semble ici arbitraire. On a donc le choix entre une nonlocalité par action à distance ou une non localité par non séparabilité, c'est-à-dire que les propriétés physiques dépendent de ce qui passe à plusieurs points de l'espace-temps. Si l'interaction implique un échange énergétique entre le champ électromagnétique classique et les particules quantiques, alors, dans la mesure du possible, un principe de conservation locale de l'énergie doit nous guider. Olariu et Popescu (1985) soutiennent, calcul à l'appui, que pour qu'il y ait transfert énergétique de nature électromagnétique dans le contexte semi-classique, il faut que le changement de phase à la contribution d'une trajectoire soit le produit d'un potentiel ayant une courbure non nulle, en d'autres mots il faut qu'il y ait des trajectoires passant par une zone où F ≠0 . On peut donc considérer que F est le porteur de l'énergie et donc de l'interaction dans ce contexte. En conclusion, il semble donc que pour certaines théories de jauge classiques, l'interaction exhibe une certaine dualité entre une interaction locale, médiatisée par l'action locale de F, et une interaction non locale, qui serait le produit d'une action à distance ou de l'action de propriétés non séparables, le tout dépendant de si, oui ou non, l'interaction implique la transmission d'énergie. 11 Plusieurs des théories de jauge qui ont eu le plus de succès en physique sont des théories des champs (relativité générale, théorie de Yang-Mills, etc.). Elles définissent donc leur ontologie en termes de champs, c'est-à-dire comme des variables dynamiques (scalaire, vecteur...) pour un système continu indexé par les points de l'espace-temps. Ces champs sont des unités indécomposables en elles-mêmes. Ils constituent donc le paradigme de ce que l'on appelle la survenance huméenne au sens que David Lewis donne à ce terme, c'est-à-dire la thèse qui soutient que le monde est une mosaïque de faits locaux (Lewis, 1986, p. ix). Dans le cadre de la philosophie de la physique, cette thèse métaphysique s'interprète comme affirmant que seuls les points de l'espace-temps sont susceptibles d'être porteur de propriétés physiques. En conséquence, toutes les propriétés physiques véritables doivent pouvoir se décrire à l'aide de champs. Ce que l'étude des théories de jauge nous apprend c'est que cette thèse, chère aux philosophes, est violée non pas seulement en physique quantique mais aussi en physique classique. Je n'hésite pas à nommer ceci une réfutation empirique, au moins temporaire, d'une thèse métaphysique. De plus, si on veut asseoir une théorie de la causalité sur l'interaction physique, dans l'esprit de Salmon (1998), on devra tenir compte de cet apparent caractère dual de l'interaction. En effet, l'une des façons de naturaliser le difficile concept de causalité est de le réduire à celui d'interaction physique fondamentale, une concept présumément moins obscur. Salmon a proposé qu'il y a rapport causal lorsqu'il y a transmission d'une quantité conservée et en particulier transmission d'énergie. Notre analyse laisse entendre que la conception de Salmon est au mieux incomplète. Si les philosophes s'étaient concentrés sur le seul cadre théorique général de la physique, par exemple en étudiant la relativité restreinte, ils n'auraient pas constaté combien la structure des théories modélisant les interactions fondamentales remet en cause certaines de nos hypothèses métaphysiques les plus communes. L'étude du particulier peut ébranler le général. La quantification Dans cette dernière section, je vais mettre de côté les questions ontologiques pour m'attarder à un aspect pragmatique concernant certaines théories de jauge. Si le surplus descriptif d'une théorie de jauge est ontologiquement superflu, il pourrait être une nécessité pragmatique, dans la mesure où il nous permet d'obtenir une théorie quantique là où nos outils mathématiques nous font défaut. Pour illustrer cela, je vais discuter de la quantification d'une famille de théories de jauge: les théories de Yang-Mills non abéliennes. Des variantes de ces théories sont au coeur de la théorie électrofaible et 12 de la chromodynamique quantique. La théorie électrofaible modélise l'interaction nucléaire faible et l'électromagnétisme quantique. Quant à la chromodynamique quantique, elle représente l'interaction nucléaire forte, la force qui maintient les quarks ensembles.15 Il existe deux familles de méthodes pour quantifier une théorie classique: 1) les méthodes canoniques et 2) la méthode fonctionnelle de Feynman. Si on applique directement l'une de ces méthodes à une théorie de Yang-Mills, on obtient une théorie au comportement pathologique. Une analyse plus fine nous permet de constater que le problème semble résider dans le propagateur des bosons de jauge (l'équivalent du photon pour cette théorie). Des modes de polarisation non physiques sont présents. Étant donné que la symétrie de jauge est aussi le résultat de variables non physiques, il semble raisonnable de traiter ce surplus dans l'espoir de résoudre le problème. Il existe quatre façons standards de faire cela: 1) on choisit une jauge et on quantifie. 2) On réduit l'espace Φ et on quantifie, en d'autres mots on quantifie une formulation de la théorie indépendante de jauge. 16 3) On reformule la théorie de Yang-Mills comme un système décrit par un Hamiltonien contraint et on quantifie. 4) On impose une nouvelle symétrie (la symétrie BRST)17 et on quantifie la théorie résultante, qui sera décrite en termes d'une action dépendante de jauge et qui contiendra de nouvelles variables non physiques que l'on appelle des champs fantômes. Dans cet essai, je ne traiterai pas de la troisième solution. Je réfère le lecteur à Earman (2003) pour une défense de cette méthode. La façon usuelle d'appliquer la première méthode est d'imposer une condition supplémentaire à la théorie qui brise la symétrie. Si on quantifie la théorie résultante, on obtient une théorie non unitaire.18 Ceci est dû au fait qu'aucune condition de jauge ne parvient à forcer le système à rester sur une hypersurface de Φ qui ne rencontre chaque orbite de jauge qu'une seule fois. Une telle difficulté nous incite donc à nous débarrasser complètement du surplus de jauge avant de quantifier et donc d'utiliser la seconde solution. Première difficulté, comment formuler la théorie indépendante de jauge, une théorie qui, présumément, n'aura pas l'air d'une théorie de champs sur M? Admettons pour les fins de l'argumentation qu'une telle formulation puisse être produite, une autre difficulté nous attend: comment quantifier la théorie réduite? En effet, si on utilise la fonctionnelle de 15 Notez que cette section puise abondemment dans Guay (2008). Pour une référence générale sur la quantification des théories de jauge, voir Henneaux et Teileboim (1992). 16 Je rappelle que Φ est l'espace de toutes les histoires possibles des champs de la théorie. 17 La symétrie BRST porte le nom de ses inventeurs Becchi, Rouet, Stora et Tyutin. 18 Si la théorie n'est pas unitaire cela signifie que la norme d'un vecteur d'état pourrait changer durant son évolution. En pratique, cela implique que la somme des probabilités des tous les événements possibles n'est pas 1, ce qui enlève tout pouvoir prédictif à la théorie. 13 Feynman, nous savons que la méthode nous permettant d'évaluer la mesure de cette fonctionnelle repose sur la localité des variables décrivant une histoire donnée. De même, les méthodes canoniques rencontrent des difficultés similaires.19 De façon contrastée, si on quantifie la théorie de Yang-Mills à laquelle on a ajouté les champs fantômes (solution 4), on obtient une théorie unitaire et renormalisable. Apparemment, c'est en ajoutant un nouveau surplus descriptif que l'on compense pour le surplus de jauge. Si on étudie en détails cette procédure, on note que les deux surplus jouent des rôles différents. Le surplus de jauge rend la théorie locale. Le surplus BRST est juste ce qu'il faut ajouter pour faire que la théorie quantique obtenue soit équivalente à une éventuelle théorie réduite quantique. Ce dernier résultat découle d'un théorème peu connu que nous devons à DeWitt (2005). En conséquence, le diagramme de la Figure 3 commute, même si le chemin de gauche n'a pu être effectivement construit. Dans le cadre des théories de Yang-Mills non abéliennes, le surplus de jauge est bel et bien une nécessité pragmatique: A) pour quantifier une théorie de Yang-Mills, nous devrions travailler avec une formulation indépendante de jauge à laquelle nos méthodes de quantification usuelles s'appliquent mal (chemin de gauche de la figure). B) On choisit donc de quantifier la théorie de Yang-Mills dans sa formulation dépendante de jauge car elle est décrite en termes de variables locales où nos méthodes s'appliquent mieux. C) On additionne le surplus BRST (chemin de droite de la figure) de façon à ce que la théorie quantique résultante soit équivalente à celle que nous aurions obtenue si nous avions poursuivi l'étape A. La discussion précédente montre bien que formuler les propriétés des entités physiques dans le cadre d'une théorie des champs (théorie locale) n'est pas qu'un impératif ontologique mais peut aussi être le résultat de contraintes pragmatiques. Le points n'est pas que nous ne pourrions pas imaginer 19 Dans cet essai, je vais présumer que les différentes méthodes de quantification sont équivalentes. Ceci est non démontré en général mais le fait d'en tenir compte n'ajouterait rien à mon propos. 14 autre chose, par exemple une théorie aux propriétés non locales, mais bien que notre compréhension du passage entre une théorie classique vers son pendant quantique passe par des procédures formelles qui nécessitent la localité, du moins dans le contexte de leurs applications usuelles. En d'autres mots, ce sont nos procédures mathématiques qui limitent ce que l'on peut exprimer précisément et peut-être en partie ce que l'on peut penser clairement. Conclusion Dans cet essai, j'ai donné un aperçu des riches filons philosophiques que recèle l'étude des théories de jauge. Malheureusement, ce domaine d'investigation n'est pas aussi exploité qu'il le devrait, probablement à cause de l'investissement substantiel qu'il demande pour en maîtriser les aspects formels. J'espère que les exemples brièvement présentés dans cet essai inciteront davantage de philosophes à se pencher sur ce domaine fascinant. Bibliographie Aharonov, Y. & Bohm, D. (1959) Significance of electromagnetic potentials in the quantum theory, Physical Review, 115(3): 485-491 Belot, G. (1998) Understanding electromagnetism, British Journal for the Philosophy of Science, 49(4): 531-555. Belot, G. (2003) Symmetry and Gauge Freedom, Studies in History and Philosophy of Modern Physics, 34: 189-225. Brading K. & H.R. Brown (2004) Are Gauge Symmetry Transformations Observables? British Journal for the Philosophy of Science, 55(4): 645-665. Choquet-Bruhat, Y., DeWitt-Morette, C. & Dillard-Bleick, M. (1982) Analysis, Manifolds and Physics, Part I: Basics, revised edition, Elsevier DeWitt, B. (2003) The Global Approach to Quantum Field Theory, Vol. 1. Oxford: Oxford University Press DeWitt, B. (2005) The space of gauge fields: Its structure and geometry. In G. 't Hooft (éd.) 50 years of Yanf-Mills theory. World Scientific, pp. 15-32 Earman, J. & Norton, J. (1987) What price spacetime substantivalism? The hole story, British Journal for the Philosophy of Science, 38(4): 515-525. Earman, J. (2002) Thoroughly modern McTaggart or what McTaggart would have said if he had read the general theory of relativity, Philosophers' Imprint, 2(3), <http://www.philosophersimprint.org/002003/>. 15 Earman, J. (2003) Tracking down the gauge: An ode to the constrained Hamiltonian formalism. In K. Brading & E. Castellani (éd.), Symmetries in Physics: philosophical reflections, Cambridge University Press, pp. 140-162 Earman, J. (2004) Laws, symmetry, and symmetry breaking: invariance, conservation principles, and objectivity, Philosophy of Science, 71: 1227-1241. Guay, A. (2004) Symétrie: Réflexions sur les formes naturelles. Thèse de doctorat, Université de Montréal. Guay, A. (2008) A Partial Elucidation of the Gauge Principle, Studies in History and Philosophy of Modern Physics, 39(2): 346-363. Healey, R. (2007) Gauging What's Real, Oxford University Press Henneaux, M. & Teileboim, C. (1992) Quantization of Gauge Systems, Princeton University Press. Kosmann-Schwarzbach, Y. (2004) Les Théorèmes de Noether: invariance et lois de conservation au XXe siècle, Les Éditions de l'École Polytechnique. Lewis, D. (1986) Philosophical Papers, Volume II, Oxford University Press. Martin. C.A. (2003) On continuous symmetries and the foundations of modern physics. In K. Brading & E. Castellani (éd.), Symmetries in Physics: philosophical reflections, Cambridge University Press, pp. 29-60. Olariu, S. & Iovitzu Popescu, I. (1985) The quantum effects of electromagnetic fluxes, Reviews of Modern Physics, 57(2): 339-449. O'Raifeartaigh, L. (1997) The Dawning of Gauge Theory, Princeton university Press. Peskin, M.E. & Schroeder, D.V. (1995) An Introduction to Quantum Field Theory, Perseus Books. Redhead, M. (1988) A Philosopher Looks at Quantum Field Theory. In H.R. Brown & P. Harré (éd.), Philosophical Foundations of Quantum Field Theory, Oxford University Press, pp. 923. Salmon, W.C. (1998) Causality and Explanation, Oxford University Press. Wu, T.T. & Yang, C.N. (1975) Concept of nonintegrable factors and global formulation of gauge fields, Physical Review D, 12(2): 3845-3857.