A lóxica da descuberta científica clásicos do pensamento universal Núm. 19 Colección dirixida por Darío VillanueVa Comité Científico Carlos Baliñas FernánDez Facultade de Filosofía luis ConCheiro Carro Facultade de Medicina ramón máiz suárez Facultade de Ciencias Políticas antón santamarina FernánDez Facultade de Filoloxía José sorDo roDríguez Facultade de Farmacia UNIVERSIDADE DE SANTIAGO DE COMPOSTELA fundación bbva P r ó l o g o J u a n V á z q u e z S á n c h e z T r a d u c i ó n M a n u e l P u g a M o r u x a Karl Popper A lóxica da descuberta científica © Da presente eDición Universidade de Santiago de Compostela, 2012 Fundación BBVA, 2012 Deseño Da colección Barro, Salgado, Santana [Grupo Revisión Deseño] Maquetación Imprenta Universitaria eDición técnica Servizo de Publicacións e Intercambio Científico Campus Vida 15782 Santiago de Compostela www.usc.es/publicacions iMpriMe Imprenta Universitaria Campus Vida Depósito legal C 434-2012 ISBN 978-84-9887-851-6 Marcuse, Herbert, 1898-1979 O home unidimensional / Herbert Marcuse; prólogo Jorge Álvarez Yágüez ; tradución Jesús Saavedra Carballido. – Santiago de Compostela : Universidade de Santiago de Compostela, Servizo de Publicacións e Intercambio Científico, 2012 334 p. ; 24 cm. – (Clásicos do pensamento universal (Universidade de Santiago de Compostela) ; 18) – D.L. C 434-2012. – ISBN: 978-84-9887-851-6 1. Socioloxía 2. Ideoloxía I. Álvarez Yágüez, Jorge, pr. II. Saavedra Carballido, Jesús, trad. III. Universidade de Santiago de Compostela. Servizo de Publicacións e Intercambio Científico, ed. 316.75 PE N EN TE Índice 9 PRÓLOGO por Juan Vázquez Sánchez 15 1. Datos biográficos de Karl Popper relativos á xénese d'A lóxica da descuberta científica 25 2. O Circulo de Viena e a xénese d'A lóxica da descuberta científica 28 3. A lóxica da descuberta científica 55 Bibliografía 63 A LÓxICA DA DESCUbERTA CIENTÍfICA Tradución de Manuel Puga Moruxa 65 Nota do tradutor 65 Edición manexada 65 O título 66 Falsificar e comprobar 67 Abreviacións 67 Agradecementos 73 NOTA SOBRE A TRADUCIÓN INGLESA 75 Prefacio á primeira edición de 1934 77 Prefacio á primeira edición en lingua inglesa de 1959 87 agraDeCementos, 1960 e 1968 89 1a PArTE. INTrODuCIóN á lóxICA DA CIENCIA 91 1. Exposición dalgúns problemas fundamentais 91 1 O problema da indución 96 2 Eliminación do psicoloxismo 98 3 Comprobación dedutiva de teorías 100 4 O problema da demarcación 106 5 A experiencia como método 108 6 A falsificabilidade como criterio de demarcación 112 7 O problema da «base empírica» 113 8 Obxectividade científica e convicción subxectiva 119 2. Sobre o problema dunha teoría do método científico 119 9 Por que as decisións metodolóxicas son indispensables 121 10 A perspectiva naturalista sobre a teoría do método 124 11 As regras metodolóxicas como convencións 129 2a PArTE. COMPOñENTES ESTruTurAIS DuNhA TEOríA DA ExPErIENCIA 131 3. Teorías 131 12 Causalidade, explicación e dedución de predicións 134 13 universalidade estrita e numérica 137 14 Conceptos universais e conceptos individuais 143 15 Enunciados estritamente universais e existenciais 146 16 Sistemas teóricos 148 17 Posibilidades de interpretación dun sistema de axiomas 152 18 Niveis de universalidade. O modus tollens 155 4. Falsificabilidade 155 19 Obxeccións convencionalistas 159 20 regras metodolóxicas 163 21 Investigación lóxica da falsificabilidade 165 22 Falsificabilidade e falsificación 167 23 Ocorrencias e acontecementos 172 24 Falsificabilidade e coherencia 174 5. O problema da base empírica 174 25 As experiencias perceptuais como base empírica: o psicoloxismo 176 26 Sobre os supostos «enunciados protocolarios» 180 27 A obxectividade da base empírica 184 28 Enunciados básicos 188 29 A relatividade dos enunciados básicos. resolución do trilema de fries 191 30 Teoría e experimento 200 6. Graos de comprobabilidade 200 31. un programa e unha ilustración 202 32 Como se comparan as clases de falsificadores potenciais? 204 33 Comparación dos graos de falsificabilidade por medio da relación de subclase 206 34 A estrutura da relación de subclase. Probabilidade lóxica 209 35 Contido empírico, implicación e graos de falsificabilidade 212 36 Niveis de universalidade e graos de precisión 214 37 ámbitos lóxicos. Notas sobre a teoría da medición 218 38 Comparación dos graos de comprobabilidade por referencia ás dimensións 223 39 A dimensión dun conxunto de curvas 225 40 Dúas maneiras de reducir o número de dimensións dun conxunto de curvas 230 7. Simplicidade 231 41 Eliminación dos conceptos pragmático e estético de simplicidade 231 42 O problema metodolóxico da simplicidade 235 43 Simplicidade e grao de falsificabilidade 238 44. Figura xeométrica e forma funcional 239 45 A simplicidade da xeometría euclidiana 241 46 O convencionalismo e o concepto de simplicidade 243 8. A probabilidade 244 47 O problema de interpretar enunciados de probabilidade 245 48 Interpretacións obxectivas e subxectivas 248 49 O problema fundamental da teoría do azar 249 50 A teoría frecuencial de von mises 253 51 Plan para unha nova teoría da probabilidade 255 52 Frecuencia relativa nunha clase finita 257 53 Selección, independencia, insensibilidade, irrelevancia 258 54 Sucesións finitas. Selección ordinal e selección de veciñanza 260 55 liberdade n en sucesións finitas 265 56 Sucesións de segmentos. A primeira forma da fórmula binomial 267 57 Sucesións infinitas. Estimacións hipotéticas de frecuencia 272 58 Exame do axioma de aleatoriedade 277 59 Sucesións aleatorias. A probabilidade obxectiva 278 60 O problema de bernoulli 283 61 A lei dos grandes números (teorema de bernoulli) 286 62 O teorema de bernoulli e a interpretacion de enunciados de probabilidade 288 63 O teorema de bernoulli e o problema da converxencia 292 64 Eliminación do axioma de converxencia. Solución do «problema fundamental da teoría do azar» 298 65 O problema da decidibilidade 301 66 A forma lóxica dos enunciados de probabilidade 307 67 un sistema probabilístico de metafísica especulativa 309 68 A probabilidade na física 317 69 lei e azar 321 70 A deducibilidade de macroleis partindo de microleis 323 71 Enunciados de probabilildade formalmente singulares 327 72 A teoría do ámbito 331 9. Algunhas observacións sobre a teoría cuántica 333 73 O programa de heisenberg e as relacións de incerteza 339 74 un breve esbozo da interpretación estatística da teoría cuántica 341 75 reinterpretación estatística das fórmulas de incerteza 347 76 un intento de eliminar elementos metafísicos invertendo o programa de heisenberg, con aplicacións 358 77 Experimentos decisivos** 370 78 Metafísica indeterminista 376 10. A corroboración, ou como unha teoría supera comprobacións 377 79 Sobre a chamada verificación de hipóteses 380 80 A probabilidade dunha hipótese e a probabilidade dos acontecementos: crítica da lóxica da probabilidade 391 81 lóxica indutiva e lóxica da probabilidade 394 82 A teoría positiva da corroboración: como unha hipótese pode «demostrar a súa validez» 398 83 Corroborabilidade, comprobabilidade e probabilidade lóxica*1 404 84 Puntualizacións sobre o uso dos conceptos «verdadeiro» e «corroborado» 407 85 O camiño da ciencia APÉNDICES 416 i Definición da dimensión dunha teoría (cf. apartados 38 e 39) 418 ii O cálculo xeral de frecuencia en clases finitas (cf. apartados 52 e 53)*1 422 iii Dedución da primeira forma da fórmula binomial (para sucesións finitas de segmentos sobrepostos, cf. apartado 56) 424 iv un método para construír modelos de sucesións aleatorias (cf. apartados 58, 64 e 66) 428 v Exame dunha obxección. O experimento das dúas fendas (cf. apartado 76)*1 432 vi Sobre un procedemento non preditivo de medición (cf. apartado 77)*1 436 vii Puntualizacións sobre un experimento imaxinario (cf. apartado 77)*1 439 Nota sobre os novos apéndices, edición de 1959 NOVOS APÉNDICES 442 *i Dúas notas sobre a indución e a demarcación, 19331934 450 *ii unha nota sobre a probabilidade, 1938 456 *iii Sobre o uso heurístico da definición clásica de probabilidade, en especial para deducir o teorema xeral da multiplicación 460 *iv A teoría formal da probabilidade 489 *v As deducións na teoría formal da probabilidade 500 *vi Sobre a desorde obxectiva ou aleatoriedade 505 *vii Probabilidade cero e a estrutura fina de probabilidade e de contido 524 *viii Contido, simplicidade e dimensión 535 *ix Corroboración, peso das probas e comprobacións estatísticas 578 *x universais, disposicións e necesidade natural ou física 606 *xi Sobre o uso e abuso de experimentos imaxinarios, especialmente na teoría cuántica 625 *xii O experimento de Einstein, Podolsky e rosen 633 índice onomástico 636 índice temático

a lóxida da descuberta científica PRÓLOGO JUAN VÁZQUEZ SÁNCHEZ 1. Datos biográficos de Karl Popper relativos á xénese d'A lóxica da descuberta científica 1.1 Primeiros anos de formación Antes de comezar a presentación dunha das obras fundamentais de Karl Popper e, sen dúbida, unha das obras máis relevantes tamén da Filosofía da Ciencia, A lóxica da descuberta científica (The Logic of Scientific Discovery, Logik der Forschung na primeira edición en lingua alemá), é oportuno indicar a orixe das dúas ideas ou alicerces sobre os que se asenta o edificio da súa formulación epistemolóxica e metodolóxica, a idea de falsación como criterio de demarcación científica ou, se se prefire, como criterio de distinción entre ciencia e seudociencia, e o seu anti-indutivismo. Dúas ideas ou puntos de vista aos que chega Karl Popper en etapas distintas da súa evolución intelectual e que, logo, van confluír na configuración do seu anti-indutivismo falsacionista, a columna vertebral que serve de soporte á teoría do coñecemento e á metodoloxía da ciencia desenvolvidas polo autor n'A lóxica da descuberta científica. Karl Popper, de orixe austríaca e pai xudeu, nace no seo dunha familia acomodada e culta o 28 de xullo de 1902 en himmelhof, un lugar do distrito de Ober St. Veit de Viena. Vive en Viena ata a idade de 34 anos. En 1937, tras a toma do poder polos partidarios de hitler, exíliase a Nova Zelandia, onde é contratado como profesor no Canterbury university College de Christchurch. Deixa Nova Zelandia no ano 1945 e ao ano seguinte, 1946, ingresa como profesor de filosofía na london School of Economics and Political Science da universidade de londres. O profesor Friedrich August von hayek foi o seu principal valedor para a consecución da praza. Permanece na london School of Economics ata o ano 1969 en que se retira da 16 prólogo Juan vázquez sánchez vida académica activa e pasa á categoría de profesor emérito. Morre como cidadán británico en East Croydon (londres) o 17 de setembro de 1994. En 1914, cando Karl Popper acababa de cumprir os 12 anos, estala a Primeira Guerra Mundial e, segundo testemuño do propio Karl Popper, (Popper: 1974, p. 8), os anos de guerra e os seus efectos foron decisivos para o seu desenvolvemento intelectual, xa que contribuíron poderosamente a espertar nel un espírito crítico non só cara ás ideas políticas senón tamén cara ao saber establecido. Coincidindo co final da guerra, á idade de 16 anos, Karl Popper decide abandonar a escola secundaria e estudar pola súa conta. Considera que os ensinos que alí estaba recibindo non só eran aburridos senón que, ademais, constituían unha perda de tempo. Con este propósito inscríbese na universidade de Viena como alumno oínte, sen dereito a matrícula, o que lle permite asistir libremente aos cursos que lle apetecía. Así permanece ata que no ano 1922 preséntase ao exame de ingreso e convértese en alumno matriculado. Despois do derribamento do Imperio Austríaco e coincidindo cos anos de estancia de Karl Popper na universidade, a escena política estaba dominada pola esquerda. Era a época da Viena Vermella, na que o Partido Socialista, asociado cos comunistas, fíxose democraticamente co poder. O ambiente na universidade era bastante anárquico, pero non por iso deixaba de ser estimulante, así o refire o propio Karl Popper na súa Autobiografía intelectual (Popper: 1974, p. 24). Estudábase, non co propósito de ter unha carreira, que apenas existían, senón polo simple gusto de aprender. As ideas políticas impregnábano todo, á sociedade e tamén á universidade. Karl Popper, que estaba interesado por aquel entón na política pedagóxica, faise membro das mocidades socialistas. Ata chega a formar parte do partido comunista, aínda que só por un período moi curto de tempo. un enfrontamento entre as mocidades comunistas e a policía vienesa, na que pereceron algúns mozos, levoulle a apartarse definitivamente do comunismo. A súa admiración pola socialdemocracia e o labor educativo que se estaba desenvolvendo en Austria seguiu, no entanto, en pé. 1.2 A idea de falsación Nese ambiente universitario e social case revolucionario Karl Popper asiste a cursos de historia, literatura, psicoloxía, matemáticas, física teórica e filosofía, entre outros, pero tamén se mostra interesado na teoría da relatividade de Albert Einstein, a teoría da historia de Karl Marx, a psicanálise de Sigmund Freud e a «psicoloxía do individuo» de Alfred Adler (Popper: 1963, p.34), todas elas moi de moda por aquel entón entre os estudantes universitarios. Con todo, Karl Popper, home de mente analítica, confesa tanto na súa Autobiografía intelectual como en Conxecturas e refutacións que pronto comezou a sentirse cada vez máis insatisfeito coas tres últimas teorías que, aínda que se presentaban como ciencias, na súa opinión tiñan máis elementos en común cos mitos primitivos que coa ciencia (Popper: 1974, p. 29 e Popper: 1963, p. 34). Intuía que algo había nelas que as facía parecerse máis á astroloxía que, por exemplo, á astronomía ou á física de Isaac Newton. Esa diferenza, séguenos dicindo Karl Popper, non estaba nin na maior exactitude destas últimas nin na súa suposta verdade, posto que poucos por aquel entón crían na verdade da teoría da relatividade. un feito sorprendente, as observacións de Arthur Stanley Eddington durante a eclipse de 1919 puxérono sobre a pista do que, segundo Karl Popper, distinguía ás teorías científicas das pseudociencias. De acordo coa teoría gravitacional de Albert Einstein, a luz ao aproximarse aos corpos dunha gran masa debía ser atraída por eles, o que daría lugar a unha desviación da súa traxectoria orixinal; e o que Eddington puido observar con motivo da eclipse de 1919 foi, efectivamente, que a luz 18 prólogo Juan vázquez sánchez procedente dunha estrela fixa, aparentemente próxima ao Sol, experimentaba esa atracción, o que daba lugar a que, a nivel experimental, a estrela fose observada como téndose afastado un pouco do Sol. De non terse producido esa especie de afastamento aparente a teoría da gravitación de Einstein sería refutada. En definitiva, que a teoría da relatividade de Einstein comprometíase, como acontecía neste caso, cunha predición arriscada, que de non cumprirse, implicaba a refutación da teoría, pola contra, as outras tres teorías, a teoría da historia de Karl Marx, a psicanálise de Sigmund Freud e a psicoloxía do individuo de Alfred Adler, non se comprometían con ningunha predición que puidese refutalas. Esa diferenza, a posibilidade de ser falsadas, empeza a sospeitar Karl Popper, é o que en realidade distingue ás teorías científicas das pseudociencias. As anteriores consideracións, di Karl Popper, son as que lle levaron durante o inverno de 1919-20 a pensar na falsación como unha das características que permiten distinguir á ciencia da pseudociencia. Karl Popper, que estivera colaborando con Alfred Adler no seu labor social entre os nenos e mozos dos distritos obreiros de Viena, cóntanos a anécdota de que en certa ocasión informou a Alfred Adler dun caso que non lle parecía particularmente adleriano, pero Adler non atopou dificultade algunha en interpretalo á luz da súa teoría dos sentimentos, a pesar de que non vira ao neno. Karl Popper, sorprendido, preguntoulle como podía estar tan seguro, «pola miña experiencia de mil casos», respondeu Alfred Adler. Ao que Karl Popper non puido evitar contestarlle, «E con este novo caso, supoño, a súa experiencia baséase en mil e un casos» (Popper: 1963, p. 35). Anécdotas como esta, así como o feito de que os seus amigos, admiradores de Marx, Freud e Adler, visen por todas partes confirmacións da teoría da historia, da psicanálise e da psicoloxía do individuo fíxolle fincarse cada vez máis na idea de que non son as verificacións senón a posibilidade de poder ser falsadas o que distingue ás 19 a lóxida da descuberta científica Popper naceu en 1902 en Viena, daquela parte do imperio austro-húngaro 20 prólogo Juan vázquez sánchez teorías científicas da pseudociencia: «unha teoría que non é refutable por ningún suceso concibible non é científica», dinos en Conxecturas e refutacións. Pero non será ata o ano 1932, época na que as preocupacións de Karl Popper desprázanse do plano psicopedagóxico ao epistemolóxico, a data na que o autor propón a falsación como criterio de demarcación científica, tal como figura n'A lóxica da descuberta científica. 1.3 Anti-indutivismo A outra idea ou suposto no que se fundamenta a epistemoloxía desenvolvida por Karl Popper n'A lóxica da descuberta científica é o seu anti-indutivismo. Fronte á tradición, na que se vai a inscribir tamén o Círculo de Viena, que viña considerando á indución como o método mediante o que a ciencia leva a cabo o descubrimento e xustificación dos seus coñecementos, Karl Popper sosterá, non só que non hai unha xustificación lóxica para a indución, como argumentou acertadamente David hume, senón ademais, que a indución non desempeña papel algún na adquisición e desenvolvemento do coñecemento. O método da ciencia, tanto se se trata das ciencias formais coma se se trata das ciencias empíricas é o dedutivo ou, se se prefire, o hipotético dedutivo. Pero este, por dicilo dalgún modo, non é o punto de partida de Karl Popper senón o de chegada, cando as súas investigacións sobre a indución desprázanse, tamén, cara ao plano epistemolóxico. Karl Popper di comezar a interesarse polo tema da indución no ano 1923, un período da súa vida no que tanto a súa actividade como as súas investigacións estaban centradas na educación, non na epistemoloxía. En 1925, época na que Karl Popper estaba traballando con nenos abandonados, a Cidade de Viena funda o Instituto Pedagóxico de Educación, co propósito de apoiar a reforma das escolas primarias e secundarias de Viena. Algúns dos traba21 a lóxida da descuberta científica A Primeira Guerra Mundial e os seus efectos foron decisivos para o desenvolvemento intelectual de Popper; na imaxe, sinatura do tratado de paz entre os aliados e hungría en 1920 22 prólogo Juan vázquez sánchez lladores sociais, entre eles Karl Popper, foron admitidos como alumnos do Instituto. O Instituto, aínda que autónomo, estaba vinculado á universidade e algúns dos cursos impartidos na universidade, por exemplo os de psicoloxía, eran obrigatorios para os alumnos do Instituto. É así como Karl Popper chega a coñecer a Karl Bühler, profesor de psicoloxía na universidade de Viena e a autoridade académica máis importante do Instituto. No seu segundo ano no Instituto entra en contacto con heinrich Gomperz, o seu primeiro profesor de filosofía, bo helenista e interesado tamén na epistemoloxía. Karl Büller, xunto co profesor heinrich Gomperz, exerceron unha profunda influencia no pensamento de Karl Popper, facéndolle derivar dos temas da educación aos da psicoloxía e destes aos da epistemoloxía. En 1927, no seo do Instituo Pedagóxico, Karl Popper presenta o seu primeiro traballo de investigación, 'Gewohnheit' und 'Gesetzerlebnis' in der Eirziehung ('Hábito' e 'Crenza en Leis' en Educación). Nese traballo, breve e non de todo acabado, se condensan os resultados das investigacións de Karl Popper en psicopedagoxía. E é con motivo desas investigacións como Karl Popper se achega ao tema da indución, ás explicacións dadas por David hume sobre a adquisición de hábitos mediante o proceso indutivo de repetición. David hume, logo de rexeitar a validez lóxica dos razoamentos indutivos, trata de explicar psicoloxicamente o noso hábito de crer en leis ou regularidades e faino argumentando que eses hábitos son o produto da repetición frecuente, é dicir, dun proceso indutivo, por máis que ese proceso indutivo non estea xustificado loxicamente. A Karl Popper parécenlle incuestionables os argumentos de David hume en contra da validez lóxica da indución, pero discrepa das súas explicacións psicolóxicas a favor do proceder indutivo na formación de crenzas. A lectura das críticas de leonard Nelson ás explicacións de David hume Popper interesouse pola teoría da historia de Marx, que aparece na imaxe en 1875 24 prólogo Juan vázquez sánchez conduce a Popper, na década dos anos 20, ao convencemento de que esas explicacións estaban equivocadas1. En definitiva, vén concluír Karl Popper neste o seu primeiro traballo de investigación, a nosa tendencia a crer en regularidades non se explica a través dos procesos indutivos de repetición, senón que somos nós os que activamente e dun xeito «a priori», impomos regularidades ao mundo para, logo, sometelas a contrastación. Fronte ás explicacións indutivistas da aprendizaxe de David hume, Karl Popper propón o método do ensaio e erro que, na súa evolución posterior, denominará de conxecturas e refutacións. O punto de vista popperiano de que a xénese e desenvolvemento do coñecemento prodúcese non indutivamente senón mediante o procedemento de ensaio e erro víase fortalecido, ademais, polo punto de vista da teoría da Gestalt sobre a percepción e a teoría kantiana do coñecemento, dous puntos de vista cos que Karl Popper entrara en contacto da man dos seus dous máis influentes mentores, os profesores heinrich Gomperz e Karl Bühler. Da teoría da Gestalt aprendera que toda observación implica xa un determinado punto de vista, unha expectativa. E de Kant que na xénese e desenvolvemento do coñecemento contamos con elementos «a priori». As conxecturas teóricas das que partimos son «a priori», xorden coa experiencia pero non da experiencia. Con todo, á diferenza de Kant, esas conxecturas ou hipóteses «a priori» non son necesarias senón que, unha vez propostas dun xeito dogmático, deben ser sometidas ao tribunal da experiencia. Niso consiste o seu non dogmatismo, a actitude crítica representada polo método de ensaio e erro. En definitiva, os primeiros estudos de Karl Popper sobre a indución obedecen a unha preocupación de natureza psicopedagóxica e iso explica que Karl Popper non vexa nos resultados da súa investigación conexión algunha coa falsación, porque, como 1 Segundo Hacohen (Hacohen: 2000, pp. 168-169) Popper lera as críticas de Nelson a Hume en torno ao ano 1925 e esas críticas son similares ás que realiza Popper en Conxecturas e refutacións en contra da indución (Popper:1963, pp. 42, 43 e 44). 25 a lóxida da descuberta científica se acaba de indicar, neses momentos a súa preocupación é psicopedagóxica e non epistemolóxica, pero neses resultados está xa configurado o que vai ser o seu anti-indutivismo epistemolóxico. En 1928 Karl Popper obtén o título de doutor cunha tese Sobre o método na psicoloxía do pensar (Zur Methodenfrage der Denkpsychologie), dirixida polo profesor Karl Bühler. A tese era unha especie de plan realizado a voapluma, orixinalmente proxectado só como introdución metodolóxica aos resultados de anos de traballo na psicoloxía do pensar e do descubrimento, pero na que xa se indicaba o seu xiro cara á metodoloxía. É a partir da presentación da súa tese doutoral e a obtención no ano 1929 da cualificación de profesor de matemáticas e de física en escolas secundarias cando a idea de falsación e a súa crítica á indución, que viviran por separado na mente de Karl Popper na súa etapa psicopedagóxica, empezan a confluír na súa nova etapa epistemolóxica. Se a indución non xoga papel algún na explicación psicolóxica da xénese do coñecemento e se, ademais, non hai unha xustificación lóxica para a indución, entón debemos concluír, como o vai facer Karl Popper na súa etapa epistemolóxica, que o método da ciencia non é o indutivo senón o hipotético dedutivo. Primeiro formulamos as hipóteses ou conxecturas teóricas e, logo, mediante o método dedutivo de contrastar, sometémolas ao tribunal da experiencia. Agora ben, como non hai unha xustificación lóxica para a indución, mediante o proceso dedutivo de contrastar só poderá ser inferido o posible valor de falsidade das teorías (falsación como criterio de demarcación) nunca o seu valor de verdade. É así como anti-indutivismo e falsación conflúen na configuración da columna vertebral da epistemoloxía popperiana. 2. O Circulo de Viena e a xénese d'A lóxica da descuberta científica En 1927 Karl Popper tivera noticias do Círculo de Viena a través de Otto Neurath, e tamén a través do seu profesor de mate26 prólogo Juan vázquez sánchez máticas hans hahn, o que lle levou ao estudo en profundidade da obra de ludwig Wittgenstein e rudolf Carnap e a abordar no marco do seu anti-indutivismo falsacionista os problemas epistemolóxicos e metodolóxicos que os membros do Círculo trataban de responder co seu indutivismo verificacionista. Nunha especie de diálogo en solitario cos escritos de Wittgenstein e Carnap Karl Popper elabora numerosos escritos que non chega a publicar, pero que si comenta co profesor heinrich Gomperz, o seu único interlocutor. A través do profesor Gomperz coñece a Victor Kraft, un dos membros do Circulo de Viena, e un tío seu, Walter Schiff, que era profesor de Estatística e Economía na universidade de Viena lle concerta unha entrevista con herbert Feigl. Tanto Victor Kraft como herbert Feigl mostráronse interesados nos puntos de vista de Karl Popper, pero foi herbert Feigl o que animou a Karl Popper a publicar as súas ideas en forma de libro, algo no que Karl Popper nunca pensara. Seguindo a suxestión de herbert Feigl, Karl Popper empeza a traballar na elaboración de Die beiden Grundprobleme der Erkenntnistheorie (Os dous problemas fundamentais da teoría do coñecemento). E en 1932 completa o que entón consideraba como primeiro volume do libro. O texto foi lido por Feigl, Frank, Schlick, Carnap, hahn, Neurath e outros membros do Círculo. En 1933 Schlick e Frank aceptan o libro para a súa publicación na serie Schriften zur wissenschaftlichen Weltauffassung, da que eran directores e na que se publicaron unha gran parte dos libros escritos polos membros do Círculo. No espazo de tempo que vai desde a terminación do que Karl Popper consideraba o primeiro volume de Os dous problemas fundamentais da teoría do coñecemento e o momento no que se lle comunica que foi aceptado para a súa publicación Karl Popper xa escribira a maior parte do segundo volume. Pero a casa editorial, Springer, esixía que o libro para poder publicarse tiña que ser abreviado. En palabras de Popper, «iso significaba que para cinguirme ao número de páxinas que os editores estaban dispostos a publi27 a lóxida da descuberta científica As observacións de Eddington durante a eclipse de 1919 puxeron a Popper sobre a pista do que distinguía ás teorías científicas das pseudociencias 28 prólogo Juan vázquez sánchez car, tería que entregar un esquema ou pouco máis, da miña obra» (Popper: 1974, p. 67). Co permiso de Schlick e Frank Karl Popper elabora un novo manuscrito, formado por extractos dos dous volumes. O manuscrito élle devolto polos editores por seguir sendo demasiado amplo. Debía cinguirse a un máximo de duascentas corenta páxinas. O extracto final que foi publicado como Logik der Forschung (A lóxica da descuberta científica) en 1934 foi elaborado polo seu tío Walter Schiff, quen reduciu o texto case á metade. unha vez visto o proceso que levou a Popper á redacción d'A lóxica da descuberta científica, creo que un dos mellores xeitos de facer unha presentación do libro é comparando as suas teses coas teses metodolóxicas e epistemolóxicas correspondentes do Círculo de Viena, pois son esas teses o pano de fondo fronte ao que foron elaborados o primeiro e o segundo volumes de Os dous problemas fundamentais da teoría do coñecemento dos que Logik der Forschung é un extracto. 3. A lóxica da descuberta científica 3.1 Marco xeral A lóxica da descuberta científica, en palabras do autor, «pretendía proporcionar unha teoría do coñecemento e, ao mesmo tempo, ser un tratado sobre o método -o método da ciencia-» (Popper: 1974, p. 67). Iso é o que pretendía ser e iso é o que é, un dos tratados de metodoloxía da ciencia máis relevantes, se non o máis relevante, de todos cantos se escribiron no século vinte. Non se trata dun manual de metodoloxía da ciencia e teoría do coñecemento, senón dun tratado, dunha presentación e defensa da epistemoloxía e filosofía da ciencia derivadas do anti-indutivismo falsacionista do autor. A lóxica da descuberta científica consta dunha «Primeira» e unha «Segunda» partes, seguidas duns «Apéndices». A «Primeira Parte», como se indica no seu subtítulo, é unha 29 a lóxida da descuberta científica especie de introdución ao libro. unha introdución moi especial, xa que nela, estruturada en dous capítulos, Karl Popper presenta os conceptos fundamentais da súa epistemoloxía. O que se fai na «Segunda Parte» é desenvolver con máis detalle esa formulación epistemolóxica e todo iso, sempre en discusión permanente cos puntos de vista alternativos dos máximos representantes do Círculo de Viena (Carnap, Schlick, etc.). Pero, a pesar das profundas diferenzas epistemolóxicas existentes entre as formulacións de Karl Popper e as do Círculo, hai, no entanto, tamén moitos puntos de vista en común. Por exemplo tanto Karl Popper como os membros do Círculo coinciden en facer filosofía da ciencia desde a lóxica, como queda reflectido no propio título da obra de Karl Popper, A lóxica da descuberta científica, e nas denominacións «positivismo lóxico» e «empirismo lóxico» coas que se designa á corrente de pensamento derivada do uso do método da análise lóxica utilizado polos membros do Círculo. Isto obrígalles, tanto aos membros do Círculo como a Karl Popper, a centrar as súas investigacións epistemolóxicas non nos procesos psicolóxicos que dan lugar á constitución e desenvolvemento do coñecemento, senón na análise lóxica dos seus contidos que, no caso da ciencia, non son outros que os representados polas teorías científicas. Como nos di Popper expresamente xa ao comezo do segundo parágrafo da Introdución a A lóxica da descuberta científica: «A fase inicial, o acto de concibir ou inventar unha teoría, non me parece que requira unha análise lóxica nin que sexa susceptible dela. A pregunta de cómo se lle ocorre unha idea nova a unha persoa (xa sexa un tema musical, un conflito dramático ou unha teoría científica) pode ser de grande interese para a psicoloxía empírica, pero é irrelevante para a análise lóxica do coñecemento científico. Este non se ocupa das cuestións de feito (o quid facti? de Kant), senón das cuestións de xustificación ou validez (o quid juris? de Kant)» (Popper: 1959, p. 31) (p. 21 da traducción de Manolo Puga). Para Karl Popper, do mesmo xeito que para os 30 prólogo Juan vázquez sánchez neopositivistas, non hai unha lóxica do descubrimento, o que lles leva a situar as súas formulacións epistemolóxicas, facendo uso da terminoloxía de hans reichenbach, no «contexto de xustificación». unha vez que as teorías foron propostas pola comunidade científica, o que lle compete ao filósofo da ciencia é avalialas. E neste proceso de avaliación, como logo veremos, soamente van intervir a lóxica e a experiencia. Posto que tanto as formulacións epistemolóxicas de Karl Popper como as dos neopositivistas marcan o inicio histórico da filosofía da ciencia como disciplina académica, aínda que a súa prehistoria podemos remontala a Kant, Bacon ou ao propio Aristóteles, iso fixo que a filosofía da ciencia tomase nos 60 ou 70 primeiros anos da súa historia ás teorías científicas como o seu obxecto de estudo, pasando a un segundo plano outras dimensións da ciencia, como a social e a experimental, tan característica esta última do coñecemento científico. un segundo punto a destacar no que tampouco vai haber profundas diferenzas entre as formulacións epistemolóxicas de Karl Popper e as dos neopositivistas radica, en terminoloxía de W. Stegmüller, na súa concepción enunciativista (statement view) das teorías. unha teoría científica desenvolvida estará constituída por un conxunto de enunciados susceptibles de ser estruturados na forma dun sistema dedutivo, de tal xeito que todos os enunciados da teoría poderán ser deducibles a partir dos seus enunciados máis xerais ou axiomas da teoría. É xustamente esta suposta estrutura a que posibilita que o coñecemento científico, representado polas teorías, sexa susceptible dunha análise lóxica. Efectivamente, a través da análise lóxica poderemos determinar a) se o sistema é consistente, é dicir, se dentro do sistema ou teoría non é posible deducir un enunciado e o seu contraditorio, o que faría insostible á teoría; b) se o sistema é independente, é dicir, ningún dos enunciados da teoría, considerados como axiomas, é deducible dos demais. A través da análise lóxica tamén poderemos determinar c) se se 31 a lóxida da descuberta científica trata dunha teoría empírica ou, pola contra, os enunciados que a constitúen son tautolóxicos; d) se a teoría supón ou non algún progreso científico en relación coas súas competidoras e, para rematar e) se é científica, o que poderemos pescudar a través da aplicación empírica das conclusións que poden deducirse dela. Aínda que tanto Karl Popper como os neopositivistas teñen unha concepción enunciativista e dedutivista das teorías científicas, hai con todo unha pequena diferenza entre eles. Mentres que os neopositivistas estiveron preocupados pola reconstrución axiomática das teorías, indicando os requisitos formais e de contido que esas axiomatizacións debían satisfacer, Karl Popper deu por feito, sen máis, que as teorías científicas teñen unha estructura dedutiva pero non chegou a ocuparse en ningún momento dos problemas que expuña ou podía chegar a expor o intento de reconstruír axiomáticamente a estrutura dunha teoría nunha linguaxe formal. un resultado máis desta concepción enunciativista e dedutivista das teorías radica en que tanto Karl Popper como os neopositivistas fixeron uso dun modelo nomolóxico dedutivo da explicación e predición científicas. En palabras de Karl Popper: «Ofrecer unha explicación causal dun acontecemento supón deducir un enunciado que o describa, empregando como premisas da dedución unha ou máis leis universais, xunto con certos enunciados singulares, as condicións iniciais» (Popper: 1959, p. 59) (p. 45 da traducción) Enténdese por «condicións iniciais» o conxunto de enunciados singulares nos que se formulan os feitos ou condicións particulares antecedentes que deben darse para que se cumpra a predición. un punto máis de coincidencia, e xa non son poucos, entre Karl Popper e os neopositivistas radica en que un e outros consideraban como unha das tarefas fundamentais da epistemoloxía proporcionar un criterio de demarcación científica, un criterio que permitise distinguir á ciencia da metafísica ou, dun modo máis xeral, ás proposicións científicas das que non o son. 32 prólogo Juan vázquez sánchez En palabras de Karl Popper: «Ao problema de atopar un criterio que nos permitise distinguir entre as ciencias empíricas por unha banda e as matemáticas e a lóxica, así como os sistemas 'metafísicos' pola outra, eu chámolle problema da demarcación» (Popper: 1959, p. 34) (p. 24 da traducción) e prosegue un pouco despois: «Atopar un criterio de demarcación aceptable ten que ser un cometido crucial para calquera epistemoloxía que non acepte a lóxica indutiva» (Popper: 1959, p. 35) (p. 25 da traducción). A procura dun criterio de demarcación, como o designa Karl Popper, foi posiblemente, tanto para el como para os neopositivistas, o problema máis importante ao que debía facer fronte a epistemoloxía, pero, ao mesmo tempo, é na diversidade da resposta que os membros do Círculo de Viena estaban dando a ese problema e o que propón Karl Popper n'A lóxica da descuberta científica onde se orixinan e fundamentan as diferenzas máis importantes entre unha e outra formulación. Fronte ao indutivismo verificacionista dos neopositivistas Karl Popper vai propor como criterio de demarcación o seu antiindutivismo falsacionista. En calquera caso, a procura dun criterio de demarcación xunto coa concepción enunciativista compartida, obriga tanto aos membros do Círculo como a Karl Popper a distinguir no seo das teorías, cando menos, dous tipos distintos de enunciados, os axiomas ou postulados teóricos, conxecturas teóricas na terminología de Popper, por unha banda e os enunciados «protocolares» ou «observacionais», enunciados «básicos» na terminología de Karl Popper, pola outra. E aínda que hai diferenzas importantes entre os enunciados protocolares ou observacionais do neopositivismo e os enunciados básicos de Karl Popper, nunha e outra formulación son este tipo de enunciados os que permiten caracterizar a unha teoría de científica. Para os membros do Circulo de Viena un enunciado ten significado empírico e, polo tanto, é científico, se e só se non é analítico e pode ser inferido loxicamente a partir dunha clase finita e 33 a lóxida da descuberta científica consistente de enunciados observacionais. E para Karl Popper unha conxectura teórica é científica se dela, xunto con certas condicións iniciais, pode inferirse un enunciado básico que, en principio, poida entrar en contradición cun dos enunciados básicos aceptados pola comunidade científica como válidos. En ambos os casos, como vemos, son os enunciados observacionais ou os básicos os que, ao actuar como premisas nas respectivas inferencias, determinan a cientificidade das teorías. Con todo xa aquí hai unha diferenza importante entre Karl Popper e os membros do Círculo. Aínda que con relación á determinación da cientificidade das teorías os enunciados observacionais do Neopositivismo e os básicos de Karl Popper desempeñen papeis similares, o status que os neopositivistas, en concreto rudolf Carnap, asignaron aos enunciados observacionais é enteiramente distinto do que lles vai asignar Karl Popper aos básicos. Para rudolf Carnap os enunciados observacionais constituían o fundamento último do noso coñecemento, xa que o seu valor de verdade viña determinado directamente pola experiencia. Pola contra, para Karl Popper, xa influído polas teorías da Gestalt, os enunciados básicos están cargados teoricamente e aínda que, pola súa proximidade á experiencia, posto que se trata de enunciados singulares existenciais (Popper: 1959, p. 102), son aceptados como non problemáticos pola comunidade científica, non teñen o status de enunciados últimos sobre os que fundamentar un coñecemento absolutamente seguro: «Os sistemas de teorías contrástanse deducindo deles enunciados dun nivel máis baixo de universalidade. Estes enunciados, á súa vez, posto que van ser contrastables intersubxectivamente, teñen que ser contrastables do mesmo xeito, e así ad infinitum» (Popper: 1959, p. 47) (p. 37 da traducción). Destas palabras de Karl Popper parece que debería seguirse que o proceso de contrastación conduce a un regreso sen fin e así sería se o que buscamos é un fundamento último ao noso coñecemento, pero na formulación epistemolóxica de Karl Popper o edificio enteiro 34 prólogo Juan vázquez sánchez do noso coñecemento é conxectural e o realmente importante radica en que sempre poida ser sometido ao tribunal da experiencia, representada neste caso polos enunciados básicos, aceptados convencionalmente pola comunidade científica como non problemáticos nun momento dado da súa historia: «A base empírica da ciencia obxectiva non ten, logo, nada de 'absoluto'. A ciencia non descansa sobre bases de rocha. A atrevida estrutura das súas teorías érguese, por dicilo así, sobre unha braña. É coma un edificio ergueito sobre uns piares. Os piares espétanse desde arriba na braña, pero sen atopar apoio en base natural ou 'dada'; e cando deixamos de intentar espetalas ata un estrato máis fondo, non é porque xa atoparamos base firme. Paramos simplemente cando nos conformamos con que os piares sexan suficientemente firmes para aguantar a estrutura, polo menos de momento» (Popper: 1959, p. 111) (p. 96 da traducción). En definitiva, que os enunciados básicos que interveñen como premisas nunha inferencia falsadora non teñen outro fundamento que o que lles proporciona o ser aceptados como non problemáticos pola comunidade científica nun momento histórico determinado. Pero, a diferenza do que acontece no convencionalismo de Pierre Duhem, para Karl Popper o convencionalismo non se estende ás conxecturas teóricas senón única e exclusivamente á base empírica proporcionada polos enunciados básicos e que, pola súa proximidade á experiencia, non deben orixinar problemas. 3.2 O problema da demarcación no marco do seu anti-indutivismo falsacionista Se sumamos ao conxunto de teses compartidas por Karl Popper e os principais membros do Círculo de Viena o feito de que Karl Popper publicase a súa primeira obra, A lóxica da descuberta científica, na mesma colección da editorial Springer na que o estaban facendo os membros do Círculo e sempre Entre os intereses de Popper estaba a teoría da relatividade de Einstein, que aparece na imaxe en 1921 36 prólogo Juan vázquez sánchez en diálogo permanente con eles, non é de estrañar que, nun principio, ata a publicación en lingua inglesa en 1959 desta a súa primeira obra fundamental, Karl Popper fose considerado como un representante máis do movemento neopositivista, por máis que Karl Popper nunca chegase a formar parte do Círculo de Viena. Con todo, e a pesar de tantos puntos en común, o seu anti-indutivismo falsacionista dá lugar a unha concepción da epistemoloxía e a metodoloxía da ciencia moi distinta á representada pola formulación indutivista e verificacionista do Neopositivismo. Karl Popper que, como xa se indicou en páxinas atrás, traballara profundamente a David hume, está enteiramente de acordo con el en que non existe, nin parece que poida existir, unha xustificación lóxica para a indución nin tampouco para o seu substituto a «probabilidade», proposto por reichenbach; iso é o que se nos recorda no primeiro parágrafo d'A lóxica da descuberta científica. Pero, ao mesmo tempo, Karl Popper, como xa se indicou tamén, discrepaba do recurso psicolóxico á indución que facía David hume para dar conta do noso hábito ou tendencia a crer en certo tipo de regularidades como as expresadas polas leis científicas. ás leis científicas non se chega a través da repetición frecuente, como propoñen os indutivistas, senón que estas son formuladas «a priori». Somos nós os que, dun xeito «a priori», tratamos de impor regularidades ao mundo e é só a partir desas ideas previas como chegamos a descubrir similaridades no mundo e interpretalas en función das regularidades previamente establecidas. hai nesta explicación da aprendizaxe de Karl Popper un certo deixe kantiano, pero cunha diferenza de matiz importante. As regularidades «a priori» non teñen carácter de necesidade, senón que son conxecturas ou hipóteses que proxectamos sobre o mundo e que poden ser descartadas sempre que a experiencia mostre que estamos equivocados. 37 a lóxida da descuberta científica Nesta explicación da aprendizaxe e desenvolvemento do coñecemento segundo a teoría do ensaio e erro, de conxecturas e refutacións, está implicada a idea de falsación. Dúas ideas, como xa vimos anteriormente, que xurdiron por separado na mente de Karl Popper, a da falsación e a da non validez lóxica da indución, preséntanse n'A lóxica da descuberta científica como complementarias, dando lugar ao trazo máis característico e definitorio da súa metodoloxía e teoría do coñecemento, o seu anti-indutivismo falsacionista. De acordo co seu criterio de falsación unha teoría é científica se é susceptible de ser falsada, se dela en conxunción con certas condicións iniciais podemos deducir enunciados básicos que poden contradicir certos enunciados básicos aceptados pola comunidade científica como válidos. E de acordo co seu anti-inductivismo, no caso de que unha teoría saia indemne dun proceso de contrastación, non por iso poderemos concluír que a teoría é verdadeira ou máis ou menos probable. A falsación pode mostrar que unha teoría é falsa pero non pode sacala nunca do seu status conxectural ou hipotético. Por medio de inferencias puramente deductivas podemos inferir, a partir da verdade de enunciados singulares, a falsidade de enunciados universais pero nunca a verdade de enunciados universais. Para dicilo coas súas propias palabras: «Eu creo que teremos que nos afacer á idea de que non se debe considerar a ciencia como un 'corpo de coñecementos', senón como un sistema de hipóteses, isto é, un sistema de conxecturas ou anticipacións que en principio non poden ser xustificadas, mais coas que traballamos sempre que superen probas de contraste, pero das cales nunca poderemos dicir xustificadamente que sabemos que son 'verdadeiras', nin 'máis ou menos certas', nin sequera 'probables'» (Popper: 1959, p. 317) (p. 254-255 da traducción). Este é o punto no que o problema da indución áchase estreitamente relacionado co da demarcación. En realidade, para Karl Popper non existe ningún problema da indución, este quedou 38 prólogo Juan vázquez sánchez disolto, porque o método segundo o que opera a ciencia non é o indutivo senón o hipotético dedutivo. Na aplicación do criterio de falsación, non se presupón a validez da lóxica indutiva, senón unicamente as transformacións tautolóxicas da lóxica dedutiva, o modus tollens, do que a súa validez non se pon en dúbida (Popper: 1959, p. 42). un punto máis que afasta a Karl Popper das formulacións epistemolóxicas neopositivistas radica en que, aínda que é certo que Karl Popper propón a falsabilidade n'A lóxica da descuberta científica como un criterio de demarcación científica alternativo ao criterio verificacionista, os neopositivistas propuxeron o seu criterio de verificación non só como criterio de demarcación senón tamén como criterio de sentido, mentres que Karl Popper propón a falsabilidade única e exclusivamente como criterio de demarcación: «A falsabilidade distingue entre dous tipos de enunciados con perfecto sentido: os falsables e os non falsables. Traza unha liña dentro da linguaxe con sentido, non ao seu redor» (Popper: 1959, p. 40, nota *3) (p. 30, nota *3 da traducción). Isto fai que Karl Popper poida caracterizar de non científica á metafísica, por non ser falsable, sen que por iso teña que verse obrigado a tachala de carente de sentido, como facían os membros do Círculo de Viena. Para Popper a especulación é necesaria na investigación científica, sen especulación non habería ciencia, pero as especulacións que non son falsables son metafísicas. Fronte ao criterio de verificación o de falsación presenta, ademais, a vantaxe de non deixar fora do ámbito da ciencia aos enunciados universais. Nunha aplicación estrita do criterio de verificación as leis científicas, que son enunciados universais, terían que ser caracterizadas como non científicas, xa que ningún enunciado universal se segue loxicamente dun conxunto finito e consistente de enunciados observacionais e, polo tanto, non serían verificables; pola contra, co criterio de falsación popperiano as leis científicas non terían que ser excluídas do 39 a lóxida da descuberta científica ámbito da ciencia, xa que poden ser falsadas, polo simple feito de que un enunciado universal sempre pode ser falsado á luz dun enunciado singular que o contradiga. O enunciado universal «todos os gatos son pardos» é incompatible con calquera enunciado singular que afirme a existencia dun gato que non é pardo. Ao desligar a noción de sentido da de demarcación, Karl Popper salva tamén moitas das obxeccións que hempel formula en contra do criterio de verificación neopositivista en «Problems and Changes in the Empiricist Criterion of Meaning» (hempel: 1950). Aínda que é certo que no texto citado hempel fai extensivas tamén esas críticas ao criterio de falsación, esa extensión só é lexítima na medida na que interpretemos o criterio de falsación tamén como criterio de sentido. É dicir, as críticas de hempel afectan non ao criterio de falsación popperiano como tal senón ao uso que del fixeron os neopositivistas, ao interpretalo non só como criterio de demarcación senón tamén como criterio de sentido, unha interpretación ou uso co que Karl Popper se mostrou sempre en desacordo (Popper: 1959, p. 40, nota *3 e p. 311). 3.3 A falsación como criterio de racionalidade científica A falsabilidade, ademais de como criterio de demarcación, opera tamén en Karl Popper como criterio de racionalidade científica. Aínda que sempre cabe a posibilidade de salvar unha teoría que foi falsada, introducindo algún suposto auxiliar, reinterpretando ad hoc a teoría de tal modo que escape á refutación ou mediante algún outro tipo de argucias, como non aceptar os resultados da experimentación, este tipo de estratexias están prohibidas na formulación falsacionista de Karl Popper. unha vez que unha teoría foi falsada esta debe ser abandonada ou modificada mediante a introdución dalgunha hipótese auxiliar 40 prólogo Juan vázquez sánchez que non sexa ad hoc. É dicir, a teoría resultante da introdución desa hipótese non só permitirá á teoría escapar da refutación senón que ademais debe supor un incremento no noso coñecemento do mundo. Dalgún modo n'A lóxica da descuberta científica Karl Popper está dando por suposto que se unha teoría foi falsada e non é posible salvala da falsación mediante a introdución dalgunha hipótese ou supostos auxiliares que incrementen a súa capacidade explicativa, a teoría debe ser abandonada. De non facelo así, estaríase procedendo dun xeito irracional. É evidente que unha falsación supón un problema para unha teoría, un problema que, na medida do posible, debe ser resolto. Pero como argumentaron desde a historia da ciencia Thomas Kuhn, Paul Feyerabend e ata Imre lakatos, un dos máis fieis seguidores de Karl Popper, se os científicos tivesen que proceder de acordo con ese criterio de racionalidade tan estrito de Karl Popper, quedariámonos sen ningunha teoría, porque non hai teoría que non sexa falsada non unha senón unha chea de veces ao longo do seu desenvolvemento. Polo demais, como coinciden tamén en afirmar non só os autores citados senón tamén outros moitos filósofos da ciencia, a avaliación das teorías científicas é sempre comparativa. No proceso de contrastación dunha teoría non só intervén a teoría en cuestión e os enunciados básicos ou posibles falsadores da teoría, como supuxo Karl Popper, senón sempre dúas ou máis teorías e os seus posibles falsadores, de tal modo que unha teoría t1 dáse por falsada única e exclusivamente cando se dispón dunha teoría alternativa t2 que é considerada como mellor para a resolución dos problemas científicos aos que nese momento a comunidade científica vese enfrontada. En definitiva, que a falsación como criterio de racionalidade científica non opera dun modo tan estrito como Karl Popper deu a entender. á fin e ao cabo, sempre é mellor vivir nunha casa con pingueiras (cunha teoría falsada) que non ao ceo descuberto. En calquera caso, por máis que logo de case medio século de historia da filosofía da ciencia se chega á conclusión de que o intento neopositivista e popperiano de establecer un criterio de demarcación e racionalidade científica foi un intento fallido, non deixa de ser certo que a contrastación empírica e a posibilidade de ser falsadas é unha propiedade característica das teorías científicas, por máis que esa propiedade non sexa una propiede definitoria, como pretendeu Karl Popper. 3.4 O status epistemolóxico das teorías científicas Como xa dixemos tantas veces, co seu rexeitamento da indución e a proposta da falsabilidade como criterio de demarcación Karl Popper estableceu as bases nas que se fundamenta toda a súa epistemoloxía. Para el, do mesmo xeito que para os membros do Círculo, o coñecemento científico é, e pretende ser, un coñecemento do mundo; pero mentres que para o Positivismo lóxico en xeral o protagonismo dese coñecemento correspondía aos «enunciados protocolares» ou «observacionais», para Karl Popper o verdadeiro protagonista sono as teorías. «As ciencias empíricas son sistemas de teorías», dísenos ao comezo do capítulo III d'A lóxica da descuberta científica, e, unhas liñas despois, prosegue: «As teorías son redes que se lanzan para pescar o que chamamos 'o mundo': para racionalizalo, explicalo e dominalo. Centramos os nosos esforzos en facer a malla cada vez máis fina» (Popper: 1959, p. 59) (p. 45 da traducción). O edificio do coñecemento non se constrúe indutivamente, paso a paso, tomando como punto de partida a súa base observacional. O punto de partida constitúeno os problemas (P), pero as tentativas teóricas (TT) que construímos para explicalos son o realmente importante. Desprovistos delas achariámonos fronte ao mundo na mesma situación na que pode atoparse ante un libro alguén a quen non se lle ensinou a ler. hai un mundo que ler e ao que en definitiva teremos que acudir, pero non para aprender a ler, senón tan só para saber que as nosas historias 42 prólogo Juan vázquez sánchez sobre el teñen unha base real. E cando esa base non é a que esperabamos porque, a través dunha falsación, o mundo dixo non a unha das nosas fabulacións, debemos modificar esa hipotética historia a fin de que a lectura dos feitos e o que as nosas historias (as teorías) nos din deles deixen de contradicirse. Agora ben, no proceso de contrastación poden ocorrer dúas cousas, ou ben que o sistema teórico en cuestión resulte falsado, nese caso o código de honestidade científica propugnado por Karl Popper esixe, como xa vimos, que se lle rexeite na súa actual formulación, ou ben que o sistema saia indemne da contrastación empírica, nese caso só poderemos dicir del que, polo momento, mostrou a súa firmeza, pero non que é verdadeiro. Por moitas que sexan as probas experimentais ás que foi sometida unha teoría e por moi incólume que saia de todas elas, sempre manterá como un estigma o seu carácter hipotético ou conxectural. Se, como mantén Karl Popper, non hai unha xustificación lóxica para a indución, entón nunca poderemos inferir a verdade das nosas teorías, por moitas e moi duras que sexan as probas das que saíron indemnes nos procesos de contrastación. Ese carácter puramente conxectural, con relación á súa verdade, inherente a toda teoría científica, pode, en principio, levarnos a pensar que o máis coherente por parte de Karl Popper fose, talvez, atribuír ás teorías científicas un valor puramente instrumental. Se ofrecer unha explicación dun acontecemento non é outra cousa que deducir un enunciado singular que o describe, utilizando como premisas da dedución, por unha banda, as leis universais da teoría e, por outra, certos enunciados singulares nos que se recollen as condicións iniciais do acontecemento (Popper: 1959, p. 59), por que, como fixo Schlick, seguindo a Wittgenstein, non considerar ás leis universais da ciencia como simples «regras» ou conxunto de «instrucións» para a derivación dos enunciados singulares ou básicos dos que dá conta a teoría? 43 a lóxida da descuberta científica Popper propuxo o método do ensaio e erro fronte ás explicacións indutivistas da aprendizaxe de hume (na imaxe, por Allan ramsay) 44 prólogo Juan vázquez sánchez De acordo coa formulación de Karl Popper, parecería lóxico pensar que se «as teorías son redes que se lanzan para pescar o que chamamos 'o mundo'» ou, como se nos di en «Tres concepcións sobre o coñecemento humano»: «as teorías son as nosas propias invencións, as nosas propias ideas; non nos son impostas desde fóra, senón que son os nosos instrumentos de pensamento forxados por nós mesmos» (Popper: 1963, p. 117), o que está en perfecta coherencia coa súa actitude anti-indutivista, entón, repito, parecería lóxico pensar que Karl Popper se inclinase tamén por unha interpretación instrumentalista das teorías. Non é ese, con todo, o seu punto de vista porque, na súa opinión, «algunhas desas teorías nosas poden chocar coa realidade; e cando isto sucede, sabemos que hai unha realidade; que hai algo que nos recorda o feito de que as nosas ideas poden ser equivocadas. E é por isto polo que o realista ten razón» (Popper: 1963, p. 117). Non sei se Karl Popper está no certo, se o seu anti-indutivismo falsacionista ten que desembocar necesariamente nunha defensa do realismo ou, pola contra, é igualmente compatible cunha interpretación instrumentalista das teorías científicas. Declararse instrumentalista con relación ao status ontolóxico das teorías non implica, nin moito menos, que teñamos que negar a existencia desa realidade experimental en base á cal Karl Popper vai argumentar a favor do seu realismo científico crítico. No entanto, é evidente que o realismo de Karl Popper non debe ser confundido cun realismo metafísico ou «esencialismo», como el o designa. O realismo científico crítico de Karl Popper conserva do esencialismo a idea de que a ciencia aspira a unha descrición verdadeira do mundo ou dalgúns dos seus aspectos e combina ese punto de vista coa concepción non esencialista de que, aínda que ese segue sendo o obxectivo do científico, este nunca pode chegar a saber con certeza se a súa descrición é verdadeira, aínda que ás veces si pode demostrar con razoable 45 a lóxida da descuberta científica certeza que unha teoría é falsa. Para terminar dicíndoo coas súas propias palabras, o realismo científico crítico ou «terceira concepción», como el a designa en «Tres concepcións sobre o coñecemento humano», caracterízase por manter que as teorías científicas «son xenuínas conxecturas, suposicións de alto contido informativo sobre o mundo, as cales, aínda que non son verificables (é dicir, aínda que non é posible demostrar que son verdadeiras), poden ser sometidas a severos tests críticos. Son intentos serios por descubrir a verdade» (Popper: 1963, p. 115). 3.5 A tese do terceiro mundo Aínda que «o mundo 3» ou «terceiro mundo» é un invento relativamente tardío de Karl Popper, froito tal vez dun celo excesivo por defender a obxectividade da ciencia fronte a certos visos de irracionalidade e relativismo epistemolóxico, xurdidos na década dos anos sesenta, a postulación do mundo 3 non está en absoluto en contradición co resto do seu pensamento; como máximo, o máis que poderiamos dicir en contra da súa aparición no seo da epistemoloxía popperiana é o exceso de obxectividade, autonomía e ata realismo co que Karl Popper o presenta. No seu relatorio de 1967, «Epistemoloxía sen suxeito cognoscente», Karl Popper comeza por indicarnos que «sen tomar demasiado en serio as palabras 'mundo' ou 'universo', podemos distinguir os tres mundos ou universos seguintes: primeiro, o mundo dos obxectos físicos ou dos estados físicos; en segundo lugar, o mundo dos estados de conciencia ou dos estados mentais ou, quizá, das disposicións comportamentais á acción; e en terceiro lugar, o mundo dos contidos de pensamento obxectivos, especialmente, dos pensamentos científicos e poéticos e das obras de arte» (Popper: 1972, p. 106). Coa distinción entre os tres mundos Karl Popper non está introducindo unha ontoloxía que non estivese xa presente na súa obra anterior, nin tan sequera unha nova epistemoloxía, 46 prólogo Juan vázquez sánchez pero si que nos vai permitir observar con máis nitidez cales eran estas e de que xeito se foron radicalizando. A distinción entre os tres mundos cumpre agora varias finalidades: por unha banda, permítelle situar as teorías científicas e outras entidades culturais producidas polo home no mundo 3, asignándolles un certo grao de obxectividade e autonomía fronte aos seus creadores, os seres humanos; por outra, coa postulación dun mundo 1 absolutamente independente aposta por un realismo ontolóxico forte; e, para rematar, bríndalle a posibilidade de levar a cabo a defensa dunha epistemoloxía non relativista, centrada no estudo das obxectividades do mundo 3. De feito, entre os inquilinos máis sobresalientes do mundo 3 atópanse as teorías, con todos os problemas, argumentos críticos e situacións problemáticas por elas expostos, e o que agora Karl Popper nos vai dicir, e no que vai facer especial fincapé, é en que a epistemoloxía ou lóxica do coñecemento debe ocuparse do estudo das obxectividades do mundo 3 e non dos procesos mentais ou de conciencia adscritos ao mundo 2, pero isto mesmo xa nolo dixo n'A lóxica da descuberta científica. Entón, igual que agora, Karl Popper xa mantiña que «a etapa inicial», «o acto de concibir ou inventar unha teoría» podía ser de grande interese para a psicoloxía empírica pero carecía de importancia para a análise lóxica do coñecemento científico (Popper: 1959, pp. 31-32). A súa epistemoloxía centrouse sempre no contexto de xustificación, no estudo das entidades do mundo 3, o que a ela lle compete é someter a análise crítica a validez ou xustificación das teorías, pero só unha vez que estas foron propostas. Neste sentido, pois, a aparición do «terceiro mundo» ou «mundo 3» na súa obra, a finais da década dos anos sesenta, non implica rotura ningunha co seu pensamento anterior, senón a máis absoluta continuidade. Para rematar, e a modo de introdución ao tema do desenvolvemento científico, cabería indicar que para Karl Popper o desenvolvemento do coñecemento ten lugar a través dun 47 a lóxida da descuberta científica proceso ininterrompido de interacción entre nós e o mundo 3. un proceso que ten como obxectivo final representar, a nivel do mundo 3, cada vez con máis éxito o noso primeiro mundo. O papel que neste proceso corresponde ao mundo 2 é o de servir de ponte entre os mundos 1 e 3 que, doutro xeito, permanecerían incomunicados. 3.6 Desenvolvemento científico e verdade á hora de expor o tema do desenvolvemento científico en Karl Popper considero que é necesario distinguir algo así como dúas etapas no seu pensamento, aínda que as diferenzas entre unha e outra sexan tan só de matiz. A primeira delas correspondería ao Popper d'A lóxica da descuberta científica e a segunda ao que, a falta dun nome mellor, poderiamos designar como Popper tarskiano. N'A lóxica da descuberta científica Karl Popper aborda o problema do desenvolvemento científico no marco do seu anti-indutivismo falsacionista, pero sen comprometerse explicitamente con ningún concepto de verdade. Como el mesmo confesará máis tarde: «antes de coñecer a teoría da verdade de Alfred Tarski, parecíame máis seguro e máis económico discutir o criterio de progreso sen penetrar moi profundamente no controvertido problema vinculado co uso da palabra 'verdade'» (Popper: 1963, p. 223). É dicir, xa n'A lóxica da descuberta científica déixase traslucir por parte de Karl Popper unha aceptación implícita do concepto de verdade como correspondencia, sobre todo naqueles momentos nos que se indica que a ciencia, ademais de ser un instrumento útil, ten como unha das súas finalidades máis importantes a procura da verdade; pero, ao mesmo tempo, evítase a aceptación explícita do concepto de verdade como correspondencia cos feitos, ao manter que o único que entra en xogo nunha falsación empírica son, por unha banda, os enunciados teóricos da ciencia e, por outra, os 48 prólogo Juan vázquez sánchez enunciados singulares que interveñen como premisas nunha inferencia falsadora. Non son os feitos os que poñen a proba as teorías senón os «enunciados básicos», aceptados intersubxectivamente como válidos pola comunidade científica. Por aquel entón, Karl Popper estaba no convencemento de que, aínda que se tendeu a pensar con certa frecuencia que as experiencias perceptivas debían proporcionar algo así como unha xustificación dos enunciados básicos, desde un punto de vista lóxico, como é o adoptado por el, «os enunciados só poden xustificarse loxicamente mediante outros enunciados» e, en consecuencia, non pode haber enunciados últimos na ciencia (Popper: 1959, p. 43). Baixo estes supostos non é nada estraño que o mesmo Karl Popper nos diga, case ao final d'A lóxica da descuberta científica, que na lóxica da ciencia que esbozou é posible evitar o uso dos conceptos de verdadeiro e falso, xa que o único que se manexa son relacións de deducibilidade entre enunciados (Popper, 1959, pp. 273-274). Así cando dunha conxectura t e dun conxunto de enunciados singulares b, nos que se expresan as condicións iniciais de experimentación, se segue un «enunciado básico» p, que é aceptado como válido pola comunidade científica, non temos por que dicir que p é verdadeiro, senón simplemente que é unha consecuencia lóxica da conxunción non contraditoria de t e b. En resumo, que o conxunto de enunciados por nós aceptado é coherente. E no caso de que o que se orixinou é unha falsación, tampouco entón estamos obrigados a dicir que t é falsa, senón simplemente que entra en contradición con certo conxunto de enunciados básicos aceptados pola comunidade científica. Desde este punto de vista, e dando por suposto que non é asumible racionalmente un conxunto de enunciados contraditorios, o único modelo de desenvolvemento científico que se segue necesariamente d'A lóxica da descuberta científica viría determinado pola procura ininterrompida dun sistema de conxecturas ou teorías que dea conta de e, ao mesmo tempo, sexa consistente con, o conxunto de enunciados básicos aceptados como non problemáticos. Atopámonos, pois, cun modelo de desenvolvemento científico baseado na eliminación de erros, do que a meta final, no caso de que puidese alcanzarse, non tería por que interpretarse como a procura da verdade, entendida nun sentido obxectivo ou de correspondencia cos feitos, senón simplemente como a procura dun sistema coherente de conxecturas teóricas explicativas e «enunciados básicos» aceptados. No entanto, a tese que mantén Karl Popper non é exactamente esta. rexeita efectivamente que o avance da ciencia poida explicarse como un proceso acumulativo de coñecementos: «O aumento do coñecemento -ou o proceso de aprendizaxe- non é un proceso repetitivo ou acumulativo, senón de eliminación de erros» (Popper: 1972, p. 142), pero mantén que mediante a eliminación de erros ou, se se prefire, mediante a eliminación das sucesivas conxecturas que lanzamos sobre o mundo e baseándonos nas cales interrogamos á natureza, camiñamos na procura de teorías non só máis útiles, senón tamén máis verdadeiras, aínda que nunca poidamos chegar a ter a certeza de que a teoría que foi máis corroborada non poida ser invalidada nun tempo posterior. En síntese, o desenvolvemento do coñecemento podería ser representado mediante o seguinte diagrama, proposto por Karl Popper: P1 →TT → EE → P2 . . . E no que P1 representa un problema, partimos sempre de problemas, TT unha tentativa ou conxectura teórica, EE a eliminación de erros e P2 un novo problema co que se volve iniciar o proceso e así indefinidamente. N'A lóxica da descuberta científica, Karl Popper evita facer uso do concepto de verdade como correspondencia cos feitos, porque, lle parecía inútil tratar de comprender claramente esa idea estrañamente esquiva dunha correspondencia entre un 50 prólogo Juan vázquez sánchez enunciado e un feito (Popper, 1963: p. 223). Con todo, o concepto de verdade como correspondencia está xa implícito nesa a súa primeira obra fundamental e é o que, unido á súa epistemoloxía falsacionista, dá lugar a esa concepción do desenvolvemento do coñecemento como un proxecto ininterrompido de aproximación á Verdade. Polo que se refire á súa obra posterior, ao que aquí denominamos como Popper tarskiano, o que realmente se vai producir é unha aceptación explícita do concepto de verdade como correspondencia e, en consecuencia, unha radicalización da súa interpretación do desenvolvemento científico como un proxecto medible de aproximación á Verdade, a unha verdade que non dubidará en cualificar de absoluta e obxectiva. Segundo Karl Popper, «a gran realización de Tarski e a verdadeira importancia da súa teoría para a filosofía das ciencias empíricas reside no feito de que restableceu unha teoría da correspondencia da verdade absoluta ou obxectiva, que se volvera sospeitosa» (Popper: 1963, p. 223). É cando menos problemático que o concepto de verdade que Tarski define para as linguaxes formais poida aplicarse sen máis ás linguaxes naturais, nas que non é fácil distinguir entre linguaxe obxecto e metalinguaxe. Por outra banda, non é menos problemático que o concepto de verdade proposto por Tarski poida interpretarse como unha definición da verdade como correspondencia entre enunciados e feitos. E, por se isto fose pouco, a definición de verdade de Tarski é só iso, unha definición do concepto de verdade, pero o que en absoluto proporciona Tarski é un criterio de verdade; con todo, Karl Popper non dubida en afirmar unha e outra vez, con estas ou outras palabras, que acepta «a teoría do sentido común (defendida e refinada por Alfred Tarski) segundo a cal a verdade é a correspondencia cos feitos (ou coa realidade) ou, máis exactamente, unha teoría é verdadeira se e só se corresponde cos feitos» (Popper, 1972: p. 44). 51 a lóxida da descuberta científica Por máis de dúas décadas e ata que se retirou da vida académica activa en 1969, Popper foi profesor na london School of Economics da universidade de londres 52 prólogo Juan vázquez sánchez Agora que Karl Popper aceptou explicitamente, con fundamento ou sen el, o concepto de verdade como correspondencia xa podemos comprender perfectamente a súa interpretación do desenvolvemento científico como un proxecto de aproximación á Verdade, á que se tende non pola acumulación de coñecementos, senón mediante a eliminación daquelas conxecturas sobre o mundo que se mostraron erróneas ou cun contido empírico menor que o das súas competidoras. Con todo, na súa explicación do desenvolvemento científico, o Popper tarskiano vai aínda máis lonxe, non só se limita a dicirnos que «todo aumento de coñecemento consiste no perfeccionamento do coñecemento existente que se modifica coa esperanza dunha maior aproximación á verdade» (Popper: 1972, p. 71), senón que ademais cre que pode ofrecernos un criterio de progreso en base a unha combinación dos conceptos de verdade e falsidade co de contido. un criterio de progreso que, á vez, funciona como criterio de elección racional entre teorías. Polo que ao contido se refire, evidentemente, son preferibles as teorías que nos ofrecen unha cantidade maior de información ou contido empírico, o que está en perfecta consonancia co seu criterio de falsabilidade. Se o que distingue ás ciencias empíricas da metafísica é a súa falsabilidade potencial, non cabe a menor dúbida de que, aínda dentro das ciencias empíricas, será máis falsable e, polo tanto, máis empírica aquela teoría que, pola gran cantidade de información que nos proporciona, ten en principio máis posibilidades de ser falsada. Se a teoría t1 só prohibe os fenómenos a e b, mentres que a teoría t2, ademais de prohibir a e b, tamén prohibe c, debemos concluír que o contido empírico de t2 é maior que o de t1 e, en consecuencia que, desde o punto de vista do contido, t2 é preferible a t1. Se agora combinamos a noción de contido coas de verdade e falsidade, teriamos que dicir que o contido verdadeiro dunha teoría calquera t (en símbolos, CtV (t) ) vén determinado pola clase de todas as consecuencias lóxicas verdadeiras e non tau53 a lóxida da descuberta científica Popper en 1990 54 prólogo Juan vázquez sánchez tolóxicas de t e o seu contido de falsidade (en símbolos, CtF (t) ) pola clase de todas as súas consecuencias falsas, e, á súa vez, o grao de «verosimilitude» ou de «aproximación á verdade» de t (en símbolos, Vs (t)), pola diferenza entre os contidos de verdade de t e os contidos de falsidade de t : Vs(t) = CtV(t) CtF(t) (Popper: 1963, p. 234). É obvio que coa súa definición cualitativa de verosimilitude, en termos de verdade e contido, Karl Popper quixo ofrecernos un criterio co que avaliar teorías en función da sua maior ou menor aproximación á verdade absoluta e obxectiva, á que debe tender o desenvolvemento científico, e, efectivamente, no capítulo 10 de Conxecturas e refutacións propón o seguinte criterio co que poder decidir de entre dúas teorías t1 e t2 cal delas é máis verosímil ou se achega máis á Verdade: Supoñendo que sexan comparables os contidos de verdade e os contidos de falsidade de dúas teorías t1 e t2, podemos dicir que t2 é máis semellante á verdade ou corresponde mellor aos feitos que t1 se e só se (a) o contido de verdade, pero non o contido de falsidade, de t2 é maior que o de t1, ou (b) o contido de falsidade de t1, pero non o seu contido de verdade, é maior que o de t2 (Popper:1963: p. 233). Con todo, non é menos certo que poucos conceptos orixinaron tanta polémica no seo da filosofía da ciencia como a súa noción de verosimilitude, tanto na súa formulación cualitativa como cuantitativa que aquí deixamos de lado. En primeiro lugar, o criterio de progreso científico formulado por Karl Popper xa non sería aplicable no caso de que as teorías t1 e t2 fosen inconmensurables, como manterá T. Kuhn que acontece no caso das revolucións científicas. En segundo lugar, como demostrou P. Tichy, para calquera dúas teorías falsas diferentes t1 e t2 (e para Karl Popper todas o son potencialmente) é imposible demostrar que t1 teña menos verosimilitude que t2, xa que de cada un dos dous membros da disxunción do criterio anterior de verosimilitud, no caso de que as dúas teorías poidan ser falsas, é posible inferir unha contradición (Tichy, 1974, pp. 155-160). En terceiro lugar, como argumentará Newton-Smith, calesquera dúas teorías minimamente interesantes permitirán inferir cada unha un número infinito de asertos empíricos e aínda ninguén foi capaz de inventar unha medida para asignar magnitudes a conxuntos infinitos de asertos empíricos ou enunciados (NewtonSmith, 1981, p. 69). Con todo, é necesario recoñecer que a figura de Karl Popper, encarnada n'A lóxica da descuberta científica, foi e segue sendo un dos fitos máis relevantes no desenvolvemento da filosofía da ciencia do século vinte. Bibliografía 1. Fontes máis relevantes PoPPer, K. r. (1934): Logik der Forschung, Viena, Springer. (Vers. ingl. revisada: The Logic of Scientific Discovery, london, hutchinson, 1959). (vers. cast. da vers. inglesa: La lógica de la investigación científica, Tecnos, Madrid, 1962). (1945): The Open Society and Its Enemies, london, routledge and Kegan Paul. (vers. cast.: La sociedad abierta y sus enemigos, Paidós, Buenos Aires, 1982). (1957): The Poverty of Historicism, routledge and K. Paul, london (vers. cast.: La miseria del historicismo, Alianza Ed. Madrid, 1963). (1963): Conjectures and refutations: the Growth of Scientific Knowledge, london, routledge and Kegan Paul. (5a. edición revisada 1989) (vers. cast.: El desarrollo del conocimiento científico. Conjeturas y refutaciones, Paidos, Buenos Aires, 1967). (1970): «Normal Science and Its Dangers», en lakatos, I y Musgrave: Criticism and the Growth of Knowledge, Cambridge, Cambridge university Press, pp. 51-58 (vers. cast.: «la ciencia normal y sus peligros», en La crítica y 56 prólogo Juan vázquez sánchez el desarrollo del conocimiento, Barcelona, Grijalbo, 1975, pp.149-158). (1971): «replies to my Critics», en P. A. SChIlPP (ed.), 1971, vol. II. pp. 961-1197. (1972): Objective Knowledge, Oxford, Clarendon Press. (vers. cast.: Conocimiento objetivo, Madrid, Tecnos, 1974). (1974): «Intellectual Autobiography», en P. SChIlPP (ed.). Edición revisada: POPPEr, K. (1976): Unended Quest. An Intellectual Autobiography, la Salle, Illinois, Open Court. (vers. cast.:Búsqueda sin término. Una autobiografía intelectual, Madrid, Tecnos, 1977). (1976): «A Note on Verisimilitude», en British Journal for the Philosophy of Science, 27, pp. 147-159. (1979): Truth, Rationality and the Growth of Scientific Knowledge, Bonn, Klostermann. (1979): Die beiden Grundprobleme der Erkenntnistheorie, Mohr, Tubinga (vers.cast.: los dos problemas fundamentales de la epistemología, Tecnos, Madrid, 1998) (1983a): Postcript to the Logic of Scientific Discovery. I. Realism and the Aim of Science (ed. de W.W. Bartley, III), london hutchinson. (vers. cast.: Post Scriptum a la lógica de la investigación científica, Vol. I: Realismo y el objetivo de la ciencia, Madrid, Tecnos, 1985). (1983b): Postcript to the Logic of Scientific Discovery.II: The Open Universe. An Argument for Indeterminism, london, hutchinson. (vers. cast.: Post Scriptum a la lógica de la investigación científica, Vol.II: El universo abierto. Un argumento en favor del indeterminismo, Madrid, Tecnos, 1986). (1983c): Postscript to the Logic of Scientific Discovery, III: Quantum Theory and the Schism in Physics, london, hutchinson. (vers. cast.: Post Scriptum a la lógica de la investigación científica, V.III. Teoría cuantica y el cisma en Física, Madrid, Tecnos, 1985). 57 a lóxida da descuberta científica (1984): «Evolutionary Epistemology», en POllArD, J. (ed.) (1984). (1992): In Search of a Better World. Lectures and Essays from thirty Years, london, routledge. (Vers. cast.: En busca de un mundo mejor, Paidós, Barcelona, 1994). (1994a): Knowledge and the Body-Mind Problem. In Defence of Interaction, london; routledge. (1994b): The Myth of the Framework. In Defence of Science and Rationality, london, routledge.(vers. cast.: El mito del marco, Paidós, Baercelona, 1995) (1994c): Alles Leben ist Problemlösen, Munich, Piper.(vers. ingl.: All Life is Problem Solving, london, routledge, 1999). (Vers. cast.: La responsabilidad de vivir, Barcelona, Piados, 1995). (1995): World of Propensities, Bristol, Thoemmes Press. (vers. cast.: Un mundo de propensiones, Madrid, Tecnos, 1992). (1997): The Lesson of This Century, london, routledge. (1998): The World of Parmenides, london, routledge. (Vers. cast.: El mundo de Parménides. Ensayos sobre la ilustración presocrática, Barcelona, Piados, 1999). PoPPer, C. y J. eCCles (1977): The Self and its Brain, Berlín, Springer-Verlag, 1977. (vers. cast.: El yo y su cerebro, Barcelona, labor, 1980). 2. Bibliografía complementaria aCkerman, r. J. (1976): The Philosophy of Karl Popper, university of Massachusetts Press, Amherst. agassi, J. (1961): «The role of Corroboration in Popper's Methodology», en Australasian Journal of Philosophy, 39, pp. 82-91. (1975): «Verisimilitude: Comment on David Miller», Synthese, V. 30, pp.199-204 (1968): «The Novelty of Popper's Philosophy of Science», Intern. Phil. Quart., 8, pp. 442-463. 58 prólogo Juan vázquez sánchez anDerson, g., FeyeraBenD, P. y grümBaum, A (eds) (1982): Progreso y racionalidad en la ciencia, Alianza Editorial, Madrid. artigas, M. (1979): Karl Popper: Búsqueda sin término, Magisterio Español, Madrid. BouVeresse, r. (1981): Karl Popper, París, J.Vrin. Boyer, m, sanChez De zaVala, V. y sChwartz, P.(eds.) (1970): Simposio de Burgos: Ensayos de filosofía de la ciencia en torno a la obra de Sir K.R.Popper, Madrid, Tecnos. Bunge, M. (ed.) (1964): The Critical Approach to Science and Philosophy: In Honour of K. Popper, New York; The Free Press of Glencoe. Burke, T. E. (1983): The Philosophy of Karl Popper, Manchester, Manchester university Press. Cohen, r. s., P. k. FeyeraBenD y M. W. wartoFsky (eds.) (1976): Essays in Memory of I. Lakatos, Dordrecht, reidel. Currie, G., y musgraVe, A. (eds.) (1985): Popper and the Human Sciences, Dordrecht, M. Nijhoff. Chalmers, P. (1973): «On learning from our Mistakes», Brit. J. Phil. Sc.,24, 1973. eCheVarria, J. r. (1970): El criterio de falsabilidad en la epistemología de Karl Popper, Ed. García del Toro, Madrid, 1970. FeyeraBenD, P. K. (1981): Problems of Empiricism. Philosophical Papers, v. 2, Cambridge, Cambridge university Press. grümBaum, A. (1976): «Is Falsifiability the Touchstone of Scientific rationality?. Karl Popper versus Inductivism» en COhEN, r. S., P. K. FEYErABEND y M. W. WArTOFSKY (eds.) (1976). haCohen, M. h. (2000): Karl PopperThe Formative Years, 1902-1945. Cambridge, Cambridge university Press. harré, r. (ed.) (1975): Problems of Scientific Revolution, Oxford, Clarendon Press. 59 a lóxida da descuberta científica harris, J. h. (1974): «Popper's Definitions of 'verisimilitude'», en British Journal for the Philosophy of Science, 25, pp. 160166. hemPel, C. G. (1950): «Problems and Changes in the Empiricist Criterion of Meaning», en Revue Internationale de Philosophie, Vol. 4, pp. 41-63. reproducido en AYEr, A. (ed.): Logical positivism, Chicago, The Free Press of Glencoe, 1959 (vers. cast.: El positivismo lógico, Fondo de Cultura Económica, México, Madrid, Buenos Aires (1969), pp. 115-136. keuth, h. (1978): «Tarski's Definition of Truth and the Correspondence Theory», en Phil. of Science, 45 , pp. 420430. lakatos, I. (ed.) (1965): The Problem of Inductive Logic, Amsterdam North holland (2a. ed., 1968). (1970): «Falsification and the Methodology of Scientific research Programmes», en I. lAKATOS y A. MuSGrAVE (1970), pp. 91-196. (1974a): «The role of Crucial Experiments in Science», en Studies in History and Philosophy of Science, 4. (vers. cast.: «El papel de los experimentos cruciales en ciencia», en Teorema, 5, 1975). (1974b): «Popper on Demarcation and Induction», en SChIlPP, P. (ed.) (1954): (1976): Proofs and Refutations (ed. de E. Zahar). london, Cambridge university Press. (vers. cast.: Pruebas y refutaciones, Madrid, Alianza, 1978). (1978a): The Methodology of Scientific Research. Philosophical Papers, vol. I (ed. de J. Whorvall y G. Currie), Cambridge, Cambridge university Press. (vers. cast.: La metodología de los programas de investigación científica, Vol. I, Madrid, Alianza, 1981). (1978b): Mathematics, Science and Epistemology. Philosophical Papers. vol. II. Cambridge, Cambridge university Press. 60 prólogo Juan vázquez sánchez (vers. cast.: Matemáticas, ciencia y epistemología, Madrid, Alianza, 1981). lakatos, I. y A. musgraVe (eds.) (1965): Problems in the Philosophy of Science, Amsterdam, North holland (2a ed., 1968). (1970): Criticism and the Growth of Knowledge, Cambridge, Cambridge university Press. (vers. cast.: La crítica y el desarrollo del conocimiento, Barcelona, Grijalbo, 1975). malherBe, J. F. (1979): La Philosophie de Karl Popper et le Positivisme Logique, París, Presses universitaires de France. miller, D. (1974): «Popper's Qualitative Theory of Verosimilitude», en The British Journal for the Philosophy of Science, 25, pp. 166-177. (1978): «The Distance between Constituents», en Synthese, 38, pp. 197-212. newton-smith, W. h. (1981): The Rationality of Science, Boston, routledge & Kegan Paul. (vers. cast.: La racionalidad de la ciencia, Barcelona, Paidos, 1987). niiniluoto, I. (1978b): «Truthlikeness: Comments on recent Dicussion», en Synthese, 38, pp. 281-329. (1979a): «Degrees of Truthlikeness», en British Journal for the Philosophy of Science, 30, pp. 371-376. (1979b): «Verisimilitude, Theory-Change an Scientific Progress», en Acta Philosophica Fennica, xxx (1978), Amsterdam, North holland. (1987): Truthlikeness, Dordrecht, reidel. (1991): «realism, relativism, and Constructivism», en Synthese, 89, pp.135-162. ODDIE, G. (1981): «Verisimilitude reviewed», en British Journal for the Philosophy of Science, 32:3, pp. 237-265. (1986): Likeness to Truth, Dordrecht, reidel O'hEAr, A. (1980): Karl Popper, london, routledge & Kegan Paul. 61 a lóxida da descuberta científica (1989): An Introduction to the Philosophy of Science, Oxford, Clarendon Press. Quintanilla, M. A. (1971): «Formalismo y epistemología en la obra de Karl r. Popper», en Teorema, 4, pp. 77-83. (1972): Idealismo y filosofía de la ciencia. Introducción a la epistemología de K. R. Popper, Madrid, Tecnos. (1973): «Popper y Piaget: dos perspectivas para la filosofía de la ciencia», en Teorema, 3:1, pp. 5-23. riVaDulla, A. (1982): «Verosimilitud, medida y estimación» en Teorema, 12:1-2, pp. 43-59. sChilPP, P. (ed.) (1974): The Philosophy of Karl Popper, la Salle, Illinois, Open Court. swinBurne, r. (1973): An Introduction to Confirmation Theory, london, Methuen. (ed.) (1974): The Justification of Induction, Oxford, Oxford university Press. (vers. cast.: La justificación del razonamiento inductivo, Madrid, Alianza). tiChy, P. (1974): «On Popper's Definitions of Verisimilitude», en British Journal for the Philosophy of Science, 25, pp. 155160. VázQuez, J. (1991): «Progreso científico y verdad», México, Crítica, Vol. xxIII, n.o 69, pp. 101-135. watkins, J.(1982): «El enfoque popperiano del conocimiento científico» en G.rADNITZKY, G. ANDErSON y otros: Fortschritt und Rationalität der Wissenschaft, (vers. cast.: Progreso y racionalidad en la ciencia, Alianza Editorial, Madrid, 1982. raDnitzky, G., y G. anDersson (eds.) (1978-1979): The Structure and Development of Science. Progress and Ratinality in Science. Dordrecht, reidel (2 vols.). (vers. cast.: Estructura y desarrollo de la ciencia, Madrid, Alianza, 1984). (1987): «A note on incongruent counterparts and verisimilitude», en Erkenntnis, 26, 1987, pp. 295-300.

A lóxica da descuberta científica

a lóxida da descuberta científica NOTA DO TRADUTOR Edición manexada Esta tradución galega d'A lóxica da descuberta científica fíxose a partir da versión en lingua inglesa de 1959 do propio Karl Popper (concretamente, manexouse a edición electrónica de 2005 de Taylor & Francis e-library, routledge, que recolle tamén correccións e engadidos posteriores do autor). Todos os textos das citas foron traducidos directamente desta versión inglesa. As referencias bibliográficas das notas remiten igualmente aos textos alemáns e ingleses que cita o autor na devandita versión. O título Dado que se partiu aquí da versión inglesa, que é unha tradución realizada polo propio Popper do orixinal alemán (Logik der Forschung), o título en galego leva a palabra descuberta porque é tradución literal do inglés (The Logic of Scientific Discovery), de xeito análogo ao que fixeron coas traducións ao francés (La logique de la découverte scientifique) e ao italiano (La logica della scoperta scientifica) e en contraste coas versións española (La lógica de la investigación científica) e portuguesa (A lógica da pesquisa científica), que levan investigación ou pesquisa no título talvez por partiren tamén da primeira versión orixinal alemá1. 1 Alemán: Logik der Forschung (Mohr Siebeck, 2005 [1934]), tradución inglesa de Popper: The Logic of Scientific Discovery (Routledge, 1992 [1959]), trad. francesa de N. Thyssen-Rutten e P. Devaux: La logique de la découverte scientifique (Payot, 2007 [1973]), trad. italiana de Mario Trinchero: La logica della scoperta scientifica (Einaudi, 1988), trad. española de Víctor Sánchez Zabala: La lógica de la investigación científica (Tecnos, 1962), trad. portuguesa de L. Hegenberg e O. Silveira da Mora: A lógica da pesquisa científica (São Paulo, Cultrix, 1972). 66 Karl Popper Falsificar e comprobar De entre as solucións de tradución propostas, quero destacar aquí estes dous termos relacionados debido, por un lado, á súa centralidade conceptual no libro e, por outro, a que se escolleron traducións galegas que difiren das que talvez resulten máis familiares para os lectores galegos por influencia da tradución española. Optouse por falsificar (cos seus derivados falsificación, falsificabilidade, falsificador, etc.) para traducir o inglés to falsify (falsification, falsifiability...) porque aquelas son as derivacións regulares en galego do adxectivo falso. O que se propón é simplemente engadirlle unha acepción específica para contextos científicos («comprobar se unha teoría científica é falsa») aos sentidos ordinarios dos termos primitivos («crear copias falsas de moedas, obxectos, etc.»). En lugar deste procedemento que se seguiu aquí para o galego (igual que en francés e italiano), en castelán optaron por cuñar unha familia de derivados de falso (falsar, falsación, falsabilidad, falsador...) específica para o uso científico. Aínda que para a acepción científica esta última familia de formas estea bastante espallada na comunidade científica galega, aquí evitouse por entendermos que o seu uso se debe á influencia da tradución española. Algo semellante ocorre con comprobar e derivados (comprobación, comprobabilidade), que é como se propón aquí traducir o inglés to test (a test, testability), no sentido de «someter a probas unha teoría». A tradución máis obvia do inglés test é proba (probar, probabilidade), opción que se descartou porque tropezaría por un lado con probar (no senso de «demostrar», inglés proof, show) e por outro con probabilidade (inglés probability), que son termos e conceptos tamén abundantemente usados neste libro. Seguramente esta sexa a razón pola que en castelán optaron polas formas contrastar, contraste e contrastabilidad, que son tamén as máis coñecidas entre nós por influencia da tradución española. Aquí evitáronse por entendermos que son usos calca67 a lóxida da descuberta científica dos do castelán; no seu lugar propóñense as formas comprobar, comprobación (ou proba algunhas veces) e comprobabilidade, que evitan tamén os problemas mencionados de posible colisión con outros termos importantes deste texto. Abreviacións Cando no orixinal aparecen termos abreviados con iniciais para seren usados en fórmulas ou ecuacións, en galego intentouse sempre que as abreviacións coincidisen coas iniciais das traducións galegas (ex. p para probabilidade, inglés probability). Así e todo, hai algunha excepción: no apéndice *ix evidence traduciuse por proba(s) pero deixouse a abreviación e porque nese mesmo capítulo aparece a inicial p para o termo probabilidade. Agradecementos Na realización da tradución contraín débeda cunha serie de persoas e quero deixar aquí constancia dela. En primeirísimo lugar quero agradecerlle a Ana Ma Fernández Fernández que me acompañase e me axudase incansablemente nesta coma en tantas outras angueiras. Tamén quero deixar constancia do meu agradecemento a Cibrán Arxibai, Felipe Gago, Antón Santamarina e Juan Vázquez polo seu xeneroso asesoramento sobre cuestións terminolóxicas puntuais da física e as matemáticas.

Cuberta da edición electrónica de 2005 de Taylor & Francis e-library, routledge

á miña muller, que é responsable do rexurdimento deste libro

a lóxida da descuberta científica NOTA SOBRE A TRADUCIÓN INGLESA The Logic of Scientific Discovery é unha tradución de Logik der Forschung, publicada en Viena no outono de 1934 (aínda que alí figura «1935»). A tradución ao inglés foi preparada polo autor, coa axuda do Dr. Julius Freed e de lan Freed. O texto orixinal de 1934 non foi alterado para a tradución. Como é habitual, a tradución é un pouco máis longa que o orixinal. Aquelas palabras e frases para as que non existen equivalentes houbo que as parafrasear. Tamén houbo que dividir e volver a reorganizar as oracións, e isto de xeito máis acentuado cando o texto traducido era xa altamente condensado: cortouse de xeito drástico en moitas ocasións para adaptarse ás esixencias da editorial. Malia isto, o autor decidiu non aumentar o texto nin restablecer as pasaxes cortadas [excepto unhas cantas palabras indicadas entre corchetes ou notas ao pé]. Para actualizar o libro, o autor engadiu novos apéndices e novas notas ao pé. Nalgúns casos simplemente se amplía ou corrixe o texto, pero noutros casos inclúense cambios de opinión por parte do autor ou reformulacións actuais dos seus argumentos. Todo o que se engadiu, tanto os novos apéndices coma as novas notas ao pé, están marcadas cun asterisco e, nos casos en que se ampliaron as notas orixinais, o engadido tamén vai marcado cun asterisco (a non ser que se engada só unha referencia á edición inglesa dun libro citado orixinalmente pola edición alemá). Nestes engadidos marcados con asterisco atoparanse referencias a unha secuela deste volume titulada Postscript to the Logic of Scientific Discovery (en tres volumes). Aínda que se complementan mutuamente, seguen a ser independentes. Débese sinalar tamén que mudou a numeración dos capítulos do presente volume: no orixinal alemán estaban numerados por separado, do i ao ii (parte i) e do i ao viii (parte ii), mentres que agora aparecen numerados do 1 ao 10.

a lóxida da descuberta científica As hipóteses son redes: só pescará aquel que as bote. noValis PREfACIO á PRImEIRA EDICIÓN DE 1934 A idea de que o home, despois de todo, solucionou os seus problemas máis difíciles [...] non lle serve de moito consolo ao entendido en filosofía, pois o que este non pode evitar temer é que a filosofía nunca ha chegar tan lonxe como para formular un problema xenuíno. m. sChliCk (1930) Eu, pola miña parte, sosteño a opinión totalmente contraria e afirmo que sempre que unha discusión alporizada se prolongou durante certo tempo, especialmente no eido da filosofía, o fondo da cuestión non era nunca un problema sobre meras palabras, senón un problema xenuíno sobre cousas. i. kant (1786) un científico que se dedica a unha investigación concreta, por exemplo, no eido da física, pódese enfrontar ao seu problema directamente. Pódese dirixir inmediatamente ao centro da cuestión, é dicir, ao centro dunha estrutura organizada, posto que xa existe unha estrutura de doutrinas científicas e, con ela, unha situación problemática xeralmente aceptada. Por isto, deixará que outros encadren a súa contribución no marco do coñecemento científico. O filósofo atópase nunha posición distinta. El non se atopa ante unha estrutura organizada, senón ante algo que semella un monte de ruínas (aínda que poida haber un tesouro agochado debaixo). Non pode recorrer ao feito de que haxa unha situación problemática xeralmente aceptada, pois quizais o único feito xeralmente aceptado é que esta non existe. De feito, nos círculos filosóficos xa é unha pregunta recorrente se a filosofía chegará algún día tan lonxe como para formular un problema xenuíno. 76 Karl Popper Non obstante, hai quen si cre que a filosofía pode formular problemas xenuínos sobre as cousas e quen, xa que logo, espera que se discutan estes problemas e se acabe con eses monólogos deprimentes que agora pasan por seren discusións filosóficas. E se, por casualidade, se atopan ante a imposibilidade de aceptar algún dos credos existentes na actualidade, o único que poden facer é volver comezar desde o principio. Viena, outono de 1934. Non hai nada máis necesario para o home de ciencia que a historia desta e a lóxica da descuberta [...]: a maneira en que se detecta o erro, o uso da hipótese, da imaxinación, o modo en que se realiza a comprobación. lorD aCton 77 a lóxida da descuberta científica PREfACIO á PRImEIRA EDICIÓN EN LINGUA INGLESA DE 1959 No prefacio que escribín en 1934, intentaba explicar (temo que con excesiva brevidade) a miña postura con respecto á situación, daquela predominante, da filosofía, e especialmente con respecto á filosofía da linguaxe e á escola de analistas da linguaxe do momento. Neste novo prefacio, pretendo expoñer a miña postura con respecto á situación presente e ás dúas escolas principais de analistas da linguaxe que existen na actualidade. Agora, igual ca daquela, os analistas da linguaxe parécenme importantes, non só como opoñentes, senón tamén como aliados, na medida en que semellan ser practicamente os únicos filósofos que aínda manteñen vivas algunhas das tradicións da filosofía racional. Os analistas da linguaxe cren que non hai problemas filosóficos xenuínos ou que os problemas da filosofía, de habelos, son problemas do uso lingüístico ou problemas relacionados co significado das palabras. Eu, no entanto, creo que hai polo menos un problema filosófico no que toda persoa intelixente está interesada. É o problema da cosmoloxía: o problema de entender o mundo (incluíndonos a nós mesmos e o noso coñecemento como parte do mundo). Creo que toda ciencia é cosmoloxía e, para min, o interese da filosofía, ao mesmo nivel que o da ciencia, radica unicamente nas contribucións que leva feito neste eido. Para min, en todo caso, tanto a filosofía como a ciencia habían perder todo aliciente se abandonasen esa busca. Debo recoñecer que o feito de entender as funcións da nosa linguaxe é unha parte importante da mesma, pero xustificar os nosos problemas como meros «crebacabezas» lingüísticos non o é. Os analistas da linguaxe consideran que practican un método exclusivo da filosofía. Eu coido que se enganan, pois creo na seguinte tese: os filósofos son tan libres coma os demais 78 Karl Popper de usar calquera método para procurar a verdade. Non hai un método exclusivo da filosofía. unha segunda tese que me gustaría formular aquí é esta: o problema central da epistemoloxía foi sempre e segue a ser o problema do desenvolvemento do coñecemento. E o desenvolvemento do coñecemento pódese estudar mellor co estudo do desenvolvemento do coñecemento científico. Non creo que o estudo do desenvolvemento do coñecemento se poida substituír polo estudo dos usos nin dos sistemas lingüísticos. Con todo, estou disposto a recoñecer que existe un método que se podería describir como «o método da filosofía», pero non é característico só da filosofía, senón que máis ben é o método de toda discusión racional e, xa que logo, das ciencias naturais, así como da filosofía. O método no que estou pensando é o que consiste en expoñer o problema claramente e examinar as diferentes solucións propostas criticamente. Poño en letra cursiva as palabras «discusión racional» e «criticamente» coa finalidade de salientar que identifico a actitude racional coa actitude crítica. A cuestión é que, cando propoñemos unha solución para un problema, debemos intentar por todos os medios botar abaixo a nosa solución, en lugar de defendela. lamentablemente, poucos de nós levan á práctica este precepto; mais, afortunadamente, outros han exercer a crítica por nós se nós non a damos exercido. Porén, a crítica só ha ser produtiva se formulamos o noso problema coa maior claridade posible e expoñemos a nosa solución dun xeito o suficientemente firme (dun xeito en que se poida discutir criticamente). Non nego que algo que se podería chamar «análise lóxica» poida desempeñar algún papel neste proceso de aclarar e escrutar os nosos problemas e as solucións propostas nin afirmo que os métodos da «análise lóxica» ou da «análise da linguaxe» non sirvan para nada necesariamente. Máis ben, a tese que defendo consiste en que estes métodos distan moito de ser os únicos dos que un filósofo pode tirar proveito e de ningún xeito son carac79 a lóxida da descuberta científica terísticos da filosofía. Non son máis característicos da filosofía ca de calquera outra investigación científica ou racional. Pode xurdir a pregunta de que outros «métodos» podería empregar un filósofo. A miña resposta é que, aínda que hai moitos «métodos» diferentes, o certo é que non teño interese en enumeralos. Non me preocupan os métodos que poida usar un filósofo (ou calquera outra persoa), sempre que teña un problema interesante e intente solucionalo de verdade. Entre os moitos métodos que podería empregar (dependendo sempre, xaora, do problema que teña entre mans) paréceme que hai un que paga a pena mencionar. É unha variante do método histórico, hoxe en día pasado de moda. Consiste simplemente en informarse do que pensaron e dixeron outras persoas sobre o problema que nos ocupa: por que tiveron que enfrontarse a el, como o formularon, como o intentaron resolver. Isto paréceme importante porque forma parte do método xeral da discusión racional. Se ignoramos o que pensan outras persoas agora ou o que pensaron no pasado, será a fin da discusión racional, aínda que cada un de nós poida seguir falando tranquilamente consigo mesmo. Algúns filósofos fixeron de falar consigo mesmos virtude, quizais porque lles parecía que non había ninguén máis con quen pagase a pena falar. Temo que a práctica de filosofar a este nivel en certo modo elevado pode ser un síntoma do declive da discusión racional. Non hai dúbida de que Deus fala principalmente consigo mesmo porque non ten ninguén con quen lle mereza a pena falar, pero un filósofo debía saber que non é máis divino ca calquera outro home. hai varias razóns históricas interesantes que explican a crenza xeneralizada de que a denominada «análise da linguaxe» é o método verdadeiro da filosofía. unha destas razóns é a atinada crenza de que os paradoxos lóxicos, tales coma o do mentireiro («Agora mesmo estou mentindo») ou os que acharon russell, richard e outros, precisan, para teren solución, do método da análise da linguaxe, coa súa 80 Karl Popper famosa distinción entre expresións lingüísticas con sentido (ou «ben formadas») e sen sentido. Esta crenza atinada combínase logo coa crenza falsa de que os problemas tradicionais da filosofía xorden do intento de solucionar paradoxos filosóficos que teñen unha estrutura análoga á dos paradoxos lóxicos, polo que a distinción entre a linguaxe con sentido e sen sentido debe ser primordial tamén para a filosofía. Pódese demostrar moi doadamente que esta crenza é falsa. De feito, pódese demostrar por medio da análise lóxica, posto que esta revela que un certo tipo característico de reflexividade ou autorreferencia que aparece en todos os paradoxos lóxicos non aparece en ningún dos chamados paradoxos filosóficos, nin sequera nas antinomias de Kant. A razón principal do enaltecemento do método da análise da linguaxe, no entanto, parece que foi a seguinte: considerouse que o chamado «novo camiño das ideas» de locke, Berkeley e hume, é dicir, o método psicolóxico ou, máis ben, pseudopsicolóxico que consistía en analizar as nosas ideas e a súa orixe nos nosos sentidos, debía substituírse por un método máis «obxectivo» e menos xenético. Considerouse que debiamos analizar as palabras e os seus significados ou usos en lugar das «ideas», «conceptos» ou «nocións»; que debiamos analizar proposicións, enunciados ou oracións en lugar de «pensamentos», «crenzas» ou «opinións». Admito de bo grao que esta substitución do «novo camiño das ideas» de locke por un «novo camiño das palabras» foi un adianto que, ademais, urxía que se producise. É comprensible que aqueles que viran no «novo camiño das ideas» o único método verdadeiro da filosofía o vexan agora no «novo camiño das palabras». Discrepo enfaticamente desta desafiante crenza, pero só vou facer dous comentarios críticos sobre ela. En primeiro lugar, o «novo camiño das ideas» nunca se debeu tomar como o método principal da filosofía e menos aínda como o único verdadeiro. O mesmo locke presentouno como un simple método para tratar certos preliminares (preli81 a lóxida da descuberta científica minares para unha ciencia da ética) e Berkeley e hume empregárono principalmente como unha arma para fustrigar os seus opoñentes. A súa propia interpretación do mundo (o mundo das cousas e dos seres humanos), que estaban desexando transmitirnos, non se baseou en ningún momento neste método. Berkeley non baseou as súas ideas relixiosas nel, nin hume as súas teorías políticas (aínda que si baseou nel o seu determinismo). Pero a miña obxección máis seria á crenza de que o «novo camiño das ideas» ou «novo camiño das palabras» sexa o método principal da epistemoloxía (ou quizais mesmo da filosofía) é a seguinte. O problema da epistemoloxía pódese abordar desde dous puntos de vista: (1) como o problema do coñecemento do sentido común ou ordinario ou (2) como o problema do coñecemento científico. Os filósofos que prefiren o primeiro enfoque pensan, con razón, que o coñecemento científico non pode ser máis ca unha extensión do coñecemento do sentido común e pensan tamén, de xeito equivocado, que o coñecemento do sentido común é o máis doado de analizar dos dous. Deste xeito, estes filósofos substitúen o «novo camiño das ideas» por unha análise da linguaxe ordinaria (a linguaxe na que se formula o coñecemento do sentido común). Substitúen a análise da visión, da percepción, do coñecemento ou da crenza pola análise das frases «vexo», «percibo», «sei», «creo», «considero que é probable»; ou quizais pola da palabra «quizais». Agora ben, a quen prefire este enfoque da teoría do coñecemento, débolle responder o seguinte. Aínda que concordo en que o coñecemento científico é un mero desenvolvemento do coñecemento ordinario ou coñecemento do sentido común, sosteño que os problemas máis importantes e apaixonantes da epistemoloxía han permanecer totalmente invisibles para aqueles que se limitan a analizar o coñecemento ordinario ou do sentido común, ou a súa formulación na linguaxe ordinaria. 82 Karl Popper Quixera mencionar aquí unicamente un exemplo do tipo de problema ao que me refiro: o problema do desenvolvemento do noso coñecemento. unha pequena reflexión amosará que a meirande parte dos problemas asociados ao desenvolvemento do noso coñecemento necesariamente ten que transcender calquera estudo que se limite ao coñecemento do sentido común por oposición ao coñecemento científico, posto que a vía de desenvolvemento máis importante do coñecemento do sentido común é, precisamente, a súa conversión en coñecemento científico. É máis, semella estar claro que o desenvolvemento do coñecemento científico é o caso máis importante e interesante de desenvolvemento do coñecemento. Cómpre lembrar, neste contexto, que case todos os problemas da epistemoloxía tradicional están asociados ao problema do desenvolvemento do coñecemento. Eu estou disposto a dicir aínda máis: desde Platón a Descartes, leibniz, Kant, Duhem e Poincaré; e desde Bacon, hobbes e locke a hume, Mill e russell, a teoría do coñecemento inspirouse na esperanza de que nos había permitir non só saber máis sobre o coñecemento, mais tamén contribuír ao avance do coñecemento, é dicir, do coñecemento científico (a única excepción posible a esta norma que se me ocorre de entre os grandes filósofos é Berkeley). A maioría dos filósofos que cren que o método característico da filosofía é a análise da linguaxe ordinaria semella que perderon aquel optimismo digno de admiración que noutrora inspirara a tradición racionalista. A súa actitude parece que pasou a ser de resignación, por non dicir de desesperación. Non só lles deixan o progreso do coñecemento aos científicos, senón que mesmo definen a filosofía de tal xeito que se torna, por definición, incapaz de realizar contribución ningunha ao noso coñecemento do mundo. A automutilación que require esta definición tan sorprendentemente convincente non me resulta nada atractiva. Non existe unha esencia da filosofía que se poida destilar e condensar nunha definición. unha definición da palabra «filosofía» 83 a lóxida da descuberta científica só pode ter o carácter dunha convención, dun acordo; e eu, polo menos, non vexo mérito ningún na proposta arbitraria de definir a palabra «filosofía» de xeito que ben podería impedir que un estudante de filosofía intentase contribuír, na calidade de filósofo, ao progreso do noso coñecemento do mundo. Ademais, paréceme paradoxal que os filósofos que se senten orgullosos de especializárense no estudo da linguaxe ordinaria pensen, non obstante, que saben tanto sobre cosmoloxía como para estaren seguros de que é en esencia tan distinta da filosofía que esta non pode facerlle contribución ningunha. E están moi equivocados, posto que é un feito que as ideas puramente metafísicas (e, xa que logo, as ideas filosóficas) tiveron unha importancia capital para a cosmoloxía. Desde Tales a Einstein, desde o atomismo antigo á especulación sobre a materia de Descartes, desde as especulacións de Gilbert, Newton, leibniz e Boscovic sobre as forzas ata ás de Faraday e Einstein sobre os campos de forzas, as ideas metafísicas marcaron o camiño. Estas son, en resumo, as razóns polas que creo que, mesmo dentro da esfera da epistemoloxía, o primeiro dos enfoques que se mencionan arriba (é dicir, a análise do coñecemento como análise da linguaxe ordinaria) é limitado de máis e inevitablemente deixa a un lado os problemas máis interesantes. Con todo, disto moito de concordar con todos eses filósofos que prefiren abordar a epistemoloxía desde o outro enfoque: o da análise do coñecemento científico. Para explicar de xeito máis doado aqueles puntos nos que discrepo e aqueles nos que concordo, vou subdividir os filósofos que escollen este segundo enfoque en dous grupos: as cabras e as ovellas, por dicilo dalgún xeito. No primeiro grupo están aqueles que teñen como obxectivo estudar «a linguaxe da ciencia» e que escollen como método filosófico a construción de linguaxes baseadas en modelos artificiais, é dicir, a construción do que eles consideran modelos da «linguaxe da ciencia». 84 Karl Popper O segundo grupo non se limita ao estudo da linguaxe da ciencia nin de ningunha outra linguaxe e tampouco escolle ningún método filosófico. Os seus membros filosofan de moitos xeitos diferentes, porque queren resolver moitos problemas diferentes, e calquera método é ben recibido se lles parece que lles pode axudar a ver os seus problemas con máis claridade ou dar cunha solución, por provisional que sexa. Voume ocupar primeiro dos que escollen o método da construción dos modelos artificiais da linguaxe da ciencia. historicamente, tamén se afastan do «novo camiño das ideas». Tamén substitúen o método (pseudo)psicolóxico do antigo «novo camiño» pola análise lingüística. No entanto, debido quizais aos consolos espirituais que ofrece a esperanza de que o coñecemento sexa «exacto», «preciso» ou «formalizado», o obxecto que escollen para a súa análise lingüística é «a linguaxe da ciencia», en lugar da linguaxe ordinaria. lamentablemente, parece que «a linguaxe da ciencia» non existe e, polo tanto, cómprelles construíla. Porén, a construción dun modelo de traballo a grande escala dunha linguaxe da ciencia (un modelo no que puidésemos aplicar unha ciencia real, coma a física) resulta algo difícil na práctica e, por esta razón, atopámolos ocupados construíndo intricados modelos de traballo en miniatura (de vastos sistemas de artefactos diminutos). Na miña opinión, este grupo de filósofos recolle o peor dos dous mundos. Co seu método de construción de modelos de linguaxe en miniatura perden os problemas máis fascinantes da teoría do coñecemento: aqueles que teñen que ver co seu progreso, posto que a complexidade da envoltura non ten que ver coa efectividade, e non se pode expresar practicamente ningunha teoría científica de interese dentro destes vastos sistemas formados por detalles minuciosos. Estas linguaxes baseadas en modelos non teñen relación ningunha nin coa ciencia nin co sentido común. En efecto, os modelos da «linguaxe da ciencia» que constrúen estes filósofos non teñen nada que ver coa linguaxe da 85 a lóxida da descuberta científica ciencia moderna. Isto pódese ver nas seguintes observacións, que se refiren ás tres linguaxes modelo máis extensamente coñecidas. (Faise referencia a elas nas notas 13 e 15 do apéndice *vii e na nota *2 do apartado 38.) A primeira destas linguaxes modelo nin sequera dispón dos medios para expresar a identidade. Como consecuencia, non pode expresar unha ecuación: nin sequera contén a aritmética máis primitiva. A segunda linguaxe modelo funciona mentres non lle engadimos os medios para demostrar os teoremas habituais da aritmética, como, por exemplo, o teorema de Euclides segundo o cal non existe un número primo que sexa o maior de todos ou mesmo o principio que di que todo número ten un sucesor. Na terceira linguaxe modelo (a máis elaborada e coñecida de todas) unha vez máis non se poden formular as matemáticas e, o que é aínda máis interesante, nela non se pode expresar ningunha propiedade medible. Por estas razóns, e por moitas outras, as tres linguaxes modelo son pobres de máis como para lle seren útiles a ningunha ciencia. Tamén son, xaora, máis pobres no esencial que as linguaxes ordinarias, incluíndo mesmo as máis primitivas. As limitacións mencionadas impuxéronse sobre as linguaxes modelo simplemente porque, de non ser así, as solucións que os autores propoñían para os seus problemas non habían funcionar. Este feito pódese demostrar facilmente e xa o demostraron en parte os propios autores. Non obstante, todos semellan afirmar dúas cousas: (a) que os seus métodos son, nun sentido ou noutro, capaces de resolver problemas da teoría do coñecemento científico ou, noutras palabras, que son aplicables á ciencia (cando en realidade só son aplicables con certa precisión a un discurso extremadamente primitivo) e (b) que os seus métodos son «exactos» ou «precisos». Claramente, estes dous enunciados non se poden soster. Deste xeito, o método de construír linguaxes baseadas en modelos artificiais é incapaz de abordar os problemas do desenvolvemento do noso coñecemento e ten aínda menos 86 Karl Popper capacidade de facelo que o método de análise das linguaxes ordinarias, simplemente polo feito de seren estas linguaxes baseadas en modelos máis pobres que as linguaxes ordinarias. Como resultado da súa pobreza, non dan producido máis que o máis rudimentario e enganoso modelo de desenvolvemento do coñecemento: aquel que consiste en ir acumulando unha morea de enunciados baseados na observación. Agora, voume ocupar do último grupo de epistemólogos: aqueles que non se comprometen de antemán con ningún método filosófico e que fan uso, na epistemoloxía, da análise de problemas científicos, teorías e procedementos e, o máis importante, de discusións científicas. Este grupo pode reivindicar, entre os seus predecesores, a case todos os grandes filósofos occidentais (mesmo pode reivindicar a Berkeley como predecesor, a pesar do feito de que fose en gran medida inimigo da idea mesma do coñecemento científico racional e de que temese o seu progreso). Os seus representantes máis importantes dos últimos dous séculos foron Kant, Whewell, Mill, Peirce, Duhem, Poincaré, Meyerson, russell e, polo menos nalgunha das súas fases, Whitehead. A maioría dos membros deste grupo concordarían en que o coñecemento científico é o resultado do desenvolvemento do coñecemento do sentido común, pero todos descubriron que o coñecemento científico se pode estudar máis facilmente que o coñecemento do sentido común, pois poderíase dicir que é unha forma acentuada do coñecemento do sentido común. Mesmo os seus problemas son prolongacións dos problemas do coñecemento do sentido común. Por exemplo, substitúe o problema que formulaba hume da «crenza razoable» polo problema das razóns para aceptar ou descartar as teorías científicas. E, posto que posuímos numerosos informes detallados das discusións relativas ao problema de se se debe aceptar ou descartar unha teoría coma a de Newton, Maxwell ou Einstein, poderiamos observar estas discusións coma se o fixésemos a través dun microscopio que nos permitise estudar 87 a lóxida da descuberta científica polo miúdo e obxectivamente algúns dos problemas máis importantes da «crenza razoable». Este enfoque dos problemas da epistemoloxía despréndese (igual ca os outros dous xa mencionados) do método pseudo-psicolóxico ou «subxectivo» do novo camiño das ideas (un método que aínda usou Kant). Propón que analicemos as discusións científicas, así como as situacións problemáticas da ciencia, polo que nos pode axudar a entender a historia do pensamento científico. Eu intentei demostrar que os problemas tradicionais máis importantes da epistemoloxía (os relacionados co desenvolvemento do coñecemento) transcenden os dous métodos habituais da análise lingüística e requiren a análise do coñecemento científico. Porén, o último que desexo é defender outro dogma. Mesmo a análise da ciencia (a «filosofía da ciencia») ameaza con converterse nunha moda ou nunha especialidade. No entanto, os filósofos non deben ser especialistas. Eu, pola miña parte, teño interese na ciencia e na filosofía só porque quero aprender algo sobre o enigma do mundo en que vivimos e sobre o enigma do coñecemento que a humanidade posúe dese mundo. E creo que só unha volta ao interese nestes enigmas pode salvar as ciencias e a filosofía da limitada especialización e dunha fe escurantista na habilidade especial do experto e no seu coñecemento e autoridade persoais; unha fe que encaixa moi ben na nosa era «post-racionalista» e «post-crítica», entregada con orgullo á destrución da tradición da filosofía racional e do pensamento racional en si mesmo. Penn, BuCkinghamshire, primavera de 1958. AgrAdecementos, 1960 e 1968 Quero agradecerlle ao Sr. David G. Nicholls que me enviase a admirable pasaxe, agora impresa na páxina xxxxx (trad. gal. p. 8), que el descubriu entre os Manuscritos de Acton na 88 Karl Popper Biblioteca da universidade de Cambridge (Add. MSS 5011: 266). A reimpresión do libro ofréceme a oportunidade de citar esta pasaxe. Verán de 1959 Nesta segunda edición inglesa engadíronse catro breves Addenda aos apéndices. Corrixíronse erros menores e mellorouse a redacción nunhas poucas frases. Corrixíronse grallas sobre as que me chamaron a atención Imre lakatos, David Miller e Alan Musgrave, que tamén fixeron suxestións para moitas novas entradas do índice temático. Estoulles moi agradecido. A maior débeda contraína con Paul Bernays, quen, pouco despois de aparecer a versión inglesa do libro, comprobou a miña axiomatización do cálculo de probabilidade, especialmente o novo apéndice *v. Teño a súa aprobación en máis alta estima do que podo expresar con palabras. Isto non me absolve a min dos erros que eu puidese ter cometidos. Novembro de 1967 1a Parte Introdución á lóxica da ciencia

a lóxida da descuberta científica 1 EXPOSICIÓN DALGÚNS PROBLEMAS FUNDAMENTAIS un científico, xa sexa teórico ou investigador, propón enunciados, ou sistemas de enunciados, e compróbaos paso a paso. No campo das ciencias empíricas, máis precisamente, constrúe hipóteses, ou sistemas de teorías, e contrástaas coa práctica por medio da observación e do experimento. Eu propoño que o cometido da lóxica da descuberta científica, ou da lóxica do coñecemento, é proporcionar unha análise lóxica deste procedemento, é dicir, analizar o método das ciencias empíricas. Pero que son estes «métodos das ciencias empíricas»? E a que lle chamamos «ciencia empírica»? 1 O problema da indución De acordo cun punto de vista xeralmente aceptado (que se rebaterá neste libro), as ciencias empíricas pódense caracterizar polo feito de empregaren os chamados «métodos indutivos». De acordo con este punto de vista, a lóxica da descuberta científica sería idéntica á lóxica indutiva, é dicir, á análise lóxica destes métodos indutivos. É habitual dicir que unha inferencia é «indutiva» se pasa de enunciados singulares (tamén chamados en ocasións enunciados «particulares»), tales como os informes dos resultados de observacións ou experimentos, a enunciados universais, tales como as hipóteses ou as teorías. Agora ben, non é nin moito menos evidente, desde un punto de vista lóxico, que teñamos motivos para inferir enunciados universais a partir dos singulares, por moi numerosos que estes sexan; pois calquera conclusión que se saque deste xeito podería sempre resultar falsa: por moitos exemplos de cisnes brancos que observásemos, non se xustifica a conclusión de que todos os cisnes son brancos. 92 Karl Popper A cuestión de se as inferencias indutivas están xustificadas, ou con que condicións se xustifican, coñécese como o problema da indución. O problema da indución tamén se pode formular como a cuestión da validez ou da verdade de enunciados universais baseados na experiencia, tales como as hipóteses e os sistemas teóricos das ciencias empíricas. Moita xente cre que a verdade destes enunciados universais «coñécese pola experiencia»; aínda así, queda claro que a explicación dunha experiencia (dunha observación ou do resultado dun experimento) pode de primeiras só un enunciado singular e non un universal. En consecuencia, aqueles que din que sabemos que un enunciado universal é certo por experiencia polo xeral queren dicir que a verdade dese enunciado universal pode dalgún xeito reducirse á verdade dos singulares, e que se sabe por experiencia que os singulares son certos, o que equivale a dicir que o enunciado universal se basea na inferencia indutiva. Deste xeito, preguntar se existen leis naturais que se sabe que son certas parece non ser máis ca outro xeito de preguntarse se as inferencias indutivas teñen unha xustificación lóxica. Con todo, se queremos dar co xeito de xustificar as inferencias indutivas, o primeiro que debemos facer é establecer un principio de indución. un principio de indución sería un enunciado que nos serviría de axuda para formular inferencias indutivas dunha forma loxicamente aceptable. Para os defensores da lóxica indutiva, un principio de indución é de suma importancia para o método científico: «[...] este principio», di reichenbach, «determina a verdade das teorías científicas. Eliminalo da ciencia suporía nada menos que privar a mesma do poder de decidir a verdade ou falsidade das súas teorías. Sen el, claramente, a ciencia xa non tería dereito a distinguir as súas teorías das creacións fantasiosas e arbitrarias da mente do poeta»1. 1 H. Reichenbach, Erkenntnis 1, 1930, p. 186 (cf. tamén p. 64 e ss.). Cf. o penúltimo parágrafo do capítulo xii sobre Russell, en Hume, na súa History of Western Philosophy, 1946, p. 699. 93 a lóxida da descuberta científica Agora ben, este principio de indución non pode ser unha verdade puramente lóxica, coma unha tautoloxía ou un enunciado analítico. De feito, de existir un principio de indución puramente lóxico, non existiría o problema da indución, posto que, neste caso, cumpriría considerar todas as inferencias indutivas como transformacións puramente lóxicas ou tautolóxicas, igual ca as inferencias da lóxica dedutiva. O principio de indución, xa que logo, debe ser un enunciado sintético, é dicir, un enunciado cuxa negación non sexa contraditoria consigo mesma, senón loxicamente posible. Deste xeito, xorde a pregunta de por que se debería aceptar un principio coma este e de como podemos xustificar a súa aceptación por motivos racionais. Algúns dos que cren na lóxica indutiva devecen por sinalar, de acordo con reichenbach, que «o principio da indución é aceptado sen reservas pola totalidade da ciencia e que, así mesmo, ninguén pode poñer seriamente en dúbida este principio na vida cotiá»2. Mais, aínda supoñendo que este fose o caso (pois, despois de todo, «a totalidade da ciencia» podería estar enganada), debo insistir en que o principio de indución é superfluo e leva necesariamente a contradicións lóxicas. O feito de que poidan xurdir facilmente contradicións en relación ao principio de indución debería quedar claro a raíz da obra de hume*1, así como o feito de que, se é que estas se poden evitar, será só con dificultade, posto que o principio de indución debe ser, á súa vez, un enunciado universal. Por isto, se intentamos considerar que a súa veracidade se sabe por experiencia, os mesmos problemas que provocaron a súa introdución han xurdir outra vez. Para xustificala, teriamos que empregar inferencias indutivas e, para xustificar estas, teriamos que adoptar un principio indutivo dunha orde superior, e así 2 Reichenbach, ibid., p. 67. *1 As pasaxes determinantes de Hume cítanse no apéndice *vii, no texto a que remiten as notas 4, 5 e 6; véxase tamén a nota 2 do apartado 81, infra. 94 Karl Popper sucesivamente. Polo tanto, o intento de basear o principio de indución na experiencia fracasa, pois leva necesariamente a unha regresión infinita. Kant intentou fuxir pola forza desta dificultade considerando o principio de indución (que el formulou como o «principio de causalidade universal») como «válido a priori». Pero eu non creo que o seu enxeñoso intento de lles proporcionar unha xustificación apriorística aos enunciados sintéticos tivese éxito. Na miña opinión, as diversas dificultades da lóxica indutiva aquí esbozadas son insuperables. Temo que tamén o son as inherentes á doutrina, tan xeneralizada hoxe en día, que defende que a inferencia indutiva, a pesar de non ser «estritamente válida», pode acadar certo grao de «fiabilidade» ou de «probabilidade». De acordo con esta doutrina, as inferencias indutivas son «inferencias probables»3. reichenbach afirma: «Describimos o principio de indución como o medio a través do cal a ciencia decide sobre a verdade. Para sermos máis exactos, debiamos dicir que serve para decidir sobre a probabilidade, pois non é cometido da ciencia acadar a verdade nin a falsidade [...] senón que os enunciados científicos non poden máis ca alcanzar graos continuos de probabilidade, que teñen como límites máximo e mínimo, inalcanzables, a verdade e a falsidade»4. A esta altura podo deixar de lado o feito de que os partidarios da lóxica indutiva sosteñan unha idea de probabilidade que máis tarde rexeitarei por ser moi pouco conveniente para os seus propios obxectivos (véxase a sección 80, máis abaixo). Podo facer isto porque o recurso á probabilidade non afecta nin o máis mínimo ás dificultades mencionadas. Isto é así porque, se se lles asigna certo grao de probabilidade aos enunciados 3 Cf. J. M. Keynes, A Treatise on Probability, 1921; O. Külpe, Vorlesungen über Logic (ed. por Selz, 1923); Reichenbach (que emprega o termo «implicacións da probabilidade»), Axiomatik der Wahrscheinlichkeitsrechnung, Mathem. Zeitschr. 34, 1932; e noutros lugares. 4 Reichenbach, Erkenntnis 1, 1930, p. 186. 95 a lóxida da descuberta científica baseados na inferencia indutiva, isto terase que xustificar recorrendo a un novo principio de indución, debidamente modificado. E este novo principio, á súa vez, terá que ser xustificado, e así sucesivamente. Ademais, non se consegue nada con que o principio de indución, á súa vez, non se tome como «verdadeiro», senón só como «probable». En resumo, igual ca calquera outra forma de lóxica indutiva, a lóxica da inferencia probable ou «lóxica da probabilidade», leva ou ben a unha regresión infinita, ou ben á doutrina do apriorismo*2. A teoría que se vai desenvolver nas seguintes páxinas oponse directamente a todo intento de traballar coas ideas da lóxica indutiva. Poderíase describir como a teoría do método dedutivo de comprobación ou como a idea de que unha hipótese só se pode comprobar empiricamente (e só despois de que alguén a propoña). Antes de entrar a explicar con detalle esta idea (que se podería denominar «dedutivismo» en contraste co «indutivismo»5), debo deixar clara a distinción entre a psicoloxía do coñecemento, que se ocupa de feitos empíricos, e a lóxica do coñecemento, que trata só as relacións lóxicas, posto que a crenza na lóxica indutiva débese en grande medida a unha confusión entre problemas psicolóxicos e epistemolóxicos. Cabería mencionar, por certo, que esta confusión representa un problema, non só para a lóxica do coñecemento, senón tamén para a súa psicoloxía. *2 Véxase tamén o capítulo 10, infra., especialmente a nota 2 do apartado 81, e o capítulo *ii do Postscript para unha exposición máis completa desta crítica. 5 Liebig (en Induktion und Deduktion, 1865) foi probablemente o primeiro en rexeitar o método indutivo desde o punto de vista das ciencias naturais; o seu ataque dirixiuse contra Bacon. Duhem, (en La théorie physique, son objet et sa structure, 1906; tradución ao inglés de P.P. Wiener: The Aim and Structure of Physical Theory, Princeton, 1954) sostén opinións marcadamente dedutivistas. (*Mais tamén se poden atopar ideas indutivistas no libro de Duhem, por exemplo, na primeira parte do terceiro capítulo, onde nos di que a experimentación, a indución e a xeneralización foron as únicas que produciron a lei da refracción de Descartes; cf. a tradución ao inglés, p. 34). O mesmo vemos en V. Kraft, Die Grundformen der Wissenschaftlichen Methoden, 1925; véxase tamén Carnap, Erkenntnis 2, 1932, p. 440. 96 Karl Popper 2 Eliminación do psicoloxismo Dixen anteriormente que o traballo do científico consiste en propoñer e someter teorías a proba. A fase inicial, o acto de concibir ou inventar unha teoría, non me parece que requira unha análise lóxica nin que sexa susceptible dela. A pregunta de como se lle ocorre unha idea nova a unha persoa (xa sexa un tema musical, un conflito dramático ou unha teoría científica) pode ser de grande interese para a psicoloxía empírica; pero é irrelevante para a análise lóxica do coñecemento científico. Este non se ocupa das cuestións de feito (o quid facti? de Kant), senón das cuestións de xustificación ou validez (o quid juris? de Kant). As cuestións que trata son do tipo: Pódese xustificar un enunciado? Se se pode, de que maneira? É posible sometelo a probas? Depende loxicamente dalgún outro enunciado? Ou pode ser que os contradiga? Para que un enunciado se poida examinar loxicamente deste xeito, tivéronnolo que presentar previamente. Alguén o tivo que formular e someter a un exame lóxico. Polo tanto, distinguirei claramente entre o proceso de concibir unha idea nova e os métodos e resultados de examinala de maneira lóxica. En canto ao cometido da lóxica do coñecemento (a diferenza do que ocorre coa psicoloxía do coñecemento) eu operarei co suposto de que consiste exclusivamente en investigar os métodos empregados nas comprobacións sistemáticas a que se debe someter toda idea nova se se quere que sexa considerada seriamente. Algúns poderían obxectar que sería máis atinado considerar como un asunto da epistemoloxía a realización do que se denominou unha reconstrución racional dos pasos que levaron o científico a unha descuberta, ao achado dunha verdade nova. Pero a pregunta é: que é exactamente o que queremos reconstruír? Se o que se vai reconstruír son os procesos que teñen lugar na estimulación e desencadeamento dunha inspiración, 97 a lóxida da descuberta científica entón debo rexeitar consideralo como o cometido da lóxica do coñecemento. Tales procesos son asunto da psicoloxía empírica, pero dificilmente o son da lóxica. Outra cousa é que queiramos reconstruír racionalmente as comprobacións posteriores polas que a inspiración pode revelarse como unha descuberta ou converterse en coñecemento. Na medida en que as persoas científicas xulgan, modifican ou rexeitan dun xeito crítico a súa propia inspiración, podemos, se así o desexamos, considerar a análise metodolóxica aquí acometida como unha especie de «reconstrución racional» dos correspondentes procesos mentais. Pero esta reconstrución non describiría os procesos tal e como ocorren en realidade: só proporcionaría un esquema lóxico do procedemento de comprobación. Así e todo, poida que isto sexa o único que queren dicir aqueles que falan dunha «reconstrución racional» das maneiras que temos de adquirir coñecemento. O caso é que os argumentos que expoño neste libro son totalmente independentes deste problema. Porén, a miña opinión sobre o asunto, por se serve de algo, é que non existe un método lóxico para ter ideas novas nin unha reconstrución lóxica deste proceso. A miña opinión pódese expresar dicindo que toda descuberta contén «un elemento irracional» ou «unha intuición creativa», no sentido que lle dá Bergson. Dun xeito semellante, Einstein fala da «busca desas leis sumamente universais [...] a partir das cales se pode obter unha imaxe do mundo por pura dedución. Non hai camiño lóxico ningún –di el– que conduza a estas [...] leis. Só se pode chegar a elas por medio da intuición, baseada en algo parecido a un amor intelectual («Einfühlung») polos obxectos da experiencia»6. 6 Discurso pronunciado no 60o aniversario de Max Planck (1918). O fragmento citado comeza coas palabras: «O cometido primordial do físico é a busca desas leis sumamente universais [...]», etc. (tirado de A. Einstein, Mein Weltbild, 1934, p. 168; tradución ao inglés de A. Harris: The World as I See It, 1935, p. 125). Atópanse ideas semellantes con anterioridade en Liebig, ob. cit.; cf. tamén Mach, Principien der Wärmelehre, 1896, p. 443 e ss. *A palabra alemá «Einfühlung» ten difícil tradución. Harris tradúcea por «sympathetic understanding of experience» (comprensión empática da experiencia). 98 Karl Popper 3 Comprobación dedutiva de teorías De acordo coa opinión que se vai propoñer aquí, o método de comprobación crítica de teorías e de selección segundo os resultados das comprobacións desenvólvese sempre do seguinte xeito. A partir dunha idea nova, proposta provisionalmente e sen xustificación de ningún tipo (unha predición, unha hipótese, un sistema teórico ou o que sexa) tíranse conclusións por medio da dedución lóxica. logo, estas conclusións compáranse entre si e con outros enunciados pertinentes, co fin de buscar as relacións lóxicas (tales como equivalencia, deducibilidade, compatibilidade ou incompatibilidade) que existen entre eles. Podemos, se así o desexamos, distinguir entre catro liñas diferentes que podemos seguir para comprobar unha teoría. En primeiro lugar, está a comparación lóxica das conclusións entre elas, coa que se pon a proba a coherencia interna do sistema. En segundo lugar, está a investigación da forma lóxica da teoría, co obxecto de determinar se ten carácter de teoría empírica ou científica ou se é, por exemplo, tautolóxica. En terceiro lugar, está a comparación con outras teorías, principalmente co fin de determinar se a teoría constituiría un avance científico, no caso de que superase as diferentes probas ás que a sometemos. Finalmente, está a comprobación da teoría por medio de aplicacións empíricas das conclusións que se poden tirar dela. O propósito deste último tipo de comprobación é descubrir ata que punto as novas consecuencias da teoría (sexa cal sexa a novidade que asevera) están á altura das esixencias da práctica, tanto das que xorden de experimentos puramente científicos como de aplicacións tecnolóxicas prácticas. Aquí, unha vez máis, o procedemento da comprobación resulta ser dedutivo. Coa axuda doutros enunciados, aceptados previamente, certos enunciados singulares (que podemos denominar «predicións») dedúcense da teoría; especialmente no caso das predicións facilmente comprobables ou aplicables. De entre estes enuncia99 a lóxida da descuberta científica dos, selecciónanse os que non se poden derivar da teoría actual e, especialmente, os que esta contradí. Despois, buscamos unha decisión con respecto a estes (e outros) enunciados derivados comparándoos cos resultados de aplicacións e experimentos prácticos. Se está decisión é positiva, é dicir, se as conclusións singulares resultan aceptables, ou verificadas, a teoría, polo momento, pasará a proba: non teremos razóns para descartala. Pero, se a decisión é negativa ou, noutras palabras, se as conclusións foron falsificadas, a súa falsificación afecta tamén á teoría a partir da cal se deduciron loxicamente. Cómpre ter en conta que unha decisión positiva só pode avalar a teoría temporalmente, posto que sempre poden aparecer decisións negativas posteriores que a boten abaixo. Mentres a teoría vaia resistindo comprobacións minuciosas e rigorosas e non a desbanque ningunha outra teoría no transcurso do desenvolvemento científico, podemos dicir que «demostrou a súa validez» ou que foi corroborada*1 pola experiencia. No procedemento aquí esbozado non aparece nada semellante á lóxica indutiva. En ningún momento dou por suposto que podemos presentar a veracidade de enunciados singulares como argumento para defender a veracidade de teorías. En ningún momento dou por suposto que en virtude de conclusións «verificadas», se poida demostrar que as teorías sexan «verdadeiras» ou nin sequera que sexan simplemente «probables». Neste libro pretendo ofrecer unha análise máis detallada dos métodos de comprobación dedutiva. Intentarei, así mesmo, mostrar que dentro do marco desta análise se poden tratar todos os problemas que habitualmente se denominan epistemolóxicos. Estes problemas, especialmente os que xorden da lóxica indutiva, pódense eliminar sen xerar outros novos para o seu sitio. *1 Para este termo, véxase a nota *1 anterior ao apartado 79 e o apartado *29 do meu Postscript. 100 Karl Popper 4 O problema da demarcación Das moitas obxeccións que probablemente se formulen en contra da idea que aquí se propón, a máis seria é quizais a seguinte. Ao rexeitar o método da indución, pódese dicir que estou privando a ciencia do que parece ser a súa característica máis importante e isto significa que estou eliminando as barreiras que separan a ciencia da especulación metafísica. A miña contestación a esta obxección é que a razón principal pola que rexeito a lóxica indutiva é precisamente que esta non proporciona unha marca distintiva axeitada do carácter empírico e non metafísico dun sistema teórico ou, noutras palabras, que non proporciona un «criterio de demarcación» axeitado. Ao problema da busca dun criterio que nos permitise distinguir entre as ciencias empíricas por unha banda e as matemáticas e a lóxica, así como os sistemas «metafísicos» pola outra, eu chámolle problema da demarcación1. hume coñecía este problema e intentou solucionalo2. Con Kant, tornouse no problema central da teoría do coñecemento. Se, de acordo con Kant, lle chamamos ao problema da indución «o problema de hume», ao problema da demarcación poderiámoslle chamar «o problema de Kant». Destes dous problemas (a orixe de practicamente todos os demais problemas da teoría do coñecemento), o problema da demarcación é, segundo a miña opinión, o fundamental. De feito, a principal razón pola que os epistemólogos con inclinación ao empirismo tenden a depositar a súa fe no «método da indución» parece ser a súa crenza en que este método por si só pode proporcionar un criterio de demarcación axeitado. Isto 1 Compárese con isto (así como cos apartados que van do 1 ao 6 e do 13 ao 24) o meu comentario en Erkenntnis 3, 1933, p. 426; *Reimprimiuse aquí, traducido, no apéndice *i. 2 Cf. a última frase do seu Enquiry Concerning Human Understanding. *Compárese co seguinte parágrafo (e coa miña alusión aos epistemólogos) a cita de Reichenbach no texto a que remite a nota 1 do apartado 1, por exemplo. 101 a lóxida da descuberta científica refírese especialmente aos empiristas que seguen a bandeira do «positivismo». Os antigos positivistas pretendían admitir como científicos ou lexítimos só aqueles conceptos (nocións ou ideas) que fosen, como eles dicían, «derivados da experiencia»; é dicir, aqueles conceptos que eles consideraban que se podían reducir loxicamente a elementos da experiencia sensorial, tales como sensacións (ou datos sensoriais), impresións, percepcións, recordos visuais ou auditivos, etc. Os positivistas modernos tenden a ver máis claramente que a ciencia non é un sistema de conceptos, senón máis ben un sistema de enunciados*1. Por conseguinte, desexan recoñecer como científicos ou lexítimos só aqueles enunciados que se poden reducir a enunciados elementais (ou «atómicos») da experiencia: a «xuízos de percepción», «proposicións atómicas», «enunciados protocolarios» e que sei eu que máis*2. Está claro que o criterio implícito de demarcación é idéntico á reivindicación dunha lóxica indutiva. Como rexeito a lóxica indutiva, tamén teño que rexeitar todos estes intentos de solucionar o problema da demarcación. Con este rexeitamento, o problema da demarcación gaña en importancia para a presente investigación. Atopar un criterio de demarcación aceptable ten que ser un cometido crucial para calquera epistemoloxía que non acepte a lóxica indutiva. *1 Cando escribín este parágrafo, sobrevalorei os «positivistas modernos», polo que vexo agora. Debín lembrar que, a este respecto, o prometedor comezo do Tractatus de Wittgenstein («O mundo é a totalidade dos feitos, non das cousas») quedaba anulado polo seu final, que denunciaba a persoa que «non atribuíra significado a certos signos das súas proposicións». Véxase tamén o apartado ii do capítulo 11 da miña obra Open Society and its Enemies e o capítulo *i do meu Postscript, en especial os apartados *ii (nota 5), *24 (os cinco últimos parágrafos) e *25. *2 Non hai nada que dependa dos nomes, por suposto. Cando inventei o nome «enunciado básico» (ou «proposición básica»; véxanse, máis abaixo, os apartados 7 e 28) fíxeno simplemente porque necesitaba un termo que non estivese cargado coa connotación que ten un enunciado de percepción. Lamentablemente, non obstante, houbo outros que non tardaron en adoptalo e usalo para expresar exactamente a clase de significado que eu pretendía evitar. Cf. tamén o meu Postscript, *29. 102 Karl Popper Os positivistas adoitan interpretar o problema da demarcación nun sentido naturalista: interprétano coma se fose un problema das ciencias naturais. En lugar de asumir como propio o cometido de propoñer unha convención axeitada, cren que teñen que descubrir unha diferenza que existe na natureza das cousas, por dicilo dalgún xeito, entre a ciencia empírica, por unha banda, e a metafísica, pola outra. Intentan demostrar constantemente que a metafísica, pola súa propia natureza, non é máis ca unha parvada absurda, «sofistería e ilusións», como di hume, que debiamos «guindar ao lume»*3. Se coas palabras «absurdo» ou «sen sentido» non queremos expresar, por definición, máis ca «que non pertence á ciencia empírica», a caracterización da metafísica como unha parvada sen sentido sería trivial, posto que a metafísica se ten definido acotío como non empírica. No entanto, os positivistas cren, xaora, que poden dicir moito máis sobre a metafísica á parte de que algúns dos seus enunciados non sexan empíricos. As palabras «sen sentido» e «absurdo» expresan, intencionadamente, unha avaliación despectiva e non hai dúbida de que o que os positivistas queren conseguir en realidade é, máis ca unha demarcación eficaz, o derrocamento3 e aniquilación da metafísica. Sexa como for, atopámonos con que cada vez que os positivistas intentaron dicir máis claramente o que significaba «con sentido», o intento levou sempre ao mesmo resultado: unha definición de «enunciado con sentido» (en contraposición a «pseudoenunciado sen sentido») que simplemente reiteraba o criterio de demarcación da súa lóxica indutiva. *3 Deste xeito, Hume, ao igual ca Sextus, condenou a súa propia obra Enquiry na última páxina, do mesmo modo que Wittgenstein, máis tarde, condenou a súa propia obra Tractatus, tamén na última páxina (véxase a nota 2 do apartado 10). 3 Carnap, Erkenntnis 2, 1932, p. 219 e ss. Anteriormente, Mill xa usara a expresión «sen sentido» dun xeito parecido, *sen dúbida baixo a influencia de Comte; cf. Early Essays on Social Philosophy, de Comte, editado por H.D. Hutton, 1911, p. 223. Véxase tamén, na miña obra Open Society, a nota 51 do capítulo 11. 103 a lóxida da descuberta científica Isto «móstrase» moi claramente no caso de Wittgenstein, para quen toda proposición con sentido ten que ser loxicamente redutible4 a proposicións elementais (ou atómicas), que el caracteriza como descricións ou «imaxes da realidade»5 (unha caracterización que, por certo, pretende abarcar todas as proposicións con sentido). Disto podemos deducir que o criterio de significación de Wittgenstein coincide co criterio de demarcación dos indutivistas, sempre que substituamos as verbas «científico» e «lexítimo» destes por «con sentido». E, precisamente polo problema da indución, este intento de solucionar o problema da demarcación fracasa: os positivistas, no seu devezo por aniquilar a metafísica, aniquilan, xunto con ela, as ciencias naturais, pois as leis científicas tampouco se poden reducir loxicamente a enunciados elementais da experiencia. Se se aplica de xeito sistemático, o criterio de Wittgenstein da significación rexeita, por non teren sentido, aquelas leis naturais cuxa busca, como di Einstein6, é «o cometido primordial do físico»: nunca se poderán aceptar como enunciados verdadeiros nin lexítimos. O intento de Wittgenstein de desenmascarar o problema da indución como un pseudoproblema baleiro formulouno Schlick*4 coas seguintes palabras: «O problema da indución consiste en pedir unha xustificación lóxica dos enunciados universais sobre a realidade [...] recoñecemos, xunto con hume, que non existe 4 Wittgenstein, Tractatus Logico-Philosophicus (1918 e 1922), Proposición 5. *Isto escribino en 1934, polo que aquí só me refiro, evidentemente, ao Tractatus. 5 Wittgenstein, ob. cit., Proposicións 4.01; 4.03;2.221. 6 Cf. nota 1 do apartado 2. *4 A idea de tratar as leis científicas como pseudoproposicións (solucionando así o problema da indución) atribuíullo Schlick a Wittgenstein. (Cf., na miña obra Open Society, as notas 46 e 51 e ss. do captítulo 11). Así e todo, en realidade é moi anterior. Forma parte da tradición instrumentalista que se pode remontar ata Berkeley e mesmo máis atrás. (Véxase, por exemplo, o meu artigo «Three Views Concerning Human Knowledge», en Contemporary British Philosophy, 1956; e «A Note on Berkeley as a Precursor of Mach», en The British Journal for the Philosophy of Science 4, 1953, p. 26 e ss., incluído na miña obra Conjectures and Refutations, 1959. Máis referencias na nota *1, anterior ao apartado 12 (p. 37). O problema tamén se trata na miña obra Postscript, nos apartados que van do *11 ao *14 e do *19 ao *26). 104 Karl Popper tal xustificación lóxica: non pode habela, simplemente porque non son enunciados verdadeiros»7. Isto demostra que o criterio indutivista da demarcación é incapaz de trazar unha liña divisoria entre os sistemas científico e metafísico e por que ten que concederlles igual estatus, pois o veredicto do dogma positivista do sentido é que ambos os dous son sistemas de pseudoenunciados sen sentido. Por conseguinte, en lugar de erradicar a metafísica das ciencias empíricas, o positivismo conduce á invasión da esfera da ciencia por parte da metafísica8. A diferenza destas estrataxemas antimetafísicas (é dicir, con intención antimetafísica), o meu obxectivo non é, tal e como eu o vexo, provocar o derrubamento da metafísica, senón que é, máis ben, formular unha caracterización apropiada da ciencia empírica ou definir os conceptos «ciencia empírica» e «metafísica» de maneira que poidamos establecer se é asunto da ciencia empírica realizar un estudo máis pormenorizado dun sistema de enunciados dado. O meu criterio de demarcación, de acordo con isto, tense que considerar como unha proposta de acordo ou convención. Pode haber discrepancias en canto á pertinencia de tal convención e só será posible que se produza unha discusión razoable destas cuestións se as partes teñen algún propósito en común. A esco7 Schlick, Naturwissenschaften 19, 1931, p. 156. (As cursivas son miñas). Con respecto ás leis naturais, Schlick escribe (p. 151): «Tense observado a miúdo que, en sentido estrito, nunca podemos falar dunha verificación absoluta dunha lei, pois sempre, por así dicilo, temos a reserva tácita de que se poida modificar á luz da experiencia futura. Se se me permite engadir, a modo de paréntese –continúa Schlick– unhas palabras sobre a situación lóxica, o feito mencionado máis arriba implica que unha lei natural, en principio, non ten o carácter lóxico dun enunciado, senón que, máis ben, é unha prescrición para a formación de enunciados». *(O termo «formación», sen dúbida, pretendía incluír transformación ou derivación). Schlick atribuíu esta teoría a unha comunicación persoal de Wittgenstein. Véxase tamén o apartado *12 do meu Postscript. 8 Cf. apartado 78 (por exemplo, a nota 1). *Véxase tamén, na miña obra Open Society, as notas 46, 51 e 52 do capítulo 11 e o meu relatorio «The Demarcation between Science and Metaphysics», incluído en xaneiro de 1955 no volume de Carnap da Library of Living Philosophers, editada por P.A. Schilpp, e agora na miña obra Conjectures and Refutations, 1963 e 1965. 105 a lóxida da descuberta científica lla de tal propósito debe ser, xaora, en última instancia cuestión dunha decisión, que vaia máis aló da argumentación racional*5. Calquera que contemple que o fin e propósito da ciencia é lograr un sistema de enunciados completamente seguros e irrevogablemente verdadeiros9 ha rexeitar, con toda certeza, as propostas que vou facer aquí. Tamén as rexeitarán aqueles que ven «a esencia da ciencia [...] na súa dignidade», que pensan que reside na súa «integridade» e na «esencialidade e verdade reais»10. Dificilmente estarán dispostos a concederlle esta dignidade á física teórica moderna, na que eu, coma outros, vexo a realización ata o de agora máis completa do que eu denomino «ciencia empírica». Os obxectivos da ciencia que eu teño en mente son outros. Porén, eu non intento xustificalos representándoos como os obxectivos verdadeiros ou esenciais da ciencia. Isto non faría máis ca terxiversar o asunto e suporía unha recaída no dogmatismo positivista. Só hai un xeito, tal e como eu o vexo, de argumentar racionalmente a favor das miñas propostas, que é analizar as súas consecuencias lóxicas: sinalar a súa fertilidade, o seu poder para elucidar os problemas da teoría do coñecemento. Admito abertamente que, para chegar ás miñas propostas, deixeime guiar, na última análise, por xuízos de valor e predileccións. No entanto, espero que as miñas propostas poidan ser aceptables para aqueles que non só valoran o rigor lóxico, senón tamén a liberdade fronte ao dogmatismo; aqueles que buscan a aplicabilidade práctica, pero que se senten aínda máis atraídos pola aventura da ciencia e polas descubertas que, unha e outra vez, fan que nos enfrontemos a preguntas novas e inesperadas, desafiándonos a poñer a proba respostas novas e ata o momento inimaxinables. *5 Coido que sempre é posible unha discusión razoable se ás partes lles interesa a verdade e están dispostas a prestárense atención mutuamente. (Cf. o capítulo 24 da miña obra Open Society). 9 Esta é a opinión de Dingler; cf. a nota 1 do apartado 19. 10 Esta é a opinión de O. Spann (Kategorienlehre, 1924). 106 Karl Popper O feito de que as miñas propostas se vexan influídas por xuízos de valor non quere dicir que estea cometendo o erro do que acusei os positivistas, e que consistía en intentar matar a metafísica aplicándolle apelativos despectivos. Eu nin sequera chego tan lonxe como para afirmar que a metafísica non teña valor para a ciencia empírica, pois é innegable que, xunto coas ideas metafísicas que obstaculizaron o avance da ciencia, houbo outras (coma o atomismo especulativo) que serviron de axuda ao mesmo. E, examinando o asunto desde a perspectiva da psicoloxía, inclínome a pensar que a descuberta científica é imposible se non se ten fe en ideas dun tipo puramente especulativo e, ás veces, incluso bastante confusas; unha fe totalmente inxustificada desde o punto de vista da ciencia e que, nese sentido, é «metafísica»11. Con todo, logo de expoñer todas estas advertencias, sigo considerando que o principal cometido da lóxica do coñecemento é propoñer un concepto de ciencia empírica, co fin de facer que o uso lingüístico, que agora é en certo modo impreciso, sexa tan definido como sexa posible, así como de trazar unha liña clara de demarcación entre a ciencia e as ideas metafísicas, a pesar de que estas ideas puidesen ter contribuído no avance da ciencia ao longo da súa historia. 5 A experiencia como método o cometido de formular unha definición aceptable da idea dunha «ciencia empírica» non está libre de dificultades. Algunhas delas xorden do feito de que ten que haber moitos sistemas teóricos cunha estrutura lóxica moi similar á do que, nun momento particular, é o sistema da ciencia empírica aceptado. Esta situación descríbese a miúdo dicindo que hai un gran 11 Cf. tamén Planck, Positivismus und reale Aussenwelt (1931) e Einstein, Die Religiosität der Forschung, en Mein Weltbild, 1934, p. 43; tradución ao inglés de A. Harris: The World as I See It, 1935, p. 23 e ss. *Véxase tamén o apartado 85 e o meu Postscript. 107 a lóxida da descuberta científica número (presumiblemente un número infinito) de «mundos loxicamente posibles». Non obstante, a intención do sistema chamado «ciencia empírica» é representar unicamente un mundo: o «mundo real» ou o «mundo da nosa experiencia»1*. Para precisar un pouco máis esta idea, podemos distinguir tres requisitos que terá que cumprir o noso sistema teórico empírico. En primeiro lugar, ten que ser sintético, para poder representar un mundo non contraditorio, un mundo posible. En segundo lugar, ten que cumprir o criterio de demarcación (cf. apartados 6 e 21), é dicir, non pode ser metafísico, senón que ten que representar un mundo da experiencia posible. En terceiro lugar, ten que ser un sistema que se distinga dalgún modo doutros sistemas semellantes por ser o único que representa o noso mundo da experiencia. Pero como se distinguirá o sistema que representa o noso mundo da experiencia? A resposta é: polo feito de que fose sometido a comprobacións e as superase. Isto quere dicir que se distinguirá aplicándolle o método dedutivo que eu pretendo analizar e describir. A «experiencia», de acordo con este punto de vista, preséntase como un método distintivo, a través do cal se pode distinguir un sistema teórico dos outros, polo que a ciencia empírica parece caracterizarse non só pola súa forma lóxica, senón tamén polo seu método distintivo. (Esta, por suposto, é tamén a opinión dos indutivistas, que intentan caracterizar a ciencia empírica polo seu uso do método indutivo). A teoría do coñecemento, cuxo cometido é a análise do método ou procedemento exclusivos da ciencia empírica, pódese describir, de acordo co anterior, como unha teoría do método empírico: unha teoría do que polo xeral se denomina «experiencia». *1 Cf. apéndice *x. 108 Karl Popper 6 A falsificabilidade como criterio de demarcación O criterio de demarcación inherente á lóxica indutiva (é dicir, o dogma positivista do sentido) é equivalente ao requisito de que todos os enunciados da ciencia empírica (ou todos os enunciados «con sentido») teñan que demostrar a capacidade de seren, ao cabo, decididos con respecto á súa verdade e falsidade; diremos que teñen que ser «decidibles de modo concluínte». Isto quere dicir que a súa forma ten que permitir que sexa loxicamente posible verificalos e falsificalos. Así, Schlick di: «[...] un enunciado verdadeiro ten que demostrar a capacidade dunha verificación concluínte»1; e Waismann di, aínda máis claramente: «Se non hai xeito posible de determinar se un enunciado é verdadeiro, ese enunciado non ten sentido en absoluto, posto que o sentido dun enunciado é o método da súa verificación»2. Agora ben, na miña opinión, a indución non existe*1. Polo tanto, a inferencia de teorías a partir de enunciados singulares «verificados pola experiencia» (signifique isto o que signifique), é loxicamente inadmisible. As teorías, xa que logo, nunca son verificables empiricamente. Se queremos evitar o erro dos positivistas de eliminar, co noso criterio de demarcación, os sistemas teóricos das ciencias naturais*2, temos que escoller un criterio que nos permita deixar paso no eido da ciencia empírica incluso a enunciados que non se poidan verificar. 1 Schlick, Naturwissenschaften 19, 1931, p. 150. 2 Waismann, Erkenntnis 1, 1903, p. 229. *1 Por suposto, aquí non considero a chamada «indución matemática». O que nego é a existencia da indución nas chamadas «ciencias indutivas»: a existencia tanto de «procedementos indutivos» como de «inferencias indutivas». *2 Na súa Logical Syntax (1937, p. 321 e ss.), Carnap admitía que isto era un erro (facendo referencia á miña crítica), e aínda o facía máis a fondo en «Testability and Meaning», onde recoñecía o feito de que as leis universais non só son «adecuadas» para a ciencia, senón que son mesmo «esenciais» (Philosophy of Science 4, 1937, p. 27). Porén, na súa obra indutivista Logical Foundations of Probability (1950), volve a unha postura moi semellante á que se critica aquí: ao descubrir que as leis naturais teñen probabilidade cero (p. 511), vese obrigado a dicir (p. 575) que, aínda que non as haxa que expulsar da ciencia, esta ben as escusa. 109 a lóxida da descuberta científica Mais, sen dúbida ningunha, eu só aceptarei un sistema como empírico ou científico se se pode comprobar mediante a experiencia. Estas consideracións indican que non se debe tomar como criterio de demarcación a verificabilidade dun sistema, senón a súa falsificabilidade*3. Noutras palabras: non lle esixirei a un sistema científico a capacidade de ser caracterizado definitivamente nun sentido positivo, senón que esixirei que posúa unha forma lóxica que permita que se poida caracterizar, por medio de comprobacións empíricas, nun sentido negativo: un sistema científico empírico tense que poder refutar por medio da experiencia3. (Deste xeito, o enunciado «Aquí mañá vai chover ou non» non se considerará empírico, simplemente porque non se pode refutar, mentres que o enunciado «Aquí mañá vai chover» si se considerará empírico.) O criterio de demarcación aquí proposto podería suscitar diversas obxeccións. En primeiro lugar, podería parecer desatinado suxerir que a ciencia, que se supón que nos debería proporcionar información segura, se deba caracterizar por cumprir un requisito negativo coma a refutabilidade. No entanto, demostrarei, nos apartados que van do 31 ao 46, que esta obxección ten pouco peso, pois a cantidade de información segura sobre o mundo que expresa un enunciado científico é meirande canto maior é a posibilidade de que se opoña, debido ao seu carácter *3 Téñase en conta que propoño a falsificabilidade como criterio de demarcación e non de sentido. Téñase en conta, ademais, que xa critiquei severamente (apartado 4) o uso da idea do sentido como criterio de demarcación, e que me volvo enfrontar ao dogma do sentido, aínda con máis dureza, no apartado 9. Polo tanto, é un puro mito (aínda que moitas das refutacións da miña teoría se basearon neste mito) que eu propuxese algunha vez a falsificabilidade como criterio de sentido. A falsificabilidade distingue entre dous tipos de enunciados con perfecto sentido: os falsificables e os non falsificables. Traza unha liña dentro da linguaxe con sentido, non ao seu redor. Véxase tamén o apéndice *i e o capítulo *i do meu Postscript, en especial os apartados *17 e *19, e os capítulos 1 e 11 da miña obra Conjectures and Refutations. 3 Atópanse ideas a este respecto, por exemplo, en Frank, Die Kausalität und ihre Grenzen, 1931, capítulo I, apartado 10 (p. 15 e ss.); Dubislav, Die Definition (3a edición de 1931), p. 100 e ss. (Cf. tamén, máis arriba, a nota 1 do apartado 4). 110 Karl Popper lóxico, a posibles enunciados singulares (non en van lles chamamos «leis» ás leis da natureza: canto máis prohiben, máis din). unha vez máis, poderíase intentar virar na miña contra a miña propia crítica do criterio de demarcación indutivista, posto que podería parecer que a falsificabilidade como criterio de demarcación pode suscitar obxeccións semellantes ás que eu mesmo suscitei en contra da verificabilidade. Este ataque non me preocuparía. A miña proposta baséase nunha asimetría entre a verificabilidade e a falsificabilidade; unha asimetría que resulta da forma lóxica dos enunciados universais*4, pois estes nunca son derivables de enunciados singulares, pero os enunciados singulares si os poden contradicir. Polo tanto, é posible, por medio de inferencias puramente dedutivas (coa axuda do modus tollens da lóxica clásica), argumentar a falsidade de enunciados universais a partir da veracidade de enunciados singulares. un argumento coma este para demostrar a falsidade de enunciados universais é o único tipo de inferencia estritamente dedutiva que se desenvolve, por así dicilo, na «dirección indutiva», é dicir, dos enunciados singulares aos universais. unha terceira obxección pode parecer máis seria. Poderíase dicir que, aínda que se admita a asimetría, segue a ser imposible, por diversas razóns, falsificar de xeito concluínte calquera sistema teórico, pois sempre é posible atopar algún xeito de evadir a falsificación, por exemplo, introducir ad hoc unha hipótese auxiliar ou cambiar ad hoc unha definición. Mesmo é posible, sen caer nunha incoherencia lóxica, adoptar simplemente a postura de non recoñecer ningunha experiencia falsificadora en absoluto. Cómpre recoñecer que os científicos non adoitan proceder deste xeito pero, loxicamente, este procedemento é posible, e poderíase afirmar que iso fai que o valor lóxico do criterio de demarcación que propoño sexa, como mínimo, discutible. *4 Esta asimetría analízase agora máis polo miúdo no apartado *22 do meu Postscript. 111 a lóxida da descuberta científica Teño que admitir a xustiza desta crítica, pero non por iso teño que retractarme da miña proposta de adoptar a falsificabilidade como criterio de demarcación. Vou propoñer (nos apartados 20 e ss.) que o método empírico se caracterizará por ser un método que exclúa precisamente esas vías de evasión da falsificación que, como insiste en afirmar atinadamente o meu detractor imaxinario, son loxicamente posibles. De acordo coa miña proposta, o que caracteriza o método empírico é o seu xeito de expoñer á falsificación, de todos os xeitos que se poidan concibir, o sistema que se vai someter a proba. O seu obxectivo non é salvarlles a vida a sistemas insustentables, senón ao contrario, seleccionar aquel que por comparación sexa o máis adecuado, expoñéndoos todos á loita máis implacable pola supervivencia. O criterio de demarcación proposto tamén nos leva a unha solución do problema da indución de hume: o problema da validez das leis naturais. A raíz deste problema é a aparente contradición entre o que se pode chamar «a tese fundamental do empirismo» (a tese de que só a experiencia pode decidir a verdade ou falsidade dos enunciados científicos) e a conclusión a que chega hume de que os argumentos indutivos son inadmisibles. Esta contradición só xorde se se supón que todos os enunciados científicos empíricos teñen que ser «decidibles de xeito concluínte», é dicir, que tanto a súa verificación coma a súa falsificación teñen que ser posibles en principio. Se renunciamos a este requisito e admitimos tamén como empíricos enunciados que só son decidibles nun sentido (decidibles unilateralmente e, especialmente, falsificables) e que se poden someter a intentos sistemáticos de falsificación, a contradición desaparece: o método de falsificación non presupón inferencia indutiva ningunha, senón só as transformacións tautolóxicas da lóxica dedutiva, cuxa validez non se pon en dúbida4. 4 Con respecto a isto, véxase tamén o meu artigo mencionado na nota 1 do apartado 4, *reimpreso agora aquí, no apéndice *i, e o meu Postscript, especialmente o apartado *2. 112 Karl Popper 7 O problema da «base empírica» Se é que a falsificabilidade se pode aplicar como criterio de demarcación, cómpre que haxa enunciados singulares dispoñibles que sirvan como premisa para falsificar inferencias. O noso criterio, xa que logo, parece que só desvía o problema para levarnos do cuestionamento inicial sobre o carácter empírico das teorías ao cuestionamento do carácter empírico dos enunciados singulares. Aínda así, algo adiantouse posto que, na práctica da investigación científica, no tocante aos sistemas teóricos, a demarcación faise urxente ás veces, mentres que, no caso dos enunciados singulares, raramente xorden as dúbidas sobre o seu carácter empírico. É certo que se dan erros de observación e que estes provocan enunciados singulares falsos, pero o científico case nunca ten ocasión de describir un enunciado singular como non empírico ou metafísico. Polo tanto, os problemas da base empírica (é dicir, os problemas relativos ao carácter empírico dos enunciados singulares e ao modo de sometelos a comprobacións) desempeñan un papel na lóxica da ciencia que difire en certo modo do desempeñado pola maioría dos outros problemas que nos van ocupar. Isto é así porque a meirande parte destes últimos gardan unha estreita relación coa práctica da investigación, mentres que o problema da base empírica corresponde case exclusivamente á teoría do coñecemento. Así e todo, terei que ocuparme deles, pois teñen suscitado moitos puntos escuros. Isto é especialmente certo en canto á relación entre experiencias perceptuais e enunciados básicos. (Chámolle «enunciado básico» ou «proposición básica» a un enunciado que pode servir como premisa para unha falsificación empírica; en resumo, o enunciado dun feito singular). As experiencias perceptuais téñense considerado decote como unha especie de xustificación dos enunciados básicos. Sostíñase que estes enunciados «se basean» nestas experien113 a lóxida da descuberta científica cias; que a súa veracidade queda «patente por medio da inspección» a través destas experiencias; que se fai «evidente» a través das mesmas, etc. Todas estas expresións amosan a tendencia perfectamente válida de subliñar a estreita conexión existente entre os enunciados básicos e as nosas experiencias perceptuais. Porén, tamén se pensaba, con razón, que os enunciados só se poden xustificar loxicamente por medio de enunciados. Así, a conexión entre as percepcións e os enunciados seguía sendo escura e describíase empregando expresións igualmente escuras que non aclaraban nada, senón que pasaban por alto as dificultades ou, no mellor dos casos, insinuábanas por medio de metáforas. Neste punto tamén se pode atopar unha solución, segundo eu creo, se separamos claramente os aspectos psicolóxicos do problema dos lóxicos e metodolóxicos. Temos que distinguir, por unha parte, entre as nosas experiencias subxectivas ou as nosas sensacións de convicción, que nunca poden xustificar un enunciado (aínda que poden ser asunto digno de investigación psicolóxica) e, por outra parte, as relacións lóxicas obxectivas que subsisten entre os diversos sistemas de enunciados científicos e dentro de cada un deles. Os problemas da base empírica analizaranse polo miúdo nos apartados que van do 25 ao 30. Agora será mellor volver ao problema da obxectividade científica, xa que os termos «obxectivo» e «subxectivo», que acabo de empregar, precisan de aclaración. 8 Obxectividade científica e convicción subxectiva As palabras «obxectivo» e «subxectivo» son termos filosóficos cargados en exceso cunha herdanza de usos contraditorios e debates interminables e non concluíntes. O meu uso dos termos «obxectivo» e «subxectivo» non difire do uso que fai Kant deles. El emprega a palabra «obxectivo» 114 Karl Popper para indicar que o coñecemento científico debe ser xustificable, independentemente do capricho de ninguén: unha xustificación é «obxectiva» se, en principio, calquera a pode comprobar e entender. «Se algo é válido –escribe el– para alguén en pleno uso da razón, entón os seus fundamentos son obxectivos e suficientes»1. Agora ben, eu sosteño que as teorías científicas nunca son totalmente xustificables ou verificables, pero que si poden ser comprobables. Direi, xa que logo, que a obxectividade dos enunciados científicos radica no feito de que se poden comprobar intersubxectivamente*1. Kant aplica a palabra «subxectivo» ás nosas sensacións de convicción (en maior ou menor grao)2. É cometido da psicoloxía estudar como se producen estas sensacións. Poden xurdir, por exemplo, «de acordo coas leis de asociación»3. Tamén as razóns obxectivas poden servir como «causas subxectivas de xuízo»4, na medida en que podemos reflexionar sobre estas razóns e convencérmonos da súa solidez. Kant foi quizais o primeiro en decatarse de que a obxectividade dos enunciados científicos está estreitamente vinculada á construción de teorías: ao uso de hipóteses e enunciados universais. Só cando certos acontecementos se repitan de acordo con regras ou regularidades, coma no caso dos experimentos 1 Kritik der reinen Vernunft, Methodenlehre, 2. Haupstück, 3. Abschnitt (2a edición, p. 848; tradución ao inglés de N. Kemp Smith, 1933: Critique of Pure Reason, The Transcendental Doctrine of Method, capítulo ii, apartado 3, p. 645). *1 Desde aquela, xeneralicei esta formulación, posto que a comprobación intersubxectiva é simplemente un aspecto moi importante da idea máis xeral da crítica intersubxectiva ou, noutras palabras, da idea do control racional mutuo por medio do debate crítico. Esta idea máis xeral, analizada detidamente nos capítulos 23 e 24 da miña obra Open Society and Its Enemies e no apartado 32 da miña obra Poverty of Historicism, tamén se analiza no meu Postscript, especialmente nos capítulos *i, *ii e *vi. 2 Ibíd. 3 Cf. Kritik der reinen Vernunft, Transcendentale Elementarlehre, apartado 19 (2a edición, p. 142; tradución ao inglés de N. Kemp Smith, 1933: Critique of Pure Reason, Transcendental Doctrine of Elements, apartado 19, p. 159). 4 Cf. Kritik der reinen Vernuft, Methodenlehre, 2. Haupstück, 3. Abschnitt (2a edición, p. 849; tradución ao inglés, capítulo ii, apartado 3, p. 646). 115 a lóxida da descuberta científica repetibles, calquera (en principio) poderá comprobar as nosas observacións. Non tomamos en serio nin sequera as nosas propias observacións nin as aceptamos como observacións científicas ata que as repetimos e as comprobamos. Só con estas repeticións nos podemos convencer de que non nos atopamos ante unha simple «coincidencia» illada, senón ante acontecementos que, pola súa regularidade e reproducibilidade, son, en principio, comprobables intersubxectivamente5. Todo físico experimental coñece eses sorprendentes e inexplicables «efectos» aparentes que mesmo se poden reproducir durante un tempo no seu laboratorio pero que, finalmente, desaparecen sen deixar rastro. Por suposto, ningún físico diría neste caso que fixo unha descuberta científica (aínda que podería intentar reordenar os experimentos para facer reproducible o efecto). De feito, o efecto físico, de gran relevancia científica, pódese definir como aquel que pode reproducir regularmente calquera que leve a cabo o experimento adecuado do xeito prescrito. Ningún físico serio presentaría para a súa publicación, como descuberta científica, un destes «efectos ocultos», como eu propoño chamarlles: un efecto para cuxa reprodución non podería dar instrucións. A «descuberta» sería rexeitada rapidamente por quimérica, simplemente porque os intentos de comprobala levarían a resultados negativos6. (De aquí dedúcese 5 Kant decatouse de que da necesaria obxectividade dos enunciados científicos se deduce que teñen que ser en todo momento comprobables intersubxectivamente e que, polo tanto, teñen que ter a forma de leis ou teorías universais. Formulou esta descuberta dun xeito un tanto escuro co seu «principio da sucesión temporal de acordo coa lei da causalidade» (cuxo principio el consideraba que podería demostrar a priori empregando o razoamento que aquí se indica). Eu non postulo ningún principio semellante a este (cf. apartado 12), pero estou de acordo en que os enunciados científicos, posto que teñen que ser comprobables intersubxectivamente, teñen que ter sempre o carácter de hipóteses universais. *Véxase tamén a nota *1 do apartado 22. 6 Na literatura da física atópanse algúns exemplos de informes, realizados por investigadores serios, que dan conta da aparición de efectos que non se puideron reproducir, pois as probas posteriores levaron a resultados negativos. Un exemplo ben coñecido da época recente é o inexplicable resultado positivo do experimento de Michelson que observou Miller (1921-1926) en Mount Wilson, logo de que el mesmo (ao igual ca Morley) reproducise previamente o resultado negativo de Michelson. Mais, como as probas posteriores volveron 116 Karl Popper que calquera controversia sobre a cuestión de se algunha vez se dan acontecementos que en principio son irrepetibles e únicos non é decisión da ciencia: sería unha controversia metafísica). Podemos volver agora a unha idea tratada no apartado anterior: á miña tese de que unha experiencia subxectiva, ou unha sensación de convicción, nunca pode xustificar un enunciado científico, e de que non pode desempeñar papel ningún na ciencia, salvo o de obxecto dunha pescuda empírica (psicolóxica). Independentemente do intensa que poida ser unha sensación de convicción, nunca pode xustificar un enunciado. Así, eu podo estar totalmente convencido da verdade dun enunciado; podo estar seguro dos sinais das miñas percepcións; podo sentirme superado pola intensidade da miña experiencia: calquera tipo de dúbida talvez me pareza absurda. Pero dálle isto a máis mínima razón á ciencia para aceptar o meu enunciado? Pódese xustificar un enunciado calquera polo feito de que K.r.P. estea totalmente convencido da súa verdade? A resposta é negativa e calquera outra resposta sería incompatible coa idea da obxectividade científica. Nin sequera o feito, para min solidamente comprobado, de que estea experimentando esta sensación de convicción pode aparecer dentro do campo da ciencia obxectiva, salvo baixo a forma dunha hipótese psicolóxica, que, por suposto, require unha comprobación intersubxectiva: a partir da conxectura de que eu experimente esta sensación de convicción, o psicólogo pode deducir, coa axuda de teorías, tanto psicolóxicas como doutro tipo, certas predicións sobre a miña conduta e estas pódense confirmar ou refutar coa realización de comprobacións experimentais. Pero, desde un punto de vista epistemolóxico, é completamente irrelevante se a miña sensación de convicción era forte ou feble; se ben xurdiu dunha impresión forte ou mesmo irresistible de certeza indubidable dar resultados negativos, agora adóitase considerar estes últimos como determinantes e a explicar o resultado diverxente de Miller como «debido a erros de procedencia descoñecida». *Véxase tamén o apartado 22, especialmente a nota ao pé *1. 117 a lóxida da descuberta científica (ou «autoevidencia»), ou simplemente dunha suposición dubidosa. Nada disto ten relación co xeito en que se poden xustificar os enunciados científicos. Desde logo, este tipo de consideracións non dan resposta ao problema da base empírica pero, cando menos, axúdannos a ver a súa principal dificultade. Ao esixirmos obxectividade para os enunciados básicos, así como para outros enunciados científicos, privámonos a nós mesmos do que poderiamos esperar que fose un xeito lóxico de reducir a verdade dos enunciados científicos ás nosas experiencias. Ademais, non nos permitimos outorgarlles unha categoría preferente aos enunciados que describen experiencias, coma os enunciados que describen as nosas percepcións (e que ás veces se denominan «enunciados protocolarios»). Estes pódense dar na ciencia só como enunciados psicolóxicos e, polo tanto, como un tipo de hipóteses cuns estándares de comprobación intersubxectiva (tendo en conta o estado actual da psicoloxía) non moi elevados, desde logo. Sexa cal sexa a nosa resposta final á pregunta da base empírica, unha cousa debe quedar clara: se engadimos á nosa esixencia que os enunciados científicos teñen que ser obxectivos, entón os enunciados que pertencen á base empírica da ciencia tamén teñen que ser obxectivos, é dicir, comprobables intersubxectivamente. Non obstante, a comprobabilidade intersubxectiva sempre implica que se poden deducir outros enunciados comprobables a partir dos enunciados que se van someter a proba. Así, se os enunciados básicos, á súa vez, van ser comprobables intersubxectivamente, daquela na ciencia non pode haber enunciados fundamentais: na ciencia non pode haber enunciados que non se poidan comprobar e, polo tanto, non pode haber enunciados que, en principio, non se poidan refutar recorrendo á falsificación dalgunha das conclusións que se poden deducir deles. 118 Karl Popper Deste xeito, chegamos á seguinte idea. Os sistemas de teorías contrástanse deducindo deles enunciados dun nivel máis baixo de universalidade. Estes enunciados, á súa vez, posto que van ser comprobables intersubxectivamente, teñen que ser comprobables do mesmo xeito, e así ad infinitum. Poderíase pensar que esta idea conduce a unha regresión infinita e que, xa que logo, é insustentable. No apartado 1, cando criticaba a indución, propuxen a obxección de que esta podería levar a unha regresión infinita e, agora, ao lector poderíalle parecer que se pode esgrimir a mesma obxección en contra do procedemento de comprobación dedutiva que eu mesmo defendo. Porén, non é así. O método de comprobación dedutiva non pode demostrar nin xustificar os enunciados que se someten a comprobación, nin é ese o seu cometido. Polo tanto, non hai perigo dunha regresión infinita. Mais cómpre admitir que a situación que acabo de expoñer (a comprobabilidade ad infinitum e a ausencia de enunciados fundamentais que non precisan comprobación) si que dá lugar a un problema. Isto é así porque, claramente, na realidade as comprobacións non se poden suceder ad infinitum: antes ou despois temos que parar. Sen afondar aquí na análise deste problema, só quero sinalar que o feito de que as comprobacións non se poidan suceder perpetuamente non se opón á miña esixencia de que todo enunciado científico teña que ser comprobable. Eu non esixo que todo enunciado científico teña que ser realmente comprobado antes de aceptalo. Só esixo que todo enunciado deste tipo ten que demostrar a capacidade de someterse a comprobación ou, noutras palabras, négome a aceptar a idea de que haxa enunciados na ciencia que teñamos que aceptar con resignación como verdadeiros porque non pareza posible, por razóns lóxicas, sometelos a comprobación. 119 a lóxida da descuberta científica 2 SOBRE O PROBLEMA DUNHA TEORÍA DO MÉTODO CIENTÍFICO De acordo coa proposta que fixen máis arriba, a epistemoloxía, ou a lóxica da descuberta científica, debíase identificar coa teoría do método científico. A teoría do método, na medida en que vai máis aló da análise puramente lóxica das relacións entre enunciados científicos, ocúpase da escolla de métodos (das decisións sobre o xeito de manexar os enunciados científicos). Estas decisións, por suposto, van depender á súa vez do obxectivo que escollamos de entre unha serie de obxectivos posibles. A decisión que aquí se propón para formular regras adecuadas para o que eu chamo o «método empírico» está estreitamente vinculada ao meu criterio de demarcación: propoño adoptar as regras que aseguren a comprobabilidade dos enunciados científicos ou, o que é o mesmo, a súa falsificabilidade. 9 Por que as decisións metodolóxicas son indispensables Que son as regras do método científico e por que as necesitamos? Pode haber unha teoría destas regras, unha metodoloxía? A maneira de contestar estas preguntas dependerá en grande medida da actitude que un teña cara á ciencia. Aqueles que, coma os positivistas, consideren a ciencia empírica como un sistema de enunciados que cumpren certos criterios lóxicos coma o sentido ou a verificabilidade, darán unha resposta. Moi diferente resposta darán aqueles que se inclinan por tomar (como eu fago) por característica distintiva dos enunciados empíricos a súa susceptibilidade de revisión, o feito de que se poidan criticar e desbancar por medio doutros mellores, e que consideran que o seu cometido é analizar a habilidade característica que ten a ciencia de avanzar e a maneira característica en que se fai unha escolla, en casos cruciais, entre sistemas de teorías contraditorios. 120 Karl Popper Estou totalmente disposto a admitir que existe a necesidade dunha análise puramente lóxica das teorías, unha análise que non teña en conta o xeito en que estas cambian e se desenvolven. Porén, este tipo de análise non aclara aqueles aspectos das ciencias empíricas que eu, pola miña parte, teño en tan alta estima. un sistema coma a mecánica clásica pode ser «científico» ata o punto que un queira, pero aqueles que o defenden dogmaticamente (crendo, talvez, que é cometido deles defender un sistema de tanto suceso contra a crítica mentres non sexa refutado de xeito concluínte), están adoptando a postura xustamente contraria á actitude crítica que, desde o meu punto de vista, é a que debe adoptar o científico. En realidade, nunca se pode producir unha refutación concluínte dunha teoría, pois sempre é posible dicir que os resultados experimentais non son fiables ou que as discrepancias que se afirma que existen entre os resultados experimentais e a teoría son só aparentes e desaparecerán co avance da nosa comprensión (na loita contra Einstein, ambos os dous argumentos se empregaron profusamente na defensa da mecánica newtoniana e no eido das ciencias sociais abundan argumentos semellantes). Se se insiste nas probas rigorosas (ou nas refutacións rigorosas*1) nas ciencias empíricas, nunca se beneficiará un da experiencia nin aprenderá con ela dos propios erros. Polo tanto, de caracterizarmos a ciencia empírica simplemente pola estrutura formal ou lóxica dos seus enunciados, non daremos excluído dela esa forma dominante da metafísica que resulta de ascender unha teoría científica obsoleta ao rango de verdade incontrovertible. *1 Engadín aquí, entre parénteses, as palabras «ou nas refutacións rigorosas»: (a) porque se dan a entender claramente no que se di inmediatamente antes («nunca se pode producir unha refutación concluínte dunha teoría») e (b) porque me teñen interpretado mal constantemente, ao considerar que defendo un criterio (e, máis aínda, un criterio de sentido en lugar dun criterio de demarcación) baseado nunha doutrina da falsificabilidade «total» ou «concluínte». 121 a lóxida da descuberta científica Estas son as razóns da miña proposta de que a ciencia empírica se debía caracterizar polos seus métodos: pola nosa maneira de manexar os sistemas científicos, polo que facemos con eles e o que lles facemos. De modo que intentarei establecer as regras ou, se se quere, as normas, que guían o científico cando se ocupa da investigación ou da descuberta, no sentido en que aquí as entendemos. 10 A perspectiva naturalista sobre a teoría do método A insinuación que fixen no apartado anterior sobre a diferenza profundamente arraigada entre a miña postura e a dos positivistas precisa dunha explicación. Ao positivista non lle gusta a idea de que haxa problemas significativos fóra do ámbito da ciencia empírica «positiva», problemas que se tratarían cunha auténtica teoría filosófica. Non lle gusta a idea de que haxa unha auténtica teoría do coñecemento, unha epistemoloxía ou unha metodoloxía*1. Desexa ver nos supostos problemas filosóficos simples «pseudoproblemas» ou «crebacabezas». Agora ben, este desexo, que, por certo, non expresa como un desexo nin como unha proposta, senón como un enunciado baseado nos feitos*2, sempre se pode compracer. Non hai nada máis doado que desenmascarar un problema aplicándolle os cualificativos de «sen sentido» ou «pseudo». O único que tes que facer é establecer un significado oportunamente limitado para a palabra «sentido» e axiña te verás obrigado a dicir, ante calquera pregunta molesta, que non *1 Durante os dous anos anteriores á primeira publicación deste libro, a crítica constante contra as miñas ideas, suscitada por algúns membros do Círculo de Viena, era que unha teoría do método que non fose unha ciencia empírica nin lóxica pura era imposible: o que quedaba fóra destes dous ámbitos era un absoluto disparate. (Wittgenstein aínda mantiña a mesma opinión en 1948; cf. o meu artigo «The Nature of Philosophical Problems», The British Journal for the Philosophy of Science 3, 1952, nota da p. 128). Máis tarde, a crítica constante afianzouse na lenda de que eu propuxera substituír o criterio de verificabilidade por un criterio de falsificabilidade do sentido. Véxase o meu Postscript, en especial os apartados que van do *19 ao *22. *2 Desde aquela, algúns positivistas mudaron de actitude; véxase, máis abaixo, a nota 6. 122 Karl Popper lle dás atopado o sentido. É máis, se só admites como problemas con sentido os das ciencias naturais1, calquera debate sobre o concepto de «sentido» acabará sendo tamén un debate sen sentido2. O dogma do sentido, unha vez consagrado, elévase para sempre por riba da batalla. xa nunca máis se poderá atacar. Tórnase (nas propias palabras de Wittgenstein) «incontestable e definitivo»33 A controvertida cuestión sobre se a filosofía existe ou ten dereito a existir é case tan antiga coma a propia filosofía. unha e outra vez, xorde un movemento filosófico totalmente novo que por fin descobre que os vellos problemas filosóficos eran pseudoproblemas e que confronta os terribles disparates da filosofía coa sensatez da ciencia con sentido, positiva e empírica. E, unha e outra vez, os odiados defensores da «filosofía tradicional» intentan explicarlles aos líderes do último ataque positivista que o principal problema da filosofía é a análise crítica do recurso á autoridade da «experiencia»4, precisamente esa «experiencia» que os máis recentes descubridores do positivismo, coma sempre, dan inxenuamente por suposta. Non obstante, o positivista responde a estas obxeccións encolléndose de ombreiros: para el non significan nada, posto que non pertencen á ciencia empírica, que é a única que ten sentido. A «experiencia» para el é un programa, non un problema (a menos que sexa obxecto de estudo da psicoloxía empírica). Non creo que os positivistas vaian responder doutro xeito aos meus propios intentos de analizar a «experiencia», que eu inter1 Wittgenstein, Tractatus Logico-Philosophicus, Proposición 6.53. 2 Ao final do Tractatus (no que explica o concepto de sentido), Wittgenstein escribe: «As miñas proposicións son esclarecedoras do seguinte modo: aquel que me entende acaba admitindo que non teñen ningún sentido [...]». Comp. Sextus Adv. Log. ii, 481; Loeb ed. ii 488). 3 Wittgenstein, ob. cit., ao final do seu Prefacio. 4 H. Gomperz (Weltanschauungslehre I, 1905, p. 35) escribe: «Se consideramos o infinitamente problemático que é o concepto de experiencia [...] podémonos ver obrigados a crer que [...] a afirmación entusiasta é moito menos apropiada con respecto a ela [...] que a crítica máis coidadosa e moderada [...]». 123 a lóxida da descuberta científica preto como o método da ciencia empírica. Isto é así porque para eles só existen dous tipos de enunciados: as tautoloxías lóxicas e os enunciados empíricos. Se a metodoloxía non é lóxica, concluirán, ten que ser unha rama dalgunha ciencia empírica: a ciencia, digamos, da conduta dos científicos no traballo. Este punto de vista, segundo o cal a metodoloxía, á súa vez, é unha ciencia empírica (un estudo do comportamento real dos científicos ou do procedementos «científicos» reais) pódese caracterizar como naturalista. unha metodoloxía naturalista (en ocasións chamada «teoría indutiva da ciencia»5) ten, sen dúbida, o seu valor. A un estudoso de lóxica da ciencia ben lle pode interesar e pode aprender dela. Pero o que eu chamo «metodoloxía» non se debería considerar como unha ciencia empírica. Creo que non é posible decidir, por medio dos métodos dunha ciencia empírica, cuestións tan controvertidas coma se a ciencia usa en realidade un principio de indución ou non. E as miñas dúbidas increméntanse cando lembro que o feito de chamarlle a algo «ciencia» ou a alguén «científico» ten que manterse sempre como unha cuestión de convención ou unha decisión que se toma. Eu coido que as cuestións deste tipo deben tratarse dun xeito diferente. Por exemplo, podemos tomar en consideración e comparar dous sistemas diferentes de regras metodolóxicas, dos cales só un conte cun principio de indución. logo, podemos investigar se ese principio, unha vez presentado, se pode aplicar sen provocar contradicións, se nos serve de axuda e se de veras o necesitamos. Este tipo de investigación é a que me leva a prescindir do principio de indución: non é porque de feito non se utilice nunca na ciencia, senón porque creo que non é necesario, que non nos serve de axuda e que incluso provoca contradicións. 5 Dingler, Physik und Hypothesis, Versuch einer induktiven Wissenschaftslehre, 1921; así mesmo, V.Kraft, Die Grundformen der wissenschaftlichen Methoden, 1925. 124 Karl Popper Por tanto, eu rexeito o punto de vista naturalista. Fáltalle sentido crítico. Os seus defensores non se decatan de que, cada vez que cren que descobren un feito, o único que fan é propoñer unha convención6, de aí que a convención poida facilmente converterse nun dogma. Esta crítica da achega naturalista non só se refire ao seu criterio do sentido, senón tamén á súa idea da ciencia e, xa que logo, á súa idea do método empírico. 11 As regras metodolóxicas como convencións As regras metodolóxicas considéranse aquí convencións. Poderíanse describir como as regras do xogo da ciencia empírica. Difiren das regras da lóxica pura, en parte, do mesmo xeito que difiren as regras do xadrez, que poucos considerarían como parte da lóxica pura: en vista de que as regras da lóxica pura regulan as transformacións das fórmulas lingüísticas, o resultado dunha investigación sobre as regras do xadrez poderíase titular «A lóxica do xadrez», pero dificilmente se podería titular «lóxica», sen máis (do mesmo xeito, o resultado dunha investigación sobre as regras do xogo da ciencia, é dicir, da descuberta científica, pódese titular «A lóxica da descuberta científica»). Pódense dar dous exemplos sinxelos de regras metodolóxicas. Abondarán para mostrar que non sería nada adecuado situar unha investigación sobre o método ao mesmo nivel ca unha investigación puramente lóxica. 6 (Engadido en 1934, cando esta obra se atopaba na fase das probas). Levo anos defendendo a idea, exposta brevemente aquí, de que o feito de chamarlle a algo «enunciado auténtico» ou «pseudoenunciado sen sentido» sexa unha cuestión de decisión (tamén a idea de que a exclusión da metafísica é, igualmente, cuestión dunha decisión). Porén, a miña presente crítica do positivismo (e da achega naturalista) xa non se pode aplicar, polo visto, á Logische Syntax der Sprache, de Carnap, 1934, onde el tamén adopta o punto de vista segundo o cal todas estas cuestións se basean en decisións (o «principio de tolerancia»). Segundo o prefacio de Carnap, Wittgenstein leva anos formulando unha idea parecida en obras inéditas. (*Véxase máis arriba, non obstante, a nota *1). A Logische Syntax de Carnap publicouse cando a presente obra estaba na fase das probas. Lamento non poder analizala no meu texto. 125 a lóxida da descuberta científica (1) O xogo da ciencia, en principio, non ten fin. Aquel que un día decide que os enunciados científicos non precisan de máis comprobación e que se poden considerar finalmente verificados, retírase do xogo. (2) unha vez que se propuxo e se someteu a comprobación unha hipótese, e esta demostrou a súa validez*1, non se poderá retirar sen unha «boa razón». unha «boa razón» pode ser, por exemplo, a substitución da hipótese por outra que se poida comprobar mellor ou a falsificación dunha das consecuencias da hipótese (a idea de «que se poida comprobar mellor» analizarase logo con máis detalle). Estes dous exemplos amosan o carácter das regras metodolóxicas. Obviamente, son moi diferentes das regras que se adoitan denominar «lóxicas». Aínda que a lóxica quizais poida establecer criterios para decidir se un enunciado é comprobable, desde logo non se ocupa de se alguén se dedica ou non a comprobalo. No apartado 6, intentei definir a ciencia empírica coa axuda do criterio de falsificabilidade. No entanto, como me vin obrigado a recoñecer a xustiza de certas obxeccións, prometín un suplemento metodolóxico para a miña definición. Do mesmo xeito que o xadrez se debe definir mediante as regras que lle son propias, a ciencia empírica débese definir por medio das súas regras metodolóxicas. Para establecer estas regras, podemos proceder de xeito sistemático. En primeiro lugar, formúlase unha regra suprema, que serve como unha especie de norma para decidir sobre as demais regras e que, polo tanto, é dun tipo superior. É a que di que as demais regras do procedemento científico teñen que deseñarse de maneira que non protexan da falsificación a ningún enunciado da ciencia. As regras metodolóxicas, polo tanto, están estreitamente relacionadas con outras regras metodolóxicas e co noso criterio de demarcación. Pero a conexión non é estritamente dedu- *1 Con respecto á tradución «to prove one's mettle» («demostrar a súa validez») para «sich bewähren», véxase, máis abaixo, a primeira nota ao pé do capítulo 10 (Corroboración). 126 Karl Popper tiva nin lóxica1, senón que é o resultado de que as regras se constrúan co obxectivo de asegurar a aplicabilidade do noso criterio de demarcación. Así, procédese á súa formulación e aprobación de acordo cunha regra práctica dun tipo superior. Anteriormente presentouse un exemplo disto (cf. regra 1): as teorías que decidimos non someter a máis comprobacións deixarían de ser falsificables. Esta conexión sistemática entre as regras é a que fai que sexa adecuado falar dunha teoría do método. hai que recoñecer que os pronunciamentos desta teoría, como mostran os nosos exemplos, son na súa maioría convencións bastante obvias. Da metodoloxía non se deben agardar verdades profundas*2. Non obstante, pódenos axudar en moitos casos a aclarar a situación lóxica e mesmo a solucionar algúns problemas transcendentais que ata o de agora resultaran irresolubles. un destes problemas, por exemplo, é o que supón decidir se un enunciado de probabilidade debería aceptarse ou descartarse. (Cf. o apartado 68). Moitas veces tense posto en dúbida que os diversos problemas da teoría do coñecemento garden algunha relación sistemática entre eles e, así mesmo, que se poidan tratar de xeito sistemático. Espero mostrar neste libro que estas dúbidas non están xustificadas. A cuestión ten bastante importancia. A única razón que me levou a propoñer o meu criterio de demarcación é que resulta produtivo, que se poden aclarar e explicar unha grande cantidade de asuntos coa súa axuda. «As definicións son dogmas; só as conclusións que se derivan delas nos poden achegar información nova», di Menger2. Isto é certo, desde logo, no tocante á definición do concepto de «ciencia». Só a partir das consecuencias da miña definición da ciencia empírica, así como das decisións metodolóxicas que dependen desta definición, os científicos e científicas serán quen de ver 1 Cf. K. Menger. Moral, Wille und Weltgestaltung, 1934, pp. 58 e ss. *2 Sigo inclinado a defender algo así, a pesar de que os teoremas do tipo «grao de corroboración ≠ probabilidade» ou o meu «teorema sobre o contido de verdade» (véxase o Festschrift: Mind,Matter, and Method de Feigl, editado por P.K. Feyerabend e G. Maxwell, 1966, pp. 343-353) poidan resultar inesperados e non exactamente superficiais. 2 K. Menger, Dimensionstheorie, 1928, p. 76. 127 a lóxida da descuberta científica ata que punto se axusta esta á idea intuitiva que el ou ela teñen sobre o obxectivo dos seus esforzos*3. Os filósofos e as filósofas tamén considerarán útil a miña definición só no caso de que poida aceptar as súas consecuencias. Debémolos convencer de que estas consecuencias nos permiten detectar contradicións e deficiencias en teorías do coñecemento antigas e seguirlles a pista ata as suposicións e convencións das que xurdiron. Mais debémolos convencer tamén de que as nosas propostas non se ven ameazadas polo mesmo tipo de dificultades. Este método de detección e resolución de contradicións aplícase tamén dentro da propia ciencia, pero ten especial importancia na teoría do coñecemento. Este é o método, se é que existe algún, que se podería empregar para xustificar as convencións metodolóxicas e demostrar o seu valor3. Temo que é moi dubidoso que os filósofos consideren estas investigacións metodolóxicas como parte da filosofía pero, en realidade, iso non importa demasiado. Aínda así, cabe mencionar a este respecto que non poucas doutrinas metafísicas, que son indubidablemente filosóficas, poderían interpretarse como típicas hipostatizacións de regras metodolóxicas. No apartado seguinte, analizarase un exemplo disto, baixo a forma do chamado «principio de causalidade». Outro exemplo co que xa nos atopamos é o problema da obxectividade, pois a esixencia de obxectividade científica tamén se pode interpretar como unha regra metodolóxica: a regra segundo a cal só se poden introducir na ciencia os enunciados que sexan comprobables intersubxectivamente (véxanse os apartados 8, 20, 27 e outros). De feito, poderíase dicir que a meirande parte dos problemas da filosofía teórica, e os máis interesantes, se poden reinterpretar deste modo como problemas de método. *3 Véxase tamén o apartado *15 do meu Postscript: «O obxectivo da ciencia». 3 Na presente obra releguei a un segundo plano o método crítico (ou, se se quere, «dialéctico») de resolución de contradicións, posto que centrei o meu interese no intento de desenvolver os aspectos metodolóxicos prácticos das miñas ideas. Nun traballo polo de agora inédito, intentei seguir o camiño crítico e amosar que tanto os problemas da teoría clásica do coñecemento como os da moderna (desde Hume, pasando por Kant, ata Russell e Whitehead) pódense retrotraer ao problema da demarcación, é dicir, ao problema de atopar o criterio do carácter empírico da ciencia.

a Parte Compoñentes estruturais dunha teoría da experiencia

a lóxida da descuberta científica 3 TEORÍAS As ciencias empíricas son sistemas de teorías. A lóxica do coñecemento científico, xa que logo, pódese describir como unha teoría de teorías. As teorías científicas son enunciados universais. Como toda representación lingüística, son sistemas de signos ou símbolos. Por isto, non creo que sexa práctico expresar a diferenza entre as teorías universais e os enunciados singulares dicindo que os últimos son «concretos», mentres que as teorías son simplemente fórmulas ou esquemas simbólicos, posto que se pode dicir iso mesmo incluso dos enunciados máis «concretos»*1. As teorías son redes que se botan para pescar o que chamamos «o mundo»: para racionalizalo, explicalo e dominalo. Centramos os nosos esforzos en facer a malla cada vez máis fina. 12 Causalidade, explicación e dedución de predicións Ofrecer unha explicación causal dun acontecemento supón deducir un enunciado que o describa, empregando como premisas da dedución unha ou máis leis universais, xunto con certos *1 Esta é unha alusión crítica a unha idea que máis tarde describín como «instrumentalismo», representada por Mach, Wittgenstein e Schlick en Viena (cf. as notas *4 e 7 do apartado 4 e a nota 5 do apartado 27). Esta idea consiste en que unha teoría non é máis ca unha ferramenta ou un instrumento de predición. Analiceina e critiqueina nos meus artigos «A Note on Berkeley as a Precursor of Mach», Brit. Journ. Philos. Science 6, 1953, pp. 26 e ss.; «Three Views Concerning Human Knowledge», en Contemporary British Philosophy iii, 1956, editado por H.D. Lewis, pp. 355 e ss. e, con máis detalle, no meu Postscript, nos apartados que van do *11 ao *15 e do *19 ao *26. En resumo, o meu punto de vista consiste en que a nosa linguaxe ordinaria está chea de teorías: que a observación é sempre observación á luz das teorías; que o prexuízo indutivista é o único que leva a xente a pensar que podería existir unha linguaxe fenoménica, libre de teorías e distinguible dunha «linguaxe teórica», e, por último, que o teórico ou teórica se interesa pola explicación en sentido estrito, é dicir, en teorías explicativas comprobables: as aplicacións e as predicións só lle interesan por razóns teóricas, porque se poden usar como comprobacións das teorías. Véxase tamén o novo apéndice *x. 132 Karl Popper enunciados singulares, as condicións iniciais. Por exemplo, podemos dicir que ofrecemos unha explicación causal da rotura dun fío se descubrimos que o fío ten unha resistencia á tensión de 1 kg e lle colocaron enriba un peso de 2 kg. Se analizamos esta explicación causal, atoparemos varias partes constituíntes. Por unha parte, está a hipótese: «Cando a un fío se lle aplica unha carga cuxo peso excede o que caracteriza a resistencia á tensión do mesmo, romperá»; un enunciado que ten o carácter de lei universal da natureza. Por outra parte, temos enunciados singulares (neste caso, dous) que só son aplicables ao suceso específico en cuestión: «O peso característico deste fío é de 1 kg» e «O peso que lle colocaron enriba ao fío era de 2 kg»*1. Deste xeito, temos dous tipos distintos de enunciados, ambos os dous ingredientes necesarios para unha explicación causal completa. Son os (1) enunciados universais, é dicir, hipóteses con carácter de leis naturais e os (2) enunciados singulares, que se refiren ao suceso específico en cuestión e que eu chamarei «condicións iniciais». A partir de enunciados universais, xunto cunhas condicións iniciais, deducimos o enunciado singular: «Este fío vai romper». A este enunciado chamámoslle predición*2 específica ou singular. As condicións iniciais describen o que se adoita chamar a causa do suceso en cuestión (o feito de que se colocase unha carga de 2 kg nun fío cunha resistencia á tensión de 1 kg foi a «causa» de que este rompese). E a predición describe o que se *1 A seguinte sería unha análise máis clara deste exemplo (unha análise que distingue dúas leis, así como dúas condicións iniciais): «Cada fío dunha estrutura E dada (determinada polo seu material, grosor, etc.) ten un peso p característico, de maneira que o fío romperá se se lle colga calquera peso superior a p»; «A cada fío que teña a estrutura E1 correspóndelle un peso p1 característico igual a 1 kg». Estas son as dúas leis universais. As dúas condicións iniciais son: «Este é un fío con estrutura E1» e «O peso que se vai colocar neste fío é igual a 2 kg». *2 O termo «predición», tal e como se emprega aquí, comprende enunciados sobre o pasado («retrodicións») ou mesmo enunciados «dados» que pretendemos explicar («explicanda»); cf. a miña obra Poverty of Historicism, 1945, p. 133 da edición de 1957, e o apartado *15 do Postscript. 133 a lóxida da descuberta científica adoita chamar o efecto. Eu evitarei ambos os dous termos. Na física, o uso da expresión explicación causal, por regra xeral, restrínxese ao caso especial en que as leis universais teñen a forma de leis de «acción por contacto» ou, máis exactamente, de acción a unha distancia que tende a cero, que se expresa por medio de ecuacións diferenciais. Esta restrición non se aplicará aquí. Ademais, tampouco farei ningunha afirmación xeral sobre a aplicabilidade universal deste método dedutivo da explicación teórica, de modo que non establecerei ningún principio de causalidade (ou «principio de causalidade universal»). O «principio de causalidade» é a afirmación de que calquera suceso pode explicarse desde o punto de vista da súa causa, que pode predicirse de xeito dedutivo. Segundo a maneira en que un interprete a palabra «pode» nesta afirmación, esta será ben tautolóxica (analítica) ou ben unha afirmación sobre a realidade (sintética). Se «pode» significa que sempre é loxicamente posible construír unha explicación causal, a afirmación é tautolóxica, posto que sempre podemos dar con enunciados universais e condicións iniciais das que se poida derivar unha calquera (o feito de que estes enunciados universais fosen comprobados e corroborados noutros casos é, xaora, unha cuestión ben distinta). En cambio, se «pode» quere dicir que o mundo está sometido ao dominio de leis estritas, que está construído de maneira que cada acontecemento concreto é un exemplo dunha regularidade ou lei universais, entón hai que recoñecer que a afirmación é sintética. Mais, neste caso, non é falsificable, como se verá máis adiante, no apartado 78. Polo tanto, non aceptarei nin descartarei o «principio de causalidade»; conformareime simplemente con excluílo, por «metafísico», do ámbito da ciencia. Así e todo, vou propoñer unha regra metodolóxica que se corresponde de tal maneira co «principio de causalidade» que este último podería considerarse como a súa versión metafísica. É a sinxela regra que consiste en que non abandonemos a busca de leis universais e dun sistema teórico coherente nin renun134 Karl Popper ciemos nunca aos nosos intentos de explicar, desde o punto de vista das súas causas, calquera tipo de acontecemento que poidamos describir1. Esta regra guía o investigador científico no seu traballo. Aquí non se acepta a idea de que as últimas novidades da física requiran a renuncia a esta regra ou de que a física establecese que, polo menos dentro dunha especialidade, é inútil continuar na procura das leis2. Este asunto analizarase no apartado 78*3. 13 Universalidade estrita e numérica Podemos distinguir dous tipos de enunciado sintético universal: o «estritamente universal» e o «numericamente universal». Os enunciados estritamente universais eran os que tiña en mente cando falaba de enunciados universais (de teorías ou leis naturais). Os do outro tipo, os enunciados numericamente univers1 A idea de considerar o principio de causalidade como a expresión dunha regra ou dunha decisión debémoslla a H. Gomperz, Das Problem der Willensfreiheit, 1907. Cf. Schlick, Die Kausalitat in der Gegenwartigen Physik, Naturwissenschaften 19, 1931, p. 154. *Coido que debo dicir aquí de maneira máis explícita que, ao tomar a decisión de procurar a explicación causal, o teórico ou teórica establece o seu obxectivo (ou o obxectivo da ciencia teórica). Ese obxectivo é atopar teorías explicativas (a ser posible, teorías explicativas verdadeiras) ou, o que é o mesmo, teorías que describan certas propiedades estruturais do mundo e que nos permitan deducir, coa axuda dunhas condicións iniciais, os efectos que se van explicar. O propósito deste apartado era explicar, aínda que fose moi brevemente, o que queriamos dicir con explicación causal. Atoparase unha exposición un pouco máis detallada no apéndice *x e no apartado *15 do meu Postscript. A miña explicación da explicación adoptárona certos positivistas ou «instrumentalistas», que viron nela un intento de xustificación, no sentido de afirmar que as teorías explicativas non son máis ca premisas para deducir predicións. Eu quero deixar ben claro que considero que o interese do teórico ou teórica pola explicación (isto é, pola descuberta de teorías explicativas), non se pode reducir ao interese tecnolóxico práctico da dedución de predicións. O interese do teórico ou teórica polas predicións, por outra parte, explícase como unha consecuencia do seu interese polo problema de se as súas teorías son verdadeiras ou, noutras palabras, como consecuencia do seu interese por someter a proba as súas teorías, polo intento de descubrir se non se pode demostrar que son falsas. Véxanse tamén a nota 4 e o texto do apéndice *x. 2 A idea que aquí se rebate deféndea, por exemplo, Schlick, que escribe (ob. cit. p. 155): «esta imposibilidade [...]» (refírese aquí á imposibilidade dunha predición exacta, que sostiña Heisenberg) «[...] supón que é imposible buscar esa fórmula». (Cf. tamén a nota 1 do apartado 78). *3 Agora, véxanse tamén os capítulos *iv e *vi do meu Postscript. 135 a lóxida da descuberta científica ais, son, de feito, equivalentes a certos enunciados singulares, ou a conxuncións destes, e clasificaranse aquí coma tales. Compárese, por exemplo, os dous enunciados seguintes: (a) Para todos os osciladores harmónicos, é certo que a súa enerxía nunca baixa dun certo valor (a saber, hv/2); e (b) Para todos os seres humanos que viven na actualidade na Terra, é certo que a súa estatura nunca supera unha certa medida (digamos, 2,5 m.). A lóxica formal (incluída a lóxica simbólica), que só se ocupa da teoría da dedución, dálles a estes dous enunciados o tratamento de enunciados universais (implicacións «formais» ou «xerais»)1. No entanto, eu coido que cómpre salientar a diferenza que existe entre eles. O enunciado (a) afirma ser verdadeiro para calquera lugar e calquera momento. O enunciado (b) refírese só a unha clase finita de elementos específicos dentro dunha rexión espacio-temporal individual (ou particular) tamén finita. Os enunciados deste último tipo, en principio, pódense substituír por unha conxunción de enunciados singulares, xa que, co suficiente tempo, un pode enumerar todos os elementos da clase (finita) afectada. Por isto, nestes casos falamos de «universalidade numérica». Pola contra, o enunciado (a) sobre os osciladores non se pode substituír por unha conxunción dun número finito de enunciados singulares sobre unha rexión espacio-temporal definida; máis ben, esa substitución só se podería levar a cabo supoñendo que o mundo ten un límite temporal e que nel existe un número finito de osciladores. Pero nós non facemos suposicións deste tipo e non as facemos, en especial, á hora de definir os conceptos da física. Pola contra, 1 A lóxica clásica (e, dun xeito semellante, a lóxica simbólica ou «loxística») distingue entre enunciados universais, particulares e singulares. Un enunciado universal é o que se refire a todos os elementos dunha clase; un enunciado particular é o que se refire a algúns de entre os seus elementos; un enunciado singular é o que se refire a un elemento dado, a un individuo. Esta clasificación non se basea en razóns relacionadas coa lóxica do coñecemento, senón que se desenvolveu con vistas á técnica da inferencia. Por tanto, non podemos identificar os nosos «enunciados universais» nin cos enunciados universais da lóxica clásica nin coas implicacións «xerais» ou «formais» da loxística (cf. a nota 6 do apartado 14). *Véxase tamén agora o apéndice*10 e o meu Postscript, en especial, o apartado *15. 136 Karl Popper consideramos un enunciado do tipo (a) como un enunciado total, é dicir, unha afirmación universal sobre un número ilimitado de individuos. Así, se se interpreta con claridade, non se pode substituír por ningunha conxunción dun número finito de enunciados singulares. O uso pola miña parte do concepto de enunciado estritamente universal (ou «enunciado total») oponse á idea de que todo enunciado universal sintético ten que ser, en principio, traducible a unha adición dun número finito de enunciados singulares. Os que comparten esta idea2 insisten en que os que eu denomino «enunciados estritamente universais» non se poden verificar nunca e descártanos por esa razón, aludindo ben ao seu criterio de sentido, que esixe verificabilidade, ou ben a algunha consideración semellante. Está claro que cunha visión das leis naturais coma esta, que elimina a distinción entre enunciados singulares e universais, o problema da indución parecería resolto, pois, obviamente, as inferencias a partir de enunciados singulares de enunciados numericamente universais pode ser perfectamente admisible sen máis. Con todo, queda igualmente claro que o problema metodolóxico da indución non se ve afectado por esta solución, xa que a verificación dunha lei natural só se pode levar a cabo determinando empiricamente todos os acontecementos concretos aos que se lles pode aplicar a lei e descubrindo que todos e cada un deses acontecementos se axusta realmente á mesma (un cometido claramente imposible) En todo caso, a cuestión de se as leis da ciencia son estrita ou numericamente universais non se pode establecer argumentalmente. É unha desas cuestións que só se poden establecer por medio dun acordo ou unha convención. E, tendo en conta a situación metodolóxica que se acaba de mencionar, coido que 2 Cf., por exemplo, F. Kaufmann, Bemerkungen zum Grundlagenstreit in Logik und Mathematik, Erkenntnis 2, 1931, p. 274. 137 a lóxida da descuberta científica é útil e produtivo considerar as leis naturais como enunciados sintéticos e estritamente universais («enunciados totais»). Isto é, consideralos como enunciados non verificables que se poden expresar baixo a seguinte forma: «Para todos os puntos do espazo e do tempo (ou para todas as rexións do espazo e do tempo), é certo que...». Pola contra, aos enunciados que se refiren só a certas rexións finitas de espazo e tempo, eu chámolles «específicos» ou «singulares». A distinción entre enunciados estritamente universais e enunciados numericamente universais simplemente (en realidade, un tipo de enunciado singular) só se aplicará a enunciados sintéticos. Non obstante, podo mencionar a posibilidade de aplicar tamén esta distinción a enunciados analíticos (por exemplo, a algúns enunciados matemáticos)3. 14 Conceptos universais e conceptos individuais A distinción entre enunciados universais e singulares está estreitamente relacionada coa que se dá entre conceptos ou nomes universais e individuais. Esta distinción adóitase aclarar coa axuda de exemplos coma os seguintes: «ditador», «planeta», «h2O» son conceptos ou nomes universais. «Napoleón», «a Terra», «o Atlántico» son conceptos ou nomes singulares ou individuais. Nestes exemplos, os conceptos ou nomes individuais parecen caracterizarse ben por seren nomes propios ou ben por precisaren de nomes propios para a súa definición, mentres que os conceptos ou nomes universais pódense definir sen necesidade de empregar nomes propios. Eu considero que a distinción entre conceptos ou nomes universais e individuais é de crucial importancia. Todas as aplicacións da ciencia se basean nunha inferencia que parte de 3 Exemplos: (a) Todo número natural ten un sucesor. (b) A excepción dos números 11, 13, 17 e 19, todos os números entre 10 e 20 son divisibles. 138 Karl Popper hipóteses científicas (que son universais) para chegar a casos singulares, é dicir, nunha dedución de predicións singulares. Pero en todos os enunciados singulares teñen que aparecer conceptos ou nomes individuais. Os nomes individuais que aparecen nos enunciados singulares da ciencia adoitan presentarse como coordenadas espaciotemporais. Isto compréndese facilmente se se ten en conta que a aplicación dun sistema espacio-temporal de coordenadas sempre implica a referencia a nomes individuais, posto que temos que fixar os seus puntos de orixe e isto só o podemos facer empregando nomes propios (ou equivalentes destes). O emprego de nomes como «Greenwich» ou «O ano do nacemento de Cristo» ilustran o que quero dicir. Por medio deste método, un número arbitrariamente grande de nomes individuais pódese reducir a uns poucos1. Algunhas expresións tan imprecisas e xerais como «esta cousa de aquí», «esa cousa de aí», etc. pódense empregar ás veces como nomes individuais, quizais en combinación con algún tipo de xesto ostensivo; en resumo, podemos usar signos que non son nomes propios pero que, ata certo punto, son intercambiables con estes, ou con coordenadas individuais. Mais os conceptos universais tamén se poden indicar, aínda que só sexa vagamente, coa axuda de xestos ostensivos. Así, podemos sinalar certas cousas individuais (ou acontecementos) e logo, por medio dunha frase como «e outras cousas semellantes» (ou «e así sucesivamente»), podemos expresar a nosa intención de considerar estes individuos como simples elementos representativos dunha clase á que se lle debería dar un nome universal como é debido. Non pode caber dúbida de que aprendemos a 1 Con todo, as unidades de medida do sistema de coordenadas que, ao principio, tamén se estableceron empregando nomes individuais (a rotación da terra, o metro estándar de París) pódense definir, en principio, por medio de nomes universais, como, por exemplo, pola lonxitude de onda ou pola frecuencia da luz monocromática emitida por certo tipo de átomos cando se manexan dun xeito concreto. 139 a lóxida da descuberta científica usar as palabras universais, é dicir, a aplicalas a elementos individuais, empregando xestos ostensivos e outros medios semellantes. A base lóxica das aplicacións deste tipo consiste en que os conceptos individuais poden ser conceptos non só de elementos, senón tamén de clases e, polo tanto, poden gardar cos conceptos universais non só a relación que mantén un elemento cunha clase, senón tamén a que mantén unha subclase cunha clase. Por exemplo, o meu can, lux, non só é un elemento da clase dos cans vieneses, que é un concepto individual, senón que tamén é un elemento da clase (universal) dos mamíferos, que é un concepto universal. E os cans vieneses, á súa vez, non só son unha subclase da clase (individual) dos cans austríacos, senón que tamén son unha subclase da clase (universal) dos mamíferos. O uso da palabra «mamíferos» como exemplo de nome universal podería provocar algún malentendido, posto que palabras como «mamífero», «can» e outras, no seu uso corrente, non están libres de ambigüidade. Que estas palabras se consideren nomes de clase individuais ou nomes de clase universais depende das nosas intencións: depende de se queremos falar dunha raza de animais que vive no noso planeta (un concepto individual) ou dun tipo de corpos físicos con propiedades que se poden describir en termos universais. xorden ambigüidades parecidas a estas con relación ao uso de conceptos como «pasteurizado», «sistema linneano» e «latinismo», na medida en que é posible eliminar os nomes propios aos que fan alusión (ou ben definilos coa axuda destes nomes propios)*1. Os exemplos e explicacións anteriores deberían deixar claro o que aquí se quería dicir con «conceptos universais» e «con- *1 «Pasteurizado» pódese definir ou ben como «tratado de acordo cos consellos de D. Louis Pasteur» (ou algo polo estilo), ou ben como «quentado ata os 80 graos centígrados e sometido a esa temperatura durante dez minutos». A primeira definición fai que «pasteurizado» sexa un concepto individual; a segunda fai que sexa un concepto universal. Non obstante, compárese tamén coa nota 4, infra. 140 Karl Popper ceptos individuais». Se me pedisen definicións, tería que dicir, como xa dixen máis arriba: «un concepto individual é un concepto en cuxa definición é indispensable que aparezan nomes propios (ou signos equivalentes a estes). Se se pode eliminar totalmente calquera referencia a un nome propio, o concepto é universal». Porén, unha definición coma esta tería moi pouco valor, pois o único que fai é reducir a idea dun concepto ou nome individual á dun nome propio (entendido como o nome dunha cousa física individual). Coido que o meu uso se corresponde en boa medida co uso habitual das expresións «universal» e «individual» pero, sexa isto así ou non, considero, desde logo, que a distinción que aquí se fai é indispensable se non queremos desdebuxar a correspondente distinción entre enunciados universais e singulares (hai unha completa analoxía entre o problema dos universais e o problema da indución). O intento de identificar unha cousa individual simplemente a través das súas propiedades e relacións universais, que parecen corresponderlle só a esa cousa e a ningunha outra, está condenado de antemán ao fracaso. un procedemento coma ese non describiría unha única cousa individual, senón a clase universal de todos eses elementos individuais aos que lles corresponden esas propiedades e relacións. Nin sequera o uso dun sistema espacio-temporal universal de coordenadas había supoñer cambio ningún2, posto que sempre quedará sen resolver a pregunta de se existen cousas individuais que se correspondan cunha descrición a base de nomes universais e, se é así, cantas existen. Do mesmo xeito, calquera intento de definir nomes universais coa axuda de nomes individuais está destinado ao fracaso. Isto tense pasado por alto con frecuencia e moitos cren que é posible ascender, por medio dun proceso chamado «abstrac2 As determinacións individuais (espaciais, temporais ou outras) baseadas en nomes propios son «principios de individuación», a diferenza do «espazo e tempo» en xeral. 141 a lóxida da descuberta científica ción», de conceptos individuais a conceptos universais. Esta idea é parente próxima da lóxica indutiva, co seu paso de enunciados singulares a enunciados universais. loxicamente, ambos os dous procedementos son igualmente impracticables3. É certo que se poden obter clases de elementos individuais deste xeito, pero estas clases seguirán sendo conceptos individuais, conceptos definidos coa axuda de nomes propios (algúns exemplos destes conceptos de clase individuais son «os xenerais de Napoleón» e «os habitantes de París»). Así, vemos que a distinción que eu fago entre nomes ou conceptos universais e nomes ou conceptos individuais non ten nada que ver coa distinción entre clases e elementos. Tanto os nomes universais como os individuais poden presentarse como nomes dalgunhas clases, e tamén como os nomes de elementos dalgunhas clases. Non é posible, xa que logo, suprimir a distinción entre conceptos individuais e universais con argumentos coma o seguinte de Carnap: «[...] esta distinción non está xustificada», di el, porque «[...] todo concepto se pode considerar como individual ou universal segundo o punto de vista que se adopte». Carnap intenta sustentar isto afirmando «[...] que (case) todos os conceptos supostamente individuais son (nomes de) clases, igual ca os conceptos universais»4. Esta última afirmación é totalmente 3 De xeito semellante, o «método da abstracción» empregado na lóxica simbólica non dá conseguido ascender de nomes individuais a nomes universais. Se, por medio da abstracción, unha clase se define por extensión coa axuda de nomes individuais, esta, á súa vez, é un concepto individual. 4 Carnap, Der logische Aufbau der Welt, p. 213. (Engadido en 1934, cando a obra estaba na fase das probas). Na obra Logical Syntax of Language (1934; edición en inglés de 1937), de Carnap, non parece que se tivese en conta a distinción entre nomes individuais e nomes universais; tampouco parece que esta distinción sexa expresable na «linguaxe de coordenadas» que el constrúe. Quizais un podería pensar que as «coordenadas», sendo como son signos de tipo menor (cf. p. 12 e ss.), hai que interpretalas como nomes individuais (e que Carnap emprega un sistema de coordenadas que se define coa axuda de elementos individuais). Pero esta interpretación non servirá, pois Carnap escribe (p. 87; véxase tamén a p. 12, edición en inglés, p. 97, parágrafo 4) que, na linguaxe que el usa, «[...] todas as expresións de tipo menor son expresións numéricas» no sentido de que denotan o que entraría dentro do concepto do signo primitivo indefinido que Peano denomina «número» (cf. páxs. 31 e 33). Con isto, queda claro que os signos numéricos que aparecen como coordenadas non se deben considerar como nomes propios nin coordenadas individuais, senón como 142 Karl Popper correcta, como xa demostrei, pero non ten nada que ver coa distinción que nos ocupa. Outros que traballan no campo da lóxica simbólica (noutrora chamada «loxística») teñen confundido de xeito semellante a distinción entre nomes universais e individuais coa distinción entre as clases e os seus elementos5. Desde logo, é lícito empregar o termo «nome universal» como sinónimo de «nome dunha clase», e «nome individual» como sinónimo de «nome dun elemento», pero este uso ten as súas desvantaxes. Isto non permite solucionar os problemas e, por outra banda, este uso pódenos impedir velos. Esta situación é moi semellante á que atopabamos antes, coa análise da distinción entre enunciados universais e singulares. Os instrumentos da lóxica simbólica non son máis adecuados para tratar o problema dos universais do que o son para tratar o problema da indución6. universais (só son «individuais» nun sentido pickwickiano ou deliberadamente optimista, cf. a nota 3 (b) do apartado 13). 5 A distinción que trazan Russell e Whitehead entre elementos individuais (ou particulares) e universais tampouco ten nada que ver coa distinción que aquí se presentou entre nomes individuais e universais. Segundo a terminoloxía de Russell, na frase «Napoleón é un xeneral francés», «Napoleón» é, igual ca no meu esquema, un elemento individual, pero «xeneral francés» é un universal. Non obstante, á inversa, na frase «O nitróxeno é un non metal», «non metal» é, igual ca no meu esquema, un universal, pero «nitróxeno» é un elemento individual. Ademais, o que Russell denomina «descricións» non se corresponde cos meus «nomes individuais», xa que, por exemplo, a clase dos «puntos xeométricos que se inscriben dentro do meu corpo», para min é un concepto individual, pero non se pode representar por medio dunha «descrición». Cf. a obra Principia Mathematica, de Whitehead e Russell (2a edición, 1925, vol. I), Introdución á segunda edición, II 1, p. xix e ss. 6 A diferenza entre enunciados universais e singulares tampouco se pode expresar no sistema de Whitehead e Russell. Non é correcto dicir que as implicacións supostamente «formais» ou «xerais» teñan que ser enunciados universais, posto que a todo enunciado singular se lle pode dar a forma dunha implicación xeral. Por exemplo, o enunciado «Napoleón naceu en Córsega» pódese expresar baixo a seguinte forma: (x) (x = N  øx); expresado en palabras: é certo, para todos os valores de x, que, se x é exactamente igual a Napoleón, x naceu en Córsega. Unha implicación xeral escríbese do seguinte xeito: «(x) (øx  fx)», onde o «operador universal», «(x)», pode lerse así: «É certo, para todos os valores de x,». «øx» e «fx» son «funcións proposicionais»: (por exemplo, «x naceu en Córsega», sen que se diga quen é x; unha función proposicional non pode ser verdadeira nin falsa). «» significa: «se é certo que [...], entón, é certo que[...]. A función proposicional øx, que precede a «», pódese denominar antecedente ou función proposicional condicionante, e fx sería a función proposicional consecuente ou predición; e a implicación xeral, (x) (øx  fx) afirma que todos os valores de x que cumpren ø tamén cumpren f. 143 a lóxida da descuberta científica 15 Enunciados estritamente universais e existenciais Non hai dúbida de que non abonda con caracterizar os enunciados universais como enunciados en que non aparecen nomes individuais. Se a palabra «corvo» se emprega como nome universal, daquela, claramente, o enunciado «todos os corvos son negros» é un enunciado estritamente universal. Pero noutros moitos enunciados como «moitos corvos son negros» ou, talvez, «algúns corvos son negros», «hai corvos negros», etc., tamén aparecen soamente nomes universais e, aínda así, non cabe dúbida de que estes enunciados non se debían describir como universais. Os enunciados nos que aparecen soamente nomes universais e non individuais chamaranse aquí «estritos» ou «puros». Os máis importantes de entre eles son os enunciados estritamente universais, que xa analicei. Ademais destes, interésanme especialmente os enunciados da forma «hai corvos negros», que se pode considerar que significan o mesmo que «existe, polo menos, un corvo negro». Os enunciados deste tipo chamaranse enunciados estrita ou puramente existenciais (ou enunciados do tipo»hai»). A negación dun enunciado estritamente universal é sempre equivalente a un enunciado estritamente existencial e viceversa. Por exemplo, «non todos os corvos son negros» di o mesmo que «existe un corvo que non é negro» ou «hai corvos que non son negros». As teorías das ciencias naturais, e en especial aquelas ás que lles chamamos leis naturais, teñen a forma lóxica de enunciados estritamente universais e, xa que logo, pódense expresar baixo a forma de negacións de enunciados estritamente existenciais ou, poderiamos dicir, baixo a forma de enunciados de inexistencia (ou enunciados do tipo «non hai»). Por exemplo, a lei da conservación da enerxía pódese expresar baixo a forma: «Non hai ningunha máquina de movemento perpetuo», ou a hipótese da 144 Karl Popper carga eléctrica elemental baixo a forma: «Non hai carga eléctrica que non sexa un múltiplo da carga eléctrica elemental». Nesta formulación vemos que as leis naturais se poderían comparar con «proscricións» ou «prohibicións». Non afirman que algo exista ou que sexa o caso, senón que o negan. Insisten na inexistencia de certas cousas, estados ou asuntos, proscribindo ou prohibindo, por así dicilo, as devanditas cousas, estados ou asuntos: descártanos. E precisamente o feito de que fagan isto é o que as converte en falsificables. Se aceptamos como verdadeiro un enunciado singular que, por dicilo dalgún xeito, infrinxe a prohibición afirmando a existencia dunha cousa (ou un acontecemento) que a lei descarta, daquela a lei queda refutada. (un exemplo disto sería: «En tal ou cal lugar, hai un aparello que é unha máquina de movemento perpetuo»). Os enunciados estritamente existenciais, pola contra, non se poden falsificar. Ningún enunciado singular (é dicir, ningún «enunciado básico», ningún enunciado dun acontecemento observado) pode contradicir o enunciado existencial: «hai corvos negros». unicamente un enunciado universal podería facelo. Baseándose no criterio de demarcación adoptado aquí, terei que considerar os enunciados estritamente existenciais como non empíricos ou «metafísicos». Esta caracterización pode parecer dubidosa a primeira vista e discordante coa práctica da ciencia empírica. A modo de obxección, poderíase afirmar (con toda xustiza) que hai teorías, mesmo na física, que teñen forma de enunciados estritamente existenciais. un exemplo sería un enunciado, deducible a partir do sistema periódico de elementos químicos, que afirma a existencia de elementos de certos números atómicos. Porén, se a hipótese da existencia dun elemento dun certo número atómico se vai formular de maneira que sexa comprobable, daquela cómpre moito máis ca un enunciado puramente existencial. Por exemplo, o elemento ao que lle corresponde o número atómico 72 (hafnio) non se descubriu simplemente baseándose nun enunciado puramente existencial 145 a lóxida da descuberta científica illado. Ao contrario, todos os intentos de atopalo foran en van ata que Bohr conseguiu predicir varias das súas propiedades deducíndoas a partir da súa teoría. No entanto, a teoría de Bohr, así como aquelas conclusións que eran relevantes para este elemento e que axudaron a que se producise a súa descuberta, distan de seren enunciados puramente existenciais illados*1. Son enunciados estritamente universais. A utilidade, así como a conformidade ao uso común, da miña decisión de considerar os enunciados estritamente existenciais como non empíricos (por non seren falsificables) verase na súa aplicación a enunciados de probabilidade e ao problema da súa comprobación empírica (cf. os apartados 66 e 68). Os enunciados estritos ou puros, xa sexan universais ou existenciais, non quedan limitados polo espazo e o tempo. Non se refiren a unha rexión espacio-temporal restrinxida e individual. Esta é a razón pola que os enunciados estritamente existenciais non son falsificables. Non podemos rexistrar o mundo enteiro para establecer que algo non existe, que nunca existiu e que nunca existirá. Precisamente pola mesma razón, os enunciados estritamente universais non son verificables, pois tampouco podemos rexistrar o mundo enteiro para asegurarnos de que non existe nada que prohiba a lei. A pesar disto, ambos os dous tipos de enunciados estritos, os estritamente existenciais e os estritamente universais, son, en principio, empiricamente decidibles. Non obstante, cada un deles éo unicamente dun xeito: son decidibles unilateralmente. Cada vez que se descobre que algo existe aquí ou acolá, pódese ou ben verificar un enunciado estritamente existencial, ou ben falsificar un universal. *1 Inseriuse a palabra «illado» para evitar unha interpretación errada da pasaxe, aínda que coido que a súa tendencia estaba o suficientemente clara: un enunciado existencial illado nunca é falsificable. Non obstante, se se ten en conta no contexto, con outros enunciados, un enunciado existencial pode, nalgúns casos, incrementar o contido empírico de todo o contexto: pode enriquecer a teoría á que pertence e pode aumentar o seu grao de falsificabilidade ou comprobabilidade. Neste caso, o sistema teórico que inclúe o enunciado existencial en cuestión describirase como científico, e non como metafísico. 146 Karl Popper A asimetría que aquí se describe, coa súa consecuencia, a falsificabilidade unilateral dos enunciados universais da ciencia empírica, pode parecer agora menos dubidosa ca antes (no apartado 6). Agora vemos que non hai unha asimetría de ningunha relación puramente lóxica, senón que, pola contra, as relacións lóxicas presentan simetría. Os enunciados universais e existenciais constrúense simetricamente. Só*2 a liña que traza o noso criterio de demarcación produce unha asimetría. 16 Sistemas teóricos As teorías científicas están sometidas perpetuamente ao cambio. Isto non se debe simplemente ao azar, senón que ben cabería esperalo, de acordo coa nosa caracterización da ciencia empírica. Quizais esta sexa a razón pola que, por regra xeral, só as ramas da ciencia (e estas, só temporalmente) chegan a adquirir a forma dun sistema de teorías elaborado e ben construído loxicamente. A pesar disto, un sistema provisional adoita permitir unha boa visión de conxunto, con todas as súas consecuencias importantes. Isto é moi necesario, posto que a comprobación rigorosa dun sistema presupón que, no momento, este está o suficientemente definido e ten unha forma o suficientemente definitiva como para que sexa imposible que se coen nel novos supostos. Noutras palabras, o sistema ten que estar formulado dunha maneira o suficientemente clara e definitiva como para que todo novo suposto se recoñeza facilmente como o que é: unha modificación e, xa que logo, unha revisión do sistema. Eu creo que esta é a razón pola que se busca a forma dun sistema rigoroso. Búscase a forma dun suposto sistema axioma- *2 Aquí, a palabra «só» non se debía tomar demasiado en serio. A situación é moi sinxela. Se a ciencia empírica se caracteriza por considerar os enunciados singulares como enunciados de comprobación, daquela a asimetría xorde do feito de que, con respecto aos enunciados singulares, os enunciados universais só son falsificables e os enunciados existenciais só son verificables. Véxase tamén o apartado *22 do meu Postscript. 147 a lóxida da descuberta científica tizado (a forma que hilbert, por exemplo, foi capaz de darlles a certas ramas da física teórica). Inténtase reunir todos os supostos necesarios, e non máis, para formar o vértice do sistema. Estes supostos adoitan denominarse «axiomas» (ou «postulados» ou «proposicións primitivas»; co termo «axioma», tal e como se emprega aquí, non se insinúa ningunha reivindicación da verdade). Os axiomas escóllense de maneira que todos os demais enunciados que forman parte do sistema teórico se poidan derivar deles por medio de transformacións puramente lóxicas ou matemáticas. un sistema teórico pódese considerar axiomatizado se se formulou un conxunto de enunciados, os axiomas, que cumpre os catro requisitos fundamentais seguintes: (a) O sistema de axiomas ten que atoparse libre de contradicións (xa sexan autocontradicións ou contradicións mutuas). Isto equivale á esixencia de que non se poida deducir do sistema calquera enunciado escollido arbitrariamente1. (b) O sistema ten que ser independente, é dicir, non pode conter ningún axioma que sexa deducible dos restantes (noutras palabras, un enunciado só se chamará axioma se non é deducible dentro do resto do sistema). Estas dúas condicións afectan ao sistema de axiomas propiamente dito. No tocante á relación do sistema de axiomas co conxunto da teoría, os axiomas debían ser (c) suficientes para a dedución de todos os enunciados que forman parte da teoría que se pretende axiomatizar, e (d) necesarios para a mesma finalidade, o que significa que non deberían conter ningún suposto superfluo2. Nunha teoría axiomatizada deste xeito, é posible investigar a dependencia mutua de diversas partes do sistema. Por exemplo, podemos investigar se certa parte da teoría é derivable 1 Véxase o apartado 24. 2 En relación con estas catro condicións, así como co seguinte apartado, véxase, por exemplo, a consideración un tanto diferente que fai Carnap na súa obra Abriss der Logistik, 1929, p. 70 e ss. 148 Karl Popper dalgunha parte dos axiomas. Algunhas investigacións deste tipo (das que se falará con máis detalle nos apartados 63, 64 e do 75 ao 77) gardan unha relación importante co problema da falsificabilidade, pois aclaran a razón de que a falsificación dun enunciado deducido loxicamente poida, ás veces, non afectar ao conxunto do sistema, senón só a unha parte do mesmo, que se pode considerar, por tanto, falsificada. Isto é posible porque, aínda que polo xeral as teorías da física non están completamente axiomatizadas, as conexións entre as súas diversas partes poden estar o suficientemente claras como para permitirnos decidir cales, de entre os seus subsistemas, se ven afectados por unha observación falsificadora concreta*1. 17 Posibilidades de interpretación dun sistema de axiomas Non se vai analizar aquí a opinión do racionalismo clásico segundo a cal os «axiomas» de certos sistemas, como, por exemplo, os da xeometría euclidiana, teñen que considerarse como inmediata ou intuitivamente certos ou evidentes. Só direi que non comparto esta opinión. Considero que se poden admitir dúas interpretación distintas de calquera sistema de axiomas. Os axiomas pódense considerar ben (i) como convencións, ou ben (ii) como hipóteses empíricas ou científicas. (i) Se os axiomas se consideran convencións, coutan o uso ou o significado das ideas fundamentais (dos termos primitivos ou conceptos) que presentan; determinan o que se pode e o que non se pode dicir sobre estas ideas fundamentais. En ocasións, os axiomas descríbense como «definicións implícitas» das ideas que presentan. Esta idea quizais se poida aclarar empregando unha analoxía entre un sistema axiomático e un sistema (coherente e resoluble) de ecuacións. *1 A cuestión analízase máis polo miúdo no meu Postscript, especialmente no apartado *22. 149 a lóxida da descuberta científica Os valores admisibles das «incógnitas» (ou variables) que aparecen nun sistema de ecuacións vense, dun modo ou outro, determinados polo propio sistema. Aínda que non sexa suficiente para unha única solución, o sistema de ecuacións non permite que se substitúa toda combinación concibible de valores polas «incógnitas» (variables). O sistema de ecuacións, máis ben, caracteriza certas combinacións de valores ou sistemas de valores como admisibles e outros como inadmisibles; distingue entre a clase dos sistemas de valores admisibles e a clase dos sistemas de valores inadmisibles. De xeito semellante, pódese distinguir entre sistemas de conceptos admisibles e inadmisibles empregando o que se podería chamar «ecuaciónenunciado». unha ecuación-enunciado obtense a partir dunha función proposicional ou función-enunciado (cf. nota 6 do apartado 14); Estas funcións son enunciados incompletos, nos que aparecen un ou máis «espazos en branco». Dous exemplos destas funcións proposicionais ou funcións-enunciado son: «un isótopo do elemento x ten un peso atómico de 65»; ou «x + y = 12». Todas as funcións-enunciado deste tipo transfórmanse nun enunciado substituíndo certos valores polos espazos en branco x e y. O enunciado que resulte será verdadeiro ou falso, segundo os valores (ou a combinación de valores) que se empregasen para a substitución. Así, no primeiro exemplo, a substitución de «x» polas palabras «cobre» ou «zinc» dá como resultado un enunciado verdadeiro, mentres que outras substitucións dan enunciados falsos. Ora ben, obtense o que eu denomino unha «ecuación-enunciado» se decidimos, con respecto a unha función-enunciado, admitir, para a substitución, só aqueles valores que convertan a función nun enunciado verdadeiro. Por medio desta ecuación-enunciado, defínese unha clase delimitada de sistemas de valores admisibles; concretamente, a clase daqueles que a cumpren. A analoxía cunha ecuación matemática é clara. Se se interpreta o noso segundo exemplo, non como unha función-enunciado, senón como unha ecuación-enunciado, 150 Karl Popper entón convértese nunha ecuación no sentido ordinario (matemático) do termo. Posto que as súas ideas fundamentais ou termos primitivos non definidos se poden considerar como espazos en branco, un sistema axiomático pódese tratar, en principio, como un sistema de funcións-enunciado. Porén, se decidimos que só se poden empregar para as substitucións aqueles sistemas ou combinacións de valores que cumpran os requisitos, daquela convértese nun sistema de ecuacións-enunciado. Así, implicitamente define unha clase de sistemas (admisibles) de conceptos. Todo sistema de conceptos que cumpre os requisitos dun sistema de axiomas pódese cualificar como un modelo dese sistema de axiomas*1. A interpretación dun sistema axiomático como un sistema de (convencións ou) definicións implícitas tamén se pode expresar dicindo que equivale á seguinte decisión: só se admitirán como substitutos os modelos*2. No entanto, se se substitúe un modelo, o resultado será un sistema de enunciados analíticos (pois será verdadeiro por convención). un sistema axiomático interpretado deste xeito non se pode considerar, polo tanto, como un sistema de hipóteses empíricas ou científicas (no sentido que nós lle damos), posto que non se pode refutar recorrendo á falsificación das súas consecuencias, xa que estas tamén serán necesariamente analíticas. (ii) Poderíase un preguntar, logo, como se pode interpretar un sistema axiomático en tanto que sistema de hipóteses empíricas ou científicas. A idea habitual é que os termos primitivos que aparecen no sistema axiomático non se deben considerar como definidos implicitamente, senón como *1 Véxase a nota *2. *2 Hoxe en día debía distinguir claramente entre os sistemas de obxectos que cumpren os requisitos dun sistema de axiomas e o sistema dos nomes deses obxectos, que se poden substituír nos axiomas (facendo que sexan verdadeiros); debía, así mesmo, chamarlle «modelo» só ao primeiro sistema. Por conseguinte, agora debía escribir: «só se poden admitir como substitutos os nomes dos obxectos que constitúen un modelo.» 151 a lóxida da descuberta científica «constantes extra-lóxicas». Por exemplo, conceptos como «liña recta» e «punto», que aparecen en todos os sistemas de axiomas da xeometría, pódense interpretar como «raio de luz» e «intersección de raios de luz». Deste xeito, suponse que os enunciados do sistema de axiomas se converten en enunciados sobre obxectos empíricos ou, o que é o mesmo, en enunciados sintéticos. A primeira vista, esta concepción do tema pode parecer perfectamente satisfactoria. Porén, conduce a dificultades ligadas ao problema da base empírica, posto que non está claro en absoluto o que sería un modo empírico de definir un concepto. Adóitase falar de «definicións ostensivas». Isto quere dicir que se lle asigna un significado empírico definido a un concepto poñéndoo en correlación con certos obxectos que pertencen ao mundo real. Entón, considérase un símbolo deses obxectos. Non obstante, xa debería estar claro que, por medio dunha referencia ostensiva a «obxectos reais» (digamos, sinalando unha cousa e pronunciando un nome, poñéndolle a esa cousa unha etiqueta cun nome, etc.), unicamente se poden establecer nomes ou conceptos individuais. No entanto, os conceptos que se vaian usar no sistema axiomático deben ser nomes universais, que non se poden definir con indicacións empíricas, sinalando, etc. Só se poden definir, se é que iso é posible, de xeito explícito, coa axuda doutros nomes universais; do contrario, só poden quedar sen definir. O feito de que algúns nomes universais deban permanecer indefinidos é, xa que logo, inevitable, e aquí radica a dificultade, pois estes conceptos indefinidos sempre se poden empregar no sentido non empírico (i), é dicir, coma se fosen conceptos definidos implicitamente. Este uso destrúe necesaria e inevitablemente o carácter empírico do sistema. Eu creo que esta dificultade só se pode superar por medio dunha decisión metodolóxica. Polo tanto, adoptarei a regra de non empregar conceptos indefinidos coma se fosen conceptos definidos implicitamente (este punto tratarase máis abaixo, no apartado 20). 152 Karl Popper Aquí, quizais poida engadir que normalmente é posible establecer unha correlación entre os conceptos primitivos dun sistema axiomático coma a xeometría cos conceptos doutro sistema como, por exemplo, a física; ou interpretar os primeiros por medio dos segundos. Esta posibilidade é especialmente importante cando, no transcurso da evolución dunha ciencia, un sistema de enunciados se explica por medio dun sistema de hipóteses novo (máis xeral), que permite a dedución, non só de enunciados que pertencen ao primeiro sistema, senón tamén de enunciados que pertencen a outros sistemas. Nestes casos, pódense definir os conceptos fundamentais do novo sistema coa axuda de conceptos que orixinalmente se usaban nalgún dos anteriores. 18 Niveis de universalidade. O modus tollens Podemos distinguir, dentro dun sistema teórico, enunciados que pertencen a diferentes niveis de universalidade. Os enunciados que se atopan no nivel máis alto da universalidade son os axiomas; os enunciados que se atopan nos niveis máis baixos pódense deducir a partir deles. Os enunciados empíricos dos niveis máis altos teñen sempre o carácter de hipóteses relativas aos enunciados dos niveis máis baixos, deducibles a partir deles: pódense falsificar por medio da falsificación destes enunciados menos universais. Porén, en calquera sistema dedutivo hipotético, estes enunciados menos universais seguen a ser estritamente universais, no sentido que aquí lles damos. Polo tanto, estes tamén teñen que ter o carácter de hipóteses (algo que a miúdo se ten pasado por alto no caso dos enunciados universais de nivel máis baixo). Mach, por exemplo, chámalle1 á teoría da condución do calor de Fourier «teoría modelo da física», pola curiosa razón de que «esta teoría non se fundamenta nunha 1 Mach, Principien der Wärmelehre, 1896, p. 115. 153 a lóxida da descuberta científica hipótese, senón nun feito observable». Non obstante, Mach describe o «feito observable» co seguinte enunciado: «[...] a velocidade da nivelación das diferenzas de temperatura, sempre que estas diferenzas de temperatura sexan pequenas, é proporcional ás propias diferenzas». un enunciado do tipo «todo» cuxo carácter hipotético debía ser o suficientemente notorio. Direi que mesmo algúns enunciados singulares son hipotéticos, en vista de que se poden derivar conclusións deles (coa axuda dun sistema teórico), de maneira que a falsificación destas conclusións pode falsificar os enunciados singulares en cuestión. A inferencia por falsificación a que aquí se fai referencia (o modo en que a falsificación dunha conclusión implica a falsificación do sistema do que esta se deriva) é o modus tollens da lóxica clásica. Pódese describir como segue*1: Supoñamos que p é unha conclusión dun sistema t de enunciados, que pode consistir en teorías e condicións iniciais (por unha cuestión de simplicidade, non distinguirei entre elas). Podemos, xa que logo, simbolizar a relación de derivabilidade (implicación analítica) de p para con t do seguinte xeito: «t  p», que se pode ler así: «p dedúcese de t». Supoñamos que p é falso, o que se pode escribir do seguinte xeito: «p¬», que se lerá: «non p». Dada a relación de deducibilidade t  p e o suposto p¬, podemos inferir t – (léase «non t»); é dicir, consideramos que t foi falsificado. Se indicamos a conxunción (afirmación simultánea) de dous enunciados poñendo un punto entre os símbolos *1 En relación con esta e outras dúas pasaxes posteriores (cf. notas *1 do apartado 35 e *1 do apartado 36), nas que uso o símbolo «», gustaríame dicir que, mentres escribía este libro, atopábame aínda nun estado de confusión no tocante á distinción entre un enunciado condicional (un enunciado «se [...] daquela»; ás veces chamado «implicación material», en certo modo enganosamente) e un enunciado sobre a deducibilidade (ou un enunciado que afirma que un enunciado condicional é loxicamente certo, ou analítico, ou que o seu antecedente implica o seu consecuente). Alfred Tarski aprendeume a entender esta distinción uns meses despois da publicación do libro. O problema non é moi relevante para o contexto da obra pero, aínda así, débese sinalar a confusión. (Estes problemas analízanse con máis detalle, por exemplo, no meu artigo publicado en Mind, 56, 1947, p. 193 e ss.). 154 Karl Popper que os representan, tamén podemos simbolizar a inferencia falsificadora do seguinte xeito: ((t  p). )  ou, expresado en palabras: «Se p é derivable de t, e se p é falso, daquela t tamén é falso». Por medio deste modo de inferencia, falsificamos todo o sistema (tanto a teoría coma as condicións iniciais) que cumpría para a dedución do enunciado p, é dicir, do enunciado falsificado. Por tanto, non se pode afirmar que ningún enunciado do sistema se vexa, ou non, expresamente afectado pola falsificación. unicamente no caso de que p sexa independente dalgunha parte do sistema, poderemos dicir que a esa parte non lle afecta a falsificación2. Con isto garda relación a seguinte posibilidade: nalgúns casos, quizais tomando en consideración os niveis de universalidade, podemos atribuírlle a falsificación a algunha hipótese definida (por exemplo, a unha hipótese acabada de formular). Isto pode ocorrer se se dá o caso de que unha teoría ben corroborada, e que continúa a ser corroborada, se explique de maneira dedutiva por medio dunha nova hipótese dun nivel superior. Terase que intentar comprobar esta nova hipótese por medio dalgunhas das consecuencias da mesma que aínda non se sometesen a comprobación. Se algunha delas resulta falsificada, daquela poderemos atribuírlle a falsificación só á nova hipótese. Entón, en lugar desta, buscaremos outras xeneralizacións de nivel alto, pero non nos sentiremos obrigados a considerar como falsificado o vello sistema, de menor xeneralidade. (Cf. tamén os comentarios sobre a «cuasiindución» no apartado 85). 2 Por tanto, non podemos saber de primeiras cal de entre os diversos enunciados do subsistema restante t' (do que p non é independente) é o culpable da falsidade de p, cal destes enunciados temos que modificar e cal debemos manter (non falo aquí dos enunciados intercambiables). Adoita ser unicamente o instinto científico do investigador (influído, por suposto, polos resultados das comprobacións e das repeticións das mesmas probas) o que o fai adiviñar cales son os enunciados de t' que debe considerar inocuos e cales os que cómpre modificar. Aínda así, merece a pena lembrar que, decote, a modificación do que nos inclinamos a considerar como obviamente inocuo (porque concorda totalmente coa nosa maneira de pensar habitual) é a que pode producir un avance decisivo. Un exemplo notable disto atopámolo na modificación que Einstein fixo do concepto de simultaneidade. 155 a lóxida da descuberta científica 4 FALSIFICABILIDADE A cuestión de se existe un enunciado singular (ou un «enunciado básico») falsificable estudarase máis tarde. Aquí, asumirei unha resposta positiva a esta pregunta; así mesmo, estudarei ata que punto o meu criterio de demarcación é aplicable (se é que chega a selo) aos sistemas teóricos. unha análise crítica dunha concepción que se adoita chamar «convencionalismo» suscitará, en primeiro lugar, algúns problemas de método, que se afrontarán tomando certas decisións metodolóxicas. Despois, intentarei caracterizar as propiedades lóxicas daqueles sistemas de teorías que son falsificables (falsificables se se adoptan as nosas propostas metodolóxicas, claro está). 19 Obxeccións convencionalistas Ben seguro que xurdirán obxeccións en contra da miña proposta de adoptarmos a falsificabilidade como criterio para decidirmos se un sistema teórico pertence ou non á ciencia empírica. Suscitaranas, por exemplo, aqueles que se atopen baixo a influencia da escola de pensamento coñecida como «convencionalismo»1. Algunhas destas obxeccións xa se mencionaron nos apartados 6, 11 e 17; agora consideraranse un pouco máis polo miúdo. A orixe da filosofía convencionalista parece que estivo no asombro causado pola simplicidade do mundo, austeramente 1 Os principais representantes da escola son Poincaré e Duhem (cf. La théorie physique, son objet et sa structure, 1906); tradución inglesa de P.P. Wiener: The Aim and Structure of Physical Theory, Princeton, 1954). Un partidario recente é H. Dingler (de entre as súas numerosas obras, cabe mencionar Das Experiment e Der Zusammenbruch der Wissenschaft und das Primat der Philosophie, 1926). *O alemán Hugo Dingler non se debe confundir co inglés Herbert Dingle. O principal representante do convencionalismo no mundo anglófono é Eddington. Cabe mencionar aquí que Duhem nega (p. 188 da tradución inglesa) a posibilidade de experimentos decisivos, porque os considera como verificacións, mentres eu afirmo a posibilidade de experimentos decisivos falsificadores. Cf. o meu artigo «Three Views Concerning Human Knowledge», en Contemporary British Philosophy, iii, 1956, e no meu Conjectures and Refutations, 1959. 156 Karl Popper fermosa, que revelaban as leis da física. Semella que os convencionalistas cren que esta simplicidade sería incomprensible, e mesmo milagrosa, se crésemos, xunto cos realistas, que as leis naturais nos revelan unha simplicidade interna, estrutural, do noso mundo, baixo a súa aparencia externa de profusa variedade. O idealismo de Kant intentou explicar esta simplicidade dicindo que o noso propio intelecto é o que impón as súas leis sobre a natureza. Dun xeito semellante, pero aínda máis atrevido, o convencionalista trata esta simplicidade como unha creación nosa. Porén, para el ou ela isto non é o efecto de que as leis do noso intelecto se impoñan sobre a natureza e así a simplifiquen, pois non cren que a natureza sexa simple. O único simple son as leis naturais, e o convencionalista sostén que estas son creacións libres, invencións, decisións e convencións arbitrarias nosas. Para o convencionalista, a teoría das ciencias naturais non é unha representación da natureza, senón unha mera construción lóxica. Non son as propiedades do mundo as que determinan esta construción, senón que, pola contra, é esta construción a que determina as propiedades dun mundo artificial: un mundo de conceptos definidos implicitamente polas leis naturais que nós escollemos. Este é o único mundo de que fala a ciencia. Segundo este punto de vista convencionalista, as leis naturais non son falsificables por medio da observación, posto que son necesarias para determinar o que é unha observación e, especialmente, o que é unha medida científica. Son estas leis, establecidas por nós, as que conforman a base indispensable para a regulación dos nosos reloxos e a corrección das nosas varas de medir supostamente «rigorosas». Dise que un reloxo é «preciso» e unha vara de medir «rigorosa» se os movementos que se miden coa axuda destes instrumentos cumpren os axiomas da mecánica que nós decidimos adoptar2. 2 Esta idea tamén se pode ver como un intento de solucionar o problema da indución, pois este desaparecería se as leis naturais fosen definicións e, polo tanto, tautoloxías. Así, de acordo coa opinión de Cornelius (cf. Zur Kritik der Wissenschaftlichen Grundbegriffe, 157 a lóxida da descuberta científica A filosofía do convencionalismo ten un mérito enorme pola maneira en que axudou a aclarar as relacións entre a teoría e o experimento. recoñeceu a importancia, na que apenas repararon os indutivistas, do papel que xogan as nosas accións e operacións, planificadas de acordo con convencións e razoamentos dedutivos, na realización e interpretación dos nosos experimentos científicos. Eu considero que o convencionalismo é un sistema autosuficiente e xustificable. Os intentos de detectar incoherencias nel non teñen moitas posibilidades de éxito. A pesar de todo isto, paréceme totalmente inaceptable. No sistema subxace unha idea da ciencia, dos seus obxectivos e propósitos, completamente diferente á miña. Mentres que eu non lle esixo á ciencia ningunha certeza definitiva (e, por conseguinte, non a recibo), o convencionalista busca na ciencia «un sistema de coñecemento baseado en razóns fundamentais», para empregar unha frase de Dingler. Este obxectivo é inalcanzable, pois é posible interpretar calquera sistema científico dado como un sistema de definicións implícitas. E os períodos en que a ciencia se desenvolve lentamente ofrecerán poucas oportunidades de conflito (fóra do puramente académico), entre os científicos que se inclinan cara ao convencionalismo e os que poden preferir un punto de vista coma o que eu defendo. A situación será moi diferente en tempos de crise. Cada vez que o sistema «clásico» do momento se vexa ameazado polos resultados de novos experimentos que se poderían interpretar como falsificacións Erkenntnis 2, 1931, número 4), o enunciado: «O punto de fusión do chumbo está ao redor dos 335°C» forma parte da definición do concepto «chumbo» (proposto por unha experiencia indutiva) e, polo tanto, non se pode refutar. Outra substancia que teña a aparencia do chumbo pero un punto de fusión diferente, simplemente, non sería chumbo. Porén, segundo o meu punto de vista, o enunciado do punto de fusión do chumbo é, en canto enunciado científico, sintético. Afirma, entre outras cousas, que un elemento cunha estrutura atómica dada (número atómico 82) sempre ten o mesmo punto de fusión, sexa cal sexa o nome que lle queiramos dar. (Engadido ao libro cando estaba na fase das probas). Ajdukiewicz parece concordar con Cornelius (cf. Erkenntnis 4, 1934, p. 100 e ss., así como a obra que alí se anuncia: Das Weltbild und die Begriffsapparatur); o autor chámalle a este punto de vista «convencionalismo radical». 158 Karl Popper segundo o meu punto de vista, ao convencionalista pareceralle que o sistema non se ve afectado. xustificará as incoherencias que puidesen xurdir, talvez botándolle a culpa a un dominio inadecuado do sistema pola nosa parte. Ou eliminará esas incoherencias propoñendo ad hoc a adopción de certas hipóteses auxiliares ou, quizais, de certas correccións dos nosos instrumentos de medida. En tales tempos de crise, o conflito sobre os obxectivos da ciencia agravarase. Nós, así como aqueles que comparten a nosa postura, esperaremos levar a cabo novas descubertas e, para isto, esperaremos recibir axuda dun sistema científico acabado de erixir. Por iso, mostraremos un grande interese no experimento falsificador. Acollerémolo como un éxito, posto que abriu novas perspectivas cara a un mundo de experiencias novas. E debémolo acoller aínda que estas experiencias novas nos proporcionen novos argumentos contra as nosas propias teorías máis recentes. Porén, os convencionalistas contemplan esta nova estrutura nacente, cuxo atrevemento nós admiramos, como un monumento ao «colapso total da ciencia», en palabras de Dingler. Aos ollos do convencionalista, só hai un principio que nos pode axudar a seleccionar un sistema de entre todos os demais posibles: o principio de selección do sistema máis simple (o sistema máis simple de definicións implícitas), que na práctica, xaora, é o sistema «clásico» do momento. (Para o problema da simplicidade, véxanse os apartados que van do 41 ao 45 e, en especial, o 46). Por isto, o meu conflito cos convencionalistas non é dos que se poden resolver en última instancia cun simple debate teórico obxectivo. Aínda así, penso que é posible extraer do pensamento convencionalista certos argumentos interesantes en contra do meu criterio de demarcación, como, por exemplo, o seguinte: admito –podería dicir un convencionalista– que os sistemas teóricos das ciencias naturais non son verificables, pero afirmo que tampouco son falsificables, posto que sempre 159 a lóxida da descuberta científica existe a posibilidade de «[...] que calquera sistema axiomático escollido acade o que se coñece como a súa 'correspondencia coa realidade'»3. hai numerosas maneiras de facer isto (algunhas delas xa se propuxeron máis arriba). Así, podemos formular hipóteses ad hoc. Ou podemos modificar as supostas «definicións ostensivas» (ou as «definicións explícitas» que as poden substituír, como se mostrou no apartado 17). Ou podemos adoptar unha postura escéptica cara á fiabilidade do experimentador cuxas observacións, que ameazan o noso sistema, podemos excluír da ciencia alegando que non acadan un grao suficiente de confirmación, que son pouco científicas ou que non son obxectivas, ou mesmo alegando que o experimentador era un mentireiro. (Este é o tipo de postura que o físico ten que adoptar ás veces, e con razón, con respecto a presuntos fenómenos ocultos). Como último recurso, sempre podemos poñer en dúbida a perspicacia do teórico (por exemplo, se non cre, como é o caso de Dingler, que a teoría da electricidade se derivará algún día da teoría da gravitación de Newton). Polo tanto, segundo o punto de vista convencionalista, non é posible dividir os sistemas de teorías entre os que son falsificables e os que non o son; ou, máis ben, tal distinción será ambigua. Como consecuencia disto, necesariamente o noso criterio de falsificabilidade resulta ser inútil como criterio de demarcación. 20 Regras metodolóxicas Estas obxeccións dun convencionalista imaxinario parécenme incontestables, así como a propia filosofía convencionalista. Admito que o meu criterio de falsificabilidade non leva a una clasificación libre de ambigüidades. De feito, é imposible decidir, analizando a súa forma lóxica, se un sistema de enunciados 3 Carnap, Über die Aufgabe der Physik, Kantstudien, 28, 1923, p. 100. 160 Karl Popper é un sistema convencional de definicións implícitas irrefutables ou se é un sistema empírico no meu sentido, é dicir, un sistema refutable. Aínda así, isto só demostra que o meu criterio de demarcación non se pode aplicar inmediatamente a un sistema de enunciados (un feito que xa sinalei nos apartados 9 e 11). A cuestión de se un sistema dado se debe considerar en si mesmo como convencionalista ou empírico está, xa que logo, mal formulada. Unicamente facendo referencia aos métodos que se aplican a un sistema teórico será posible preguntar se nos atopamos ante unha teoría convencionalista ou empírica. O único xeito de evitar o convencionalismo é tomar unha decisión: a decisión de non aplicar os seus métodos. Decidimos que, se o noso sistema se ve ameazado, non o salvaremos nunca empregando ningún tipo de estrataxema convencionalista. Para isto, gardarémonos de explotar a posibilidade sempre aberta que acabamos de mencionar de «[...] que calquera sistema [...] escollido acade o que se coñece como a súa 'correspondencia coa realidade'». Black, cen anos antes de Poincaré, expresou unha crítica clara sobre o que se pode gañar (e perder) ao empregar métodos convencionalistas coas seguintes palabras: «unha boa adaptación das condicións fará que case calquera hipótese concorde cos fenómenos. Isto compracerá a imaxinación, pero non supón progreso ningún para o noso coñecemento»1. Para formularmos regras metodolóxicas que impidan adoptar estrataxemas convencionalistas, teriamos que coñecer ben as diversas formas que poden adquirir as devanditas estrataxemas, para enfrontarmos cada unha delas co contraataque anticonvencionalista adecuado. É máis, debiamos acordar que, sempre que descubramos que un sistema foi rescatado por medio dunha estrataxema convencionalista, volverémolo comprobar e rexeitarémolo se as circunstancias o esixen. 1 J. Black, Lectures on the Elements of Chemistry, Vol. I, Edinburgh, 1803, p. 193. 161 a lóxida da descuberta científica As catro estrataxemas principais do convencionalismo xa se enumeraron ao final do apartado anterior. Non se pretendía presentar unha lista completa: cómpre que sexa o investigador, especialmente nos eidos da socioloxía e a psicoloxía (o físico apenas necesita a advertencia), o que evite constantemente a tentación de empregar novas estrataxemas convencionalistas (unha tentación á que adoitan sucumbir os psicanalistas, por exemplo). No tocante ás hipóteses auxiliares, propoñemos establecer a regra de que só sexan aceptables aquelas que non reduzan o grao de falsificabilidade ou comprobabilidade do sistema en cuestión, senón que, pola contra, o incrementen (nos apartados que van do 31 ao 40 explicarase como se estiman os graos de falsificabilidade). Se o grao de falsificabilidade se ve incrementado, daquela a formulación da hipótese fortalece a teoría: o sistema é máis excluínte ca antes, prohibe máis. Dito doutro xeito: a formulación dunha hipótese auxiliar sempre se debería considerar como un intento de construír un sistema novo, e este sistema novo sempre se debía xulgar tendo en conta se a súa adopción constituiría un avance real no noso coñecemento do mundo. un exemplo de hipótese auxiliar claramente aceptable neste sentido é o principio de exclusión de Pauli (cf. apartado 38). un exemplo de hipótese auxiliar non satisfactoria sería a hipótese da contracción de Fitzgerald e lorentz, que non tivo consecuencias falsificables, senón que simplemente*1 serviu para restaurar o acordo entre a teoría e o experimento (principalmente, os resultados de Michelson e Morley). Aquí o único avance realizouno a teoría da relatividade, que prediciu novas consecuencias, novos efectos físicos, e, dese xeito, abriu novas posibilidades de comprobación, e de falsificación, de si *1 Isto é un erro, como dixo A. Grünbaum, B.J.P.S. 10, 1959, p. 48 e ss. Aínda así, posto que esta hipótese é menos comprobable que a relatividade especial, pode ilustrar graos de adhocidade. 162 Karl Popper mesma. A nosa regra metodolóxica débese matizar coa observación de que non hai necesidade de rexeitar, por convencionalistas, todas as hipóteses auxiliares que non cumpran estes estándares. En concreto, hai enunciados singulares que en realidade non forman parte do sistema teórico. ás veces, chámanlles «hipóteses auxiliares» e, aínda que se formulan para apoiar a teoría, son totalmente inofensivas. (un exemplo disto sería o suposto de que certa observación ou medida que non se dá repetido puido deberse a un erro. Cf. nota 6 do apartado 8 e os apartados 27 e 68). No apartado 17 mencionaba as definicións explícitas, polas que os conceptos dun sistema de axiomas reciben un significado en termos dun sistema dun nivel de universalidade máis baixo. Os cambios nestas definicións son lícitos sempre que sexan útiles, pero teñen que considerarse como modificacións do sistema, que, a partir dese momento, terá que volver estudarse coma se fose novo. No tocante aos nomes universais indefinidos, cómpre distinguir dúas posibilidades: (1) hai algúns conceptos indefinidos que só aparecen en enunciados do máis alto nivel de universalidade, cuxo uso se establece porque coñecemos a relación lóxica que gardan outros conceptos con eles. Pódense eliminar durante o proceso de dedución (un exemplo disto é a «enerxía»)2. hai outros conceptos indefinidos que tamén aparecen en enunciados de niveis de universalidade máis baixos, cuxo significado se establece polo uso (por exemplo, «movemento», «masa puntual», «posición»). En relación con estes últimos, non permitiremos alteracións subrepticias do uso, senón que procederemos conforme ás nosas decisións metodolóxicas, como fixemos antes. 2 Compárese, por exemplo, Hahn, Logik, Mathematik, und Naturerkennen, en Einheitswissenschaft 2, 1933, p. 22 e ss. A este respecto, só quero dicir que, segundo a miña opinión, os termos «constituíbles» (é dicir, empiricamente definibles) non existen. No canto deles, eu emprego nomes universais indefinibles, establecidos unicamente polo uso lingüístico. Véxase tamén o final do apartado 25. 163 a lóxida da descuberta científica No que respecta aos dous puntos restantes (que teñen que ver coa competencia do experimentador ou teórico) adoptaremos regras semellantes. Os experimentos comprobables intersubxectivamente aceptaranse ou rexeitaranse á luz de contraexperimentos. A simple apelación ás derivacións lóxicas que se descubrirán no futuro pode non terse en conta. 21 Investigación lóxica da falsificabilidade Só cómpre gardarse das estrataxemas convencionalistas no caso dos sistemas que serían falsificables ao manexalos de acordo coas nosas regras do método empírico. Supoñamos que prohibimos con éxito estas estrataxemas por medio das nosas regras: agora poderiamos pedir unha caracterización lóxica destes sistemas falsificables. Intentaremos caracterizar a falsificabilidade dunha teoría por medio das relacións lóxicas que manteñen a teoría e a clase dos enunciados básicos. O carácter dos enunciados singulares que eu chamo «enunciados básicos» analizarase máis polo miúdo no seguinte capítulo, así como a cuestión de se estes son, á súa vez, falsificables. Aquí, supoñeremos que existen os enunciados básicos falsificables. Débese ter en conta que, cando falo de «enunciados básicos», non me refiro a un sistema de enunciados aceptados. O sistema de enunciados básicos, de acordo co uso que eu fago do termo, inclúe, máis ben, todos os enunciados singulares coherentes consigo mesmos que teñan unha certa forma lóxica (todos os enunciados fácticos singulares que se poidan concibir, por así dicilo). Deste xeito, o sistema de todos os enunciados básicos conterá moitos enunciados mutuamente incompatibles. Como primeiro intento, un podería dicir que unha teoría é «empírica» sempre que se poidan deducir dela enunciados singulares. Así e todo, este intento fracasa, porque para deducir enunciados singulares dunha teoría, sempre precisamos outros enunciados singulares (as condicións iniciais que nos din o que temos que substituír polas variables da teoría). Como segundo intento, un podería dicir que unha teoría é «empírica» se se 164 Karl Popper poden derivar dela enunciados singulares coa axuda doutros enunciados singulares, que serven como condicións iniciais. Porén, isto tampouco funcionará, posto que mesmo unha teoría non empírica como, por exemplo, unha teoría tautolóxica, nos permitiría derivar uns enunciados singulares a partir doutros. (De acordo coas regras da lóxica, podemos dicir, por exemplo, que da conxunción de «Dous por dous é igual a catro» e «Aquí hai un corvo negro», dedúcese, entre outras cousas: «Aquí hai un corvo»). Nin sequera abondaría con esixir que da teoría, xunto con algunhas condicións iniciais, debésemos ser capaces de deducir máis do que poderiamos deducir só das condicións iniciais. Esta esixencia excluiría, en efecto, as teorías tautolóxicas, pero non os enunciados metafísicos sintéticos. (Por exemplo, de «Todo acontecemento ten unha causa» e «Aquí está sucedendo unha catástrofe», podemos deducir: «Esta catástrofe ten unha causa»). Isto lévanos á esixencia de que a teoría nos deba permitir deducir, por dicilo en liñas xerais, máis enunciados singulares empíricos que os que podemos deducir só das condicións iniciais*1. Isto quere dicir que temos que basear a nosa definición nunha clase concreta de enunciados singulares, e para isto necesitamos os enunciados básicos. En vista de que non sería moi doado explicar en detalle de que modo serve de axuda un *1 Algúns fundamentos equivalentes ao que aquí se ofrece propuxéronse como criterios do sentido das oracións (e non como criterios de demarcación aplicables aos sistemas teóricos) unha e outra vez logo da publicación do meu libro, mesmo por parte de críticos que desprezaron o meu criterio de falsificabilidade. Pero vese facilmente que, se se emprega como criterio de demarcación, a presente formulación equivale á falsificabilidade. Isto é así porque, se o enunciado básico b2 non se deduce de b1, senón de b1 en conxunción coa teoría t (esta é a presente formulación), isto equivale a dicir que a conxunción de b1 coa negación de b2 contradí a teoría t. Pero a conxunción de b1 coa negación de b2 é un enunciado básico (cf. apartado 28). Deste xeito, o noso criterio esixe a existencia dun enunciado básico falsificador, é dicir, esixe a falsificabilidade no sentido exacto que eu lle dou. (Véxase tamén a nota *1 do apartado 82). No entanto, como criterio de sentido (ou de «verificabilidade feble») fracasa por varias razóns. En primeiro lugar, porque as negacións dalgúns enunciados con sentido pasarían a non ter sentido, de acordo con este criterio. E, en segundo lugar, porque a conxunción dun enunciado con sentido e unha «pseudooración sen sentido» pasaría a ter sentido (o que é igualmente absurdo). 165 a lóxida da descuberta científica sistema teórico complicado para a dedución de enunciados singulares ou básicos, propoño a seguinte definición: unha teoría cualificarase de «empírica» ou «falsificable» se divide sen ambigüidades a clase de todos os enunciados básicos posibles en dúas subclases, que non poden quedar baleiras. En primeiro lugar, a clase de todos aqueles enunciados básicos cos que a teoría garda unha contradición (ou que descarta ou prohibe). A esta chamámola a clase dos falsificadores potenciais da teoría. En segundo lugar, a clase daqueles enunciados básicos que a teoría non contradí (ou que «permite»). Podemos resumir isto dicindo: unha teoría é falsificable se a clase dos seus falsificadores potenciais non está baleira. Pódese engadir que unha teoría só fai afirmacións sobre os seus falsificadores potenciais (afirma a súa falsidade). Sobre os enunciados básicos «permitidos» non di nada. En concreto, non di que sexan certos*2. 22 Falsificabilidade e falsificación Cómpre que distingamos claramente entre a falsificabilidade e a falsificación. Formulamos a falsificabilidade unicamente como un criterio para o carácter empírico dun sistema de enunSe agora intentamos aplicar estas dúas observacións críticas ao noso criterio de demarcación, ambas as dúas resultan ser inofensivas. En relación coa primeira, véxase o apartado 15, infra., especialmente a nota *2 (e o apartado *22 do meu Postscript). En canto á segunda, as teorías empíricas (tales coma a de Newton) poden conter elementos «metafísicos». Porén, estes non se poden eliminar cunha regra inflexible, aínda que, se conseguimos presentar a teoría de maneira que se converta nunha conxunción dunha parte comprobable e outra non comprobable, sabemos, por suposto, que entón podemos eliminar un dos seus compoñentes metafísicos. O parágrafo anterior desta nota pódese considerar como a ilustración doutra regra de método (cf. o final da nota *5 do apartado 80): logo de realizar unha crítica a unha teoría contraria, sempre debiamos facer un intento serio de aplicar a mesma crítica ou unha semellante á nosa propia teoría. *2 De feito, moitos dos enunciados básicos «permitidos» contradiranse entre eles en presenza da teoría (cf. apartado 38). Por exemplo, a lei universal «Todos os planetas desprázanse en círculos» (é dicir: «Calquera conxunto de posicións de calquera planeta é cocircular») «exemplifícase» de xeito trivial cun conxunto de non máis de tres posicións dun só planeta; así e todo, dous destes «exemplos» xuntos contradirán a lei na maioría dos casos. 166 Karl Popper ciados. En canto á falsificación, cómpre formular unhas regras especiais que determinarán baixo que condicións se considerará falsificado un sistema. Dicimos que unha teoría resulta falsificada unicamente se aceptamos enunciados básicos que a contradín (cf. apartado 11, regra número 2). Esta condición é necesaria, pero non suficiente, posto que xa vimos que os acontecementos únicos non reproducibles non teñen importancia ningunha para a ciencia. Por isto, uns poucos enunciados básicos illados que contradigan unha teoría dificilmente nos inducirán a rexeitala por considerala falsificada. Só a daremos por falsificada cando descubramos un efecto reproducible que refute a teoría. Noutras palabras, só aceptaremos a falsificación se se propón e corrobora unha hipótese empírica de baixo nivel que describa un efecto desas características. Este tipo de hipótese pódese denominar hipótese falsificadora1. O requisito de que a hipótese falsificadora sexa empírica e, polo tanto, falsificable, significa unicamente que ten que gardar unha certa relación lóxica con posibles enunciados básicos; polo tanto, este requisito só afecta á forma lóxica da hipótese. A condición de que a hipótese sexa corroborada refírese ás comprobacións que debía ter superadas (probas que a confrontan con enunciados básicos aceptados*1). 1 A hipótese falsificadora pode ser dun nivel moi baixo de universalidade (obtida, por así dicilo, xeneralizando as coordenadas individuais do resultado dunha observación; como exemplo, podería citar o suposto «feito» de Mach, ao que fixen referencia no apartado 18). Aínda que teña que ser comprobable intersubxectivamente, en realidade non ten por que ser un enunciado estritamente universal. Así, para falsificar o enunciado «Todos os corvos son negros», abondaría co enunciado, comprobable intersubxectivamente, que di que hai unha familia de corvos brancos no zoolóxico de Nova York. *Todo isto demostra a necesidade urxente de substituír unha hipótese falsificada por outra mellor. Na maioría dos casos, antes de falsificar unha hipótese, xa temos outra de reserva, posto que o experimento falsificador adoita ser un experimento decisivo, concibido para optar por unha das dúas. Isto quere dicir que o experimento proponse porque as dúas hipóteses difiren nalgún aspecto, e o experimento emprega esa diferenza para refutar (cando menos) unha delas. *1 Pode parecer que esta referencia aos enunciados básicos aceptados contén o xermolo dunha regresión infinita. O noso problema é o seguinte: posto que para falsificar unha hipótese cómpre aceptar un enunciado básico, necesitamos regras metodolóxicas para a aceptación de enunciados básicos. Agora ben, se estas regras, á súa vez, fan referencia a enunciados básicos aceptados, podémonos ver envoltos nunha regresión infinita. A miña 167 a lóxida da descuberta científica De acordo con isto, os enunciados básicos desempeñan dous papeis diferentes. Por unha banda, usamos o sistema de todos os enunciados básicos loxicamente posibles para obter, coa súa axuda, a caracterización lóxica que buscabamos (a da forma dos enunciados empíricos). Por outra banda, os enunciados básicos aceptados son a base para a corroboración das hipóteses. Se contradín a teoría, entón consideramos que proporcionan os motivos suficientes para a súa falsificación unicamente se corroboran unha hipótese falsificadora ao mesmo tempo. 23 Ocorrencias e acontecementos A esixencia de falsificabilidade, que nun principio era un tanto imprecisa, agora dividiuse en dúas partes. A primeira, o postulado metodolóxico (cf. apartado 20) dificilmente se pode precisar de todo. A segunda, o criterio lóxico, queda totalmente definido desde o momento en que está claro cales son os enunciados que se denominan «básicos» (cf. apartado 28). Este criterio lóxico presentouse, polo de agora, dun xeito un tanto formal, como unha relación lóxica entre enunciados (os enunciados da teoría e os enunciados básicos). Poida que as cousas queden intuitivamente máis claras se expreso o meu criterio nunha linguaxe máis «realista». Aínda que equivale a un rexistro formal, pode estar un pouco máis próximo ao uso común. Empregando este rexistro «realista», podemos dicir que un enunciado singular (un enunciado básico) describe unha ocorrencia. En lugar de falar de enunciados básicos que unha teoría descarta ou prohibe, podemos dicir, logo, que a teoría descarta certas ocorrencias posibles e que resultará falsificada se, en efecto, se dan esas ocorrencias. resposta a isto é que as regras que necesitamos simplemente serven para aceptar enunciados básicos que poidan falsificar unha hipótese que se sometese ás comprobacións correctas e, ata o momento, resultase satisfactoria; os enunciados básicos aceptados aos que recorre a regra non teñen por que ter este carácter. É máis, a regra que se formula no texto dista de ser exhaustiva; só menciona un aspecto importante da aceptación dos enunciados básicos que poden falsificar unha hipótese que, doutro xeito, resultaría satisfactoria. A formulación desta regra ampliarase no capítulo 5 (especialmente no apartado 29). 168 Karl Popper O uso dunha expresión imprecisa como «ocorrencia» pódese prestar a crítica. Tense dito1 en ocasións que expresións como «ocorrencia» ou «acontecemento» se debían excluír completamente do debate epistemolóxico e que non debiamos falar de «ocorrencias» ou «ausencia de ocorrencias», nin da «ocorrencia» de «acontecementos», senón da verdade ou falsificidade dos enunciados. Non obstante, eu prefiro manter a expresión «ocorrencia». Definir o seu uso é o suficientemente doado como para que nada teña de obxectable, porque a podemos usar de maneira que, sempre que falemos dunha ocorrencia, poderiamos estar falando, en cambio, dalgún dos enunciados singulares que se corresponden con ela. á hora de definir «ocorrencia», podemos lembrar que sería totalmente normal dicir que dous enunciados singulares que son loxicamente equivalentes (é dicir, deducibles mutuamente) describen a mesma ocorrencia. Isto leva a pensar na seguinte definición: Supoñamos que pk é un enunciado singular. (O subíndice «k» fai referencia aos nomes ou coordenadas individuais que se dan en pk). logo, á clase de todos enunciados que son equivalentes a pk chamámoslle ocorrencia Pk. Así, diremos que é unha ocorrencia, por exemplo, que estea tronando aquí e agora. E podemos considerar esta ocorrencia como a clase dos enunciados «Está tronando aquí e agora»; «Está tronando no Distrito 13 de Viena o 10 de xuño de 1933 ás 5:15 p.m.», e de todos os demais enunciados equivalentes a estes. Pódese considerar, xa que logo, que a formulación realista «O enunciado pk representa a ocorrencia Pk» significa o mesmo que o enunciado algo trivial «O enunciado pk é un elemento da clase Pk de todos 1 Sobre todo, algúns autores que escriben sobre a probabilidade; cf. Keynes, A Treatise on Probability, 1921, p. 5. Keynes afirma que foi Ancillon o primeiro en propoñer a «expresión formal»; tamén fai referencia a Boole, Czuber e Stumpf. *Aínda que sigo considerando que as definicións («sintácticas») que ofrezo máis abaixo de «ocorrencia» e «acontecemento» son adecuadas para o meu obxectivo, xa non creo que sexan intuitivamente adecuadas, é dicir, non creo que representen de xeito adecuado o noso uso ou as nosas intencións. Alfred Tarski foi quen me indicou (en París, en 1935) que cumpriría unha definición «semántica» no canto dunha «sintáctica». 169 a lóxida da descuberta científica os enunciados que lle son equivalentes». De xeito semellante, consideramos que o enunciado «A ocorrencia Pk ocorreu» (ou «está ocorrendo») significa o mesmo que «pk e todos os enunciados que lle son equivalentes son verdadeiros». O obxectivo destas regras de tradución non é afirmar que independentemente de quen use a palabra «ocorrencia» no rexistro lingüístico realista estea pensando nunha clase de enunciados. O seu obxectivo consiste simplemente en ofrecer unha interpretación do rexistro realista que faga intelixible o que se quere dicir, por exemplo, cando se afirma que unha ocorrencia Pk contradí unha teoría t. Isto significará simplemente que todo enunciado equivalente a pk contradí a teoría t e, xa que logo, é un falsificador potencial da mesma. Agora, presentarase o termo «acontecemento» para indicar o que pode ter de típico ou universal unha ocorrencia ou o que dela se pode describir coa axuda de nomes universais. (Polo tanto, non entendemos o acontecemento como unha ocorrencia complexa, ou quizais prolongada, independentemente do que nos poida levar a pensar o uso común). Damos a definición seguinte: Supoñamos que Pk, Pl, [...] son elementos dunha clase de ocorrencias que difiren unicamente con respecto aos elementos individuais implicados (as posicións ou rexións espacio-temporais); daquela, chamámoslle a esta clase «o acontecemento (P)». Segundo esta definición, diremos do enunciado «Aquí acábase de entornar un vaso de auga», por exemplo, que a clase de enunciados que lle son equivalentes é un elemento do acontecemento: «Entornamento dun vaso de auga». Falando do enunciado singular pk, que representa unha ocorrencia Pk, un pode dicir, no rexistro lingüístico realista, que este enunciado afirma a ocorrencia do acontecemento (P) na posición espacio-temporal k. E consideramos que isto significa o mesmo que «a clase Pk, dos enunciados singulares equivalentes a pk, é un elemento do acontecemento (P)». 170 Karl Popper Agora aplicaremos esta terminoloxía2 ao noso problema. Podemos dicir dunha teoría, sempre que sexa falsificable, que descarta ou prohibe non só unha simple ocorrencia, senón sempre un acontecemento polo menos. Así, a clase dos enunciados básicos prohibidos, é dicir, dos falsificadores potenciais da teoría, sempre conterá, se non está baleira, un número ilimitado de enunciados básicos, posto que unha teoría non fai referencia aos elementos individuais en si. Aos enunciados básicos singulares que corresponden a un acontecemento podémoslles chamar «homotípicos», para indicar a analoxía que existe entre os enunciados equivalentes que describen unha ocorrencia e os enunciados homotípicos que describen un acontecemento (típico). Daquela, podemos dicir que toda clase non baleira de falsificadores potenciais dunha teoría contén, polo menos, unha clase non baleira de enunciados básicos homotípicos. Imaxinemos agora que a clase de todos os enunciados básicos posibles se representa mediante unha superficie circular. Pódese considerar que a superficie do círculo representa algo parecido ao conxunto de todos os mundos da experiencia posibles, ou de todos os mundos empíricos posibles. Imaxinemos, ademais, que cada acontecemento se representa mediante un dos radios (ou, máis concretamente, mediante unha zona moi estreita, ou un sector moi estreito, ao longo dun dos radios) e que calquera par de ocorrencias que compartan as coordenadas (ou elementos individuais) están situadas á mesma distancia do centro e, polo tanto, no mesmo círculo concéntrico. Daquela, podemos ilustrar o postulado da falsificabilidade co requisito de que en toda teoría empírica debe aparecer no noso 2 Cómpre indicar que, aínda que os enunciados singulares representan ocorrencias, os enunciados universais non representan acontecementos, senón que os exclúen. De xeito semellante ao que sucede co concepto de «ocorrencia», pódese definir unha «uniformidade» ou «regularidade» dicindo que os enunciados universais representan uniformidades. No entanto, aquí non precisamos un concepto coma este, tendo en conta que só nos interesa o que os enunciados universais exclúen. Por esta razón, cuestións como a de se existen as uniformidades («estados de cousas» universais, etc.) non nos incumben. *Porén, estas cuestións analízanse no apartado 79 e, agora, tamén no apéndice *x e no apartado *15 do Postscript. 171 a lóxida da descuberta científica diagrama, polo menos, un radio (ou un sector moi estreito) que a teoría prohiba. Esta ilustración pode resultar de axuda no debate dos diversos problemas que nos ocupan*1, tales como o do carácter metafísico dos enunciados puramente existenciais (aos que se fixo unha breve referencia no apartado 15). Evidentemente, a cada un destes enunciados corresponderalle un acontecemento (un radio), de maneira que cada un dos diversos enunciados básicos que corresponden a este acontecemento verificarán o enunciado puramente existencial. Así e todo, a clase dos seus falsificadores potenciais está baleira; por tanto, do enunciado existencial non se deduce nada sobre os mundos da experiencia posibles. (Non exclúe nin prohibe ningún dos radios). O feito de que, á inversa, de todo enunciado básico se deduza un enunciado puramente existencial non se pode esgrimir como argumento para apoiar o carácter empírico deste último. Toda tautoloxía, xaora, dedúcese tamén de todo enunciado básico, posto que se deduce de calquera tipo de enunciado. Talvez sexa este o momento de dicir algo sobre os enunciados autocontraditorios. Mentres que as tautoloxías, os enunciados puramente existenciais e outros enunciados non falsificables afirman, por así dicilo, demasiado pouco sobre a clase de enunciados básicos posibles, os enunciados autocontraditorios afirman demasiado. Dun enunciado autocontraditorio pódese deducir de maneira válida calquera enunciado, do tipo que sexa*2. Por conseguinte, a clase dos seus falsificadores potenciais é idéntica á de todos os enunciados básicos posibles: calquera enunciado, do tipo que sexa, pode falsificala. (un podería dicir que este feito ilus- *1 A ilustración usarase especialmente no apartado 31 e ss. *2 Dez anos despois da publicación deste libro, aínda non todo o mundo entendía este feito. A situación pódese resumir como segue: un enunciado obxectivamente falso «implica materialmente» a todos os enunciados (pero non carrexa loxicamente con el a todos os enunciados). Un enunciado loxicamente falso implica loxicamente (ou carrexa) a todos os enunciados. Polo tanto, é esencial, desde logo, establecer unha distinción clara entre o que 172 Karl Popper tra unha vantaxe do noso método, é dicir, da maneira en que temos en conta os posibles falsificadores en lugar dos posibles verificadores, porque se un pode verificar un enunciado por medio da verificación das súas consecuencias lóxicas, ou simplemente facer que sexa probable deste xeito, daquela un podería esperar que, por medio da aceptación de calquera enunciado básico, do tipo que sexa, calquera enunciado autocontraditorio resultaría confirmado, verificado ou, cando menos, probable). 24 Falsificabilidade e coherencia O requisito da coherencia desempeña un papel especial entre os diversos requisitos que debe cumprir un sistema teórico ou axiomático. Pódese considerar como o primeiro requisito que ten que cumprir todo sistema teórico, xa sexa empírico ou non empírico. Para demostrar a importancia fundamental deste requisito, non abonda con mencionar o feito evidente de que un sistema autocontraditorio ten que rexeitarse necesariamente por ser «falso». Adoitamos traballar con enunciados que, aínda que en realidade son falsos, ofrecen resultados adecuados para certos é simplemente un enunciado obxectivamente falso (sintético) e un enunciado loxicamente falso, incoherente ou autocontraditorio, é dicir, un enunciado do que se pode deducir outro coa forma p * . O feito de que un enunciado incoherente carrexa con el a todos os enunciados pódese mostrar como segue: Das «proposicións primitivas» de Russell, obtemos, inmediatamente: (1) p  (p v q) e, ademais, substituíndo primeiro « » por «p» e logo «p  q» por « v q» obtemos (2)  (p  q), o que dá, por «importación», (3) * p  q Así e todo, a terceira fórmula permítenos deducir, empregando o modus ponens, calquera enunciado q a partir de calquera enunciado que teña a forma «p * » ou «p * ». (Véxase tamén a miña nota en Mind 52, 1943, p. 47 e ss.). P.P. Wiener (The Philosophy of Bertrand Russell, editado por P.A. Schilpp, 1944, p. 264) trata acertadamente como ben coñecido o feito de que todo é deducible a partir dun conxunto incoherente de premisas. Porén, sorprendentemente, Russell pono en dúbida na súa resposta a Wiener (ob. cit. p. 695 e ss.), ao falar de «proposicións falsas» alí onde Wiener falaba de «premisas incoherentes». Cf. a miña obra Conjectures and Refutations, 1963, 1965, p. 317 e ss.). 173 a lóxida da descuberta científica propósitos*1 (un exemplo é a aproximación de Nernst á ecuación do equilibrio dos gases). Pero a importancia do requisito da coherencia valorarase se un se decata de que un sistema autocontraditorio non achega información, pois del pódese derivar calquera conclusión que desexemos. Deste xeito, non se distingue entre enunciados incompatibles e derivables, posto que todos son derivables. un sistema coherente, pola outra banda, divide o conxunto de todos os enunciados posibles en dous: aqueles que contradí e aqueles cos que é compatible (entre estes últimos atópanse as conclusións que se poden derivar del). Esta é a razón pola que a coherencia é o requisito xeral para un sistema, sexa empírico ou non empírico, se se pretende que sexa útil nalgunha medida. Ademais de ser coherente, un sistema empírico debía cumprir unha condición máis: ten que ser falsificable. As dúas condicións son, en grande medida, análogas1. Os enunciados que non cumpren a condición da coherencia fracasan á hora de diferenciar entre dous enunciados, sexan cales sexan, de entre o conxunto de todos os enunciados posibles. Os enunciados que non cumpren a condición da falsificabilidade fracasan á hora de diferenciar entre dous enunciados, sexan cales sexan, de entre o conxunto de todos os enunciados básicos empíricos posibles. *1 Cf., no meu Postscript, o apartado *3 (a miña resposta á «segunda proposta») e o punto (2) do apartado *12. 1 Cf. o meu comentario en Erkenntnis 3, 1933, p. 426. *Agora isto atópase impreso no apéndice *i, infra. 174 Karl Popper 5 O PROBLEMA DA BASE EMPÍRICA xa reducimos a cuestión da falsificabilidade das teorías á da falsificabilidade daqueles enunciados singulares que eu denominei enunciados básicos. Pero que tipo de enunciados singulares son estes enunciados básicos? Como se poden falsificar? Estas preguntas poden non interesarlle moito a quen se dedique á investigación práctica, pero os puntos escuros e os malentendidos que rodean o problema fan que sexa recomendable tratalo aquí máis polo miúdo. 25 As experiencias perceptuais como base empírica: o psicoloxismo Moitos aceptan como evidente, máis aló de calquera tipo de dúbida, a doutrina de que as ciencias empíricas se poden reducir a percepcións sensoriais e, polo tanto, ás nosas experiencias. Porén, esta doutrina sosterase ou caerá coa lóxica indutiva, e aquí rexéitase xunto con ela. Non quero negar que haxa unha miga de verdade na opinión de que as matemáticas e a lóxica se basean no pensamento, mentres que e as ciencias obxectivas fano en percepcións sensoriais, pero o que esta opinión teña de certo ten pouco que ver co problema epistemolóxico. De feito, practicamente non hai un problema na epistemoloxía que sufrise máis severamente a confusión da psicoloxía coa lóxica ca este problema da base dos enunciados da experiencia. O problema da base da experiencia preocupou a poucos pensadores tanto como a Fries1. Este autor mostrou que, se os enunciados da ciencia non se deben aceptar dogmaticamente, temos que ser capaces de xustificalos. Se esiximos unha xustificación por medio de argumentos razoados, no sentido lóxico, daquela 1 J.F. Fries, Neue oder anthropologische Kritik der Vernunft (1828 a 1831). 175 a lóxida da descuberta científica apostamos pola idea de que os enunciados só se poden xustificar por medio de enunciados. Polo tanto, a esixencia de que todos os enunciados deban xustificarse loxicamente (esixencia que Fries describe como unha «predilección polas probas») conduce inevitablemente a unha regresión infinita. Agora ben, se queremos evitar o perigo do dogmatismo, así como a regresión infinita, parece que só podemos recorrer ao psicoloxismo, é dicir, á doutrina de que os enunciados se poden xustificar, non só por medio de enunciados, senón tamén por medio da experiencia perceptual. Fronte a este trilema (dogmatismo vs. regresión infinita vs. psicoloxismo), Fries e, xunto con el, case todos os epistemólogos que pretenderon dar conta do noso coñecemento empírico, optaron polo psicoloxismo. Fries defendía que na experiencia sensorial temos «coñecemento inmediato»2, por medio do cal podemos xustificar o noso «coñecemento mediato» (o coñecemento expresado no simbolismo dunha linguaxe). E este coñecemento mediato inclúe, por suposto, os enunciados da ciencia. Na exploración deste problema non se adoita chegar tan loxe. Nas epistemoloxías do sensualismo e do positivismo, dáse por suposto que os enunciados científicos empíricos «falan das nosas experiencias»3. Se non, como nos sería posible chegar a adquirir algún coñecemento dos feitos se non fose a través da percepción sensorial? O ser humano non pode incrementar nin un chisco o seu coñecemento do mundo dos feitos empregando só o pensamento. Polo tanto, a experiencia perceptual ten que ser a única «fonte de coñecemento» de todas as ciencias empíricas. Todo o que sabemos sobre o mundo dos feitos, xa que logo, ten que poderse expresar baixo a forma de enunciados sobre as nosas experiencias. O feito de que esta mesa sexa ver2 Cf., por exemplo, J. Kraft, Von Husserl zu Heidegger, 1932, p. 102 e ss. (*Segunda edición, 1957, p. 108 e ss.). 3 Aquí sigo practicamente palabra por palabra as exposicións de P. Frank (cf. nota 4 do apartado 27) e H. Hahn (cf. nota 1 do apartado 27). 176 Karl Popper mella ou azul só se pode saber se consultamos a nosa experiencia sensorial. Por medio da inmediata sensación de convicción que esta produce, podemos distinguir o enunciado verdadeiro, aquel cuxos termos concordan coa experiencia, fronte ao enunciado falso, cuxos termos non concordan coa mesma. A ciencia é un mero intento de clasificar e describir este coñecemento perceptual, estas experiencias inmediatas cuxa veracidade non podemos poñer en dúbida; é a presentación sistemática das nosas conviccións inmediatas. Esta doutrina fracasa, na miña opinión, no tocante aos problemas da indución e dos universais. Isto é así porque non podemos pronunciar ningún enunciado científico que non vaia moito máis aló do que se pode saber con certeza «sobre a base da experiencia inmediata» (a este feito podémonos referir como a «transcendencia inherente a toda descrición»). Toda descrición usa nomes universais (símbolos ou ideas); todo enunciado ten carácter de teoría, de hipótese. O enunciado «Aquí hai un vaso de auga» non se pode verificar por medio de ningunha experiencia observacional. A razón disto é que non se pode establecer unha correlación dos universais que aparecen nel con ningunha experiencia sensorial específica. (unha «experiencia inmediata» «prodúcese inmediatamente» só unha vez; é única). Coa palabra «vaso», por exemplo, referímonos a corpos físicos que presentan un certo comportamento con carácter de lei, e o mesmo ocorre coa palabra «auga». Os universais non se poden reducir a clases de experiencias, ou sexa, non se poden «constituír»4. 26 Sobre os supostos «enunciados protocolarios» O punto de vista ao que eu lle chamo «psicoloxismo», analizado no apartado anterior, sustenta, segundo o meu parecer, unha 4 Cf. nota 2 e texto do apartado 20. *»Constituír» é un termo de Carnap. 177 a lóxida da descuberta científica teoría moderna da base empírica, aínda que os seus defensores non falan de experiencias nin de percepcións, senón de «enunciados» (enunciados que representan experiencias). Neurath1 e Carnap2 denomínanos enunciados protocolarios. Con anterioridade, reininger defendera unha teoría semellante. O seu punto de partida era a pregunta por onde radica a correspondencia ou acordo entre un enunciado e o feito ou estado de cousas que describe. Chegou á conclusión de que os enunciados só se poden comparar con enunciados. Segundo o seu punto de vista, a correspondencia dun enunciado cun feito non é máis ca unha correspondencia lóxica entre enunciados que pertencen a distintos niveis de universalidade: é33«[...] a correspondencia de enunciados de nivel superior con enunciados de contido semellante e, en última instancia, con enunciados que rexistran experiencias» (en ocasións, reininger chámalles a estes últimos «enunciados elementais»4). Carnap comeza cunha pregunta un tanto diferente. A súa tese consiste en que todas as investigacións filosóficas falan «das formas do discurso»5. A lóxica da ciencia ten que investigar «as formas da linguaxe científica»6. Non fala de «obxectos» (físicos), senón de palabras; non fala de feitos, senón de enunciados. Con este, co rexistro formal do discurso, o correcto, Carnap contrasta o ordinario ou, como el o denomina, «o rexistro material do discurso». Se se quere evitar a confusión, o rexistro material do discurso só se debería empregar aquí cando sexa posible traducilo ao rexistro formal correcto. Ora ben, este punto de vista (co que eu podo estar de acordo) leva a Carnap (igual ca a reininger) a afirmar que, na lóxica 1 O termo cuñouno Neurath; cf., por exemplo, Soziologie, en Erkenntnis 2, 1932, p. 393. 2 Carnap, Erkenntnis 2, 1932, p. 432 e ss.; 3, 1932, p. 107 e ss. 3 R. Reininger, Metaphysik der Wirklichkeit, 1931, p. 134. 4 Reininger, ob. cit., p. 132. 5 Carnap, Erkenntnis 2, 1932, p. 435, «These der Metalogik». 6 Carnap, Erkenntnis, 3, 1933, p. 228. 178 Karl Popper da ciencia, non debemos dicir que os enunciados se someten a commprobación comparándoos con estados de cousas ou con experiencias: só podemos dicir que se poden comprobar comparándoos con outros enunciados. Aínda así, en realidade, Carnap mantén as ideas fundamentais da achega psicoloxista ao problema; o único que fai é traducilas ao «rexistro formal do discurso». Carnap di que os enunciados da ciencia se se someten a proba «coa axuda de enunciados protocolarios»7; pero, posto que estes se presentan como enunciados «que non necesitan confirmación, senón que serven como base para todos os demais enunciados da ciencia», isto equivale a dicir, no rexistro «material» ordinario do discurso, que os enunciados protocolarios se refiren aos «datos coñecidos»: aos «datos sensoriais». Describen (en palabras do propio Carnap) «o contido da experiencia inmediata ou os fenómenos e, polo tanto, os feitos cognoscibles máis simples»8. Isto mostra de xeito ben claro que a teoría dos enunciados protocolarios non é máis ca unha tradución do psicoloxismo ao rexistro formal do discurso. Da opinión de Neurath pódese dicir practicamente o mesmo9: esixe que nos enunciados protocolarios aparezan palabras como «percibir», «ver», etc., xunto co nome completo do autor do mesmo. Os enunciados protocolarios, como o termo indica, deberían ser rexistros ou protocolos de observacións inmediatas ou de percepcións. Ao igual que reininger10, Neurath sostén que os enunciados perceptuais que rexistran experiencias (é dicir, os «enunciados protocolarios») non son irrevogables, senón que se poden 7 Carnap, Erkenntnis 2, 1932, p. 437. 8 Carnap, Erkenntnis, p. 438. 9 Otto Neurath, Erkenntnis 3, 1933, p. 205 e ss. Neurath dá o seguinte exemplo: «Un enunciado protocolario completo podería dicir o seguinte: {Protocolo de Otto ás 3 h. 17 m. [O discurso-pensamento de Otto produciuse ás 3 h. 16 m.: (no cuarto, ás 3 h. 15 m., había unha mesa que observou Otto)]}.» 10 Reininger, ob. cit., p. 133. 179 a lóxida da descuberta científica descartar nalgunhas ocasións. Oponse11 ao punto de vista de Carnap (que este último xa revisou desde aquela12) de que os enunciados protocolarios son definitivos e non necesitan confirmación. Porén, mentres reininger describe un método de comprobación dos seus enunciados «elementais», en caso de dúbida, por medio doutros enunciados (o método de dedución e comprobación das conclusións), Neurath non proporciona tal método. limítase a observar que podemos «borrar» un enunciado protocolario que contradiga un sistema, «[...] ou, pola contra, aceptalo e modificar o sistema, de maneira que, despois de engadir o enunciado, siga a ser coherente». A opinión de Neurath de que os enunciados protocolarios non son inviolables representa, segundo a miña opinión, un avance notable. Non obstante, á parte da substitución das percepcións por enunciados de percepción (unha simple tradución ao rexistro formal do discurso), a doutrina segundo a cal os enunciados protocolarios se poden someter a revisión é o único adianto que Neurath achega á teoría (que lle debemos a Fries) da inmediatez do coñecemento perceptual. Trátase dun paso na dirección correcta, pero non leva a ningures se non o segue outro paso: necesitamos unha serie de regras que limiten a arbitrariedade da acción de «borrar» (ou de «aceptar») un enunciado protocolario. Neurath non ofrece ningunha regra deste tipo e, por esa razón, inconscientemente, tira o empirismo pola borda, pois, sen esas regras, os enunciados empíricos xa non se distinguen de ningún outro tipo de enunciados. Todos os sistemas se tornan defendibles se a un lle está permitido (como lle está permitido a todo o mundo, segundo a opinión de Neurath), simplemente «borrar» un enunciado protocolario por resultar inoportuno. Deste xeito, un podería non só rescatar calquera sistema, á maneira do convencionalismo, senón que, ben 11 Neurath, ob. cit., p. 209 e ss. 12 Carnap, Erkenntnis 3, 1933, p. 215 e ss.; cf. nota 1 do apartado 29. 180 Karl Popper provisto de enunciados protocolarios, un podería mesmo confirmalo, empregando testemuñas que testificasen, ou expresasen protocolariamente, o que viron e oíron. Neurath evita unha forma de dogmatismo, pero prepara o terreo para que calquera sistema arbitrario se poida erixir como «ciencia empírica». Non é doado, xa que logo, ver que papel se supón que desempeñan os enunciados protocolarios no esquema de Neurath. Na obra temperá de Carnap, o sistema de enunciados protocolarios era a pedra de toque mediante a que había que xulgar toda afirmación dunha ciencia empírica. Esa era a razón de que tivesen que ser «irrefutables», pois podían por si sós botar abaixo enunciados (enunciados que non fosen protocolarios, por suposto). Pero, se os privan desta función e se as teorías os poden botar abaixo a eles, para que serven? Posto que Neurath non intenta resolver o problema da demarcación, semella que a súa idea dos enunciados protocolarios é unha mera reliquia, un monumento que queda da opinión tradicional de que a ciencia empírica parte da percepción. 27 A obxectividade da base empírica Eu propoño observar a ciencia cunha mirada un tanto diferente da escollida polas diversas escolas psicoloxistas: o que pretendo é distinguir claramente entre a ciencia obxectiva, por unha banda, e «o noso coñecemento», pola outra. Estou disposto a admitir que só a observación nos pode proporcionar «coñecemento sobre os feitos» e que podemos (como di hahn) «ser conscientes dos feitos só por medio da observación1». Pero esta consciencia, este coñecemento noso, non xustifica nin establece a veracidade de ningún enunciado. Polo tanto, non creo que a pregunta que ten que formular a epistemoloxía sexa: «[...] en que se basea o noso coñecemento? [...] 1 H. Hahn, Logik, Mathematik und Naturerkennen, en Einheitswissenschaft 2, 1933, páxs. 19 e 24. 181 a lóxida da descuberta científica ou, máis concretamente, despois de ter a experiencia S., como podo xustificar a descrición que fago dela e defendela contra toda dúbida?2». Isto non servirá de nada, aínda que cambiemos o termo «experiencia» por «enunciado protocolario». Na miña opinión, o que ten que preguntar a epistemoloxía é, máis ben: Como sometemos a proba os enunciados científicos por medio das súas consecuencias dedutivas?*1 E que tipo de consecuencias podemos seleccionar para isto se, á súa vez, estas deben ser comprobables intersubxectivamente? hoxe en día este tipo de achega obxectiva e non psicolóxica está xeralmente aceptada no que respecta aos enunciados lóxicos ou tautolóxicos. Aínda así, non hai tanto que se defendía que a lóxica era unha ciencia que trataba os procesos mentais e as súas leis (as leis do noso pensamento). Segundo este punto de vista, non había máis xustificación para a lóxica que o suposto feito de que non podiamos pensar doutro xeito. unha inferencia lóxica parecía quedar xustificada porque se percibía como unha necesidade do pensamento, como unha sensación de verse obrigado a pensar de acordo con certos parámetros. No campo da lóxica, poida que agora este tipo de psicoloxismo sexa cousa do pasado. A ninguén lle pasaría pola cabeza xustificar a validez dunha inferencia lóxica, ou defendela fronte ás dúbidas, escribindo ao lado, na marxe, o seguinte enunciado protocolario: «Protocolo: Ao comprobar hoxe esta serie de inferencias, experimentei unha fonda sensación de convicción». A postura é moi diferente no tocante aos enunciados empíricos da ciencia. Neste caso, todo o mundo cre que estes se basean en experiencias coma as percepcións ou, dito no rexis2 Cf. Carnap, por exemplo, Scheinprobleme in der Philosophie, 1928, p. 15 (sen cursivas no orixinal). *1 Hoxe en día debería formular esta pregunta do seguinte xeito: Como podemos criticar mellor as nosas teorías (as nosas hipóteses, as nosas suposicións), en lugar de defendelas de toda dúbida? Por suposto, segundo o meu punto de vista, a comprobación sempre foi unha parte da crítica. (Cf. apartado *7, o texto entre as notas 5 e 6, e o final do apartado *52 do meu Potscript). 182 Karl Popper tro formal do discurso, en enunciados protocolarios. A maioría consideraría que calquera intento de basear os enunciados lóxicos en enunciados protocolarios é un caso de psicoloxismo. Porén, curiosamente, cando se trata de enunciados empíricos, isto mesmo coñécese hoxe como «fisicalismo». Non obstante, eu creo que, tanto se se cuestionan os enunciados da lóxica como os da ciencia empírica, a resposta é a mesma: o noso coñecemento, que se pode describir de xeito impreciso como un sistema de disposicións, e que pode ser de interese para a psicoloxía, pódese relacionar en ambos os dous casos con sensacións de crenza ou convicción: nun caso, quizais, coa sensación de verse obrigado a pensar de certo modo; no outro, coa sensación de «certeza perceptual». Pero todo isto só lle interesa ao psicólogo. Nin sequera se tocan problemas coma os das conexións lóxicas entre os enunciados científicos, que só lle interesan ao epistemólogo. (Existe unha crenza moi espallada de que o enunciado «Eu vexo que esta mesa de aquí é branca», posúe algún tipo de profunda vantaxe sobre o enunciado «Esta mesa de aquí é branca», desde o punto de vista da epistemoloxía. No entanto, desde o punto de vista da avaliación das comprobacións obxectivas ás que se pode someter, o primeiro enunciado non parece máis seguro, por falar dunha primeira persoa, ca o segundo enunciado, que fala da mesa que está aquí). Só hai un xeito de asegurarse da validez dunha serie de razoamentos lóxicos, que é expresala baixo a forma en que é máis facilmente comprobable: dividímola en moitos pasos pequenos, fáciles de comprobar para calquera que aprendese a técnica matemática ou lóxica da transformación de enunciados. Se, aínda así, alguén segue a suscitar dúbidas, só poderemos pregarlle que indique un erro nos pasos da proba ou que volva considerar a cuestión. No caso das ciencias empíricas, a situación é practicamente a mesma. Calquera enunciado científico empírico se pode presentar (describindo os preparativos 183 a lóxida da descuberta científica experimentais, etc.) de maneira que calquera que aprendese a técnica pertinente poida comprobalo. Se resulta que esta persoa descarta o enunciado, non abondará con que nos explique polo miúdo todas as súas sensacións de dúbida ou de convición con respecto ás súas percepcións. O que ten que facer é formular un enunciado que contradiga o nosa e darnos as instrucións para comprobalo. Se non fai isto, o único que podemos facer é pedirlle que volva observar, talvez máis detidamente, o noso experimento e o reconsidere. unha afirmación que, debido á súa forma lóxica, non sexa comprobable, pode actuar dentro da ciencia, no mellor dos casos, como estímulo: pode suxerir un problema. No campo da lóxica e das matemáticas, isto pódese exemplificar co problema de Fermat e, no campo da historia natural, digamos que cos rumores sobre as serpes de mar. Nestes casos, a ciencia non di que os rumores sexan infundados, non di que Fermat estivese enganado ou que todos os rexistros de observación de serpes de mar sexan mentiras. En lugar disto, a ciencia deixa en suspenso a decisión sobre o asunto3. A ciencia pódese abordar desde varios puntos de vista, non só desde o da epistemoloxía. Por exemplo, podémola observar como un fenómeno biolóxico ou sociolóxico. Se a observamos deste xeito, poderíase describir como unha ferramenta, ou un instrumento, comparable quizais con algunhas das nosas maquinarias industriais. A ciencia pódese considerar como un medio de produción, como a última palabra en «produción indirecta»4. Nin sequera desde este punto de vista a ciencia está máis conectada á «nosa experiencia» ca outros instrumentos ou medios de produción. Aínda que consideremos que satisfai as nosas necesidades intelectuais, a súa conexión coas nosas experiencias non difire, en principio, da de ningunha outra estrutura 3 Cf. o comentario sobre os «efectos ocultos» no apartado 8. 4 A expresión é de Böhm-Bawerk («Produktionsumweg«). 184 Karl Popper obxectiva. hai que recoñecer que non é incorrecto dicir que a ciencia é «[...] un instrumento» cuxo propósito é «[...] predicir experiencias posteriores a partir doutras inmediatas ou determinadas, e ata o punto que sexa posible para controlalas»5. Así e todo, non creo que este debate sobre as experiencias contribúa a aclarar o asunto, pois ten pouco máis sentido do que tería, por exemplo, caracterizar, dun xeito que non sería incorrecto, unha torre de perforación de petróleo pola afirmación de que o seu obxectivo é proporcionarnos certas experiencias: non o petróleo, senón a visión e o olor do petróleo; non os cartos, senón a sensación de posuír os cartos. 28 Enunciados básicos xa se indicou brevemente que papel desempeñan os enunciados básicos na teoría epistemolóxica que defendo. Necesitámolos para decidir se unha teoría se pode cualificar de falsificable, é dicir, de empírica. (Cf. apartado 21). E tamén os necesitamos para corroborar as hipóteses falsificadoras e, polo tanto, para a falsificación de teorías. (Cf. apartado 22). Os enunciados básicos, xa que logo, teñen que cumprir as seguintes condicións: (a) Dun enunciado universal sen condicións iniciais non se pode deducir ningún enunciado básico*1. 5 Frank, Das Kausalgesetz und seine Grenzen, 1932, p. 1. *En relación co instrumentalismo, véxase a nota *1 anterior ao apartado 12 e o meu Postscript, especialmente os apartados que van do *12 ao *15. *1 Cando escribín isto, pensaba que quedaba o suficientemente claro que só a partir da teoría de Newton, sen condicións iniciais, non se pode deducir nada que teña o carácter dun enunciado observacional (e, polo tanto, sen dúbida, ningún enunciado básico). Lamentablemente, resultou que algúns dos críticos do meu libro non comprenderon isto, nin as súas consecuencias para o problema dos enunciados observacionais ou «enunciados básicos». Por iso, vou engadir aquí uns cantos comentarios. En primeiro lugar, dun enunciado total puro (por exemplo: «Todos os cisnes son brancos») non se deduce nada observable. Isto vese facilmente se temos en conta o feito de que «Todos os cisnes son brancos» e «Todos os cisnes son negros», desde logo, non se contradín, senón que, xuntos, simplemente implican que non hai cisnes, un enunciado que, evidentemente, non é observacional e nin sequera se pode «verificar». (Un enunciado falsificable unilateralmente como «Todos os cisnes son brancos», por certo, ten a mesma forma lóxica que «Non hai cisnes», posto que equivale a «Non hai cisnes que non sexan brancos». 185 a lóxida da descuberta científica Por outra banda, (b) un enunciado universal e un enunciado básico poden ser mutuamente contraditorios. A condición (b) só se pode cumprir se é posible deducir a negación dun enunciado básico da teoría que contradí. Disto e mais da condición (b) tírase que un enunciado básico ten que ter unha forma lóxica tal que a súa negación non poida ser, á súa vez, un enunciado básico. xa atopamos enunciados que tiñan unha forma lóxica distinta da que tiñan as súas respectivas negacións. Tratábase de enunciados universais e mais de enunciados existenciais: uns son a negación dos outros e, aínda así, difiren na súa forma lóxica. Os enunciados singulares pódense construír de xeito análogo. Pódese dicir que o enunciado «hai un corvo na rexión espacio-temporal k» é diferente na súa forma lóxica (e non só na súa forma lingüística) do enunciado «Non hai ningún corvo na rexión espacio-temporal k». un enunciado que teña a forma «hai tal ou cal na rexión k» ou «Está ocorrendo tal ou cal acontecemento na rexión k» pódese denominar «enunciado existencial singular» ou «enunciado 'hai' singular». E o enunciado Se se admite isto, verase enseguida que os enunciados singulares que se poden deducir de enunciados puramente universais non poden ser enunciados básicos. Estou pensando en enunciados da forma: «Se hai un cisne no lugar k, daquela hai un cisne branco no lugar k». (Ou: «En k, ou ben non hai un cisne ou ben hai un cisne branco»). Agora, vemos enseguida por que estes «enunciados exemplificadores» (como se poden denominar) non son enunciados básicos. A razón é que estes enunciados exemplificadores non poden desempeñar o papel de enunciados de comprobación (ou de falsificadores potenciais), que é precisamente o papel que se supón que desempeñan os enunciados básicos. Se aceptásemos os enunciados exemplificadores como enunciados de comprobación, deberiamos obter para calquera teoría (e, polo tanto, para «Todos os cisnes son brancos» e para «Todos os cisnes son negros») un número enorme de verificacións (de feito, un número infinito, unha vez que aceptamos como unha realidade o feito de que hai unha parte enorme do mundo na que non hai cisnes). Como os «enunciados exemplificadores» son deducibles dos universais, as súas respectivas negacións teñen que ser falsificadores potenciais e poden, xa que logo, ser enunciados básicos (se se cumpren as condicións explicitadas máis abaixo no texto). Os enunciados exemplificadores, viceversa, serán logo da forma de enunciados básicos negados (véxase tamén a nota *4 do apartado 80). É interesante sinalar que os enunciados básicos (que son demasiado fortes para seren deducibles só de leis universais) terán un contido informativo maior que as súas negacións exemplificadores; o cal significa que o contido dos enunciados básicos é superior á súa probabilidade lóxica (pois ten que ser superior a 1/2). Estas eran algunhas das consideracións subxacentes na miña teoría da forma lóxica dos enunciados básicos (véxase o meu Conjectures and Refutations, 1963, p. 386 ss.). 186 Karl Popper que resulte da negación, isto é, «Non hai tal ou cal na rexión k» ou «Ningún acontecemento do tipo tal ou cal está ocorrendo na rexión k» pódese denominar «enunciado de non existencia singular» ou «enunciado 'non hai' singular». Agora podemos establecer a seguinte regra sobre os enunciados básicos: os enunciados básicos teñen a forma de enunciados existenciais singulares. Esta regra significa que os enunciados básicos cumprirán a condición (a), pois un enunciados existencia singular nunca se pode deducir dun enunciado estritamente universal, isto é, dun enunciado de non existencia estrito. Tamén cumprirán a condición (b), como se pode ver polo feito de que de todos os enunciados existenciais singulares pódense deducir enunciados puramente existenciais simplemente omitindo calquera referencia a ningunha rexión espacio-temporal individual e, como vimos, non cabe dúbida de que un enunciado puramente existencial pode contradicir a teoría. Nótese que a conxunción destes dous enunciados básicos, p e r, que non se contradín mutuamente, é á súa vez un enunciado básico. ás veces podemos mesmo obter un enunciado básico xuntando un enunciado básico con outro enunciado que non sexa básico. Por exemplo, podemos formar a conxunción do enunciado básico r «hai un punteiro no lugar k» co enunciado non existencial singular «Non hai nungún punteiro en movemento no lugar k». Isto é porque a conxunción r* («r e non-p») dos dous enunciados é equivalente ao enunciado existencial singular «hai un punteiro parado no lugar k». Isto ten a consecuencia de que, se se nos dá unha teoría t e as condicións iniciais r, das que deducimos a predición p, entón o enunciado r* será un falsificador da teoría e, por tanto, un enunciado básico. (Por outra banda, o enunciado condicional «r  p», isto é, «Se r, entón p», non é máis básico que a negación , pois é equivalente á negación dun enunciado básico, ou sexa, á negación de r* ). 187 a lóxida da descuberta científica Estes son os requisitos formais dos enunciados básicos, que son cumpridos por todos os enunciados existenciais singulares. Amais, un enunciado básico debe cumprir un requisito material: un requisito sobre o acontecemento que, como nos indica o enunciado básico, ocorre no lugar k. Este acontecemento ten que ser observable, isto é, os enunciados básicos teñen que ser comprobables intersubxectivamente mediante a observación. Como son enunciados singulares, este requisito pódese referir só, xaora, a observadores que estean adecuadamente situados no tempo e no espazo, algo no que non me vou deter aquí. Non cabe dúbida de que, ao esixir observabilidade, semellará que estou reintroducindo o psicoloxismo na miña teoría, mais isto non é así. É certo que o concepto dun acontecemento observable se pode interpretar nun senso psicoloxista, mais eu estou a usalo de tal maneira que se poida substituír por «un acontecemento que implique posición e movemento de corpos físicos microscópicos». Máis precisamente, poderíamos establecer que todo enunciado básico ou ben ten que ser el mesmo un enunciado sobre posicións relativas de corpos físicos, ou ben ten que ser equivalente a algún enunciado básico do tipo «materialista» ou «mecanístico». (Que esta estipulación é factible relaciónase co feito de que unha teoría que sexa comprobable intersubxectivamente tamén será comprobable intersensorialmente1. Isto quere dicir que as comprobacións que impliquen percepción dun dos nosos sentidos poden, en principio, ser substituídos por comprobacións que impliquen outros sentidos). Así que a acusación de que, ao apelar á observabilidade estou admitindo á calada o psicoloxismo non tería máis consistencia que unha acusación de que admitín o mecanicismo ou o materialismo. Isto mostra que a miña teoría é en realidade bastante neutral e que non se lle debería colgar ningunha destas dúas etiquetas. Digo todo isto para salvar o termo «observable», tal como o eu 1 Carnap, Erkenntnis 2, 1932, p. 445. 188 Karl Popper uso, do estigma do psicoloxismo (as observacións e as percepcións poderán ser psicolóxicas, pero a observabilidade non). Non pretendo definir o termo «observable» ou «acontecemento observable», malia que estea disposto a elucidalo por medio de exemplos psicoloxistas ou mecanísticos. Paréceme que se debía introducir como termo non definido que logo se fai suficientemente preciso co seu uso: como concepto primitivo cuxo uso ten que aprender o epistemoloxista, do mesmo xeito que ten que aprender o uso do termo «símbolo», igual que o físico ten que aprender o uso do termo «punto de masa». Os enunciados básicos son (no modo material de linguaxe) enunciados que aseveran que un acontecemento observable ocorre nunha determinada rexión individual do espazo e o tempo. Os varios termos usados nesta definición, coa excepción do termo primitivo «observable», foron explicados con máis precisión no apartado 23; «observable» non é definido, pero pódese explicar con bastante precisión, como vimos aquí. 29 A relatividade dos enunciados básicos. Resolución do trilema de fries Toda comprobación dunha teoría, xa dea como resultado a corroboración ou a falsificación, ten que deterse nalgún enunciado básico que nós decidamos aceptar. Se non chegamos a ningunha decisión, e se non aceptamos un enunciado básico determinado, entón a comprobación non levará a ningures. Mais, do punto de vista lóxico, a situación por si soa nunca nos levará a deternos neste enunciado básico particular en lugar daquel outro ou, se non, tampouco a abandonar definitivamente a comprobación. Isto é porque calquera enunciado básico pode á súa vez ser sometido a comprobacións, usando como pedra de toque calquera dos enunciados básicos que se poden deducir del coa axuda dalgunha teoría, xa sexa a que está sendo sometida a proba ou calquera outra. Este modo de proceder non ten 189 a lóxida da descuberta científica un final natural1. Polo tanto, se queremos que a comprobación nos leve a algures, non hai máis remedio que parar nalgún punto e dicir que de momento nos conformamos. É bastante doado ver que chegamos desta maneira a un procedemento segundo o cal só nos deteremos nun tipo de enunciado que sexa facilmente comprobable. Isto significa que nos detemos en enunciados sobre cuxa aceptación ou rexeitamento é probable que os varios investigadores se poñan de acordo. E se non se poñen de acordo, simplemente continuarán coas comprobacións ou, se non, comezalas de novo. Se isto tampouco dá resultado ningún, entón podemos dicir que os enunciados en cuestión non eran comprobables intersubxectivamente ou que non se trataba, despois de todo, de acontecementos observables. Se algún día xa non fose posible que os observadores científicos chegasen a un acordo sobre os enunciados básicos, isto sería equivalente ao fracaso da lingua como medio de comunicación universal. Sería equivalente a unha nova «Babel de linguas»: a descuberta científica quedaría reducida ao absurdo. Nesta nova Babel, o edificio da ciencia, en constante crecemento, axiña se convertería en ruínas. Da mesma maneira que unha proba lóxica acada unha forma satisfactoria cando se remata o traballo difícil e todo pode ser comprobado doadamente, tamén ocorre na ciencia que, unha vez rematado o seu traballo de dedución e explicación, detémonos naqueles enunciados básicos que sexan doadamente comprobables. Está claro que os enunciados sobre experiencias 1 Carnap, Erkenntnis 3, 1932, p. 224. Paréceme aceptable o informe que Carnap fai da miña teoría, excepto no relativo a uns cantos detalles non demasiado importantes. Estes detalles son, primeiro, a idea de que os enunciados básicos (que Carnap de denomina «enunciados protocolarios») son os puntos de partida para a ciencia; segundo, a afirmación (p. 225) de que un enunciado protocolario se pode confirmar «con tal ou cal grao de certeza»; terceiro, que os «enunciados sobre percepcións» constitúen «elos da cadea igualmente válidos» e que é a estes enunciados sobre percepción aos que «apelamos en casos críticos». Cf. a cita do texto á próxima nota. Gustaríame aproveitar esta oportunidade para agradecerlle ao Profesor Carnap as súas amables palabras sobre o meu traballo non publicado, no lugar mencionado. 190 Karl Popper persoais (isto é, oracións protocolarias) non son deste tipo, polo cal non son os enunciados apropiados para deterse neles. É certo que usamos documentos ou informes, como son os certificados de comprobacións emitidas por un departamento de investigación científica ou industrial, que poden ser reexaminados se fose necesario. Por exemplo, se cadra pode xurdir a necesidade de comprobar o tempo de reacción dos expertos que realizan as comprobacións (ou sexa, o tempo que lles leva resolver as súas ecuacións persoais). Pero en xeral, e en especial «en casos críticos», si que nos detemos cando aparecen enunciados doadamente comprobables, e non, como recomenda Carnap, cando aparecen oracións de percepción ou protocolarias; isto é, non «... nos detemos cando aparecen estas... porque a comprobación intersubxectiva de enunciados sobre percepcións... sexa relativamente complicada e difícil»2. Cal é a nosa posición actual con relación ao trilema de Fries e a escolla entre o dogmatismo, a regresión infinita e o psicoloxismo? (cf. apartado 25). Os enunciados básicos en que nos detemos, que decidimos aceptar como satisfactorios e como suficientemente comprobados, poida que teñan o carácter de dogmas, pero só na medida en que desistimos de xustificalos mediande argumentos ou comprobacións ulteriores. Mais este tipo de dogmatismo é inocuo pois, se xurdise a necesidade, poderíase doadamente continuar a comprobar estes enunciados. Admito que isto fai que a cadea de dedución sexa en principio infinita, mais este tipo de regresión infinita tamén é inocua pois na nosa teoría non se intenta probar ningún enunciado por medio diso. E por último, en canto ao psicoloxismo, de novo admito que a decisión de aceptar e dar por bo un enunciado básico está relacionado de xeito causal coas nosas experiencias, en especial coas nosas experiencias de percepción. Mais 2 Cf. a nota anterior. *Este artigo de Carnap contiña o primeiro informe publicado sobre a miña teoría de comprobación de hipóteses; a idea que aquí se cita del atribuíaseme alí a min erroneamente. 191 a lóxida da descuberta científica non intentamos xustificar os enunciados básicos mediante estas experiencias. As experiencias poden motivar unha decisión e, xa que logo, a aceptación ou rexeitamento dun enunciado, mais non poden xustificar un enunciado básico, como tampouco o pode xustificar dar golpes na mesa3. 30 Teoría e experimento Acéptase que os enunciados básicos son o resultado dunha decisión ou acordo e, na medida en que isto é así, son convencións. As decisións acádanse seguindo un procedemento gobernado por regras. De especial importancia é a regra que nos di que non debemos aceptar enunciados básicos illados (isto é, que non teñan conexións desde o punto de vista lóxico), pero que si debemos aceptar enunciados básicos no proceso de contrastación de teorías, e tamén de formulación de preguntas incisivas sobre as teorías, que terán que ser respondidas pola aceptación de enunciados básicos. O que ocorre en realidade é, xa que logo, algo bastante diferente do que supoñen os empiristas inxenuos ou os que cren na lóxica indutiva, que pensan que se comeza pola colleita e organización das nosas experiencias e que así se vai ascendendo pola escaleira da ciencia. usando unha linguaxe máis formal, diríase que se se quere construír unha ciencia, primeiro hai que recoller oracións protocolarias. Mais se a min me mandan que anote a experiencia que estou tendo agora mesmo, non sabería como obedecer esta ambigua orde. Que é o que tería que anotar exactamente? Que estou escribindo, que oio tocar unha campá, 3 Paréceme que a opinión sostida aquí está máis próxima da escola «crítica» (kantiana) de filosofía (quizais na forma representada por Fries) que do positivismo. Na súa teoría da nosa «predilección polas probas», Fries subliña que as relacións (lóxicas) existentes entre enunciados son bastante diferentes das relacións existentes entre enunciados e experiencias sensoriais; o positivismo, por outra banda, sempre intenta abolir a distinción: ou ben toda a ciencia se concibe como parte do meu acto de coñecer, da «miña» experiencia sensorial, ou ben as experiencias sensoriais se conciben como parte da rede científica e obxectiva de argumentos na forma de enunciados protocolarios (monismo dos enunciados). 192 Karl Popper que oio berrar un neno, que oio zoar un altofalante? Ou tería que anotar, talvez, a irritación que me causan estes ruídos? E mesmo supoñendo que se puidese obedecer a orde, por moi abundante que fose a colección de enunciados recollidos desta maneira, isto nunca daría lugar a unha ciencia. unha ciencia necesita puntos de vista e problemas teóricos. Normalmente chégase a un acordo sobre a aceptación ou rexeitamento dunha teoría con ocasión da aplicación dunha teoría; o acordo, de feito, é parte dunha aplicación que pon a teoría a proba. Acadar un acordo sobre enunciados básicos é, coma noutros casos de aplicacións, é realizar unha acción para conseguir un obxectivo, que é guiada por consideracións teóricas diversas. Agora estamos, paréceme, en condicións de resolver casos como, por exemplo, o problema de Whitehead de por que se debería servir o almorzo táltil xunto co almorzo visual, ou o Times táctil xunto co Times visible e o audible ruxir das follas*1. O lóxico indutivo que cre que toda ciencia comeza por percepcións elementais illadas debe quedar perplexo ante a regularidade de tales coincidencias; débenlle parecer enteiramente «accidentais». O que lle impide ao indutivo lóxico explicar a regularidade das teorías é o seu presuposto de que as teorías non son máis que enunciados de coincidencias regulares. Mais, segundo a posición a que se chegou aquí, as conexións entre as nosas varias experiencias son explicables, e deducibles, en termos de teorías sometidas a comprobación (as nosas teorías non nos levan a agardar que xunto coa lúa visible se nos sirva unha lúa táctil, como tampouco agardamos ser molestados por un pesadelo auditivo). hai unha pregunda que segue aí, sen dúbida (unha pregunta que non se pode contestar por medio de ningunha teoría falsificable e que é, xa que logo, «metafísica»: *1 A. N. Whitehead, An Inquiry Concerning the Principles of Natural Knowledge (1919), 1925, p. 194. 193 a lóxida da descuberta científica a pregunta de por que temos tanta sorte coas teorías que construímos): por que existen «as leis naturais»?*2 Todas estas consideracións son importantes para a teoría epistemolóxica do experimento. A persoa teórica formúlalle certas preguntas claras á persoa que fai o experimento, e esta, á súa vez, intenta obter unha responsta decisiva a estas preguntas, e non a outras. Todas as demais preguntas inténtaas excluír (aquí pode ser importante a relativa independencia dos subsistemas dunha teoría). Entón, fai que a comprobación con respecto a esta pregunta específica sexa «... todo o sensible que sexa posible, e todo o insensible que sexa posible con respecto a todas as outras preguntas asociadas... unha parte deste traballo consiste en excluír todas as posibles fontes de erro»1. Mais é un erro supoñer que quen fai o experimento procede deste xeito «para alixeirar o labor da persoa teórica»2 ou, talvez, para proporcionarlle á persoa teórica unha base para xeneralizacións empíricas. Ao contrario, o teórico debe ter feito o seu labor desde hai tempo, ou polo menos a parte máis importante do seu traballo: ten que ter a súa pregunta formulada do xeito máis preciso posible. Así que é el ou ela quen lle mostra o camiño a quen fai o experimento. Pero nin sequera quen fai o experimento se dedica a facer observacións exactas: tamén o seu traballo é en grande medida de tipo teórico. A teoría domina o traballo experimental desde o planeamento inicial ata os últimos toques do laboratorio*3. *2 Esta pregunta tratarase no apartado 79 e no apéndice *x; véxase tamén o Postscript, especialmente os apartados *15 e *16. 1 H. Weyl, Philosophie der Mathematik und Naturwissenschaft, 1927, p. 113; Edicion inglesa: Philosophy of Mathematics and Naturall Science, Princeton, 1949, p. 116. 2 Weil, ibid. *3 Visto agora, paréceme que aquí debía ter subliñado unha idea que se atopa noutros lugares do libro (por exemplo, no penúltimo e último parágrafos do apartado 19). Quero dicir a idea de que as observacións, e máis aínda os enunciados procedentes da observación ou enunciados de resultados experimentais, sempre son interpretacións dos feitos observados, que son interpretacións en virtude de teorías. Esta é unha das principais razóns polas que sempre é enganosamente doado atopar verificacións dunha teoría, e polas que temos que adoptar unha actitude altamente crítica cara ás nosas teorías se non queremos caer na argumentación circular: a actitude consistente en intentar refutalas. 194 Karl Popper Isto ilústrase ben cos casos en que a persoa teórica acertou na predición dun efecto observable que despois foi creado experimentalmente; quizais o caso máis fermoso sexa a predición por parte de de Broglie do carácter de onda da materia, que Davisson e Germer*4 foron os primeiros en confirmar experimentalmente. Se cadra aínda se ilustra mellor cos casos en que os experimentos tiveron unha influencia manifesta no progreso da teoría. O que leva á persoa teórica a buscar unha teoría mellor, nestes casos, é case sempre a falsificación experimental dunha teoría, ata daquela aceptada e corroborada: é de novo o resultado de comprobacións guiadas pola teoría. Exemplos famosos disto son o experimento de MichelsonMorley que levou á teoría da relatividade, e mais a falsificación por parte de lummer e Pringsheim da fórmula da radiación de rayleigh e Jeans, e a de Wien, que levou á teoría cuántica. Tamén ocorren, xaora, descubertas accidentais, mais son relativamente raras. Mach3 fala nestes casos dunha «corrección de opinións científicas por circunstancias accidentais» (recoñecendo así a significación das teorías, a pesar do que afirma explicitamente). Agara talvez esteamos en condicións de contestar a pregunta de cómo e por que aceptamos e preferimos unha teoría sobre outras. Esta preferencia non se debe a ningunha xustificación experiencial dos enunciados que compoñen a teoría, nin se debe tampouco a unha redución lóxica da teoría á experiencia. Escollemos a teoría que mellor se sostén en competición con outras teorías, aquela que, por selección natural, demostra ser a máis adecuada para sobrevivir. Será aquela teoría que non só superase as comprobacións máis rigorosas, senón que tamén sexa comprobable da maneira máis rigorosa. unha teoría é unha *4 O caso cóntao moi ben, e abreviadamente, Max Born en Albert Einstein, Philosopher-Scientist, editado por P. A. Schilpp, 1949, p. 174. Hai mellores exemplos, coma a descuberta de Neptuno por parte de Adams e Leverrier, ou a das ondas de Hertz. 3 Mach, Die Prinzipien der Wärmelehre, 1896, p. 439. 195 a lóxida da descuberta científica ferramenta que comprobamos aplicándoa e da cal xulgamos a súa idoneidade polos resultados das súas aplicacións*5. Do punto de vista lóxico, a comprobación dunha teoría depende dos enunciados básicos cuxa aceptación ou rexeitamento, á súa vez, dependa de decisións nosas. Así que son as decisións as que determinan o destino das teorías. Neste sentido, a miña resposta á pregunda de como seleccionamos unha teoría é semellante á resposta do convencionalista: eu digo, coma el, que a escolla vén determinada en parte por consideracións de utilidade. Malia isto, hai unha enorme diferenza entre as miñas ideas e as súas, pois eu sosteño que o que caracteriza o método empírico é só isto: que a convención ou decisión non determina inmediatamente a aceptación pola nosa parte de enunciados universais, senón que, ao contrario, afecta a aceptación pola nosa parte dos enunciados singulares, isto é, os enunciados básicos. Para o convencionalista, a aceptación de enunciados básicos está regulada polo principio de simplicidade: escolle o sistema máis simple. Eu, en cambio, propoño que a primeira cousa que hai que ter en conta debería ser a rigorosidade das comprobacións. (hai unha íntima conexión entre o que eu chamo «simplicidade» e a rigorosidade das comprobacións, pero a miña idea de simplicidade difire enormemente da do convencionalista; véxase o apartado 46). Amais, eu sosteño que o que decide en última instancia o destino dunha teoría é o resultado dunha comprobación, isto é, un acordo sobre enunciados básicos. Coma o convencionalista, sosteño que a escolla dunha teoría particular é unha acción, un asunto de carácter práctico, pero para min a escolla está crucialmente influída pola aplicación dunha teoría e a aceptación dos enunciados básicos relaciona- *5 Así e todo, para unha crítica da perspectiva «instrumentalista» véxanse as referencias da nota *1 antes do apartado 12 (p. 37), e na adición marcada con asterisco á nota 1, apartado 12. 196 Karl Popper dos con esta aplicación, mentres que para o convencionalista os motivos estéticos son os decisivos. Difiro do convencionalista, pois, en que para min os enunciados decididos por acordo non son universais, senón singulares. E difiro do positivista en que para min os enunciados básicos non son xustificables polas nosas experiencias inmediatas, senón que, do punto de vista lóxico, son aceptados por un acto, por unha decisión libre (do punto de vista psicolóxico isto talvez poida ser unha reacción con sentido e ben apropiada). Esta importante distinción entre unha xustificación e unha decisión (unha decisión á que se chega segundo un procedemento regulamentado) talvez se poida aclarar servíndonos dunha analoxía: o vello procedemento do xuízo ante un xurado no sistema legal inglés. O veredicto dun xurado (vere dictum = dito con verdade), igual que o da persoa que fai o experimento, é a resposta a unha pregunta sobre un feito (quid facti?) que se lle debe formular ao xurado do xeito máis preciso e claro posible. Pero a pregunta que se realiza, igual que a maneira de formulala, dependen en grande medida da situación legal, isto é, do sistema imperante do dereito criminal (que correspondería a un sistema de teorías). Pola súa decisión, o xurado acepta, por acordo, un enunciado sobre a ocorrencia dun feito (un enunciado básico, por dicilo así). A significación desta decisión reside no feito de que a partir dela, e mais dos enunciados universais do sistema (do dereito criminal), pódense deducir certas consecuencias. Noutras palabras, a decisión forma a base para a aplicación do sistema; o veredicto desempeña a función dun «enunciado fáctico verdadeiro». Pero está claro que un enunciado non ten por que ser verdadeiro simplemente porque o xurado o dese por bo. Este extremo é recoñecido pola regra que permite que un veredicto sexa revisado ou anulado. O veredicto acádase seguindo un procedemento gobernado por regras. Estas regras están baseadas en certos principios 197 a lóxida da descuberta científica fundamentais que están deseñadas principalmente, se non exclusivamente, para que dean como resultado a descuberta da verdade obxectiva. As regras ás veces deixan unha marxe para conviccións subxectivas, e mesmo para prexuízos subxectivos. Pero aínda ignorando estes aspectos especiais do vello procedemento e imaxinando un procedemento que estivese baseado exclusivamente no obxectivo de promover a descuberta da verdade obxectiva, o veredicto do xurado nunca xustificaría a verdade do que enuncia, nin proporcionaría razóns en que baseala. E tampouco se pode soster que as conviccións subxectivas dos membros do xurado xustifiquen a decisión acadada, aínda que exista, xaora, unha íntima relación causal entre elas e a decisión acadada (unha conexión que pode ser expresada por leis psicolóxicas, por iso se pode dicir que estas conviccións constitúen os «motivos» da decisión). O feito de que estas conviccións non sexan xustificacións ten que ver co feito de que o procedemento do xurado estivese orientado por regras diferentes (por exemplo, unha maioría simple ou cualificada). Isto demostra que as relacións entre as conviccións dos membros do xurado e o seu veredicto poden variar enormemente. En contraste co veredicto do xurado, a sentenza dun xuíz é «razoada»: ten que conter unha xustificación. O xuíz ou xuíza intenta xustificala por medio doutros enunciados, ou deducila loxicamente deles: os enunciados do sistema legal, xunto co veredicto que desempeña o papel das condicións iniciais. Este é o motivo polo que a sentenza pode ser cuestionada por razóns lóxicas. A decisión dun xurado, por outra banda, só se pode cuestionar preguntando se a decisión foi acadada con observancia das regras aceptadas do procedemento, isto é, formalmente, pero non no relativo ao seu contido (por algo a xustificación do contido dunha decisión se denomina «informe de motivos», en vez de «informe de xustificación lóxica»). Está clara a analoxía entre este procedemento o procedemento polo que decidimos sobre os enunciados básicos. Axuda 198 Karl Popper a ver, por exemplo, a súa relatividade e a maneira en que as decisións dependen das preguntas formuladas pola teoría. No caso do xuízo ante un xurado, sería claramente imposible aplicar a «teoría» a non ser que haxa antes un veredicto ao que se chegou por unha decisión; mais o veredicto ten que atoparse nun procedemento que se axusta, e por tanto que aplica, unha parte do código legal xeral. Este caso é análogo ao dos enunciados básicos. A súa aceptación é parte da aplicación dun sistema teórico; e é só esta aplicación a que fai posible aplicacións ulteriores do sistema teórico. A base empírica da ciencia obxectiva non ten, logo, nada de «absoluto»4. A ciencia non descansa sobre bases de rocha. A audaz estrutura das súas teorías érguese, por dicilo así, sobre unha braña. É coma unha edificio ergueito sobre uns piares. Os piares espétanse na braña desde arriba, pero sen atopar apoio en base natural ou «dada»; e cando deixamos de intentar espetalas ata un estrato máis fondo, non é porque xa atoparamos base firme. Paramos simplemente cando nos conformamos con que os piares sexan suficientemente firmes para aguantar a estrutura, polo menos de momento. 4 Weyl (ob. cit., p. 83), edición inglesa p. 116) afirma: «... paréceme que este par de opostos, subxectivo-absoluto e obxectivo-relativo, contén unha das verdades epistemolóxicas máis profundas que se poden tirar do estudo da natureza. Quen persiga o absoluto ten que incluír a subxectividade (ego-centricidade) no intento, e quen aspire á obxectividade non pode evitar o problema do relativismo». E antes o lector atopa isto: «O que se percibimos pola experiencia é subxectivo e absoluto...; o mundo obxectivo, por outra banda, que a ciencia natural aspira a precipitar en forma pura e cristalina... é relativo». Born exprésase en termos semellantes (Die Relativitätstheorie Einsteins und ihre physikalischen Grundlagen, 3a edición, 1922, Introdución). En esencia, esta idea é a teoría da obxectividade de Kant desenvolvida coherentemente (cf. apartado 8 e nota 5 dese mesmo apartado). Tamén se refire a esta situación Raininger, qnen afirma en Das Psycho-Pysische Problem, 1916, p. 29: «A metafísica como ciencia é imposible... porque aínda que é certo que o absoluto se percibe pola experiencia, e por este motivo pode ser sentido intuitivamente, non se deixa expresar en palabras, pois «Spricht die Seele, so spricht, ach! Schon die Seele nicht mehr» («se a alma fala, entón, desafortunadamente, xa non é a alma a que fala»). 199 a lóxida da descuberta científica Addenda, 1972 (1) O termo «base» úsoo con ton irónico: é unha base que non é firme. (2) Asumo un punto de vista realista e obxectivista: pretendo substituír a percepción como «base» pola comprobación crítica. (3) As nosas experiencias observacionais nunca están a salvo de seren sometidas a probas; e están impregnadas de teorías. (4) Os «enunciados básicos» son «enunciados de comprobación»: están, coma toda linguaxe, impreganados de teorías (mesmo unha linguaxe «fenoménica» que permitise enunciados como «vermello aquí agora» estaría impregnada de teorías sobre tempo, espazo e cor). 200 Karl Popper 6 GRAOS DE COMPROBABILIDADE As teorías poden ser sometidas a probas máis ou menos rigorosamente, isto é, poden ser máis ou menos doadamente falsificables. O seu grao de comprobabilidade é relevante para a selección de teorías. Neste capítulo vou comparar os varios graos de comprobabilidade ou falsificabilidade das teorías mediante a comparación das clases dos seus potenciais falsificadores. Esta investigación é independente da cuestión de se é posible distinguir dun xeito absoluto entre teorías falsificables e non falsificables. De feito, poderíase dicir que no presente capítulo se «relativiza» o requisito de falsificabilidade demostrando que a falsificabilidade é unha cuestión de grao. 31. Un programa e unha ilustración unha teoría é falsificable, como vimos no apartado 23, se existe polo menos unha clase non baleira de enunciados básicos homotípicos prohibidos pola teoría, isto é, se a clase dos seus potenciais falsificadores non está baleira. Se representarmos, como fixemos no apartado 23, a clase de todos os posibles enunciados básicos mediante unha área circular e os posibles acontecementos mediante os radios do círculo, entón podemos dicir que polo menos un radio (ou mellor aínda, un sector estreito cuxa anchura pode significar que o acontecemento vai ser 'observable') ten que ser incompatible coa teoría e ten que ser descartado por esta. Os falsificadores potenciais dunha variedade de teorías poderíanse representar mediante a variación na anchura dos sectores. E segundo a maior ou menor anchura dos sectores descartados por elas, poderíase dicir que as teorías teñen máis ou menos falsificadores potenciais (de momento deixaremos a un lado a cuestión de se é posible ou non deter201 a lóxida da descuberta científica minar con precisión a cantidade deles). Poderíase dicir, ademais, que se a clase dos falsificadores potenciais dunha teoría é 'maior' que a doutra, haberá máis oportunidades de que a primeira teoría sexa refutada pola experiencia. Comparándoa deste xeito coa segunda teoría, pódese dicir que a primeira é 'falsificable nun grao máis elevado'. Isto tamén significa que a primeira teoría di máis que a segunda sobre o mundo da experiencia, pois descarta unha clase máis ampla de enunciados básicos. Aínda que a clase dos enunciados permitidos diminúa, isto non afecta a nosa argumentación, pois xa vimos que a teoría non fai ningunha afirmación sobre a clase. Pódese dicir, logo, que a cantidade de información empírica transmitida por unha teoría, ou o seu contido empírico, aumenta segundo o seu grao de falsificabilidade. Imaxinemos agora que se nos dá unha teoría na cal vai en aumento o sector que representa os enunciados básicos prohibidos. Os enunciados básicos non prohibidos pola teoría serán representados en última instancia polo estreito sector restante (para que a teoría sexa coherente, ten que manterse un sector coma este). Obviamente, unha teoría deste tipo sería moi doada de falsificar, pois o abano de posibilidades permitido ao mundo empírico é moi estreito ao excluír case todos os acontecementos concibibles, isto é, aqueles que son loxicamente posibles. Afirma tantas cousas sobre o mundo da experiencia, e ten un nivel tan elevado de contido empírico, que a posibilidade de evitar a falsificación é baixa. A ciencia teórica ten por obxectivo, precisamente, a obtención de teorías que sexan doadamente falsificables neste sentido. Pretende restrinxir ao mínimo o abano de acontecementos permitidos e, de ser posible, restrinxilos ata tal punto que ningunha restrición posterior leve na realidade a unha falsificación empírica da teoría. Se se dese conseguido unha teoría deste tipo, entón esta describiría «o noso mundo particular» do xeito máis preciso posible para unha teoría, pois identificaría o 202 Karl Popper mundo da 'nosa experiencia' partindo da clase de todos os mundos da experiencia loxicamente posibles co grao máis elevado de precisión que pode acadar unha ciencia teórica. Todos os acontecementos ou clases de ocorrencias que de feito atopamos e observamos, e só estes, se caracterizarían como 'permitidos'*1. 32 Como se comparan as clases de falsificadores potenciais? As clases de falsificadores potenciais son clases infinitas. As etiquetas «máis» ou «menos» que intuitivamente se lles poden aplicar ás clases finitas sen especiais cautelas non son aplicables ás clases infinitas. Non é doado superar esta dificultade, nin sequera se en lugar de enunciados básicos prohibidos ou ocorrencias consideramos, a efectos de realizar a comparación, clases de acontecementos prohibidos, co obxectivo de determinar cales delas conteñen 'máis' acontecementos prohibidos. Isto é porque o número de acontecementos prohibidos por unha teoría empírica tamén é infinito, como se pode ver polo feito de que a conxunción dun acontecemento prohibido con calquera outro acontecemento (prohibido ou non) é de novo un acontecemento prohibido. Vou considerar tres maneiras de lle atribuír un sentido preciso, mesmo no caso de clases infinitas, ás etiquetas intuitivas «máis» ou «menos», co obxectivo de descubrir se se pode usar algún deles para comparar clases de acontecementos prohibidos. (1) O concepto de cardinalidade (ou poder) dunha clase. Este concepto non serve para solucionar o noso problema porque se pode demostrar doadamente que as clases de potenciais falsificadores teñen o mesmo número cardinal para todas as teorías1. *1 Sobre os obxectivos da ciencia, véxase o apéndice *x, o apartado *15 do Postscript e o meu artigo «The Aim of Science», Ratio 1, 1957, pp. 24-35. 1 Tarski demostrou que baixo certas suposicións toda clase de enunciados é numerable (cf. Monatshefte f. Mathem. U. Physik 40, 1993, p. 100, nota 10). *O concepto de medida non é aplicable por razóns semellantes (isto é, porque o conxunto de todos os enunciados dunha lingua é numerable). 203 a lóxida da descuberta científica (2) O concepto de dimensión. A idea intuitiva e imprecisa de que, dalgún xeito, un cubo contén máis puntos que, poñamos, unha liña recta pódese formular en termos lóxicos e sen excepcións mediante o concepto de dimensión da teoría de conxuntos. Isto distingue clases ou conxuntos de puntos de acordo coa abundancia de «relacións de veciñanza» entre os seus elementos: os conxuntos de dimensión máis alta teñen relacións de veciñanza máis abundantes. O concepto de dimensión que nos permite comparar clases de dimensión «máis alta» e «máis baixa» usarase aquí para abordar o problema de comparar graos de comprobabilidade. Isto é posible porque os enunciados básicos, combinados por conxunción con outros enunciados básicos, dan como resultado enunciados básicos que teñen un «grao de composición máis alto» que os seus compoñentes, co cal se pode relacionar este grao de composición dos enunciados básicos co concepto de dimensión. A razón é que os acontecementos prohibidos por unha teoría poden ser de calquera grao de composición. Por outro lado, algúns dos enunciados permitidos son permitidos só pola súa forma ou, máis concretamente, porque o seu grao de composición é demasiado baixo para poderen contradicir a teoría en cuestión. Por iso se pode usar este feito para comparar dimensións*1. (3) A relación de subclase. Sexan todos os elementos dunha clase α tamén elementos dunha clase β, de xeito que α sexa unha subclase de β (en símbolos: α Ì β). Así, ou ben todos os membros de β son á súa vez membros de α –neste caso dise que as dúas clases teñen a mesma extensión, ou que son idénti- *1 O termo alemán komplex traduciuse ao inglés aquí e en contextos semellantes por composite («composto»), en lugar de complex («complexo»). A razón é que en inglés composite non denota, como si fai complex, o oposto a «simple». Para o oposto de «simple» (einfach) úsase en alemán kompliziert (cf. o primeiro parágrafo do apartado 41, onde kompliziert se traduce por «complex».) En vista de que o grao de simplicidade é un dos temas centrais deste libro, podería levar a engano falar aquí (e no apartado 38) de degree of complexity («grao de complexidade»). Decidín, logo, usar o termo degree of composition («grao de composición») que semella cadrar ben neste contexto. 204 Karl Popper cas– ou hai membros de β que non pertencen a α. Neste último caso, os membros de β que non pertenzan a α forman a 'clase diferente' ou o complemento de α con respecto a β, e α é unha subclase propia de β. A relación de subclase correspóndese adecuadamente coas etiquetas intuitivas «máis» e «menos», aínda que ten a desvantaxe de que esta relación só se pode usar para comparar as dúas clases se unha delas inclúe a outra. Se hai intersección entre dúas clases de falsificadores potenciais, sen que unha estea incluída na outra, ou se non teñen membros comúns, entón o grao de falsificabilidade das teorías correspondentes non se pode comparar servíndose da relación de subclase, pois non son comparables con respecto a esta relación. 33 Comparación dos graos de falsificabilidade por medio da relación de subclase Ofrécense provisionalmente as seguintes definicións, que serán melloradas máis adiante segundo vaia avanzando a discusión das dimensións das teorías*1. (1) Dise que un enunciado x é «falsificable nun grao máis alto» ou «máis comprobable» que un enunciado y, en símbolos: Fsb(x) > Fsb(y), se e só se a clase dos falsificadores potenciais de x inclúe a clase dos falsificadores potenciais de y como subclase propia. (2) Se as clases de falsificadores potenciais dos dous enunciados x e y son idénticas, entón teñen o mesmo grao de falsificabilidade, isto é, Fsb(x) = Fsb(y). *1 O termo alemán komplex traduciuse ao inglés aquí e en contextos semellantes por composite ("composto"), en lugar de complex ("complexo"). A razón é que en inglés composite non denota, como si fai complex, o oposto a "simple". Para o oposto de "simple" (einfach) úsase en alemán kompliziert (cf. o primeiro parágrafo do apartado 41, onde kompliziert se traduce por "complex".) En vista de que o grao de simplicidade é un dos temas centrais deste libro, podería levar a engano falar aquí (e no apartado 38) de degree of complexity ("grao de complexidade"). Decidín, logo, usar o termo degree of composition ("grao de composición") que semella cadrar ben neste contexto 205 a lóxida da descuberta científica (3) Se ningunha das clases de falsificadores potenciais dos dous enunciados inclúe a outra como subclase propia, entón os dous enunciados teñen graos non comparables de falsificabilidade (Fsb(x) Fsb(y)). Se ocorre (1), sempre haberá unha clase complementaria non baleira. No caso de enunciados universais, esta clase complementaria ten que ser infinita. Non é posible, por tanto, que as dúas teorías (estritamente universais) difiran en que unha delas prohiba un número finito de ocorrencias simples que a outra permita. As clases de falsificadores potenciais de todos os enunciados metafísicos e tautolóxicos están baleiras. De acordo con (2), elas son, logo, idénticas (pois as clases baleiras son subclases de todas as clases, polo tanto tamén das clases baleiras, de xeito que todas as clases baleiras son idénticas; o cal se pode expresar dicindo que hai só unha clase baleira). Denominando «e» un enunciado empírico e «t» ou «m» un enunciado metafísico (por exemplo un enunciado puramente existencial), respectivamente, entón podémoslles atribuír aos enunciados metafísicos ou tautolóxicos un grao cero de falsificabilidade e podemos escribir: Fsb(t) = Fsb(m) = 0, e mais Fsb(e) > 0. Pódese dicir que un enunciado contraditorio consigo mesmo (que podemos denominar «c») ten como clase de falsificadores potenciais a clase de todos os enunciados básicos loxicamente posibles. Isto significa que calquera tipo de enunciado é comparable cun enunciado contraditorio consigo mesmo polo seu grao de falsificabilidade. Así temos Fsb(c) > Fsb(e) > 0.*1 Se poñemos arbitrariamente Fsb(c) = 1, isto é, se asignamos arbitrariamente o número 1 ao grao de falsificabilidade dun enunciado contraditorio consigo mesmo, entón podemos mesmo definir un enunciado empírico e pola condición 1 > Fsb(e) > 0. De acordo con esta fórmula, Fsb(e) sempre cadra dentro do intervalo entre 0 e 1, excluíndo estes límites, isto é, dentro do «intervalo aberto» limitado por estes números. Ao excluír a *1 Véxase o apartado 38 e os apéndices i, *vii e *viii. 206 Karl Popper contradición e a tautoloxía (e tamén os enunciados metafísicos) a fórmula expresa ao mesmo tempo o requisito de coherencia e mais o de falsificabilidade. 34 A estrutura da relación de subclase. Probabilidade lóxica xa definimos a comparación do grao de falsificabilidade de dous enunciados servíndonos da relación de subclase, coa que comparte todas as propiedades estruturais. A cuestión da comparabilidade pódese ilustrar mediante un diagrama (diagrama 1) onde á esquerda se representan as relacións de subclase e á dereita as correspondentes relacións de comprobabilidade. Diagrama 1 Os números arábigos da figura da dereita correspóndense cos números romanos da figura da esquerda, de tal xeito que os números romanos designan a clase dos falsificadores potenciais do enunciado sinalado cos correspondentes números arábigos. As frechas do diagrama que mostran os graos de comprobabilidade van dos enunciados con maior comprobabilidade ou que teñen maior grao de falsificabilidade aos que teñen menor comprobabilidade (corresponden de xeito bastante preciso coas frechas de deducibilidade; véxase o apartado 35). 207 a lóxida da descuberta científica Observarase no diagrama que se poden distinguir e trazar varias sucesións de subclases, por exemplo a sucesión I-II-IV ou I-III-V, e que estas se poderían facer máis «densas» introducindo novas clases intermedias. Todas estas sucesións comezan neste caso particular por 1 e rematan pola clase baleira, pois esta está incluída en todas as clases (a clase baleira non se pode representar á esquerda do noso diagrama porque é unha subclase de todas as clases e tería que aparecer, por dicilo así, por todas partes). Se decidimos identificar a clase 1 coa clase de todos os enunciados posibles, entón 1 equivale á contradición (c) e 0 (que corresponde á clase baleira) pode designar a tautoloxía (t). É posible pasar de 1 á clase baleira, ou de (c) a (t), por varios camiños; algúns destes, como se pode observar na parte dereita do diagrama, pódense cruzar entre eles. Podemos dicir, entón, que a estrutura da relación é reticular (unha «retícula de sucesións» ordenadas pola frecha ou pola relación de subclase). hai puntos nodais (por exemplo os enunciados 4 e 5) en que a retícula está parcialmente conectada. A relación está totalmente conectada só na clase universal e mais na clase baleira, correspondentes á contradición c e a tautoloxía t. Será posible ordenar os graos de falsificabilidade de varios enunciados nunha escala, por exemplo facendo correlacións entre series de enunciados e números ordenados segundo a súa falsificabilidade? Está claro que non podemos de ningunha maneira ordenar todos os enunciados desta maneira*1, pois se *1 Eu continúo crendo que o intento de facer comparables todos os enunciados introducindo unha métrica deben conter un elemento extralóxico arbitrario. Isto é bastante claro no caso de enunciados como "Todos os homes adultos miden máis de 50 cm." (ou "Todos os homes adultos miden menos de tres metros"; isto é, enunciados que teñen predicados que indican unha propiedade mensurable. Isto é porque sempre se pode demostrar que a métrica do contido ou falsificabilidade tería que ser unha función da medida do predicado e esta última debe sempre conter un elemento arbitrario ou en todo caso extralóxico. Claro que sempre se poden construír linguaxes artificiais nas que se establezan métricas. Mais a medida resultante non será puramente lóxica, por moi "obvia" que semelle a medida, sempre que só se admitan predicados cualitativos e discretos do tipo "si ou non" (en oposición aos cuantitativos, que son mensurables). Véxase tamén o apéndice *ix, Segunda e Terceira Notas. 208 Karl Popper o fixésemos estariamos convertendo arbitrariamente enunciados non comparables en comparables. Porén, nada nos impide seleccionar unha das sucesións da retícula e indicar a orde dos seus enunciados con números. Ao facer isto, un enunciado que estea máis próximo á contradición c sempre obterá un número máis elevado que o que estea máis próximo á tautoloxía t. Como xa lles asignáramos os números 0 e 1 á tautoloxía e á contradición respectivamente, teriamos que asignar fraccións propias aos enunciados empíricos da sucesión seleccionada. En realidade non é a miña intención particularizar unha das sucesións. Amais, a asignación de números aos enunciados da sucesión sería totalmente arbitraria. Porén, o feito de que sexa posible asignar tales fraccións é de grande interese, sobre todo pola luz que bota sobre a conexión entre grao de falsificabilidade e a idea de probabilidade. Sempre que poidamos comparar graos de falsificabilidade de dous enunciados, podemos dicir que o menos falsificable é tamén o máis probable, en virtude da súa forma lóxica. A esta probabilidade eu chámolle*2 probabilidade lóxica1, que non se debe confundir coa probabilidade numérica que se usa na teoría dos xogos de azar e mais na estatística. A probabilidade lóxica dun enunciado é complementaria do seu grao de falsificabilidade: aumenta segundo decrece o grao de falsificabilidade. A probabilidade lóxica 1 correspóndese co grao 0 de falsificabilidade, e viceversa. O enunciado de maior *2 Agora (desde 1938, cf. Apéndice *ii) uso o termo "probabilidade lóxica absoluta" en vez de "probabilidade lóxica" para distinguila da "probabilidade lóxica relativa" (ou "probabilidade lóxica condicional"). Véxanse tamén os apéndices *iv e *vii a *ix. 1 A esta idea de probabilidade lóxica (comprobabilidade invertida) corresponde a idea de validez de Bolzano, especialmente cando esta se aplica á comparación de enunciados. Por exemplo, Bolzano describe as proposicións fundamentais nunha relación de deducibilidade como os de menor validez e as consecuentes como as de maior validez (Wissenschaftslehre, 1837, Vol. II, apartado 157, No. 1). A relación do seu concepto de validez co de probabilidade explícaa Bolzano en ob. cit. apartado 147. Cf. tamén Keyness, A Treatise on Probability, 1921, p. 224. Os exemplos alí ofrecidos mostran que a miña comparación de probabilidades lóxicas é idéntica á "comparación da probabilidade que asignamos a priori a unha xeneralización". Véxase tamén a nota 1 do apartado 36 e a nota 1 do apartado 83. 209 a lóxida da descuberta científica comprobabilidade, isto é, o que ten un grao máis elevado de falsificabilidade, é o que é loxicamente menos probable; e o enunciado menos comprobable é o que é loxicamente máis probable. Como se mostrará no apartado 72, a probabilidade numérica pódese relacionar coa probabilidade lóxica e, por tanto, co grao de falsificabilidade. É posible interpretar a probabilidade numérica aplicable a unha subsucesión (seleccionada da relación de probabilidade lóxica) para a que se poida definir un sistema de medición, baseándose en estimacións de frecuencia. Estas observacións sobre a comparación de graos de falsificabilidade non son só aplicables aos enunciados universais ou sistemas de teorías, senón que tamén son aplicables aos enunciados singulares. Son válidas tamén, por exemplo, para teorías conxuntadas con enunciados iniciais. Neste caso a clase de falsificadores potenciais non se debe confundir coa clase de acontecementos –a clase de enunciados básicos homotípicos– pois é unha clase de ocorrencias (esta observación ten certa relevancia para a conexión entre a probabilidade numérica e a lóxica que se analizará no apartado 72). 35 Contido empírico, implicación e graos de falsificabilidade Díxose no apartado 31 que o que eu chamo contido empírico dun enunciado aumenta co seu grao de falsificabilidade: canto máis prohibe un enunciado, máis di sobre o mundo da experiencia (cf. apartado 6). Sen ser idéntico, o que chamo «contido empírico» está intimamente relacionado co concepto de «contido» tal e como o definiu Carnap1, por exemplo. Cando me refira a este último usarei a expresión «contido lóxico», para distinguila do contido empírico. 1 Carnap, Erkenntnis 2, 1932, p. 458. 210 Karl Popper Defino o contido empírico dun enunciado p como a clase dos seus falsificadores potenciais (cf. apartado 31). O contido lóxico defínese, coa axuda do concepto de deducibilidade, como a clase de todos os enunciados non tautolóxicos que sexan deducibles do enunciado en cuestión. (Pódese denominar a súa «clase das consecuencias»). Así que o contido lóxico de p é polo menos igual (isto é, maior ou igual) ao doutro enunciado q, se q é deducible de p (ou, en símbolos, se «p  p»*1). Se a deducibilidade é mutua (en símbolos, «p  q») entón dise que p e q teñen igual contido2. Se q é deducible de p, pero non p de q, entón a clase de consecuencias de q debe ser un subconxunto propio da clase de consecuencias de p; e entón p posúe unha clase máis grande de consecuencias e, por tanto, tamén un maior contido lóxico (ou forza lóxica*2). Como consecuencia da miña definición de contido empírico, a comparación dos contidos lóxico e empírico de dous enunciados p e q leva ao mesmo resultado se os enunciados comparados non conteñen elementos metafísicos. Cumprirannos, por tanto, os seguintes requisitos: (a) dous enunciados de igual contido lóxico deben ter tamén igual contido empírico; (b) un enunciado p con maior contido lóxico que o dun enunciado q tamén ten que ter maior contido empírico, ou polo menos igual contido empírico; e finalmente, (c) se o contido empírico dun enunciado p é maior que o dun enunciado q, entón o contido lóxico ten que ser maior ou non comparable. houbo que engadir en (b) a matiza- *1 «p  p» significa, segundo esta explicación, que o enunciado condicional co antecedente p e o consecuente q é tautolóxico ou loxicamente verdadeiro. (No momento de escribir o texto non expresei isto claramente, nin comprendía eu daquela cabalmente a relevancia do feito de que unha aseveración sobre a deducibilidade sexa metalingüística. Véxase tamén a nota *1 do apartado 18). Por tanto, «p  p» pódese interpretar como «p implica q».. 2 Carnap, ob. cit., di: "O termo metalóxico 'igualdade de contidos' defínese como 'mutuamente derivable'". Os libros de Carnap Logische Syntax der Sprache, 1934, e Die Aufgabe der Wissenschaftslogik, 1934, foron publicados demasiado tarde para seren considerados aquí. *2 Se o contido lóxico de p excede o de q, entón dicimos tamén que p é loxicamente máis forte que q, ou que a súa forza lóxica excede a de q. 211 a lóxida da descuberta científica ción «ou polo menos igual contido empírico» porque p pode ser, por exemplo, unha conxunción de q cun enunciado puramente existencial ou con calquera outro tipo de enunciado metafísico ao que lle temos que asignar un certo contido lóxico. Isto ocorre porque neste caso o contido empírico de p non será maior que o de q. Consideracións análogas son as que fan necesario engadirlle a (c) a matización «ou non comparable»*3. Ao comparar graos de comprobabilidade ou de contido empírico, no caso de enunciados puramente empíricos, polo regular chegaremos aos mesmos resultados que na comparación de contido lóxico ou de relacións de deducibilidade. Así, será posible en grande medida basear a comparación de graos de falsificabilidade nas relacións de deducibilidade. Ambas as relacións mostran formas de retículas totalmente conectadas na autocontradición e na tautoloxía (cf. apartado 34). Isto pódese expresar dicindo que unha autocontradición carrexa calquera enunciado e que unha tautoloxía é carrexada por calquera enunciado. Ademais, os enunciados empíricos, como vimos, pódense caracterizar como aqueles cuxo grao de falsificabilidade cae dentro do intervalo aberto limitado polos graos de falsificabilidade de autocontradicións, por un lado, e de tautoloxías, polo outro. De igual maneira, os enunciados sintéticos en xeral (incluíndo os que son non empíricos) sitúanse, no relativo á relación de implicación, no intervalo aberto entre a autocontradición e a tautoloxía. á tese positivista de que os enunciados non empíricos (metafísicos) «non teñen sentido» correspondería a tese de que é superflua a miña distinción entre enunciados sintéticos e empíricos, ou entre contido lóxico e empírico, pois todos os enunciados sintéticos terían que ser empíricos (enténdase, todos os enunciados xenuínos, non meros pseudo-enunciados). *3 Véxase, outra volta, o apéndice *vii. 212 Karl Popper Mais seméllame que esta maneira de usar as palabras contribúe máis a confundir as cousas que a aclaralas. Por tanto, para min a comparación do contido empírico de dous enunciados é equivalente á comparación dos seus graos de falsificabilidade. Isto fai que a nosa regra metodolóxica consistente en darlle prioridade ás teorías de comprobabilidade máis rigorosa (cf. as regras anticonvencionalistas no apartado 20) sexa equivalente á regra que lles dá prioridade ás teorías co contido empírico máis elevado posible. 36 Niveis de universalidade e graos de precisión hai outras esixencias metodolóxicas que se poden reducir á esixencia dun nivel de contido empírico o máis elevado posible. As esixencias máis salientables deste tipo son dúas: a de acadar o nivel (ou grao) máis alto posible de universalidade e a de acadar o grao máis alto posible de precisión. Tendo isto en conta, podemos considerar as leis naturais seguintes: p: Todos os corpos celestes que se desprazan en órbitas pechadas desprázanse en círculos: ou dito máis brevemente: Todas as órbitas dos corpos celestes son círculos. q: Todas as órbitas dos planetas son círculos. r: Todas as órbitas dos corpos celestes son elipses. s: Todas as órbitas dos planetas son elipses. As relacións de deducibilidade existentes entre estes catro enunciados represéntanse mediante frechas no diagrama. Todos os outros enunciados séguense de p; de q dedúcese s, que tamén se segue de r, de tal maneira que s se segue de todos os outros. Ao pasar de p a q vai aumentando o grao de universalidade; e q di menos que p porque as órbitas dos planetas forman unha subclase propia das órbitas de corpos celestes. En consecuencia, p é máis doadamente falsificable que q: se q é falsificado, tamén o é p, mais non viceversa. Ao pasar de p a r, vai diminuíndo o grao de precisión (do predicado): os círculos son unha subclase propia das elipses; se r é falsificada, tamén o é p, mais 213 a lóxida da descuberta científica non viceversa. Consideracións semellantes son aplicables ao resto dos movementos: no tránsito de p a s diminúen tanto o grao de universalidade como o de precisión; pasando de q a s diminúe a precisión e ao pasar de r a s diminúe a universalidade. A maior grao de universalidade ou precisión corresponde un maior contido empírico (ou lóxico) e, por tanto, un maior grao de comprobabilidade. Tanto os enunciados universais como os singulares se poden formular en forma dun «enunciado condicional universal» (ou unha «implicación xeral» como se denomina con frecuencia). Se expresamos as catro leis anteriores desta forma, se cadra poderemos ver máis doadamente como se poden comparar os graos de universalidade e os graos de precisión de dous enunciados. un enunciado condicional universal (cf. nota 6 do apartado 14) pódese formular desta forma: «(x) (φx  fx)» ou, dito en palabras: «todos os valores de x que cumpran a función de enunciado φx tamén cumpren a función de enunciado fx». O enunciado s do diagrama anterior dá o seguinte exemplo: «(x) (x é unha órbita dun planeta  x é unha elipse)», o cal quere dicir: «Sexa x o que sexa, se x é unha órbita dun planeta, entón x é unha elipse». Supoñendo que p e q dous enunciados escritos desta forma «normal», entón poderemos dicir que p é dunha maior universalidade que q se a función do enunciado antecedente de p (que se pode formular «φpx») é tautoloxicamente implicada por (ou loxicamente deducible de), mais non equivalente, a función de enunciado correspondente de q (que se pode formular «φqx»); ou, noutras palabras, se «(x) (φqx  fpx)» é tautolóxico (ou loxicamente verdadeiro). Do mesmo xeito, diremos que p ten maior precisión que q se «(x) (φpx  fqx)» é tautolóxico, isto é, se o predicado (ou a función de enunciado consecuente) de p é máis restrinxido que o de q, o cal quere dicir que o predicado de p implica o de q.*1 *1 Observarase que no presente apartado, ao contrario do que ocorre no 18 e no 35, a frecha úsase para indicar unha relación condicional e non unha relación de implicación; cf. tamén a nota *1 do apartado 18. 214 Karl Popper Esta definición pódese estender ás funcións de enunciados con máis dunha variable. Por medio de transformacións lóxicas elementais chégase ás relacións de deducibilidade que xa presentamos e que se poden expresar mediante a regra seguinte1: se son comparables tanto a universalidade como a precisión de dous enunciados, entón o menos universal e o menos preciso é deducible do máis universal ou máis preciso, a menos que un sexa máis universal e outro máis preciso (como ocorría cos casos de p e q do meu diagrama)2. Poderiamos dicir agora que a nosa decisión metodolóxica, ás veces interpretada en termos metafísicos como o principio de causalidade, pretende non deixar nada sen explicar, isto é, tenta sempre deducir os enunciados doutros de maior universalidade. Esta decisión procede da esixencia de obter o maior grao posible de universalidade e precisión, o cal se pode reducir á esixencia, ou regra, de darlle prioridade ás teorías que poidan ser comprobadas do xeito máis rigoroso posible*2. 37 Ámbitos lóxicos. Notas sobre a teoría da medición Se un enunciado p é máis doado de falsificar que un enunciado q, porque ten un maior nivel de universalidade ou precisión, entón a clase de enunciados básicos permitidos por p é unha subclase propia da clase de enunciados básicos permitidos por 1 Podemos formulalo así: [(φqx  fpx). (fpx  fqx)]  [(φpx  fpx)  (φqx  fqx)], abreviado: [(φq  φp), (fp  fq]  (p  q). *O carácter elemental desta fórmula, que se afirmou no texto, queda ben claro se escribimos: "[(a  b). (c  d)]  [(b  c)  (a  d)]". De acordo co dito no texto, despois poñemos "p" para "b  c" e "q" para "a  d", etc. 2 O que eu chamo maior universalidade dun enunciado corresponde máis ou menos ao que a lóxica clásica denomina maior "extensión do suxeito" e o que eu denomino maior precisión corresponde á extensión menor ou "restrición do predicado". A regra sobre a relación de deducibilidade, que acabamos de comentar, pode ser vista como unha clarificación e combinación do clásico "dictum de omni et nullo" e mais o principio "nota-notae", o "principio fundamental da predicación mediada". Cf. Bolzano, Wissenchaftslehre II, 1837, apartado 263, Nos. 1 e 4; Külpe, Vorlesungen über Logik (editado por Selz, 1923), apartado 34, 5 e 7. *2 Véxase tamén o apartado *15 e o capítulo *iv do meu Postscript, en especial o apartado *76, o texto a que remite a nota 5. 215 a lóxida da descuberta científica q. A relación de subclase que se dá entre clases de enunciados permitidos é a oposta á que se dá entre clases de enunciados prohibidos (falsificadores potenciais): pódese dicir que as dúas relacións son inversas (ou se cadra complementarias). á clase de enunciados básicos permitidos por un enunciado pódeselle chamar o seu ámbito1. O «ámbito» que un enunciado lle permite á realidade é, por dicilo así, a marxe de «libre xoga» (ou o grao de liberdade) que lle permite á realidade. O ámbito e o contido empírico (cf. apartado 35) son conceptos inversos (ou complementarios). Segundo isto, os ámbitos de dous enunciados relaciónanse entre si da mesma maneira en que se relacionan as súas respectivas probabilidades lóxicas (cf. apartados 34 e 72) Introducín o concepto de ámbito porque facilita a manipulación de certas cuestións relativas ao grao de precisión na medición. Supoñamos que as consecuencias de dúas teorías difiren tan pouco en todos os campos de aplicación que as mínimas diferenzas entre os acontecementos observables calculados non son detectables, debido ao feito de que o grao de precisión atinxible nas nosas medicións non é suficientemente elevado. Neste caso será imposible decidir pola experimentación entre as dúas teorías se antes non melloramos a técnica de medición*1. Isto mostra que a técnica de medida imperante dá lugar a un certo ámbito: unha zona onde a teoría permite discrepancias entre as observacións. Así, a regra que afirma que as teorías deberían ter o máis alto grao atinxible de comprobabilidade (que permitan, logo, 1 O concepto de ámbito (inglés range, alemán Spielraum) foi introducido por von Kries (1886); ideas semellantes atópanse en Bolzano. Waismann (Erkenntnis 1, 1930, p. 228 e ss.) intenta combinar a teoría do ámbito coa teoría da frecuencia; cf. o apartado 72. *Keynes (Treatise, p. 88) traduciu Spielraum ao inglés por field (campo) [aquí traducido por ámbito, N. do T.]; Keyness tamén usa (p. 224) scope (ámbito) para o que na miña opinión vén sendo o mesmo. *1 Seméllame que Duhem interpretou isto erroneamente. Véxase o seu Aim and Structure of Physical Theory, p. 137 ss. 216 Karl Popper unha marxe máis estreita de ámbito) implica a esixencia de elevar o máis posible o grao de precisión na medición. Dise decote que toda medición consiste na determinación de coincidencias de puntos. Mais unha determinación tal só pode ser correcta dentro de certos límites, pois en senso estrito non hai coincidencias de puntos*2. Dous «puntos» físicos –unha marca, poñamos, na vara de medir e outra no corpo obxecto da medición– como moito pódense aproximar bastante, mais non poden coincidir, isto é, fusionarse nun punto único. Aínda que isto pareza unha trivialidade en calquera outro contexto, é importante para a cuestión da precisión na medición, pois lémbranos que a medición se debería describir nos termos que indicamos a seguir. Descubrimos que o punto do obxecto medido está entre dúas gradacións ou marcas da vara de medir ou, poñamos, que o punteiro do noso aparato de medición se atopa entre dúas gradacións da escala. Despois podemos considerar estas dúas gradacións ou marcas como os dous límites óptimos de erro, ou ben facer unha estimación da posición, por exemplo, do punteiro dentro do intervalo das gradacións, obtendo así un resultado máis preciso. Neste último caso pódese dicir que consideramos que o punteiro se atopa entre dúas marcas de gradación imaxinarias. Por iso sempre queda un intervalo ou ámbito. Os físicos teñen por costume facer unha estimación deste intervalo para todas as medicións (así, seguindo a Millican, por exemplo, para a carga elemental do electrón, medida en unidades electrostáticas, dan o valor e = 4,774.10-10, engadindo que o ámbito de imprecisión é ± 0,005.10-10). Mais isto presenta un problema: un pode preguntarse pola utilidade de substituír unha marca nunha escala por dúas –a saber, os dous extremos do intervalo– cando para cada un destes extremos se vai presentar de novo a mesma pregunta: cales son os límites de precisión nos extremos do intervalo? *2 Nótese que estou a falar aquí de medicións, non de contar. (A diferenza entre os dous está intimamente relacionada coa existente entre números racionais e números reais). 217 a lóxida da descuberta científica Está claro que dar os extremos do intervalo non serve de nada a non ser que estes dous extremos á súa vez se poidan fixar cun grao de precisión que excede amplamente o que podemos aspirar a acadar coa medición orixinal; fixalos, enténdase, dentro dos seus propios intervalos de imprecisión que deberían logo ser menores, por varias ordes de magnitude, que o intervalo que determinan para o valor da medida orixinal. Noutras verbas, os extremos do intervalo non son nítidos, senón que son intervalos moi pequenos, que á súa vez teñen extremos aínda máis pequeniños, etc. Deste xeito chégase á idea do que se poden denominar «extremos difusos» ou extremos de condensación do intervalo. Estas consideracións non presupoñen a teoría matemática dos erros nin a teoría da probabilidade. Máis ben é ao revés: ao analizar a idea dun intervalo de medición ofrécennos un contexto sen o cal carece de sentido a teoría estatística dos erros. Se medimos unha magnitude moitas veces, obtemos valores que se distribúen con densidades diferentes ao longo dun intervalo (sendo o intervalo de precisión dependente da técnica de medición empregada). Só se sabemos o que buscamos (a saber, os extremos de condensación deste intervalo) poderemos aplicar a estes valores a teoría dos erros para determinar os extremos do intervalo*3. Todo isto bota algunha luz, na miña opinión, sobre a superioridade dos métodos que empregan medicións sobre métodos puramente cualitativos. É certo que mesmo no caso das estimacións cualitativas, coma na estimación do timbre dun son musical, ás veces é posible dar un intervalo de precisión para as estimacións, mais en ausencia de medicións calquera intervalo dese tipo só pode ser moi impreciso, pois en tales casos non é aplicable o concepto de extremos de condensación. Este concepto *3 Estas consideracións están en estreita relación cos resultados comentados nos puntos 8 e seguintes da "Terceira Nota", reimpresa no apéndice *ix. Véxase tamén o apartado *15 do Postscript sobre a importancia da medición para a "profundidade" das teorías. 218 Karl Popper só é aplicable cando se pode falar de ordes de magnitude e, por tanto, só no caso de que os métodos de medición sexan definidos. Posteriormente usarei de novo o concepto de extremos de condensación dos intervalos de precisión no apartado 68, en relación coa teoría da probabilidade. 38 Comparación dos graos de comprobabilidade por referencia ás dimensións Ata o de agora falamos da comparación de teorías con relación aos seus graos de comprobabilidade só na medida en que se poden comparar servíndose da relación de subclase. Nalgúns casos este método é válido para orientarnos na escolla entre teorías. Así, agora estamos en condicións de afirmar que o principio de exclusión de Pauli, mencionado a modo de exemplo no apartado 20, resulta ser moi satisfactorio como hipótese auxiliar, debido a que aumenta enormemente o grao de precisión e, con el, o grao de comprobabilidade, da anterior teoría antiga (igual que o correspondente enunciado da moderna teoría cuántica, que afirma que os estados antisimétricos son realizados por electróns e os simétricos por partículas sen carga e con algunhas de carga múltiple). A comparación por medio da relación de subclase non é suficiente para moitas finalidades. Así, Frank, por exemplo, afirmou que os enunciados dun alto nivel de universalidade, como o principio da conservación de enerxía na formulación de Planck, son susceptibles de se converteren en tautolóxicos, e de perderen o seu contido empírico, a non ser que se poidan determinar as súas condicións iniciais « ... mediante unhas poucas medicións, ... isto é, mediante un pequeno número de magnitudes características do estado do sistema»1. A cuestión do número de parámetros que hai que determinar, e substituír nas 1 Cf. Frank, Das Kausalgesetz und seine Grenzen, 1931, p. 24. 219 a lóxida da descuberta científica fórmulas, non se pode elucidar mediante a relación de subclase, a pesar do feito de que sexa evidente unha relación íntima entre o problema da comprobabilidade e o da falsificabilidade, xunto cos seus graos. Cantas menos magnitudes cumpran para determinar as condicións iniciais, menos compostos*1 serán os enunciados básicos suficientes para a falsificación da teoría, pois un enunciado básico falsificador consiste na conxunción das condicións iniciais coa negación da predición deducida (cf. apartado 28). Así, pode ser posible comparar teorías polo seu grao de comprobabilidade determinando o grao mínimo de composición que ten que ter un enunciado básico para que sexa capaz de contradicir a teoría; sempre a condición de podermos atopar a maneira de comparar enunciados básicos para podermos determinar se son máis (ou menos) compostos, isto é, compostos por un número maior (ou menor) de enunciados básicos dun tipo máis simple. Independentemente do seu contido, todos os enunciados básicos que teñan un grao de composición que non acade o mínimo requirido serían permitidos pola teoría debido simplemente ao seu baixo grao de composición. Mais tal programa atopa algunhas dificultades, pois en xeral non é doado decidir, mediante unha simple inspección, se un enunciado é composto, isto é, se é equivalente á conxunción de enunciados máis simples. En todos os enunciados aparecen nomes universais e, mediante a análise destes últimos, pódese dividir o enunciado nos seus compoñentes conxuntivos (por exemplo, o enunciado «hai un vaso de auga no lugar k» quizais se poida analizar e dividir en dous enunciados: «hai un vaso que contén un fluído no lugar k» e «hai auga no lugar k»). Non hai maneira de atopar unha fin natural á disección de enunciados por este método, sobre todo polo motivo de que sempre se poden introducir novos universais definidos co obxectivo de facer posible unha disección ulterior. *1 Sobre o termo 'composto' (inglés 'composite'), véxase a nota *1 do apartado 32. 220 Karl Popper Coa idea de facilitar a comparabilidade dos graos de composición de todos os enunciados básicos, poderíase propoñer seleccionarmos unha certa clase de enunciados como enunciados atómicos ou elementais2, dos cales se poderían obter todos os elementos restantes mediante conxunción e outras operacións lóxicas. Se isto funcionase, significaría que teriamos definido un «cero absoluto» de composición, co cal se podería expresar a composición de calquera enunciado, por dicilo así, en graos absolutos de composición*2. Mais, pola razón aducida anteriormente, tal procedemento tería que ser considerado como altamente inapropiado, pois imporía serias restricións ao libre uso da linguaxe científica*3. Así e todo, continúa a ser posible comparar os graos de composición de enunciados básicos e, por tanto, tamén os doutros enunciados. Pódese facer mediante a selección dunha clase de enunciados relativamente atómicos, que tomamos como base da 2 "Proposicións elementais" en Wittgenstein, Tractatus Logico-Philosophicus, Proposición 5: "As proposicións son funcións de verdade de proposicións elementais". "Proposicións atómicas" (en oposición ás "proposicións moleculares") en Whitehead e Russel, Principia Mathematica Vol. I. Introdución á 2a edición, 1925, p. xv e ss. C. K. Ogden traduciu o termo de Wittgenstein Elementarsatz por "elementary proposition" ["proposición elemental"], mentres que Bertrand Russell no Prefacio do Tractatus, 1922, p. 13, traduciuna por "atomic proposition" ["proposición atómica"]. Esta última expresión acadou máis popularidade. *2 Os graos absolutos de composición determinarían, claro está, graos absolutos de contido e, por ende, de improbabilidade lóxica absoluta. O proxecto indicado aquí de introducir a improbabilidade e, por tanto, a probabilidade mediante a selección dunha certa clase de enunciados absolutamente atómicos (esbozados inicialmente, por exemplo, por Wittgenstein) foi elaborado máis recentemente por Carnap no seu libro Logical Foundations of Probability, 1950, co fin de elaborar unha teoría da indución. Véxanse tamén os meus comentarios sobre linguaxes modelo no meu "Prefacio á edición inglesa", 1958, máis arriba, onde aludo ao feito de que a terceira linguaxe modelo (o sistema lingüístico de Carnap) non admite propiedades mensurables (nin permite na súa forma presente a introdución dunha orde temporal ou espacial). *3 A expresión "linguaxe científica" usouse aquí bastante inxenuamente, por iso non se debe interpretar no sentido técnico do que hoxe se chama un "sistema lingüístico". Ao contrario, o meu argumento principal era que non debemos perder de vista o feito de que os científicos non poden usar un "sistema lingüístico" porque teñen que andar cambiando constantemente de linguaxe, con cada paso novo que vaian dando. As palabras "materia" ou "átomo" significan, despois de Rutherford, o mesmo que "materia" e "enerxía" despois de Einstein, ou sexa, algo diferente do que significaban antes: o significado destes conceptos é unha función da teoría, que muda constantemente. 221 a lóxida da descuberta científica comparación. Tal clase de enunciados relativamente atómicos pódese definir por medio dun esquema xerador ou matriz («hai un aparato de medición de... no lugar..., cuxo punteiro está situado entre as marcas ... e... da escala»). A continuación podemos definir como relativamente atómica e, por tanto, como equi-composta, a clase de todos os enunciados obtidos a partir deste tipo de matriz (ou función de enunciado) mediante a substitución de valores definidos. A clase destes enunciados, xunto con todas as conxuncións que se poden formar a partir deles, pódese denominar campo». A unha conxunción de n enunciados diferentes relativamente atómicos dun campo pódeselle chamar o «n-uplo do campo» e pódese dicir que o seu grao de composición é igual ao número n. Se existe, para unha teoría t, un campo de enunciados singulares (mais non necesariamente básicos) tal que, para un número d, a teoría t non pode ser falsificada por ningún d-uplo do campo, aínda que pode ser falsificada por certos d + 1-uplos, entón chamámoslle d ao número característico da teoría con respecto a aquel campo. Todos os enunciados do campo cun grao de composición menor que d, ou igual a d, son compatibles coa teoría, e son permitidos por ela, independentemente do seu contido. É posible, entón, basear a comparación do grao de comprobabilidade das teorías no número característico d. Mais para evitar as incoherencias que poidan xurdir co uso de diferentes campos, cómpre usar un concepto algo máis restrinxido que o de campo, a saber, o concepto de campo de aplicación. Dada unha teoría t, dicimos que un campo é un campo de aplicación da teoría t se existe un número característico d da teoría t con respecto a este campo e se, ademais, cumpre un certo número de condicións (que se explican no apéndice i). A un número característico d dunha teoría t, con respecto a un campo de aplicación, eu chámolle dimensión de t con respecto a este campo de aplicación. A palabra «dimensión» xurdiu porque se pode concibir que todos os posibles n-uplos 222 Karl Popper dun campo están arranxados espacialmente (nun espazo de configuración de dimensións infinitas). Se, por exemplo, d = 3, entón os enunciados admisibles porque a súa composición sexa demasiado baixa forman un subespazo tridimensional desta configuración. A transición de d = 3 a d = 2 correspóndese coa transición dun sólido a unha superficie. Canto menor sexa a dimensión de d, máis reducida será a clase dos enunciados permitidos que, independentemente do seu contido, non poden contradicir a teoría debido ao seu baixo grao de composición, e maior será o grao de falsificabilidade da teoría. O concepto de campo de aplicación non se restrinxe aos enunciados básicos, pois tamén aos enunciados singulares de todo tipo se lles permite seren enunciados pertencentes ao campo de aplicación. Comparando as súas dimensións mediante o campo, pódese facer unha estimación do grao de composición dos enunciados básicos (asumimos que a enunciados singulares altamente compostos corresponden enunciados básicos altamente compostos). Pódese asumir, logo, que a unha teoría con dimensión elevada corresponde unha clase de enunciados básicos de dimensión elevada, de xeito que permite todos os enunciados desta clase, independentemente do que aseveren. Isto responde á pregunta sobre a relación que manteñen os dous métodos de comparación de graos de comprobabilidade, un mediante a dimensión dunha teoría e o outro mediante a relación de subclase. haberá casos en que non sexa aplicable ningún, ou que só o sexa un, dos métodos. En tales casos, obviamente, non hai posibilidade de conflito entre os dous métodos. Pero se nun caso concreto son aplicables os dous métodos, podería moi ben ocorrer que dúas teorías de dimensións iguais teñan, en cambio, graos diferentes de falsificabilidade se son postas a proba polo método baseado na relación de subclase. En tales casos débese dar por bo o resultado deste último método, pois demostraría ser o método máis sensible. En todos os demais casos en que ambos sexan aplicables, os dous métodos 223 a lóxida da descuberta científica deben dar o mesmo resultado, pois pódese demostrar, usando un simple teorema da teoría da dimensión, que a dimensión dunha clase ten que ser maior, ou igual, que a das súas subclases3. 39 A dimensión dun conxunto de curvas O que eu chamei o «campo de aplicación» dunha teoría ás veces pódese identificar simplemente co campo da súa representación gráfica, isto é, a área dunha folla cuadriculada de papel onde representamos a teoría con gráficos: pódese considerar que cada punto deste campo de representación gráfica corresponde a un enunciado relativamente atómico. A dimensión da teoría con respecto a este campo (definida no apéndice 1) é idéntica á dimensión do conxunto de curvas correspondentes á teoría. Tratarei estas relacións usando os enunciados q e s vistos no apartado 36. (Esta nosa comparación de dimensións é aplicable a enunciados con diferentes predicados). A hipótese q –que todas as órbitas planetarias son círculos– é tridimensional: para a súa falsificación cómpren polo menos catro enunciados singulares do campo, correspondentes a catro puntos da súa representación gráfica. A hipótese s, que di que todas as órbitas planetarias son elipses, é pentadimensional, pois para a súa falsificación fan falta polo menos seis enunciados singulares, correspondentes a seis puntos do gráfico. No apartado 36 viamos que q é máis fácil de falsificar que s: como todos os círculos son elipses, era posible basear a comparación na relación de subclase. Mais o uso das dimensións permítenos comparar teorías que antes éramos incapaces de comparar. Por exemplo, agora podemos comparar unha hipótese do círculo cunha hipótese da parábola (que é tetradimensional). Cada unha destas palabras («círculo», «elipse», «parábola») designa unha clase ou conxunto de curvas, e cada un destes conxuntos ten a dimensión d se os puntos d son necesarios e suficientes para 3 Cf. Menger, Dimensionstheorie, 1928, p. 81. *Sempre se pode supoñer que as condicións baixo as que é válido este teorema se poden cumprir mediante os "espazos" de que nos ocupamos aquí. 224 Karl Popper singularizar ou caracterizar unha curva particular do conxunto. Na representación alxébrica, a dimensión do conxunto de curvas depende do número de parámetros dos que podemos escoller libremente os valores. Podemos, xa que logo, dicir que o número de parámetros libremente determinados dun conxunto de curvas polos que se representa unha teoría é característico do grao de falsificabilidade (ou comprobabilidade) da teoría. En relación cos enunciados q e s do meu exemplo gustaríame facer algúns comentarios metodolóxicos relativos á descuberta das leis de Kepler*1. Eu non quero dicir que a crenza na perfección –o principio heurístico que levou a Kepler á súa descuberta– estea inspirada, consciente ou inconscientemente, en consideracións metodolóxicas sobre graos de falsificabilidade, mais si penso que o éxito de Kepler se debeu en parte ao feito de que a hipótese do círculo coa que el comezou fose relativamente doada de falsificar. Se Kepler comezase cunha hipótese que non fose tan doadamente comprobable pola súa forma lóxica coma a hipótese do círculo, podería facilmente ocorrer que non obtivese resultado ningún, tendo en conta as dificultades de facer cálculos dos que as propias bases andaban «polo ar»: á deriva no ceo, por dicilo así, e con movementos descoñecidos. O resultado negativo inequívoco a que chegou Kepler mediante a falsificación da súa teoría do círculo foi, en realidade, o seu primeiro éxito verdadeiro. O seu método mostraralle a suficiente fiabilidade como para continuar adiante, sobre todo porque xa o primeiro intento fornecera certas aproximacións. Non hai dúbida de que as leis de Kepler tamén se poderían descubrir por outros métodos, mais eu creo que non foi casualidade que fose este o método que o levou ao éxito. Corresponde ao método de eliminación, que é aplicable só cando a teoría é suficientemente fácil de falsificar, isto é, suficientemente precisa para chocar coa experiencia da observación. *1 Afirmaron estar de acordo coas ideas expresadas aquí, con recoñecemento explícito, W. C. Kneale, Probability and Induction, 1949, p. 230 e J. G. Kemeny, "The Use of Simplicity in Induction", Philoso. Review 57, 1953; véxase a nota ao pé na p. 404. 225 a lóxida da descuberta científica 40 Dúas maneiras de reducir o número de dimensións dun conxunto de curvas hai conxuntos de curvas que, sendo moi diferentes, poden ter a mesma dimensión. O conxunto de todos os círculos, por exemplo, é tridimensional, mais o conxunto de todos os círculos que pasan por un punto dado é bidimensional (o mesmo que o conxunto de liñas rectas). Se esiximos que todos os círculos pasen por dous puntos dados, entón obtemos un conxunto unidimensional, e así por diante. Cada esixencia adicional de todas as curvas pasaren por un punto máis reduce en unha unidade as dimensións do conxunto. O número de dimensións tamén se pode reducir mediante métodos distintos ao de aumentar o número de puntos dados. clases de dimensión cero1 clases unidimensionais clases bidimensionais clases tridimensionais clases tetradimensionais _ _ liña recta círculo parábola _ liña recta pasando por un punto dado círculo pasando por un punto dado parábola pasando por un punto dado cónica pasando por un punto dado liña recta pasando por dous puntos dados círculo pasando por dous puntos dados parábola pasando por dous puntos dados cónica pasando por dous puntos dados _ círculo pasando por tres puntos dados parábola pasando por tres puntos dados cónica pasando por tres puntos dados _ _ 1 Por exemplo, o conxunto de elipses cunha razón dada dos eixos é tetradimensional (igual que o das parábolas) e tamén o é o conxunto de elipses cunha excentricidade numérica dada. A transición da elipse ao círculo, obviamente, é equivalente á especificación dunha excentricidade (a excentricidade 0) ou unha razón concreta dos eixos (a unidade). Como o que nos interesa é avaliar os graos de falsificabilidade das teorías, agora ímonos preguntar se os varios métodos 1 Tamén poderiamos comezar, obviamente, pola clase baleira de dimensión-menosun (sobredeterminada). 226 Karl Popper de redución do numero de dimensións son equivalentes para os obxectivos que nós perseguimos ou se, pola contra, deberiamos examinar máis polo miúdo os seus méritos relativos. Pois ben, a estipulación de que unha curva pase por un determinado punto singular (ou rexión pequena) con frecuencia estará ligada, ou corresponderá, á aceptación dun determinado enunciado singular, isto é, dunha condición inicial. Por outra banda, a transición, por exemplo, dunha hipótese de elipses a unha hipótese de círculos corresponderá á redución da dimensión da propia teoría. Mais, como se poderá manter a distinción entre estes dous métodos de redución das dimensións? Podemos denominar redución material o método de redución de dimensións que non opera con estipulacións sobre a «forma» ou a «figura» da curva, isto é, ás reducións mediante a especificación dun ou máis puntos, por exemplo, ou mediante unha especificación semellante. Ao outro método, aquel en que se especifica máis estritamente a forma ou figura da curva cando, por exemplo, pasamos de elipse a círculo ou de círculo a liña recta, etc., chamareille o método da redución formal do número de dimensións. Non é tan doado, porén, trazar esta distinción de xeito nidio. Isto pódese observar da seguinte maneira: reducir as dimensións dunha teoría significa, en termos alxébricos, substituír un parámetro por unha constante, mais non está moi claro como se pode distinguir entre diferentes métodos de substituír un parámetro por unha constante. Pódese dicir que a redución formal, ao pasar da ecuación xeral dunha elipse é ecuación dun círculo, consiste en igualar un parámetro a cero e un segundo parámetro a un. Mais se iguala outro parámetro (o termo absoluto) a cero, entón isto apuntaría a unha redución material, en concreto a especificación dun punto da elipse. Seméllame, así e todo, que se pode manter nidia a distinción se reparamos na súa conexión co problema dos nomes universais, pois a relación material introduce un nome individual na definición do conxunto de curvas pertinente, mentres que a redución formal introduce un nome universal. 227 a lóxida da descuberta científica Imaxinemos que se nos dá un determinado plano individual, talvez por «definición ostensiva». O conxunto de todas as elipses deste plano pódese definir por medio da ecuación xeral da elipse, e o conxunto de círculos por medio da ecuación xeral do círculo. Estas definicións son independentes do lugar, dentro do plano, en que tracemos as coordenadas cartesianas coas que se relacionan e, en consecuencia, son independentes da escolla da orixe e da orientación das coordenadas. un sistema específico de coordenadas só se pode determinar mediante nomes individuais, por exemplo, mediante a especificación ostensiva da súa orixe e orientación. Como a definición do conxunto de elipses (ou círculos) é a mesma para todas as coordenadas cartesianas, é independente da especificación destes nomes individuais: é invariante con respecto a todas as transformacións de coordenadas do grupo euclidiano (transformacións de semellanza e desprazamentos). Se, por outro lado, se desexa definir un conxunto de elipses (ou círculos) que teñan en común un punto específico ou individual no plano, entón temos que operar cunha ecuación que non sexa invariante con respecto ás transformacións do grupo euclidiano, senón que se relacione con un sistema de coordenadas singular, isto é, especificado individual ou ostensivamente. Por tanto, está relacionada con nomes individuais2. As transformacións pódense ordenar xerarquicamente. unha definición que sexa invariante con respecto a un grupo máis xeral de transformacións tamén é invariante con respecto aos máis especiais. Para cada definición dun conxunto de curvas, hai un grupo de transformacións (o máis xeral) que é característico dela. Entón pódese dicir: a definición D1 dun conxunto de curvas dise que é «igualmente xeral» a (ou máis xeral que) unha definición D2 dun conxunto de curvas se é tan invariante 2 Sobre as relacións entre grupos de transformación e «individualización» cf. Weyl, Philosophie der Mathematik u. Naturwissenschaft, 1927, p. 59, edición inglesa p. 73 ss., onde se fai referencia a Erlanger Programm de Klein. 228 Karl Popper con respecto ao mesmo grupo de transformación como D2 (ou un grupo máis xeral). unha redución dunha dimensión dun conxunto de curvas pódese dicir que é formal se a redución non diminúe a xeneralidade da definición; se a diminúe pódese dicir que é material. Se comparamos os graos de falsificabilidade de dúas teorías considerando as súas dimensións, está claro que teremos que ter en conta a súa xeneralidade, isto é, a súa invariancia con respecto ás transformacións de coordenadas, amais das súas dimensións. O procedemento, obviamente, terá que ser distinto segundo a teoría faga, como ocorre coa de Kepler, enunciados xeométricos sobre o mundo ou, pola contra, só sexa «xeométrica» no senso de que poida ser representada por un gráfico (como, por exemplo, o gráfico que mostra que a presión depende da temperatura). No caso deste último tipo de teoría, ou do correspondente conxunto de curvas, non cabería agardar que a súa definición fose invariante con respecto, por exemplo, ás rotacións do sistema de coordenadas, pois nestes casos as diferentes coordenadas poden representar cousas totalmente diferentes (presión unha e temperatura a outra). Con isto remato a exposición sobre os métodos de comparación de falsificabilidade. Teño o convencemento de que estes métodos nos poden axudar a elucidar cuestións epistemolóxicas, como o problema da simplicidade, que será o que abordemos a continuación. Mais hai outros problemas sobre os que se bota nova luz mediante o exame dos graos de falsificabilidade, como veremos máis adiante, especialmente o problema da denominada «probabilidade de hipóteses» ou da corroboración. Addenda, 1972 unha das ideas máis importantes deste libro é a do contido (empírico ou informativo) dunha teoría (non é casualidade que 229 a lóxida da descuberta científica se lles chame «leis» ás leis da natureza: canto máis prohiben máis din». Cp. pp. 18-19 supra, e p. 95 ss.). No capítulo precedente destaquei dúas ideas: (1) O contido ou comprobabilidade (ou simplicidade: véxase o capítulo vii) dunha teoría pode ter graos que, por tanto, se pode dicir que relativizan a idea de falsificabilidade (da que o modus tollens segue a ser a base lóxica). (2) O obxectivo da ciencia –incrementar o coñecemento –pódese identificar co incremento do contido das nosas teorías. (Véxase o meu artigo «The Aim of Science», en Ratio I, 1957, pp. 24-35 e (revisado) en Contemporary Philosophy, editado por r. Klibanski, 1969, pp. 129-142; incluído como capítulo 5 no meu libro Objective Knowledge: An Evolutionary Approach, 1972, Clarendon Press). Máis recentemente desenvolvín máis estas ideas; véxase especialmente o capítulo 5 do meu libro Conjectures and Refutations, 1963 e edicións posteriores (coas novas addenda). Dúas das novas ideas son: (3) unha maior relativización da idea do contido ou comprobabilidade con respecto ao problema ou conxunto de problemas tratados. (xa en 1934 relativicei estas ideas con respecto a un campo de aplicación; véxase o vello Apéndice i). (4) A introdución da idea do contido de verdade dunha teoría e da súa aproximación ou proximidade á verdade («verosimilitude»). 230 Karl Popper 7 SIMPLICIDADE Non semella haber moito acordo sobre o denominado «problema da simplicidade». Weyl dixo non hai moito que «o problema da simplicidade é de importancia central na epistemoloxía das ciencias naturais»1. Así e todo, semella que ultimamente decaeu o interese por este problema, talvez porque, sobre todo despois da penetrante análise de Weyl, non se albiscaba moita posibilidade de resolvelo. Ata non hai moito a idea de simplicidade foi empregada de maneira acrítica, coma se fose obvio o que é a simplicidade e a razón pola que se lle debía conceder tanta relevancia. Non son poucos os filósofos da ciencia que lle outorgaron nas súas teorías unha importancia crucial, sen decatárense sequera das dificultades a que dá lugar. Por exemplo, os seguidores de Mach, Kirchhoff e Avenarius tentaron substituír a idea dunha explicación causal pola da «descrición máis simple». Sen a cualificación «máis simple» ou unha expresión semellante esta doutrina non diría absolutamente nada. Como supostamente explica por que preferimos unha descrición do mundo baseada en teorías que outra baseada en enunciados singulares, semella que se presupón que as teorías son máis simples que os enunciados singulares. Mais houbo poucos que tentasen explicar por que habían ser máis simples as teorías ou o que significa máis concretamente a simplicidade. Se, alén diso, se asume que a simplicidade é un fin en si mesmo no uso de teorías, entón non hai dúbida de que se deben usar as teorías máis simples. Así é como Poincaré, para quen a escolla de teorías é asunto convencional, formulou o seu principio de selección de teorías: el escolle á máis simple das convencións posibles. Mais, cales son as máis simples? 1 Weyl, ob. cit., p. 115 ss.; edición inglesa p. 155. Véxase tamén o apartado 42 infra. 231 a lóxida da descuberta científica 41 Eliminación dos conceptos pragmático e estético de simplicidade A palabra «simplicidade» úsase en moitos sentidos diferentes. A teoría de Schrödinger, por exemplo, é dunha grande simplicidade no senso metodolóxico, mais, noutro sentido, moi ben se lle podería chamar «complexa». Dise que a solución dun problema non é simple, senón que é difícil, ou que unha exposición non é simple, senón que é complicada. Ao longo da miña argumentación vou excluír, para comezar, a aplicación do termo «simplicidade» para referirse a cousas do tipo dunha presentación ou unha exposición. Entre dúas exposicións da mesma proba matemática, dise ás veces que unha delas é máis simple ou máis elegante que a outra. Esta distinción ten escaso interese desde o punto de vista da teoría do coñecemento, debido a que non cae no dominio da lóxica, senón que soamente indica unha preferencia de carácter pragmático ou estético. unha situación análoga ocorre cando se di que unha acción se pode «realizar por medios máis simples» que outra, o cal quere dicir que se pode facer de xeito máis doado ou que para realizala fai falta menos preparación ou coñecementos. En todos estes casos pódese eliminar doadamente a palabra «simple», pois o seu uso é de carácter extralóxico. 42 O problema metodolóxico da simplicidade Que queda, se é queda algo, despois de descartarmos as acepcións pragmática e estética do concepto de simplicidade? Existe un concepto de simplicidade que sexa de relevancia para os lóxicos? É posible distinguir teorías que sexan loxicamente equivalentes segundo o seu grao de simplicidade? A resposta a estas preguntas pode semellar moi dubidosa, á vista do escaso éxito que tiveron a maioría dos intentos de definir a simplicidade. Schlick, por exemplo, ofrece unha resposta negativa. Di el: «A simplicidade é ... un concepto indicativo 232 Karl Popper de preferencias que son en parte de orde práctica e en parte de orde estética»1. É salientable que el ofreza esta resposta cando trata o concepto que a nós nos interesa aquí, que eu chamarei o concepto epistemolóxico de simplicidade, pois, segundo el, «aínda que non sexamos capaces de explicar aquí que se quere dicir exactamente co termo «simplicidade», debemos recoñecer o feito de que calquera científico que fose quen de representar unha serie de observacións por medio dunha fórmula moi simple (por exemplo, por unha función lineal, cuadrática ou exponencial) está inmediatamente convencido de que descubriu unha lei». Shlick considera a posibilidade de definir o concepto de regularidade «de tipo lei», e especialmente a distinción entre «lei» e «casualidade», baseándose no concepto de simplicidade. remata por descartalo coa puntualización de que «a simplicidade é, obviamente, un concepto enteiramente impreciso e relativo; non é posible acadar unha definición estrita de causalidade baseándose na simplicidade, nin tampouco distinguir claramente unha lei e a casualidade»2. Queda claro nesta pasaxe que é o que se agarda realmente conseguir co concepto de simplicidade: que proporcione unha medida do grao de regularidade ou de «tipo lei» dos acontecementos. unha opinión semellante maniféstaa Feigl cando fala da «idea de definir o grao de regularidade ou do «tipo lei» valéndose do concepto de simplicidade».3 A idea epistemolóxica de simplicidade desempeña un papel especial nas teorías da lóxica indutiva, en relación, por exemplo, co problema da «curva máis simple». Os que cren na lóxica indutiva presupoñen que ás leis naturais se chega por xeneralización a partir de observacións concretas. Se imaxinamos 1 Schlick, Naturwissenschften 19, 1931, p. 148. * Traducín libremente o termo pragmatischer de Schlick. 2 Schlick, ibid. 3 Feigl, Theorie und Erfahrung in der Physik, 1931, p. 25. 233 a lóxida da descuberta científica os varios resultados dunha serie de observacións como puntos marcados nun sistema de coordenadas, entón a representación gráfica da lei será unha curva que pase por todos eses puntos. Mais por un número finito de puntos sempre se poden trazar un número infinito de curvas das formas máis diversas. Como, en consecuencia, a lei non é determinada unicamente polas observacións, a lóxica indutiva enfróntase ao problema de decidir que curva escoller entre todas estas curvas posibles. A resposta máis normal afirma que se debe escoller a curva máis simple. Wittgenstein, por exemplo, afirma: «O proceso de indución consiste en asumir a lei máis simple que se poida harmonizar coa nosa experiencia».4 Ao escoller a lei máis simple, normalmente asúmese de xeito tácito que unha función lineal é máis simple, poñamos, que unha cuadrática, un círculo máis simple que unha elipse, etc. Mais non se aducen razóns para darlle preferencia a esta particular xerarquía sobre calquera outra, nin tampouco para pensar que as leis «simples» teñan vantaxes sobre as menos simples (a parte da vantaxe estética ou práctica)5. Schlick e Feigl fan referencia6 a unha conferencia non publicada de Natkin onde este propón determinar se unha curva é máis simple ca outra, segundo a versión de Schlick, se a súa curvatura media é menor ou, segundo a versión de Feigl, se se desvía menos dunha liña recta (as dúas versións non son equivalentes). Esta definición semella coincidir en boa medida coas nosas intuicións, mais dalgún xeito pasa por alto o punto crucial: por exemplo, faría que determinadas partes dunha hipérbole (as asintóticas) fosen máis simples ca un círculo, etc. En realidade, eu non creo que a cuestión se poida resolver mediante tales «artificios» (como lles chama Schlick). Amais, 4 Wittgenstein, ob. cit., proposición 6.363. 5 O apuntamento de Wittgenstein sobre a simplicidade da lóxica (ob.cit., Proposición 5.4541), que establece a «norma de simplicidade» non dá pistas. O «principio da curva máis simple» de Reichenbach (Mathematische Zeitschrift 34, 1932, p. 616) baséase no seu Axioma de Indución (que a min me semella insostible) e tampouco serve de moito. 6 Nas referencias xa indicadas. 234 Karl Popper continuaría a ser un misterio a razón pola que se lle debería dar preferencia á simplicidade definida deste xeito particular. Weyl analiza e rexeita un intento moi interesante de basear a simplicidade na probabilidade. «Supoñamos, por exemplo, que vinte pares coordenados de valores (x, y) da mesma función y=f(x) se sitúan (coa precisión requirida) nunha liña recta cando son marcados nunha folla de cuadriculada. Poderemos conxecturar, entón, que estamos ante unha lei natural rigorosa e que y depende linealmente de x. Esta conxectura pódese facer debido á simplicidade da liña recta ou porque, se a lei fose diferente, sería extremadamente improbable que precisamente estes vinte pares de observacións, seleccionados arbitrariamente, estivesen situados desa forma a tanta proximidade. Se agora usamos a liña recta para interpolacións e extrapolacións, obtemos predicións que van máis alá do que nos di a simple observación. Así é todo, esta análise é vulnerable á crítica. Sempre será posible definir todo tipo de funcións matemáticas que... serán satisfeitas polas vinte observacións, e algunhas destas funcións desviaranse considerablemente da liña recta. E poderemos dicir de cada unha delas que é extremadamente improbable que as vinte observacións se sitúen xusto nesta curva, a menos que representen unha verdadeira lei. É esencial, despois de todo, que as matemáticas nos proporcionen a priori a función, ou a clase de funcións, pola súa simplicidade matemática. Débese sinalar que esta clase de funcións non pode depender do mesmo número de parámetros que de observacións que haxa que satisfacer»7. Cando afirma que «as matemáticas nos deben proporcionar a priori a clase de funcións, en razón da súa simplicidade» e cando fai referencia ao número de parámetros, a perspectiva de Weyl coincide coa miña (que desenvolverei no apartado 43). 7 Weil, ob.cit., p. 116; edición inglesa, p. 156. *No momento de escribir este libro eu non sabía (como tampouco o sabía Weyl cando escribiu o seu) que Harold Jeffreys e Dorothy Wrinch afirmaran, seis anos antes de Weyl, que se debía medir a simplicidade dunha función pola escaseza de parámetros de axuste libre. 235 a lóxida da descuberta científica Pero Weyl non di o que é a «simplicidade matemática» e, sobre todo, non di que vantaxes lóxicas ou epistemolóxicas se supón que posúe a lei máis simple, en comparación con outra que sexa máis complexa8. Todas as pasaxes citadas anteriormente son moi importantes pola súa relevancia para o noso presente obxectivo, que é a análise do concepto epistemolóxico de simplicidade, pois este concepto aínda non foi determinado de xeito preciso. É posible, por tanto, rexeitar calquera intento (o meu, por exemplo) de tornalo máis preciso dicindo que o concepto de simplicidade que lles interesa aos epistemoloxistas é en realidade un concepto bastante diferente. A estas obxeccións eu podería contestar que non lle concedo a máis mínima importancia á palabra «simplicidade». Non fun eu quen introduciu o termo e, amais, son perfectamente consciente das desvantaxes que ten. Eu só afirmo que o concepto de simplicidade que vou esclarecer aquí axuda a responder as propias interrogantes que con frecuencia, como mostran as pasaxes que aquí citei, presentaron os filósofos da ciencia en relación co «problema da simplicidade». 43 Simplicidade e grao de falsificabilidade os interrogantes epistemolóxicos que xorden en relación co concepto de simplicidade pódense contestar todos se igualamos a simplicidade co grao de falsificabilidade. Como é probable que esta afirmación atope algúns detractores*1, tentarei, en primeiro lugar, facela máis aceptable desde un punto de vista intuitivo. 8 Os comentarios posteriores de Weyl sobre a conexión entre simplicidade e corroboración tamén son importantes para isto: basicamente van na liña das miñas propias posicións, manifestadas no apartado 82, aínda que a natureza da miña achega e mais o tipo de argumentos sexan bastante distintos; cf. nota 1 do apartado 82, *e a nova nota seguinte (nota *1 do apartado 43). *1 Resulta gratificante ver que esta teoría da simplicidade (incluíndo as ideas do apartado 40) foi aceptada polo menos por un epistemoloxista, William Kneale, que afirma no seu libro Probability and Induction, 1949, p. 229 ss.: «... é doado ver que a hipótese que sexa máis simple neste sentido é tamén a que podemos agardar eliminar máis rapidamente se é 236 Karl Popper xa mostrei que as teorías de menor dimensión son máis fáciles de falsificar que as de maior dimensión. unha lei con forma de función de primeiro grao, por exemplo, é máis doadamente falsificable que outra que sexa expresable por medio dunha función de segundo grao. Mais esta última continúa estando entre as máis falsificables entre aquelas leis que teñen forma matemática de función alxébrica. Isto está en liña co que afirma Schlick: «Non hai dúbida de que deberiamos tender a considerar a función de primeiro grao máis simple que a de segundo grao, aínda que esta última tamén represente, sen dúbida, unha lei perfectamente válida...»1 O grao de universalidade e de precisión dunha teoría aumenta segundo aumenta o seu grao de falsificabilidade, como falsa... Dito brevemente, a estratexia de asumir sempre a hipótese máis simple que harmonice cos feitos coñecidos é a que nos permitirá desfacernos máis rapidamente de hipóteses falsas». Kneale engade unha nota ao pé na que remite á p. 116 do libro de Weyl e tamén ao meu. Mais non atopo nesta páxina, da cal citei neste texto as pasaxes relevantes, nin en ningunha outra do grande libro de Weyl (nin en ningún outro) nin rastro da idea de que a simplicidade dunha teoría está en relación coa súa falsificabilidade, isto é, coa facilidade con que é eliminada. Nin tampouco tería eu escrito, como fixen ao final do apartado anterior, que Weyl «non di que vantaxes epistemolóxicas ou lóxicas se supón que posúe a lei simple», se Weyl (ou calquera outro por min coñecido) tivese anticipado a miña teoría. Estes son os feitos. No tratamento en profundidade que Weyl fai do tema (aquí citado no apartado 42, texto da nota 7), menciona en primeiro lugar a opinión intuitiva que di que unha curva simple (poñamos, unha liña recta) ten unha vantaxe sobre unha curva máis complexa porque se podería considerar un accidente altamente improbable se todas as observacións cadrasen cunha tal curva simple. Mais en vez de seguir esta opinión intuitiva (que a min me parece que o levaría a observar que a teoría máis simple é a máis comprobable), Weyl rexéitaa por non resistir a crítica racional: el sinala que o mesmo se podería dicir de calquera curva dada, por moi complexa que fose. (Este argumento é correcto, mais xa non é válido se temos en conta os falsificadores potenciais –e os seus graos de composición– máis que os casos de verificación). Despois Weyl pasa a tratar a escaseza de parámetros como criterio de simplicidade, sen relacionar isto nin coa opinión intuitiva que acaba de rexeitar, nin con ningún outro factor, como a comprobabilidade ou o contido, que poderían explicar a nosa preferencia epistemolóxica pola teoría máis simple. A caracterización de Weyl da simplicidade dunha curva en razón da escaseza dos seus parámetros foi anticipada en 1921 por Harold Jeffreys e Dorothy Wrinch (Phil. Mag. 42, 269 ss.). Mais se Weyl simplemente non viu o que agora é «doado de ver» (segundo Kneale), Jeffreys si que viu –e aínda ve –xusto o contrario: atribúelle á lei máis simple a maior probabilidade previa en lugar da maior improbabilidade previa (por iso as opinións de Jeffreys e Kneale, tomadas no seu conxunto, poden ilustrar a afirmación de Schopenhauer de que a solución dun problema decote semella un paradoxo ao principio e despois unha banalidade). Gustaríame engadir aquí que desenvolvín con máis detalle as miñas ideas sobre a simplicidade e que, en facendo isto, fixen grandes esforzos, agardo que non totalmente en van, por aprender algo de Kneale. Cf. apéndice *x e apartado *15 do Postscript. 1 Schlick, Naturwissenschaften 19, 1931, p. 148 (cf. nota 1 do apartado anterior). 237 a lóxida da descuberta científica xa vimos. Quizais así sexa posible identificar o grao de rigorosidade dunha teoría –o grao, digamos, en que a teoría impón o rigor dunha lei sobre a natureza– co seu grao de falsificabilidade, o cal demostra que esta última realiza exactamente o que Schlick e Feigl buscaban co concepto de simplicidade. Pola miña parte, podo engadir que a distinción que quería trazar Schlick entre lei e azar tamén se pode esclarecer servíndose da idea de graos de falsificabilidade: os enunciados de probabilidade sobre sucesións que son de «tipo casual» resultan ser de dimensión infinita (cf. apartado 65), non seren simples senón complexos (cf. apartado 58 a última parte do 59) e seren falsificables só baixo condicións de especiais garantías (apartado 68). A comparación de graos de falsificabilidade xa se comentou polo miúdo nos apartados 31 a 40. Algúns dos exemplos e outros pormenores ofrecidos alí son trasladables ao problema da simplicidade. Isto ocorre especialmente no caso do grao de universalidade dunha teoría: un enunciado máis universal pode ocupar o lugar de moitos enunciados menos universais e, por esta razón, ten sido decote considerado «máis simple». Pódese dicir que o concepto de dimensión dunha teoría lle outorga precisión á idea de Weyl de usar o número de parámetros para determinar o concepto de simplicidade*2. E, por medio da nosa *2 Como se mencionou nas notas 7 do apartado 42 e *1 deste apartado, foron Harold Jeffreys e Dorothy Wrinch os primeiros que propuxeron medir a simplicidade dunha función pola escaseza dos seus parámetros de axuste libre. Mais eles tamén propuxeron ligar á hipótese máis simple unha maior probabilidade previa. A súa concepción pódese expresar por medio deste esquema: simplicidade = escaseza de parámetros = alta probabilidade previa Ocorre que eu fixen unha aproximación desde outro ángulo totalmente diferente. A min o que me interesaba era avaliar os graos de comprobabilidade e o primeiro que descubrín foi que a comprobabilidade se podía medir pola improbabilidade «lóxica» (que corresponde exactamente á improbabilidade «previa» de Jeffreys). Despois descubrín que a comprobabilidade e, en consecuencia, a improbabilidade previa, se igualar á escaseza de parámetros; só ao final igualei comprobabilidade alta con simplicidade alta. A miña aproximación pódese representar mediante o esquema: comprobabilidade = alta improbabilidade previa = escaseza de parámetros = simplicidade Observarase que estes dous esquemas coinciden en parte, mais son totalmente opostos no punto decisivo: probabilidade vs. improbabilidade. Véxase tamén o apéndice *viii. 238 Karl Popper distinción entre a redución formal e material da dimensión dunha teoría (cf. apartado 40), pódense contestar algunhas posibles obxeccións á teoría de Weyl. unha destas obxeccións é que o conxunto de elipses cuxos eixes teñan unha razón dada, e cunha excentricidade tamén dada, ten exactamente os mesmos parámetros que o conxunto de círculos, aínda que sexa obviamente menos «simple». Por riba de todo, a nosa teoría explica a razón pola que a simplicidade é tan altamente desexable. Para comprender isto non fai falta asumir un «principio de economía do pensamento» nin nada polo estilo. Se o noso obxecto é o coñecemento, os enunciados simples deben ter unha valoración superior aos menos simples debido a que nos din máis, debido a que o seu contido empírico é maior e debido a que son máis comprobables. 44. Figura xeométrica e forma funcional A nosa perspectiva sobre o concepto de simplicidade permítenos resolver unha serie de contradicións que ata o de agora poñían en dúbida a utilidade do concepto. Non hai moitos que consideren que a configuración xeométrica dunha curva, por exemplo, sexa especialmente simple, mais normalmente considérase simple unha lei que se poida representar por unha función logarítmica. De xeito semellante, normalmente dise que unha función sinusoidal é simple, aínda que a configuración xeométrica da curva sinusoidal non sexa tan simple. Dificultades deste tipo pódense eliminar se lembramos a conexión entre o número de parámetros e o grao de falsificabilidade e se distinguimos entre a redución formal e a material das dimensións (débese lembrar tamén o papel da invariancia con respecto ás transformacións do sistema de coordenadas). Se falamos da forma ou figura xeométrica dunha curva, entón o que se lle pide é invariancia con respecto a todas as transfor239 a lóxida da descuberta científica macións pertencentes ao grupo dos desprazamentos, e tamén se lle pode pedir invariancia con respecto ás transformacións de semellanza, pois non se concibe que unha figura ou forma xeométrica vaia ligada a unha determinada posición. En consecuencia, se imaxinamos a figura dunha curva logarítmica con un parámetro (y = logax) en calquera punto dun plano, entón tería cinco parámetros (se permitimos as transformacións de semellanza). Esta non sería en absoluto unha curva particularmente simple. Se, por outro lado, unha teoría ou lei se representa mediante unha curva logarítmica, entón son irrelevantes as transformacións de coordenadas do tipo das aquí descritas. En tales casos non caben rotacións, nin desprazamentos paralelos nin transformacións de semellanza, pois unha curva logarítmica é normalmente unha representación gráfica na que non se poden intercambiar as coordenadas (por exemplo, o eixe x pode representar presión atmosférica e o eixe y altitude sobre o nivel do mar). Este é o motivo polo que as transformacións de semellanza non teñen aquí relevancia ningunha. Consideracións análogas valen para as oscilacións sinusoidais ao longo dun eixe particular, por exemplo, o eixe dos tempos, e tamén para moitos outros casos. 45 A simplicidade da xeometría euclidiana un dos temas que desempeñaron un papel máis importante nos debates sobre a teoría da relatividade foi o da simplicidade da xeometría euclidiana. Ninguén puxo nunca en dúbida que a xeometría euclidiana en si é máis simple que calquera outra xeometría non euclidiana con curvatura constante dada, e xa non digamos comparada coas xeometrías non euclidianas con curvaturas variables. A primeira vista, este tipo de simplicidade non semella que teña moito que ver cos graos de falsificabilidade. Mais se os enunciados en cuestión se formulan como hipóteses empíricas, 240 Karl Popper entón descubrimos que os dous conceptos, simplicidade e falsificabilidade, coinciden tamén neste caso. Vexamos que experimentos nos poden axudar a comprobar a seguinte hipótese: «No noso mundo temos que empregar unha determinada xeometría métrica con tal radio de curvatura». A comprobación só será posible se identificamos certas entidades xeométricas con certos obxectos físicos, por exemplo, liñas rectas con raios luminosos, ou puntos coa intersección de fíos. Se se adopta tal identificación (unha definición correlativa, ou talvez unha definición ostensiva; cf. apartado 17), entón pódese demostrar que a hipótese da validez dunha xeometría euclidiana asociada ao raio luminoso é falsificable nun grao superior a calquera outra hipótese alternativa que afirme a validez dunha xeometría non euclidiana. En efecto, se medimos os ángulos dun triángulo de raios luminosos, entón calquera desviación significativa de 180 graos falsificará a hipótese euclidiana. Por outro lado, a hipótese dunha xeometría de Bolyai-lobatschewski con curvatura dada sería compatible con calquera medición particular que non excedese os 180 graos. Ademais, para falsificar esta hipótese faría falta medir non só a suma dos ángulos, senón tamén o tamaño (absoluto) do triángulo, o cal significa que, amais dos ángulos, teríase que definir outra unidade de medida, por exemplo, unha unidade de área. Observamos así que cómpren máis medicións para unha falsificación, que a hipótese é compatible con maiores variacións no resultado das medidas e que, por tanto, é de máis difícil falsificación: ten un menor grao de falsificabilidade. Noutras palabras, a xeometría euclidiana é a única xeometría métrica con curvatura definida na que son posibles as transformacións de semellanza. En consecuencia, as figuras xeométricas euclidianas poden ser invariantes con respecto a máis transformacións, isto é, poden ser de menor dimensión e, por tanto, máis simples. 241 a lóxida da descuberta científica 46 O convencionalismo e o concepto de simplicidade O que os convencionalistas denominan «simplicidade» non se corresponde co que eu denomino «simplicidade». A idea central dos convencionalistas, e tamén o seu punto de partida, é que ningunha teoría pode ser determinada de maneira non ambigua pola experiencia, algo no que tamén eu concordo. Por iso lles parece que teñen que seleccionar a teoría «máis simple». Mais como non consideran que as súas teorías sexan sistemas falsificables, senón estipulacións convencionais, eles usan «simplicidade», obviamente, nunha acepción distinta a grao de falsificabilidade. A concepción convencionalista da simplicidade resulta ser, en realidade, en parte de orde estética e en parte de orde práctica. A seguinte apreciación de Schlick (cf. parágrafo 42) é aplicable á concepción convencionalista da simplicidade, pero non á miña: «É seguro que o concepto de simplicidade só se pode definir mediante unha convención que sempre ha de ser arbitraria»1. resulta curioso que os propios convencionalistas non se decatasen do carácter convencional do seu concepto fundamental, o de simplicidade. Parece claro que non se decataron pois, se non, verían que o seu recurso á simplicidade nunca os poderá poñer a salvo da arbitrariedade, unha vez que xa optaron pola vía da convención arbitraria. Desde o meu punto de vista, un sistema ten que ser considerado complexo no máis algo grao, de acordo coa práctica convencionalista, se un está disposto a mantelo como sistema permanente que sempre se poida recuperar, en caso de que sexa posto en perigo, mediante a introdución de hipóteses auxiliares. O grao de falsificabilidade dun sistema protexido desta maneira é igual a cero. Así que volvemos de novo, mediante o noso concepto de simplicidade, ás regras metodolóxicas do apartado 20, 1 Schlick, ibid., p. 148. 242 Karl Popper especialmente aquela regra ou principio que nos prevén contra a tentación de contentármonos con hipóteses ad hoc e hipóteses auxiliares, isto é, o principio de parsimonia no uso de hipóteses. Addenda, 1972 Neste capítulo tentei demostrar en que medida os graos de simplicidade se poden identificar cos graos de comprobabilidade. Isto non depende en absoluto da palabra «simplicidade»: eu nunca discuto sobre os sentidos das palabras, nin tampouco pretendín revelar a esencia da simplicidade. O que eu intentaba facer era só o seguinte: houbo grandes científicos e filósofos que fixeron afirmacións sobre o valor da simplicidade para a ciencia. A idea que defendín é que algunhas destas afirmacións se poden comprender mellor se se asume que cando falan da simplicidade ás veces o que teñen en mente é a comprobabilidade. Isto mesmo serve para elucidar algúns dos exemplos de Poincaré, aínda que contradiga as súas opinións. hoxe en día tería que facer dúas matizacións máis: (1) que podemos comparar teorías con respecto á comprobabilidade só no caso de que coincidan algúns dos problemas que se supón que solucionan. (2) As hipóteses ad hoc non son comparables desta maneira. 243 a lóxida da descuberta científica 8 A PROBABILIDADE Neste capítulo tratarei unicamente a probabilidade dos acontecementos e os problemas que presenta. Os problemas xorden en relación coa teoría dos xogos de azar e coas leis probabilísticas da física. De momento deixo a un lado o que se pode chamar probabilidade de hipóteses (cuestións coma se unha hipótese comprobada máis frecuentemente é máis probable que outra que fose pouco comprobada), que será abordada nos apartados 79 a 85 baixo o título «corroboración». As ideas relativas á teoría da probabilidade xogan un papel decisivo na física moderna. Así e todo, aínda non dispoñemos dunha definición coherente e satisfactoria de probabilidade ou, o que vén sendo o mesmo, aínda carecemos dun sistema axiomático satisfactorio para o cálculo da probabilidade. Están tamén aínda pendentes de esclarecemento as relacións entre probabilidade e experiencia. No curso da investigación deste problema atoparémonos co que a primeira vista semella ser unha obxección insuperable para as miñas perspectivas epistemolóxicas. Isto é debido a que, aínda que os enunciados de probabilidade xoguen un papel tan vital na ciencia empírica, resulta que, en principio, son impermeables á falsificación estrita. Porén, este mesmo obstáculo converterase na pedra de toque para comprobar a miña teoría, co fin de enxergar cal é o seu valor. Enfrontámonos, xa que logo, a dous cometidos. O primeiro será o de proporcionar fundamentos novos para o cálculo de probabilidade. Isto tentarei levalo a cabo desenvolvemento unha teoría da probabilidade en termos de teoría de frecuencia, na liña seguida por richard von Mises, mais sen usar o que el denomina «axioma de converxencia» (ou «axioma do límite»), e cun «axioma de aleatoriedade» máis debilitado. O segundo 244 Karl Popper cometido será o de elucidar as relacións entre probabilidade e experiencia. Isto implica resolver o que chamo o problema da decidibilidade dos enunciados de probabilidade. Agardo que estas investigacións contribúan a remediar a insatisfactoria situación actual en que os físicos fan uso abundante das probabilidades sen seren quen de dicir cun mínimo de coherencia o que entenden por «probabilidade»*1. 47 O problema de interpretar enunciados de probabilidade Comezarei por distinguir dous tipos de enunciados de probabilidade: os que enuncian unha probabilidade en termos numéricos (que eu denominarei enunciados numéricos de probabilidade) e os que non. Así, o enunciado «A probabilidade de que saia once con dous dados (perfectos) é 1/18)» sería un exemplo dun enunciado numérico de probabilidade. Os enunciados non numéricos de probabilidade poden ser de varios tipos: «É moi probable que obteñamos unha mestura homoxénea se mesturamos auga e alcohol» é un tipo de enunciado que, se é interpretado correctamente, se pode transformar nun enunciado de proba- *1 Desde 1934 fixen tres tipos de cambios na teoría da probabilidade: (1) A introdución dun cálculo formal (axiomático) de probabilidades susceptible de ser interpretado de moitas maneiras, por exemplo, no sentido das interpretacións lóxica e de frecuencia tratadas neste libro e tamén no da interpretación de propensións tratada no meu Postscript. (2) Unha simplificación da teoría frecuencial da probabilidade mediante unha elaboración máis completa e máis detallada que en 1934 do programa de reconstrución da teoría da frecuencia subxacente neste capítulo. (3) A substitución da interpretación obxectiva da probabilidade en termos de frecuencias por outra interpretación obxectiva (interpretación de propensións) e a substitución do cálculo de frecuencias polo formalismo neoclásico (ou de teoría da medida). Os dous primeiros cambios remóntase a 1938 e indícanse xa neste volume: os do primeiro grupo nos novos apéndices (*ii a *v) e os do segundo –os que afectan ao argumento do presente capítulo –nunha serie de notas ao pé neste capítulo e no novo apéndice *vi. O cambio principal exponse na nota *1 do apartado 57. O terceiro cambio (que introducín de xeito provisional en 1953) explícase e desenvólvese no Postscript, onde tamén se aplica aos problemas da teoría cuántica. 245 a lóxida da descuberta científica bilidade numérico (por exemplo, «A probabilidade de obter... está moi próxima a 1»). un tipo moi diferente de enunciado de probabilidade non numérico sería, por exemplo: «A descuberta dun efecto físico que contradiga a teoría cuántica é altamente improbable», un enunciado que, na miña opinión, non se pode transformar nun enunciado de probabilidade numérica, nin ser aquiparado aos deste último tipo, sen distorsionar o seu significado. Ocupareime primeiro dos enunciados de probabilidade numéricos; dos non numéricos, que considero menos importantes, ocupareime con posterioridade. En relación co enunciado de probabilidade numérica preséntasenos a pregunta de como interpretar un enunciado deste tipo, en especial a afirmación numérica que fai. 48 Interpretacións obxectivas e subxectivas A teoría clásica da probabilidade (a de laplace) define o valor numérico dunha probabilidade como o cociente que se obtén de dividir o número de casos favorables polo número de casos igualmente posibles. Podemos ignorar as obxeccións lóxicas que se lle fixeron a esta definición1, como que a expresión «igualmente posibles» significa o mesmo que «igualmente probables». Mais, mesmo neste caso, malamente podiamos aceptar que esta definición nos proporcione unha interpretación aplicable de maneira non ambigua, pois atópanse de forma latente varias interpretacións posibles, que eu clasificarei en subxectivas e obxectivas. O uso frecuente de certas expresións que teñen un aroma psicolóxico indica unha interpretación subxectiva da teoría da 1 Cf. por exemplo von Mises, Wahrscheinlichkeit, Statistik und Wahrheit, 1928, p. 62 ss.; 2a ed., 1936, p. 84 ss.; tradución inglesa de J. Neyman, D. Sholl e E. Rabinowitsch, Probability, Statistics and Truth, 1939, p. 98 ss. *Aínda que a definición clásica se chame decote laplaciana (tamén aquí), é polo menos tan antiga coma Doctrine of Chances de De Moivre, 1918. Para unha obxección temperá á frase «igualmente posibles», véxase C. S. Peirce, Collected Papers 2, 1932 (orixinalmente publicado en 1878), p. 417, parágrafo 2.673. 246 Karl Popper probabilidade: por exemplo, expresións como «expectativa matemática», «lei normal de erros», etc. Na súa forma orixinal esta interpretación é psicoloxista: trata os graos de probabilidade como medida das sensacións de certeza ou incerteza, de crenza ou dúbida, que nos poden causar certas afirmacións ou conxecturas. Aplicada a enunciados non numéricos, a palabra «probable» pódese traducir satisfactoriamente deste xeito, mais unha interpretación deste estilo non me semella moi satisfactoria para enunciados de probabilidade numéricos. Consideración máis seria pola nosa parte merécea unha variante máis recente da interpretación subxectiva*1. Esta variante interpreta os enunciados de probabilidade en termos lóxicos, no canto de psicolóxicos, como afirmacións do que se pode chamar «proximidade lóxica»2 dos enunciados. Os enunciados, como ben sabemos, poden manter varios tipos de relacións lóxicas entre si, como deducibilidade, incompatibilidade ou independencia mutua. A teoría lóxico-subxectiva, da que Keynes3 é o principal expoñente, toma a relación de probabilidade como un tipo especial de relación lóxica entre dous enunciados. Os dous casos extremos desta relación de probabilidade son a deducibilidade e a contradición: dise que un enunciado q «dá»4 a outro enunciado p a probabilidade 1 se p se deduce de q. En caso de que p e q se contradigan mutuamente, a probabilidade dada por q a p é cero. Entre estes dous extremos existen outras relacións de probabilidade que, en termos aproximados, se poden interpretar do seguinte xeito: a *1 As razóns polas que inclúo a interpretación lóxica como unha variante da interpretación subxectiva expóñense máis polo miúdo no capítulo *ii do Postscript, onde se fai unha crítica detallada da interpretación subxectiva. Cf. tamén o apéndice *ix. 2 Waismann, Logische Analyse des Wahrscheinlichkeitsbegriffs, Erkenntnis 1, 1930, p. 237: «Así definida, a probabilidade é, coma se dixésemos, unha medida da proximidade lóxica, a conexión dedutiva entre os dous enunciados». Cf. tamén Wittgenstein, ob. cit., proposición 5.15 e seguintes. 3 J. M. Keynes, A Treatise on Probability, 1921, p. 95 ss. 4 Wittgenstein, ob. cit., proposición 5.152: «Se p se segue de q, a proposición q dálle á proposición p a probabilidade 1. A certeza da conclusión lóxica é un caso extremo de probabilidade». 247 a lóxida da descuberta científica probabilidade numérica dun enunciado p (dado q) é tanto maior canto menos descenda o seu contido por debaixo do que xa contén ese enunciado q do que depende a probabilidade de p (e que lle «dá» a probabilidade a p). O parentesco estre esta teoría e a psicoloxista pódese observar no feito de que Keynes define a probabilidade como un «grao de crenza racional». Con isto refírese ao nivel de confianza que se considera razoable atribuírlle a un enunciado p á luz da información ou coñecemento que temos do enunciado q que lle «dá» probabilidade a p. unha terceira interpretación, a interpretación obxectiva, trata todo enunciado de probabilidade numérica como un enunciado sobre a frecuencia relativa con que ocorre un acontecemento de certo tipo nunha sucesión de ocorrencias5. Segundo esta interpretación, o enunciado «A probabilidade de que a próxima vez que se lance este dado saia un cinco é igual a 1/6» non é realmente unha afirmación sobre a próxima vez que se lance o dado, senón que é unha afirmación sobre toda unha clase de lanzamentos da que o próximo lanzamento é só un elemento. O enunciado en cuestión só di que a frecuencia relativa dos cincos, neste tipo de lanzamento de dados, é igual a 1/6. Segundo esta perspectiva, os enunciados de probabilidade numérica só son admisibles cando se pode ofrecer unha interpretación frecuencial deles. Aqueles enunciados de probabilidade dos que non se poida dar unha interpretación frecuencial, especialmente os de probabilidade non numérica, son normalmente rexeitados polos teóricos da frecuencia. 5 Sobre a antiga teoría da frecuencia cf. a crítica de Keyness, ob. cit., p. 95 ss., onde se fai especial referencia a The Logic of Chance de Venn. Sobre a concepción de Whitehead cf. apartado 80 (nota 2). Son representantes principais da nova teoría da frecuencia: R. von Mises (cf. nota 1 do apartado 50), Dörge, Kamke, Reichenbach e Tornier. *Unha nova interpretación obxectiva, moi próxima á teoría da frecuencia, mais diferindo dela mesmo no formalismo matemático, é a interpretación de propensións, exposta no apartado 53 e seguintes do meu Postscript. 248 Karl Popper Nas páxinas que seguen tentarei elaborar de novo a teoría da probabilidade en termos dunha teoría frecuencial (modificada). Declaro así a miña fe na interpretación obxectiva, principalmente porque teño a crenza de que só unha teoría obxectiva pode explicar a aplicación do cálculo de probabilidade na ciencia empírica. hai que recoñecer que a teoría subxectiva é capaz de ofrecer unha solución coherente ao problema de escoller enunciados de probabilidade e, en xeral, enfróntase a menos dificultades lóxicas que a teoría obxectiva. Mais a súa solución é que os enunciados de probabilidade non son empíricos, que son tautoloxías. E esta teoría resulta ser a todas luces inaceptable se lembramos o uso que na física se fai da teoría da probabilidade. (rexeito a variante da teoría subxectiva que sostén que os enunciados de frecuencia obxectivos se deben deducir de suposicións subxectivas –talvez usando de «ponte» o teorema de Benoulli6– e, por razóns lóxicas, considero irrealizable este programa). 49 O problema fundamental da teoría do azar A aplicación máis importante da teoría da probabilidade é no eido do que se podería chamar acontecementos ou ocorrencias «de carácter casual» ou «aleatorio», os cales semellan caracterizarse por posuír un tipo peculiar de incalculabilidade que fai pensar –tras moitos intentos fracasados– que con eles non funcionará ningún dos métodos racionais de predición coñecidos. un ten a sensación, por dicilo así, de que só un profeta, non un científico, os podería predicir. Malia isto, é precisamente esta incalculabilidade a que nos leva a concluír que a estes acontecementos se lles pode aplicar o cálculo de probabilidade. Esta conclusión, que ten un ar paradoxal neste salto da incalculabilidade á calculabilidade (ou sexa, á aplicabilidade dun certo cálculo) deixa de ser paradoxal, débese recoñecer, se aceptamos a 6 O maior erro de Keynes; cf. apartado 62, neste volume, especialmente a nota 3. *Non cambiei de opinión sobre este tema aínda que agora penso que o teorema de Bernoulli pode servir de «ponte» dentro dunha teoría obxectiva: como ponte entre as propensións e a estatística. Véxase tamén o apéndice *ix e os apartados *55 e *57 do Postscript. 249 a lóxida da descuberta científica teoría subxectiva. Mais esta maneira de evitar o paradoxo resulta extremadamente insatisfactoria, pois implica que o cálculo de probabilidade non é un método para calcular predicións, en marcado contraste con todos as outros métodos da ciencia empírica, senón que sería, segundo a teoría subxectiva, simplemente un método para levar a cabo transformacións lóxicas do que xa coñecemos; ou mellor, do que non coñecemos, pois realizamos estas transformacións xusto cando carecemos de coñecemento1. É certo que esta concepción disolve o paradoxo, mais non explica como un enunciado de ignorancia, interpretado como un enunciado frecuencial, se pode comprobar e corroborar empiricamente. Pois este é precisamente o problema que se nos presenta a nós. Como podemos explicar o feito de que da propia incalculabilidade (isto é, da ignorancia) poidamos tirar conclusións que se poidan interpretar como enunciados sobre frecuencias empíricas, que despois poidamos ver brillantemente corroboradas na práctica? Nin sequera a teoría frecuencial foi quen, polo de agora, de ofrecer unha solución satisfactoria a este problema, o problema fundamental da teoría do azar, como lle vou chamar eu. Mostrarase no apartado 67 que este problema está relacionado co «axioma de converxencia», que é unha parte fundamental da teoría na súa forma presente. Mais é posible atopar unha solución satisfactoria dentro do marco da teoría frecuencial unha vez que se elimine este axioma. A solución atoparase mediante a análise das suposicións que nos permiten pasar da sucesión irregular de ocorrencias soltas á regularidade ou estabilidade das súas frecuencias. 50 A teoría frecuencial de von mises unha teoría frecuencial que proporciona unha fundamentación para todos os teoremas principais do cálculo de probabilidade 1 Waismann, Erkenntnis 1, 1930, p. 238, afirma: «Non hai outra razón para introducir o concepto de probabilidade máis que a imperfección do noso coñecemento». C. Stumpf manifesta unha opinión semellante (Sitzungsberichte der Bayerischen Akademie der Wissenschaften, phil.-hist. Klasse, 1892, p. 41). *Paréceme que esta idea, que está moi espallada, deu lugar ás peores confusións. Isto demostrarase polo miúdo no meu Postscript, capítulos *ii e *v. 250 Karl Popper foi proposta en primeiro lugar por richard von Mises1. As súas ideas fundamentais expóñense a seguir. O cálculo de probabilidade é unha teoría de certas sucesións de acontecementos ou ocorrencias de carácter casual ou aleatorio, isto é, de acontecementos repetitivos, como unha serie de lanzamentos dun dado. Estas sucesións defínense como «casuais» ou «aleatorias» por medio de dúas condicións axiomáticas: o axioma de converxencia (ou o axioma do límite) e o axioma de aleatoriedade. Se unha sucesión de acontecementos cumpre estas dúas condicións, von Mises chámalle un «colectivo». un colectivo é, en termos aproximados, unha sucesión de acontecementos ou ocorrencias que, en principio, se pode continuar indefinidamente, por exemplo, unha sucesión de lanzamentos realizados con un dado que supostamente sexa indestrutible. Cada un destes acontecementos ten un determinado carácter ou propiedade: por exemplo, o lanzamento pode sacar un cinco e entón dirase que ten a propiedade cinco. Se tomamos todos os lanzamentos que teñen a propiedade cinco que apareceron ata determinado elemento da sucesión, e dividimos este número polo número total de lanzamentos ata ese elemento (isto é, o seu número ordinal na sucesión), entón obtemos a frecuencia relativa de cincos ata aquel elemento. Se determinamos a frecuencia relativa de cincos ata todos os elementos da sucesión, entón obtemos deste xeito unha nova sucesión: a sucesión das frecuencias relativas de cincos. Esta sucesión de frecuencias é distinta da sucesión orixinal de acontecementos a que corresponde, e que se pode denominar «sucesión de acontecementos» ou «sucesión de propiedades». Escollerei como exemplo sinxelo de colectivo o que podemos chamar unha alternativa. Con este termo referímonos a unha sucesión de acontecementos que se supón que só teñen dúas 1 R. von Mises, Fundamentalsätze der Wahrscheinlichkeitsrechnung, Mathematische Zeitschrift 4, 1919, p. 1; Grundlagen der Wahrscheinlichkeitsrechnung, Mathematische Zeitschrift 5, 1919, p. 52; Wahrscheinlichkeit, Statistik, und Wahrheit (1928), 2a edición 1936, tradución inglesa de J. Neyman, D. Sholl e E. Rabinowitsch: Probability, Statistics and Truth, 1939; Wahrscheinlichkeitsrechnung und ihre Anwendung in der Statistik und theoretischen Physik (Vorlesungen über angewandte Mathematik 1), 1931. 251 a lóxida da descuberta científica propiedades, por exemplo, unha sucesión de lanzamentos de moeda. unha das propiedades (cara) marcarase con un «1» e a outra (cruz) con un «0». Así, pódese representar unha sucesión de acontecementos como se indica a seguir: (A) 0 1 1 0 0 0 1 1 1 0 1 0 1 0... Con esta «alternativa» correspóndese (mellor dito, está correlacionada coa propiedade «1» da alternativa) a seguinte sucesión de frecuencias relativas ou «sucesión de frecuencias»2: (A') O 1 2 2 2 2 3 4 5 5 6 6 7 7 ... 2 3 4 5 6 7 8 9 10 11 12 13 14 O axioma de converxencia (ou «axioma do límite») postula que, segundo a sucesión de acontecementos se vai facendo máis longa, a sucesión de frecuencias tamén tenderá cara a un límite definido. Von Mises usa este axioma porque temos que asegurarnos de que haxa un valor de frecuencia fixo co que poidamos traballar (malia que as frecuencias reais teñan valores flutuantes). En calquera colectivo existen polo menos dúas propiedades, e se se nos dan os límites das frecuencias que corresponden a todas as propiedades dun colectivo, entón estásenos proporcionando o que se chama a súa distribución. O axioma de aleatoriedade ou, como ás veces se denomina, o «principio de exclusión dos sistemas de xogos de azar», está deseñado para darlle expresión matemática ao carácter aleatorio da sucesión. Obviamente, quen practique estes xogos sería capaz de aumentar as súas posibilidades de gañar usando un sistema de xogos se as sucesións, por exemplo, no lanzamento 2 Podemos facer correspondencias entre cada sucesión de propiedades e tantas sucesións de frecuencias relativas distintas como propiedades haxa definidas na sucesión. Así, no caso dunha alternativa haberá dúas sucesións distintas. Mais estas dúas sucesións son mutuamente deducibles porque son complementarias (os termos correspondentes suman 1). Por esta razón, para abreviar, referireime a «(unha) sucesión de frecuencias relativas correlacionadas coa alternativa (α)», que sempre indicará a sucesión de frecuencias correlativas á propiedade «1» desta alternativa (α). 252 Karl Popper de moedas mostrasen regularidades do tipo, poñamos, de unha aparición bastante regular de unha cruz tras cada serie de tres caras. O axioma da aleatoriedade postula que non hai sistema de xogos de azar que se poida aplicar satisfactoriamente a todos os colectivos. Independentemente do sistema de xogos de azar que escollamos para seleccionar lanzamentos supostamente favorables, o axioma postula que atoparemos que, se o xogo se alonga o suficiente, as frecuencias relativas na sucesión de lanzamentos supostamente favorables aproximaranse ao mesmo límite que as da sucesión de todos os lanzamentos. Así, unha sucesión para a que exista un sistema de xogos de azar mediante o cal un xogador poida aumentar as súas posibilidades de gañar non é un colectivo no senso en que von Mises usa o termo. Para von Mises, a probabilidade é outro nome para indicar «o límite de frecuencia relativa nun colectivo». A idea de probabilidade só é aplicable, por tanto, a sucesións de acontecementos, unha restrición que é moi probable que unha perspectiva como a de Keynes non considere aceptable. A aqueles críticos que lle reprocharon que a súa interpretación era demasiado restrinxida, von Mises contestoulles dicindo que existen diferenzas entre os usos científicos da probabilidade, por exemplo na física, e os usos populares da mesma, sinalando que sería un erro agardar que un termo científico estritamente definido teña que corresponder en todos os extremos co seu uso inexacto e precientífico. O cometido do cálculo de probabilidade consiste, segundo von Mises, pura e simplemente no seguinte: en inferir certos «colectivos deducidos» con «distribucións deducidas» partindo de determinados «colectivos iniciais» dados con certas «distribucións iniciais»; dito brevemente: en calcular probabilidades que non están dadas a partir de probabilidades dadas. Os trazos distintivos da súa teoría resúmeos von Mises en catro puntos3: o concepto de colectivo precede o de probabi3 Cf. von Mises, Wahrscheinlichkeitsrechnung, 1931, p. 22. 253 a lóxida da descuberta científica lidade; este último defínese como límite das frecuencias relativas; formúlase un axioma de aleatoriedade; e o cometido do cálculo de probabilidade xa está definido. 51 Plan para unha nova teoría da probabilidade Aos dous axiomas ou postulados formulados por von Mises para definir o concepto de colectivo fixéronselle moitas críticas, unhas críticas que na miña opinión non son totalmente inxustificadas. En concreto, criticóuselle que combinase o axioma de converxencia co axioma de aleatoriedade1 argumentando que é inadmisible a aplicación do concepto matemático de límite, ou de converxencia, a unha sucesión que por definición (enténdase, debido ao axioma de aleatoriedade) non pode estar suxeita a ningunha regra ou lei matemáticas. Isto é debido a que o límite matemático non é máis que unha propiedade característica da regra ou lei matemáticas pola que se determina a sucesión. Só é unha propiedade desta regra ou lei se, para calquera fracción escollida arbitrariamente e próxima a cero, hai un elemento na sucesión tal que todos os elementos seguintes se desvían menos que esa fracción dun valor definido, ao que entón se lle chama límite. Para responder a tales obxeccións propúxose absterse de combinar o axioma de converxencia co de aleatoriedade, postulando só a converxencia, isto é, a existencia dun límite. En canto ao axioma de aleatoriedade, propúxose descartalo na súa totalidade (Kamke) ou substituílo por un requirimento más débil (reichenback). Estas propostas presupoñen que o causante do problema é o axioma da aleatoriedade. A diferenza destas propostas, eu inclínome por pensar que o problema está tanto no axioma de converxencia coma no de aleatoriedade. Eu creo que o que hai que facer son dúas cousas: mellorar o axioma de aleatoriedade (que é un problema 1 Waisman, Erkenntnis 1, 1930, p. 232. 254 Karl Popper matemático ante todo), e eliminar completamente o axioma de converxencia, que é motivo de preocupación especial para os epistemólogos2 (cf. apartado 66). A continuación voume ocupar primeiro da cuestión matemática e despois da epistemolóxica. O primeiro destes dous cometidos, a reconstrución da teoría matemática,3 ten como principal obxectivo a dedución do teorema de Bernoulli –a primeira «lei dos Grandes Números»– a partir dun axioma modificado de aleatoriedade; modificado, sobre todo, no sentido de que non se esixa máis do necesario para conseguir este obxectivo. Para ser máis concreto, o que pretendo conseguir é a dedución da Fórmula Binomial (ás veces denominada «Fórmula de Newton»), no que eu chamo a súa «terceira forma». Isto é porque a partir desta fórmula pódense obter de maneira normal o teorema de Bernoulli e os outros teoremas do límite da teoría da probabilidade. O meu plan consiste, en primeiro lugar, en elaborar unha teoría frecuencial para clases finitas co obxectivo de levar a teoría, dentro deste marco, tan lonxe como sexa posible, isto é, ata a dedución da («primeira») Fórmula Binomial. A teoría frecuencial para clases finitas resulta ser unha parte bastante elemental da teoría das clases. Aquí desenvolverase só co obxectivo de obter unha base para tratar o axioma de aleatoriedade. En segundo lugar, pasarei ás sucesións infinitas, isto é, sucesións de acontecementos que se poden continuar infinitamente, mediante o vello método de introducir un axioma de converxencia, pois fainos falta algo deste tipo para abordar o axioma da aleatoriedade. E despois de derivar e examinar o teorema de Bernoulli, considerarei como se pode eliminar o axioma de 2 Esta preocupación exprésaa Schlick, Natursissenschaften 19, 1931. *Sigo a crer que estas dúas cousas son importantes. Aínda que neste libro case conseguín facer o que me propuxera, estes dous cometidos só foron completados satisfactoriamente no novo apéndice *vi. 3 Unha versión completa da elaboración matemática publicarase por separado. *Cf. o novo apéndice *vi. 255 a lóxida da descuberta científica converxencia e, por que tipo de sistema axiomático deberiamos optar en consecuencia. No curso da derivación matemática usarei tres símbolos de frecuencia diferentes: F'' simboliza frecuencia relativa en clases finitas; F' simboliza o límite das frecuencias relativas dunha sucesión de frecuencias infinita; e por último F simboliza a probabilidade obxectiva, isto é, a frecuencia relativa nunha sucesión «irregular», «aleatoria» ou «de carácter casual». 52 Frecuencia relativa nunha clase finita Considérese unha clase α dun número finito de ocorrencias, por exemplo a clase de lanzamentos realizados onte con este dado particular. Esta clase α, que se asume que é non baleira, serve, por dicilo así, de marco de referencia e chamarémoslle clase de referencia (finita). O número de elementos pertencentes a α, isto é, o seu número cardinal, desígnase por «N(α)», que quere dicir «o número de α». Sexa agora outra clase, β, que pode ser finita ou non. Chamarémoslle β á clase de propiedades: pode ser, por exemplo, a clase de todos os lanzamentos en que sae cinco ou, como nós diremos, que teñen a propiedade cinco. A clase dos elementos que pertencen tanto a α como a β, por exemplo a clase dos lanzamentos realizados onte con este dado concreto e que teñen a propiedade cinco chámase a clase produto de α e β, e represéntase por «α.β», que se lerá «α e β». Como α.β é unha subclase de α, pode conter como máximo un número finito de elementos (pode estar baleiro). O número de elementos de α.β represéntase por «N(α.β)». Mentres que os números de elementos (finitos) se representan por N, a frecuencia relativa represéntanse por F''. Por exemplo, «a frecuencia relativa da propiedade β na clase de referencia finita α» escríbese «F''(β)», que se le «a frecuencia α de β». Agora podemos definir (Definición 1) αF"(β) = (N (α.β)) (N(α)) 256 Karl Popper En termos do noso exemplo, isto quere dicir: «A frecuencia relativa de cincos entre os lanzamentos de onte con este dado é, por definición, igual ao cociente obtido de dividir o número de cincos, tirados onte con ese dado, polo número total de lanzamentos que onte se fixeron co ese dado»*1. Desta definición bastante trivial pódense deducir doadamente os teoremas do cálculo de frecuencia en clases finitas (máis concretamente, o teorema da multiplicación xeral, o teorema da suma e os teoremas da división, isto é, as regras de Bayes. Cf. apéndice ii). É unha característica dos teoremas deste cálculo de frecuencia, e do cálculo de probabilidade en xeral, que os números cardinais (números N) nunca aparecen neles, só as súas frecuencias relativas, isto é, proporcións ou números F. Os números N só aparecen nas probas duns cantos teoremas fundamentais que se deducen directamente da definición, mais non aparecen nos propios teoremas*2. Isto comprenderase mellor coa axuda dun sinxelo exemplo (no apéndice ii fornécense máis exemplos). represéntese mediante a clase de elementos que non pertencen a β (léase: «o complemento de β» ou simplemente «non β»). Entón pódese escribir αF"(β) + αF"( ) = 1 Mentres que este teorema só contén números F, a súa proba fai uso de números N. Pois o teorema dedúcese da definición (1) servíndose dun simple teorema do cálculo de clases que afirma que N (α.ß) + N (α. ) = N (a) *1 A definición 1 está, obviamente, relacionada coa clásica definición da probabilidade como a división de casos favorables entre os casos igualmente posibles; mais deberíase distinguir claramente desta última, pois na definición 1 non se asume que os elementos de α sexan «igualmente posibles». *2 Seleccionando un conxunto de fórmulas F das que se poden deducir outras fórmulas F, obtense un sistema axiomático de probabilidade; compárese cos apéndices ii, *ii, *iv e *v. 257 a lóxida da descuberta científica 53 Selección, independencia, insensibilidade, irrelevancia Entre as operacións que se poden realizar con frecuencias relativas en clases finitas, a operación de selección1 é de especial importancia para o que vén a seguir. Sexa unha clase de referencia finita α, por exemplo a clase dos botóns dunha caixa, e dúas clases de spropiedade: β (poñamos, os botóns vermellos) e γ (poñamos, os botóns grandes). Agora podemos tomar a clase produto α.β como unha nova clase de referencia, e preguntarnos polo valor de α.βF'' (γ), isto é, da frecuencia de γ da nova clase de referencia2. á nova clase de referencia α.β pódeselle chamar «o resultado de seleccionar elementos β de α», ou «a selección feita en α segundo a propiedade β», pois pódese entender que resulta de seleccionar os elementos de α (botóns) que teñen a propiedade β (vermellos). Agora ben, tamén é posible que γ apareza na nova clase de referencia, α.β, coa mesma frecuencia relativa que na clase de referencia orixinal α; isto é, ben pode ser certo que α.βF'' (γ) = αF'' (γ) Neste caso dise (seguindo a hausdorff3) que as propiedades de β e γ son «mutuamente independentes, dentro da clase de referencia α». A relación de independencia é unha relación de tres termos e é simétrica nas propiedades β e γ.4 Se dúas pro1 O termo que usa von Mises é «escolla» (Auswahl). 2 A resposta a esta pregunta ofrécea o teorema xeral da división. 3 Hausdorff, Berichte über die Verhandlungen der sächsischen Ges. d. Wissenschaften, Leipzig, mathem.-physik. Klasse 53, 1901, p. 158. 4 É simétrica mesmo nun triplo sentido, isto é, para α, β e γ, se supoñemos que β e γ tamén son finitos. Sobre a proba da afirmación de simetría cf. apéndice ii, (1s) e (1s). *A condición de finitude para a tripla simetría aquí afirmada é insuficiente. O que eu pretendía dicir talvez fose a condición de que β e γ estean limitados pola clase de referencia finita α ou, máis probable, que α debería ser o noso universo finito de discurso (estas condicións son suficientes). A insuficiencia da condición, tal como se formula na miña nota, demostrase co seguinte contraexemplo. Tómese un universo de 5 botóns: 4 son redondos (α), 2 dous son redondos e negros (αβ), 2 son redondos e grandes (αγ), 1 é redondo, negro e grande (αβγ); e 1 é cadrado, negro e grande ( βγ). Entón non temos tripla simetría porque αF'' (γ) βF'' (γ). 258 Karl Popper piedades β e γ son (mutuamente) independentes dentro dunha clase de referencia α tamén podemos dicir que a propiedade γ é, dentro de α, insensible á selección de elementos β; ou talvez que a clase de referencia α é, con respecto a esta propiedade γ, insensible á selección de acordo coa propiedade β. A independencia mutua, ou insensibilidade, de β e γ dentro de α tamén se podería interpretar, desde o punto de vista da teoría subxectiva, como segue: se se nos informa de que un elemento concreto da clase α ten unha propiedade β, entón esta información é irrelevante se β e γ son mutuamente independentes dentro de α; irrelevante, enténdase, para a cuestión de se este elemento posúe a propiedade γ ou non*1. Se, por outra banda, sabemos que γ aparece con máis (ou menos) frecuencia na subclase α.β (que foi seleccionada de α segundo β), entón a información de que un elemento posúe a propiedade β é relevante para a cuestión de saber se este elemento tamén ten a propiedade γ ou non5. 54 Sucesións finitas. Selección ordinal e selección de veciñanza Supoñamos que os elementos dunha clase de referencia finita α están numerados (por exemplo, poñéndolle un número a cada botón da caixa) e que están ordenados nunha sucesión, de acordo con estes números ordinais. En tal sucesión podemos distinguir dous tipos de selección de especial importancia: a saber, a selección segundo o número ordinal dun elemento (selección ordinal) e mais a selección segundo a veciñanza. A selección ordinal consiste en facer unha selección, partindo dunha sucesión α, segundo unha propiedade β que depende do *1 Así, a información de calquera tipo sobre posesión de propiedades é relevante, ou irrelevante, sé e só se as propiedades en cuestión son, respectivamente, dependentes ou independentes. A relevancia pódese definir, entón, en termos de dependencia, pero non á inversa (cf. a próxima nota e a nota *1 do apartado 55). 5 Keynes púxolle obxeccións á teoría da frecuencia porque lle parecía que era imposible definir a relevancia nos seus termos; cf. ob.cit., p. 103 ss. *De feito, a teoría subxectiva non pode definir a independencia (obxectiva), o cal é unha obxección seria, como demostro no meu Postscript, capítulo *ii, especialmente nos apartados *40 a *43. 259 a lóxida da descuberta científica número ordinal do elemento (sobre o que hai que decidir a selección). Por exemplo, β pode ser a propiedade par, así que seleccionamos de α todos os elementos que teñan un número ordinal par. Os elementos así seleccionados forman unha subsucesión seleccionada. Se unha propiedade γ fose independente dunha selección ordinal segundo β, entón tamén se pode dicir que a selección ordinal é independente con respecto a γ, e tamén que a sucesión α é, con respecto a γ, indiferente á selección de elementos β. A relación de veciñanza é posible polo feito de que, ao ordenar os elementos nunha sucesión numerada, créanse determinadas relacións de veciñanza. Isto permítenos, por exemplo, seleccionar aqueles números que teñan un predecesor inmediato coa propiedade γ; ou por exemplo, aqueles que teñan como predecesores primeiro e segundo, ou como sucesor segundo, a propiedade γ, etc. Así, se temos unha sucesión de acontecementos, por exemplo, de lanzamentos dunha moeda, temos que distinguir dous tipos de propiedades: as propiedades primarias, como «cara» ou «cruz», que pertencen a cada elemento independentemente da súa posición na sucesión; e as propiedades secundarias, como «par» ou «posterior a cruz», etc., que son as que adquire un elemento en virtude da súa posición na sucesión. Denomínase «alternativa» unha sucesión con dúas propiedades primarias. Como mostrou von Mises, é posible construír (procedendo con cautela) os fundamentos dunha teoría da probabilidade en termos dunha teoría de alternativas sen sacrificar a xeneralidade. representando as dúas primeiras propiedades dunha alternativa polas cifras «1» e «0», todas as alternativas pódense representar como unha sucesión de uns e ceros. A estrutura dunha alternativa pode ser regular ou máis ou menos irregular. No que segue estudaremos máis polo miúdo a regularidade e a irregularidade de determinadas alternativas finitas*1. *1 Permítome suxerir que nunha primeira lectura se poden saltar os apartados 55 a 64, ou quizais do 56 ao 64. Talvez sexa aconsellable ir directamente desde aquí, ou desde o cabo do apartado 55, ao capítulo 10. 260 Karl Popper 55 Liberdade n en sucesións finitas Tómese unha alternativa finita α, por exemplo unha que conteña mil uns e ceros ordenados nunha sucesión regular como a que segue: (α) 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 ... Nesta alternativa temos distribución equitativa, isto é, a frecuencia relativa dos uns e os ceros é igual. Se representamos a frecuencia relativa da propiedade 1 mediante «F'' (1)» e a de 0 mediante «F'' (0)», podemos escribir: (1) αF'' (1) = αF'' (0) = 1 2 Agora seleccionamos de α todos os termos que teñan a propiedade de veciñanza de suceder inmediatamente a un (na sucesión α). Se representamos esta propiedade por «β» podémoslle chamar á subsucesión seleccionada «α.β», que terá a seguinte estrutura: (α.β) 1 0 1 0 1 0 1 0 1 0 ... Esta sucesión é tamén de distribución equitativa. Amais, non variou a frecuencia relativa dos uns nin a dos ceros; isto é, temos (2) α.βF'' (1) = αF'' (1); α.βF'' (0) = αF'' (0) Na terminoloxía presentada no apartado 53, podemos dicir que as propiedades primarias da alternativa α son insensibles á selección segundo a propiedade β ou, dito máis abreviadamente, que α é insensible á selección segundo β. Como cada elemento de α posúe ou ben a propiedade β (suceder a un) ou ben a de suceder a cero, podemos representar esta última propiedade por « ». Se agora seleccionamos 261 a lóxida da descuberta científica os membros que teñen a propiedade obtemos a seguinte alternativa: (α. ) 0 1 0 1 0 1 0 1 0 ... Esta sucesión presenta unha variación moi leve con respecto á distribución equitativa por canto que comeza e remata en cero (pois o propio α acaba en «0, 0» debido á súa distribución equitativa). Se α contén 2000 elementos, entón α.β conterá 500 ceros e só 499 uns. Tales desviacións da distribución equitativa (ou doutros tipos de distribución) xorden só en razón do primeiro ou o último elementos: pódense reducir todo o que queiramos mediante alongando suficientemente a sucesión. Por esta razón prescindiremos delas no que segue, tendo sobre todo en conta que a nosa investigación se vai ampliar a sucesións infinitas, nas que estas desviacións se esvaen. Diremos, xa que logo, que a alternativa α.β ten distribución equitativa e que a alternativa α é insensible á selección de elementos que teñan a propiedade β. En consecuencia, α ou, mellor dito, a frecuencia relativa das propiedades primarias de α, é insensible á selección tanto segundo β como segundo , polo que podemos, logo, dicir que α é insensible a toda selección segundo a propiedade do predecesor inmediato. Está claro que esta insensibilidade se debe a determinados aspectos da estrutura da alternativa α, aspectos que talvez a distingan doutras alternativas. Por exemplo, as alternativas α.β e α. non son insensibles á selección segundo a propiedade dun predecesor. Agora podemos investigar a alternativa α co obxectivo de observar se é insensible e outras seleccións, especialmente segundo a propiedade dun par de predecesores. Pódese, por exemplo, seleccionar de α todos aqueles elementos que sexan sucesores dun par 1, 1. E axiña vemos que α non é insensible á selección do sucesor de calquera dos catro posibles pares 1, 262 Karl Popper 1; 1, 0; 0, 1; 0, 0. En ningún destes casos teñen distribución equitativa as subsucesións resultantes; ao contrario, todas conteñen bloques ininterrompidos (ou iteracións), isto é, só de uns ou só de ceros. O feito de que α sexa insensible á selección segundo os predecesores únicos, pero non á selección segundo pares de predecesores, poderíase expresar, segundo a perspectiva da teoría subxectiva, como a seguir se indica. A información sobre a propiedade dun predecesor de calquera elemento de α é irrelevante no relativo á propiedade deste elemento. Por outra banda, a información sobre as propiedades dos seus predecesores é da maior importancia pois, dada a lei segundo a que se construíu α, permítenos predicir a propiedade do elemento en cuestión: a información sobre as propiedades do seu par de predecesores proporciónanos, por así dicir, as condicións iniciais que se necesitan para deducir a predición. (A lei pola cal se constituíu α require un par de propiedades como condicións iniciais; é, xa que logo, «bidimensional» con respecto a estas propiedades. A especificación de unha propiedade é «irrelevante» só por ser composta nun grao insuficiente para servir como condición inicial. Cf. apartado 38.*1) lembrando o íntima que é a conexión entre a idea de causalidade (de causa e efecto) e a dedución de predicións, de agora en diante usarei a terminoloxía que se indica a seguir. A afirmación feita anteriormente sobre a alternativa α («α é insensible á selección segundo un único predecesor») agora expresareina dicindo: «α está libre de calquera repercusión de predecesores únicos» ou, abreviadamente, «α é libre 1». E en vez de dicir, coma antes, que α é (ou non é) «insensible á selección segundo pares de predecesores», agora direi: «α (non) está libre das *1 Esta é outra indicación do feito de que os termos «relevante» e «irrelevante», que figuran de xeito tan notorio na teoría subxectiva, poden inducir a flagrantes erros. Pois se p é irrelevante, e tamén o é q, é un pouco sorprendente que se nos diga que p.q pode ser da maior relevancia. Véxase tamén o apéndice *ix, especialmente os puntos 5 e 6 da primeira nota. 263 a lóxida da descuberta científica repercusións de pares de predecesores» ou, abreviado, «a (non) é libre 2».*2 usando a alternativa α libre 1 como prototipo podemos agora construír outras sucesións doadamente, tamén con distribución equitativa, que están libres non só das repercusións de un predecesor, isto é, libre 1 (coma α), senón que están, ademais, libres das repercusións dun par de predecesores, isto é, libre 2; e a continuación podemos continuar con sucesións libre 3, etc. Deste xeito chegamos a unha idea xeral que é fundamental para todo canto segue: a idea de estar libre das repercusións de todos os predecesores ata un certo número n, ou como diremos nós, a liberdade n. Máis concretamente, diremos que unha sucesión é «libre n» se e só se as frecuencias relativas das súas propiedades primarias son insensibles n, isto é, insensibles á selección segundo predecesores únicos, segundo pares de predecesores, segundo tripletes de predecesores... e mais segundo n-uplos de predecesores.1 unha alternativa α que é libre 1 pódese construír repetindo o período xerador (A) 1 1 0 0 ... tantas veces como se queira. De xeito semellante obtemos unha alternativa libre 2 con distribución equitativa se tomamos (B) 1 0 1 1 1 0 0 0 ... *2 A idea xeral de distinguir veciñanzas segundo o tamaño e de operar con seleccións de veciñanza precisas foi introducida por min. Mais a expresión «libre de repercusións» (nachwirkungsfrei) débese a Reichenbach. Reichenbach, porén, usáraa daquela só no senso absoluto de «selección insensible a calquera grupo precedente de elementos». É miña a idea de introducir un concepto definible recursivamente de liberdade 1, liberdade 2... e liberdade n e, por tanto, de utilizar o método recursivo para analizar seleccións de veciñanza e especialmente para construír sucesións aleatorias (usei o mesmo método recursivo tamén para definir a independencia mutua de n acontecementos). Este método é bastante diferente do de Reichenbach. Véxase tamén a nota 4 do apartado 58 e especialmente a nota 2 do apartado 60, infra. Engadido en 1968: descubrín máis tarde que o termo fora usado por Smoluchowski moito antes de Reichenbach. 1 Como me indicou o Dr. K. Schiff, esta definición pódese simplificar. Basta con pedir insensibilidade á selección de calquera n-uplo predecesor (para un n dado). A insensibilidade á selección de n 1-uplos (etc.) pódese probar doadamente. 264 Karl Popper como o seu período xerador. unha alternativa libre 3 obtense do período xerador (C) 1 0 1 1 0 0 0 0 1 1 1 1 0 1 0 0 e unha alternativa libre 4 obtense do período xerador (D) 0 1 1 0 0 0 1 1 1 0 1 0 0 1 0 0 0 0 0 1 0 1 1 1 1 1 0 0 1 1 ... Observarase como aumenta a impresión intuitiva de estar ante unha sucesión irregular segundo aumenta o número n da súa liberdade n. O período xerador dunha alternativa libre n con distribución equitativa debe conter polo menos 2n+1 elementos. Os períodos dados como exemplos poden comezar, obviamente, en lugares diferentes; por exemplo, (C) pode comezar no seu cuarto elemento, de maneira que obtemos, en lugar de (C), (C') 1 0 0 0 0 1 1 1 1 0 1 0 0 1 0 1 ... hai outras transformacións que non alteran a liberdade n dunha sucesión. un método para construír períodos xeradores de sucesións libres n para todo número n desenvolverase noutro lugar*3. Se ao período xerador dunha alternativa libre n lle engadimos os primeiros elementos n do seguinte período, entón obtemos unha sucesión de lonxitude 2n+1 + n. Isto ten, entre outras, as seguintes propiedades: toda ordenación de n + 1 ceros e uns, isto é, todo posible n + 1-uplo, aparece nela polo menos unha vez*4. *3 Cf. a nota *1 do apéndice iv. O resultado é unha sucesión de lonxitude 2n + n 1, tal que omitindo os seus últimos elementos n 1, obtemos un período xerador para unha alternativa libre m, onde m = n 1. *4 A seguinte definición, aplicable a calquera alternativa dada A longa pero finita, con equidistribución, semella apropiada. Sexa N a lonxitude de A, e sexa n o número enteiro máis alto, tal que 2n+1 N. Daquela dise que A é perfectamente aleatoria se e só se o número relativo de ocorrencias de calquera par, triplete, ..., m-uplete (ata m = n) non se desvía do de calquera outra parella, triplete, ..., m-uplete, máis de, digamos, m/N1/2 respectivamente. Esta caracterización permítenos afirmar dunha alternativa A que é aproximadamente aleatoria e mesmo nos permite definir un grao de aproximación. Unha definición máis elaborada pódese basear no método (de maximizar a miña función E) descrito nos puntos 8 e seguintes da miña «Terceira Nota», incluída no apéndice *ix. 265 a lóxida da descuberta científica 56 Sucesións de segmentos. A primeira forma da fórmula binomial Dada unha sucesión finita α, a unha subsucesión de α que conteña n elementos consecutivos denominámola «segmento de α de lonxitude n ou, de xeito abreviado, un «segmento n de α». Se, ademais da sucesión α, se nos dá un número definido n, entón podemos ordenar os segmentos n de α nunha sucesión: a sucesión de segmentos n de α. Dada unha sucesión α, podemos construír unha nova sucesión, de segmentos n de α, de tal xeito que comecemos co segmento dos primeiros n elementos de α. Despois vén o segmento dos elementos 2 a n + 1 de α. En xeral, tomamos como x-ésimo elemento da nova sucesión o segmento que contén os elementos x a x + n – 1 de α. A nova sucesión obtida pódese denominar «sucesión dos segmentos n sobrepostos de α». Esta denominación indica que só dous elementos consecutivos (isto é, segmentos) da nova sucesión se sobrepoñen de tal maneira que teñen en común n 1 elementos da sucesión orixinal α. Agora podemos obter, por selección, outras sucesións n dunha sucesión de segmentos superpostos, en especial sucesións de segmentos n adxacentes. unha sucesión de segmentos n adxacentes contén só segmentos n que se suceden inmediatamente en α sen sobrepoñerse. Pode comezar, por exemplo, polos segmentos n dos elementos numerados do 1 ao n, da sucesión orixinal α, seguidos polos dos elementos n + 1 a 2n, 2n + 1 a 3n, etc. En xeral, a sucesión de elementos adxacentes comezará co elemento k-ésimo de α e os seus segmentos conterán os elementos de α numerados k a n + k -1, 2n + k a 3n + k 1, etc. De aquí en diante, as sucesións de segmentos n sobrepostos de α representaranse por «α(n)», e as sucesións de segmentos n adxacentes por «αn». 266 Karl Popper Observemos agora un pouco máis de preto as sucesións de segmentos sobrepostos α(n) . Todo elemento de tal sucesión é un segmento n de α. Como propiedade primaria dun elemento de α(n) podemos considerar, por exemplo, o n-uplo de ceros e uns de que consta o segmento. Ou poderiamos, de xeito máis simple, considerar o número de uns como propiedade primaria do elemento (descartando a orde de uns e ceros). Se «m» representa o número de uns, entón temos claramente m ≤ n. Agora, de cada sucesión α(n) obtemos de novo unha alternativa se seleccionamos un m particular (m ≤ n), asignando a propiedade «m» a cada elemento da sucesión α(n) que teña exactamente m uns (e por tanto n – m ceros) e a propiedade « » (non m) a todos os outros elementos de α(n) . Todo elemento de α(n) ten que ter unha destas dúas propiedades. Imaxinemos agora que se nos dá unha alternativa finita α coas propiedades primarias «1» e «0». Asumimos que a frecuencia dos uns, αF'' (1), é igual a p, e que a frecuencia dos ceros, αF'' (0), é igual a q (non asumimos que a distribución sexa igual, isto é, que p = q). Sexa, entón, esta alternativa α polo menos libre n 1 (sendo n un número natural escollido arbitrariamente). Podemos, logo, facer a seguinte pregunta: con que frecuencia aparece a propiedade m na sucesión αn? Noutras palabras, cal será o valor de α(n)F'' (m)? Sen asumir nada alén do feito de que α é polo menos libre n 1, pódeselle dar resposta a esta pregunta1 por medio da aritmética elemental. A resposta está contida na seguinte fórmula, da cal se atopará a proba no apéndice iii: (1) α(n)F'' (m) = nCmpmqn–m 1 Ao correspondente problema sobre as sucesións infinitas de segmentos adxuntos eu chámolle «o problema de Bernoulli» (seguindo a von Mises, Wahrscheinlichkeitsrechnung, 1931, p. 128); e ao problema relativo ás sucesións infinitas de segmentos sobrepostos chámolle «cuasiproblema de Bernoulli» (cf. a nota 1 do apartado 60). Así que o problema tratado aquí sería o cuasiproblema de Bernoulli para sucesións finitas. 267 a lóxida da descuberta científica O segundo membro da fórmula «binomial» (1) foi dado por Newton nouotro contexto e por iso ás veces lle chaman a fórmula de Newton. Eu denominareina a «primeira forma da fórmula binomial»*1. unha vez deducida esta fórmula, agora deixo a teoría da frecuencia no relativo ás clases de referencia finitas. A fórmula forneceranos un fundamento para examinarmos o axioma de aleatoriedade. 57 Sucesións infinitas. Estimacións hipotéticas de frecuencia resulta bastante doado estender os resultados obtidos nas sucesións finitas libres n ás sucesións infinitas libres n definidas por un período xerador (cf. apartado 55). A unha sucesión infinita de elementos que teñan a función de clase de referencia coa que se relacionan as nosas clases relativas pódeselle chamar «sucesión de referencia». Corresponde máis ou menos a un «colectivo» no senso de von Mises*1. *1 No orixinal alemán usei a expresión «fórmula de Newton» mais, en vista de que non se usa moito en inglés, decidín traducila por «fórmula binomial». *1 Chegamos aquí ao punto en que eu non fun que de levar a cabo plenamente o meu plan intuitivo, a saber, analizar primeiro na medida do posible a aleatoriedade no dominio das sucesións finitas, e só con posterioridade pasar ás sucesións de referencia infinitas (nas que se necesitan límites de frecuencias relativas). Este programa poderíao ter levado a cabo doadamente construíndo, nunha segunda fase, sucesións libres n máis curtas para un n crecente, como se fixo no vello apéndice iv. Despois poderíase demostrar doadamente que se, nestas sucesións máis curtas, a n se lle permite aumentar sen límites, as sucesións vólvense infinitas, e as frecuencias vólvense, sen suposicións ulteriores, límites de frecuencia (véxase a nota *2 do apéndice iv e mais o novo apéndice *vi). Todo isto tería simplificado, sen dúbida, os seguintes apartados, malia que estes continúen a ter a súa relevancia. Pero tería resolto totalmente e sen suposicións ulteriores os problemas dos apartados 63 e 64 pois, como xa é demostrable a existencia de límites, xa non fai falta mencionar os puntos de acumulación. Estas melloras, así e todo, continúan a estar dentro do marco da teoría da frecuencia pura: excepto a medida en que definen unha media ideal da desorde obxectiva, xa son innecesarias se se adopta unha interpretación de propensións do formalismo neoclásico (da teoría da medida), como se explica nos apartados *53 e seguintes do Postscript. Mais mesmo nese caso continúa a ser necesario falar de hipóteses de frecuencia (de estimacións hipotéticas e de probas estatísticas) e, por tanto, o presente apartado continúa a ser relevante, o mesmo que a maior parte dos apartados sucesivos, ata o número 64. 268 Karl Popper O concepto de liberdade n presupón o de frecuencia relativa, pois a insensibilidade da súa definición (insensibilidade á selección segundo determinados predecesores) é a frecuencia relativa con que aparece unha propiedade. Nos nosos teoremas sobre sucesións infinitas farei uso, mais só provisionalmente ata o apartado 64, da idea dun límite de frecuencias relativas (representado por F'), en substitución da frecuencia relativa en clases finitas (F»). O uso deste concepto non presenta ningún problema sempre que nos limitemos a sucesións de referencia construídas segundo unha regra matemática. Sempre se pode determinar no caso destas sucesións se as sucesións correspondentes de frecuencias relativas son converxentes ou non. A idea dun límite de frecuencias relativas crea problemas só no caso das sucesións das que non se dá unha regra matemática, senón unha regra empírica (ligando, por exemplo, a sucesión con lanzamentos dunha moeda), pois nestes casos non está definido o concepto de límite (cf. apartado 51). un exemplo de regra matemática para construír unha sucesión é a seguinte: «O elemento enésimo dunha sucesión α será 0 se e só se n é divisible por 4». Isto define a alternativa infinita (α) 1 1 1 0 1 1 1 0 ... cos límites das frecuencias relativas: αF' (1) = 3/4; e αF' (0) = 1/4. Chamareille abreviadamente sucesións matemáticas a aquelas que se definan deste xeito, mediante unha regra matemática. En cambio, unha regra para construír unha sucesión empírica sería, por exemplo: «O enésimo elemento dunha sucesión α será 0 se e só se o enésimo lanzamento dunha moeda m sae cruz». Mais as regras empíricas non sempre necesitan definir sucesións de carácter aleatorio. Por exemplo, para min a seguinte regra sería empírica: «O enésimo elemento dunha sucesión será 1 se e só se o enésimo segundo (contando desde un momento cero) atopa o péndulo p á esquerda desta marca». 269 a lóxida da descuberta científica Este exemplo mostra que ás veces é posible substituír unha regra empírica por unha regra matemática, por exemplo baseándose en determinadas hipóteses e medicións relacionadas cun péndulo. Deste xeito podemos atopar que unha sucesión matemática se aproxime á sucesión empírica cun grao de precisión que poderá ser ou non ser satisfactorio, dependendo dos nosos obxectivos. No noso contexto é de interese especial a posibilidade (que se podería determinar a través do noso exemplo) de obter unha sucesión matemática cunhas frecuencias que se aproximan ás dunha determinada sucesión empírica. Ao dividir as sucesións entre matemáticas e empíricas estou a facer uso dunha distinción que se podería chamar «intensional» máis que «extensional». Pois se se nos dá unha sucesión «extensionalmente», isto é, ordenando os elementos individualmente un tras outro (de xeito que só poidamos coñecer unha porción finita, un segmento finito, por moi longo que sexa), entón é imposible determinar, partindo das propiedades da sucesión, se a sucesión de que forma parte é matemática ou empírica. Só cando se proporciona unha regra de construción (isto é, unha regra «intensional») poderemos decidir se unha sucesión é matemática ou empírica. Como o que pretendemos é analizar as nosas sucesións infinitas servíndonos do concepto de límite (de frecuencias relativas), temos que restrinxir a nosa investigación a sucesións matemáticas e, en realidade, a aquelas para as que sexa converxente a correspondente sucesión de frecuencias relativas. Esta restrición equivale a introducir o axioma de converxencia (os problemas asociados a este axioma non se tratarán ata os apartados 63 a 66, pois convén tratalos cando se vexa a «lei de grandes números»). Así que só nos ocuparemos das sucesións matemáticas. De entre estas só nos ocuparemos daquelas que se agarda, ou se conxectura, que se aproximen, no relativo ás frecuencias, a sucesións empíricas aleatorias ou de carácter casual, pois estas 270 Karl Popper son as que máis nos interesan. Mais agardar, ou conxecturar, que unha sucesión matemática se aproxime, no relativo ás frecuencias, a unha empírica non é máis que formar unha hipótese sobre as frecuencias dunha sucesión empírica.1 O feito de as nosas estimacións de frecuencias en sucesións de aleatoriedade empíricas seren hipóteses non ten ningunha repercusión na maneira en que poidamos calcular estas frecuencias. En relación coas clases finitas, está claro que non importa o máis mínimo a maneira de obter as frecuencias coas que comezamos os cálculos. Estas frecuencias pódense obter mediante cómputos reais, mediante unha regra matemática ou mediante unha hipótese de calquera outro tipo. Ou mesmo podemos inventalas. No cálculo de frecuencias acéptanse unhas frecuencias dadas e despois a partir destas dedúcense outras frecuencias. O mesmo vale para as estimacións de frecuencias en sucesións infinitas. Así, a cuestión das «fontes» destas estimacións de frecuencia non constitúe un problema para o cálculo de probabilidade, o cal non implica que se vaia excluír ao tratarmos os problemas da teoría da probabilidade. No caso de sucesións empíricas infinitas podemos distinguir dúas «fontes» principais das nosas estimacións hipotéticas de frecuencias, isto é, dúas maneiras en que se nos poden presentar. unha das estimacións baséase nunha hipótese de probabilidade equitativa (ou hipótese de equiprobabilidade) e a outra baséase nunha extrapolación de resultados estatísticos. Por hipótese de probabilidade equitativa entendo unha hipótese que afirma que as probabilidades das varias propiedades primarias son iguais: é unha hipótese que afirma distribución equitativa. As hipóteses equitativas baséanse normalmente en 1 Máis adiante, nos apartados 65 a 68, tratarei o problema da decidibilidade de hipóteses de frecuencia, isto é, o problema de se se pode comprobar unha conxectura ou hipótese dese tipo e, en caso afirmativo, se se pode corroborar dalgunha maneira e mais se se pode falsificar. *Cf. tamén o apéndice *ix. 271 a lóxida da descuberta científica consideracións de simetría2. un exemplo típico é a conxectura sobre a frecuencia equitativa no xogo dos dados, baseándose na simetría e na equivalencia xeométrica das seis caras do cubo. un bo exemplo das hipóteses de frecuencia baseadas en extrapolación estatística son as estimacións de índices de mortalidade. Nestas, primeiro establécense empiricamente os datos sobre mortalidade e, operando coa hipótese de que os patróns pasados continuarán sendo aproximadamente estables, ou que non mudarán moito (polo menos no período inmediatamente posterior), partindo dos casos coñecidos realízase unha extrapolación aos casos descoñecidos, isto é, pártese de ocorrencias que foron empiricamente clasificadas e cuantificadas. Os que teñen inclinacións indutivistas tenden a pasar por algo o carácter hipotético destas estimacións: confunden unha estimación hipotética, isto é, unha predición de frecuencia baseada en extrapolación estatística, unha das súas «fontes» empíricas: a clasificación e cuantificación real de ocorrencias ou sucesións de ocorrencias do pasado. Afírmase moitas veces que «deducimos» estimacións de probabilidades –isto é, predicións de frecuencias– partindo de ocorrencias do pasado que foron clasificadas e cuantificadas (coma as estatísticas de mortalidade). Mais desde un punto de vista lóxico non está xustificada esta afirmación, pois non faceos ningunha dedución lóxica para nada. O que si que se fai é avanzar unha hipótese non verificable que nunca poderá ser loxicamente xustificada por nada: faise a conxectura de que as frecuencias permanecerán constantes, permitindo así a extrapolación. Os defensores da lóxica indutiva, como supoñen que as hipóteses están baseadas na experiencia estatística, isto é, en frecuencias empiricamente observadas, nin sequera consideran que as hipóteses de probabilidade equitativa sexan «deducibles empiricamente» ou 2 Keyness trata estes temas na súa análise do principio de indiferenza. Cf. ob. cit., capítulo IV, p. 41-64. 272 Karl Popper «explicables empiricamente». Pola miña parte, eu sosteño que ao facermos estas estimacións hipotéticas de frecuencia o único que estamos a facer é guiármonos polas nosas reflexións sobre o significado da simetría e por consideracións análogas. Eu non vexo razón para que tales conxecturas teñan que estar inspiradas unicamente na acumulación dunha enorme cantidade de observacións indutivas. Non lle atribúo demasiada importancia a estas cuestións sobre as orixes ou «fontes» das nosas estimacións (cf. apartado 2). É máis importante, na miña opinión, deixar claro o feito de que toda estimación preditiva de frecuencias, incluíndo as obtidas por extrapolación estatística (e desde logo todas as referidas a sucesións empíricas infinitas), sempre será pura conxectura, pois sempre irá moito máis alá do que estariamos autorizados a afirmar sobre a base de observacións. A distinción que eu fago entre hipóteses de oportunidade equitativa e extrapolacións estatísticas correspóndese de xeito bastante preciso coa distinción entre probabilidades a priori e a posteriori. Mais como estes termos se teñen usado en tantos sensos diferentes3, e tamén por estaren tan fortemente contaminados por asociacións filosóficas, é preferible evitalos. No exame do axioma de aleatoriedade que vén a seguir tentarei atopar sucesións matemáticas que se aproximen a sucesións empíricas aleatorias, o cal significa que o que vou examinar son hipóteses de frecuencia*2. 58 Exame do axioma de aleatoriedade Os conceptos de selección ordinal (isto é, dunha selección segundo a posición) e o de selección de veciñanza xa foron 3 Born e Jordan, por exemplo, en Elementare Quantenmechanik, 1930, p. 1930, usan o primeiro destes termos para referirse a unha hipótese de distribución equitativa. A. A. Tschuprow, por outro lado, usa a expresión «probabilidade a priori» para todas as hipóteses de frecuencia, co obxectivo de as distinguir das súas probas estatísticas, isto é, dos resultados obtidos a posteriori da cuantificación empírica. *2 Este é precisamente o programa a que se aludiu aquí na nota *1, que se leva a cabo nos apéndices iv e *vi. 273 a lóxida da descuberta científica introducidos e explicados no apartado 55. Apoiándome nestes conceptos examinarei agora o axioma de aleatoriedade de von Mises (o principio de exclusión de sistemas de xogos de azar) co obxectivo de atopar un requirimento que, sendo máis débil, sexa capaz de o substituír. Na teoría de von Mises este «axioma» forma parte da súa definición do concepto de colectivo: o que el lle esixe é que os límites de frecuencias dun colectivo sexan insensibles á selección sistemática de calquera tipo. Como el sinala, un sistema de xogo de azar sempre se pode considerar unha selección sistemática. A maioría das críticas que se lle fixeron a este axioma céntranse nun aspecto relativamente irrelevante e superficial desta formulación: ten que ver co feito de que, entre as posibles seleccións, haberá a selección de, poñamos, aqueles lanzamentos en que sae cinco, e dentro desta selección, obviamente, a frecuencia dos cincos será bastante diferente do que é na sucesión orixinal. Esta é a razón pola que na súa formulación do axioma de aleatoriedade von Mises fala do que el chama «seleccións» ou «escollas» que son «independentes do resultado» do lanzamento en cuestión, e son definidas, polo tanto, sen facer uso da propiedade do elemento que hai que seleccionar1. Mais os numerosísimos ataques dirixidos contra esta formulación2 pódense contestar todos simplemente sinalando que o axioma de aleatoriedade de von Mises se pode formular sen usar en absoluto as expresións cuestionables3. A resposta poderíase expresar, por exemplo, deste xeito: os límites das frecuencias dun colectivo serán insensibles tanto á selección ordinal coma á de veciñanza, e tamén a todas as combinacións destes dous 1 Cf. por exemplo von Mises's Wahrscheinlichkeit, Statistik und Wahrheit, 1928, p. 25; tradución inglesa, 1939, p. 33. 2 Cf. por exemplo Feigl, Erkenntnis 1, 1930, p. 256, onde esta formulación se describe como «non expresable matematicamente». A crítica de Reichenbach, que está en Mathematische Zeitschrift 34, 1932, p. 594 ss., é moi semellante. 3 Dörge afirmou algo parecido, aínda que non deu explicacións detalladas. 274 Karl Popper métodos de selección que se poidan ser usados como sistemas de xogos de azar*1. Con esta formulación desaparecen as dificultades anteriormente mencionadas. Aínda quedan, así e todo, algunhas doutro tipo. Así, talvez sexa imposible probar que o concepto de colectivo, definido mediante un axioma de aleatoriedade tan forte, non é contraditorio consigo mesmo ou, dito doutro xeito, que a clase dos «colectivos» non está baleira (Kamke4 foi quen subliñou a necesidade de probar isto). Cando menos semella imposible construír un exemplo dun colectivo e demostrar deste xeito que os colectivos existen. Isto é así porque un exemplo dunha sucesión infinita que teña que satisfacer certas condicións só pode ser dado por unha regra matemática. Mais para un colectivo no senso de von Mises non pode haber, por definición, unha regra tal, debido a que calquera regra se podería usar como sistema de xogos de azar ou como sistema de selección. Esta crítica semella irrebatible se se descartan todos os posibles sistemas de xogos de azar*2. Poderíase aducir, con todo, outra obxección contra a idea de excluír todos os sistemas de xogos de azar: a idea de que realmente esixe demasiado. Se o que se quere é axiomatizar un sistema de enunciados (neste caso os teoremas do cálculo de probabilidade, en especial o teorema da multiplicación ou o teorema de Bernoulli), entón os axiomas escollidos non deberían ser só suficientes para a dedución das teorías do *1 Esta última frase encabezada por que (que resulta fundamental) non estaba no texto alemán. 4 Cf., por exemplo, Kamke, Einführung in die Wahrscheinlichkeitstheorie, 1932, p. 147, e Jahresbericht der Deutschen mathem. Vereinigung 42, 1932. A obxección de Kamke tamén se lle debe aplicar ao intento de Reichenbach de mellorar o axioma de aleatoriedade mediante a introdución de sucesións normais, pois non deu probado que o seu concepto sexa non baleiro. Cf. Reichenbach, Axiomatik der Wahrscheinlichkeitsrechnung, Mathematische Zeitschrift 34, 1932, p. 606. *2 É rebatible, porén, se se descarta calquera conxunto numerable de sistemas de xogos de azar, pois nese caso pódese construír un exemplo dunha sucesión (por unha especie de método diagonal). Véxase o apartado *54 do Postscript (texto posterior á nota 5) sobre A. Wald. 275 a lóxida da descuberta científica sistema, senón tamén (se é que o conseguimos) necesarios. Malia isto, pódese demostrar que non é necesaria a exclusión de todos os sistemas de selección para a dedución do teorema de Bernoulli e os seus corolarios. É suficiente con esixir a exclusión dunha clase especial de selección de veciñanza: é suficiente con demandar que a sucesión sexa insensible á selección segundo n-uplos de predecesores seleccionados arbitrariamente; isto é, que é libre n de repercusións posteriores para todo n ou, dito máis abreviadamente, que tería que ser absolutamente libre. Por tanto, eu propoño substituír o principio de exclusión dos sistemas de xogos de azar de von Mises polo requisito menos restritivo de «liberdade absoluta», no senso de liberdade n para todo n e, segundo isto, definir que as que cumpren este requisito son as sucesións matemáticas de carácter aleatorio. A principal vantaxe que ten isto é que non exclúe todos os xogos de azar, de xeito que sexa posible dar regras matemáticas para construír sucesións que sexan «absolutamente libres» no senso que nós lle atribuímos e, en consecuencia, construír exemplos. (Cf. apartado (a) do apéndice iv). Con isto respondemos á obxección de Kamke, anteriormente comentada, posto que agora estamos en condicións de probar que o concepto de sucesións matemáticas de carácter aleatorio non está baleiro, senón que é coherente*3. Se cadra semella raro que tentemos seguir a pista dos trazos altamente irregulares de sucesións aleatorias mediante sucesións matemáticas que teñen que cumprir as regras máis estritas. A primeira vista, se cadra o axioma de aleatoriedade de von Mises cadra mellor coas nosas impresións intuitivas. Parécenos aceptable que nos digan que unha sucesión aleatoria é completamente irregular, de xeito que calquera conxectura *3 A referencia ao apéndice iv faise aquí necesaria. A maioría das obxeccións que se lle fixeron á miña teoría contéstanse no seguinte parágrafo deste texto. 276 Karl Popper de regularidade se mostrará que falla, contra a parte final da sucesión, só con continuar tentando falsificar a conxectura alongando a sucesión o tempo suficiente. Mais este argumento intuitivo tamén pode ser favorable á miña proposta, pois se as sucesións aleatorias son irregulares, entón, non serán, a fortiori, sucesións regulares dun tipo particular. E o noso requisito de «liberdade absoluta» o único que fai é excluír un tipo particular de sucesión regular, aínda que este é importante. Que é un tipo importante pódese observar polo feito de que polo noso requisito excluímos explicitamente os seguintes tres tipos de sistemas de xogos de azar (cf. o próximo apartado): primeiro excluímos as seleccións de veciñanza «normais» ou «puras»*4, isto é, aquelas en que seleccionamos segundo algunha característica constante da veciñanza. Segundo, excluímos a selección ordinal «normal» que selecciona elementos que están a unha distancia constante, por exemplo, os elementos numerados k, n + k, 2n + k... e así sucesivamente. Por último, excluímos [moitas] combinacións destes dous tipos de seleccións (por exemplo a selección de todo enésimo elemento, sempre que a súa veciñanza teña certas características especificadas). unha propiedade característica de todas estas seleccións é que non fan referencia a un primeiro elemento absoluto da sucesión, polo que poden dar a mesma subsucesión seleccionada se a numeración da sucesión orixinal comeza por outro elemento (apropiado). Así que os sistemas de xogos de azar que son excluídos polo meu requisito son os que se poderían usar cando non se coñece o primeiro elemento da sucesión: os sistemas excluídos son invariables con respecto a certas transformacións (lineais), isto é, son sistemas de xogos de azar simples (cf. apartado 43). Polo meu requisito, só*5 non se exclúen os sistemas de xogos de azar *4 Cf. o último parágrafo do apartado 60, infra. *5 A palabra «só» é correcta só se falamos de sistemas de xogos de azar (preditivos); cf. a nota *3 do apartado 60, infra., e a nota 6 do apartado *54 do Potscript. 277 a lóxida da descuberta científica que se refiren a distancias absolutas partindo dun elemento5 (inicial) absoluto. O requisito de liberdade n para todo n (de 'liberdade absoluta') semella cadrar bastante ben coa idea, consciente ou inconsciente, que a maioría temos sobre as sucesións aleatorias, por exemplo, que o resultado do próximo lanzamento dun dado non depende do resultado dos lanzamentos previos (existe o costume de bater o dado antes de lanzalo precisamente para asegurar a súa 'independencia'). 59 Sucesións aleatorias. A probabilidade obxectiva Visto o que levamos dito ata aquí, propoño agora a seguinte definición: dise que unha sucesión de acontecementos ou unha sucesión de propiedades, especialmente unha alternativa, é «aleatoria» ou de «tipo casual» se e só se os límites das frecuencias das súas propiedades primarias son «absolutamente libres», isto é, insensibles a toda selección baseada nas propiedades de calquera n-uplo de predecesores. O límite de frecuencia correspondente a unha sucesión que sexa aleatoria denomínase probabilidade obxectiva da propiedade en cuestión, dentro da sucesión de que se trate e represéntase polo símbolo F. Isto pódese formular tamén do seguinte xeito: sexa a sucesión α unha sucesión aleatoria coa propiedade primaria β; neste caso vale o seguinte: αF (ß) =αF' (ß) Agora teremos que demostrar que a nosa definición é suficiente para a dedución dos principais teoremas da teoría matemática da probabilidade, en particular o teorema de Bernoulli. Máis adiante (no apartado 64) a definición dada aquí será modificada para que sexa independente do concepto de límite de frecuencias*1. 5 Exemplo: a selección de todos os termos que teñan número primo. *1 Na actualidade inclínome por usar o concepto de «probabilidade obxectiva» nunha acepción diferente, isto é, nun senso máis amplo, de xeito que cubra todas as interpreta278 Karl Popper 60 O problema de bernoulli A primeira fórmula binomial mencionada no apartado 56, ou sexa, α(n)F'' (m) = nCmpmqn–m (1) é válida para sucesións finitas de segmentos sobrepostos. É deducible asumindo que a sucesión finita α sexa polo menos libre n 1. Asumindo o mesmo, obtemos de inmediato a fórmula exactamente correspondente para sucesións infinitas, isto é, se α é infinita e polo menos libre n 1, entón α(n)F' (m) = nCmpmqn–m (2) Dado que as sucesións aleatorias son totalmente libres, isto é, libres n para todo n, a fórmula (2), a segunda fórmula binomial, tamén ten que ser aplicable a elas; e ten que ser aplicable a elas, en realidade, para calquera valor de n que escollamos. No que segue, ocuparémonos só de sucesións aleatorias, segundo se definiron no apartado anterior. Imos demostrar que, para sucesións aleatorias, é aplicable unha terceira fórmula binomial (3), ademais da fórmula (2); é esta: α(n)F(m) = nCmpmqn–m (3) A fórmula (3) difire da fórmula (2) en dous aspectos: primeiro, aplícase a sucesións de segmentos adxacentes αn en lugar de a sucesións de segmentos sobrepostos α(n). Segundo, non contén o símbolo F', senón o F. Isto significa que afirma, por implicación, que as sucesións de elementos adxacentes son, ás súa vez, aleatorias, pois F (probabilidade obxectiva) defínese só para sucesións aleatorias. cións «obxectivas» do cálculo formal de probabilidades, como a interpretación de frecuencias e, máis concretamente, a interpretación de propensións que se aborda no Postscript. Aquí, no apartado 59, este concepto úsase só como concepto auxiliar na construción dunha determinada forma da teoría da frecuencia. 279 a lóxida da descuberta científica A cuestión –á que (3) dá resposta– da probabilidade obxectiva da propiedade m nunha sucesión de segmentos adxacentes (isto é, a cuestión do valor de ) eu denomínoa, seguindo a von Mises, o «problema de Bernoulli»1. Para solucionalo e, por tanto, deducir a terceira fórmula binomial (3), é suficiente con supoñer que α é aleatorio2. (O noso cometido é equivalente a mostrar que o teorema especial da multiplicación é válido para a sucesión de segmentos adxacentes dunha sucesión aleatoria α). A proba*1 da fórmula (3) realízase en dúas fases. Primeiro, mostramos que a fórmula (2) é válida non só para sucesións de segmentos superpostos α(n) , senón tamén para sucesións de segmentos adxacentes αn. Segundo, móstrase que estas últimas son «totalmente libres». (A orde destas fases non se pode inverter, pois sabemos con certeza que unha sucesión de segmentos sobrepostos α(n) non é «totalmente libre»; de feito, as sucesións deste tipo son as que ofrecen o típico exemplo daquelas que se poden chamar «sucesións con repercusións posteriores»3). Primeira fase. As sucesións de segmentos adxacentes αn son subsucesións de α(n). Pódense obter destas mediante selección ordinal normal. Por tanto, se damos mostrado que os límites de frecuencias en sucesións sobrepostas α(n)F'(m) son insensibles á selección ordinal normal, entón xa teremos dado o primeiro 1 A cuestión correspondente das sucesións de segmentos sobrepostos, isto é o problema , a que dá resposta (2), pódese denominar o «cuasiproblema de Bernoulli»; cf. a nota 1 do apartado 56 e o apartado 61. 2 Reichenbach (Axiomatik der Wahrscheinlichkeitsrechnung, Mathematische Zeitschrift 34, 1932, p. 603) refuta isto implicitamente cando afirma: «... as sucesións normais tamén están libres de repercusións posteriores, mentres que o inverso non é necesariamente certo». Mais as sucesións normais de Reichenbach son aquelas para as que se aplica (3). (A miña proba é posible polo feito de que me afasto dos procedementos anteriores, definindo o concepto de «liberdade de repercusións posteriores» non directamente, senón coa axuda de «liberdade n de repercusións posteriores», facéndoa así accesible para o procedemento de indución matemática). *1 Só se dá aquí un esbozo da proba. Os lectores que non estean interesados na proba poden saltar ata o último parágrafo do presente apartado. 3 Von Smoluchowski baseou a súa teoría do movemento browniano en sucesións de repercusión posterior, isto é, sucesións de segmentos sobrepostos. 280 Karl Popper paso (mesmo teremos ido un pouco alén), pois significa que xa teremos probada a fórmula: αnF'(m) = α(n)F'(m) (4) Esbozarei primeiro esta proba no caso de n = 2; isto é, mostrarei que α2F'(m) = α(2)F'(m) (m ≤ 2) (4a) é verdadeira; despois será doado xeneralizar esta fórmula para todo n. Da sucesión de segmentos sobrepostos α(2) podemos seleccionar dúas, e só dúas, sucesións distintas α2 de segmentos adxacentes; unha, que designaremos por (A), contén os segmentos primeiro, terceiro, quinto, ... de α que comprenden os números 1, 2; 3, 4; 5, 6; ... A outra, designada por (B), contén os segmentos segundo, cuarto, sexto, ... de α(2), isto é, as parellas de elementos de α que comprenden os números 2,3; 4, 5; 6, 7; ..., etc. Agora, se se asume que a fórmula (4a) non é válida para unha das dúas sucesións, (A) ou (B), de maneira que o segmento (isto é, a parella) 0,0 aparece demasiadas veces, poñamos, na sucesión (A); entón na sucesión (B) debe aparecer unha desviación complementaria, isto é, o segmento 0,0 aparecerá demasiado poucas veces («demasiadas veces» ou «demasiado poucas veces» en comparación coa fórmula binomial). Mais isto contradí a asumida 'liberdade absoluta' de α. Pois se o par 0,0 aparece en (A) máis veces que en (B), entón en segmentos o suficientemente longos de α o par 0,0 debe aparecer máis veces a certas distancias características que a outras. As distancias máis frecuentes serían aquelas que resultarían se os pares 0,0 pertencesen a unha das dúas sucesións α2. As distancias menos frecuentes serían as que resultarían se pertencesen ás dúas sucesións α2. Pero isto contradiría a «liberdade absoluta» asumida de α, pois de acordo coa segunda fórmula binomial, 281 a lóxida da descuberta científica a «liberdade absoluta» de α implica que a frecuencia con que aparece unha sucesión particular de lonxitude n en calquera α(n) depende só do número de uns e ceros que aparecen nela, e non do arranxo da sucesión*2. Isto proba (4a) e, dado que esta proba se pode xeneralizar doadamente para calquera n, dedúcese a validez de (4), co cal se completa a primeira fase da proba. Segunda fase. O feito de que as sucesións αn sexan «absolutamente libres» pódese mostrar mediante un argumento análogo. De novo comezamos polas sucesións α2, e con respecto a estas mostrarase inicialmente só que son libres 1. Asúmase que unha das dúas sucesións α2, por exemplo, a sucesión (A), non é libre 1. Entón en (A), despois de polo menos un dos segmentos que comprenden os dous elementos –un par α concreto– (poñamos despois dun segmento 0,0), outro segmento (poñamos 1,1) iría a seguir con máis frecuencia que se (A) fose «absolutamente libre»; isto quere dicir que o segmento 1,1 aparecería con maior frecuencia na subsucesión seleccionada de (A) segundo o segmento predecesor 0,0 do que agardariamos pola fórmula binomial. Esta suposición, con todo, contradí a «liberdade absoluta» da sucesión α, pois se o segmento 1,1 segue en (A) o segmento 0,0 demasiado frecuentemente, entón, por compensación, o contrario ten que ocorrer en (B) pois, se non, aparecería a cuádrupla 0, 0, 1, 1 aparecería, nun segmento suficientemente longo de α, demasiado frecuentemente a determinadas distancias características (a saber, as distancias resultantes se os pares dobres en cuestión pertencesen a unha e a mesma sucesión α2). Ademais, a outras distancias características non ocorrería a cuádrupla con frecuencia suficiente (a saber, a aquelas distancias resul- *2 A seguinte formulación pode axudar intuitivamente: se as parellas 0,0 son máis frecuentes en certas distancias típicas que noutras, entón este feito pódese usar doadamente como base dun sistema simple que podería dalgún xeito aumentar as oportunidades dun xogador. Mais os sistemas de xogos de azar deste tipo son incompatibles coa «liberdade absoluta» da sucesión. Esta consideración subxace á «segunda fase» da proba. 282 Karl Popper tantes se pertencesen ás dúas sucesións α2). Enfrontámonos exactamente á mesma situación que antes e podemos mostrar, por consideracións análogas, que a asunción dunha ocorrencia preferente a distancias características é incompatible coa «liberdade absoluta» asumida de α. Esta proba pódese xeneralizar novamente, de xeito que podemos dicir que as sucesións α non só son libres 1, senón libres n para todo n e, por tanto, que son aleatorias ou que teñen carácter casual. Con isto completamos o esbozo das dúas fases. Agora estamos en condicións de substituír en (4) F' por F, e isto significa que podemos aceptar a hipótese de que a terceira fórmula binomial resolve o problema de Bernoulli. Tamén mostramos, por acaso, que as sucesións α(n) de segmentos sobrepostos son insensibles á selección ordinal normal sempre que α sexa «absolutamente libre». O mesmo vale para as sucesións αn de segmentos adxacentes, dado que toda selección ordinal normal de αn pódese considerar como unha selección ordinal normal de α(n) e debe, por tanto, ser aplicable á propia sucesión α, pois α é idéntica a α(1) e α1. Por tanto, xa demostramos, entre outras cousas, que da «liberdade absoluta» (que significa insensibilidade a un tipo especial de relación de veciñanza) se deriva a insensibilidade á selección ordinal normal. Outra consecuencia, como se pode observar doadamente, é a insensibilidade a calquera selección de veciñanza «pura» (isto é, á selección segundo unha caracterización constante da súa veciñanza, unha caracterización que non varía co número ordinal do elemento). Por último, tamén demostramos que a «liberdade absoluta» implica insensibilidade a todas*3 as combinacións destes dous tipos de selección. *3 Aquí a palabra 'todas' é, paréceme agora, equivocada e debíase substituír, para ser máis precisos, por «todas aquelas... que se poidan usar como sistemas de xogos de azar». Abraham Wald mostroume a necesidade de realizar esta corrección en 1935. Cf. notas *1 e *5 do apartado 58, supra, (e a nota 6, que remite a A. Wald, no apartado *54 do Postscript). 283 a lóxida da descuberta científica 61 A lei dos grandes números (teorema de bernoulli) O teorema de Bernoulli ou (primeira1) «lei dos grandes números» pódese deducir da terceira fórmula binomial mediante un razoamento puramente aritmético, baixo a suposición de que podemos levar n ao límite, n  ∞. Só é aplicable a sucesións infinitas α, pois só nestas os segmentos n de sucesións αn poden aumentar a lonxitude infinitamente. E só de tales sucesións α se pode afirmar que sexan «absolutamente libres», pois só baixo a asunción de liberdade n para todo n poderemos levar n ao límite, n  ∞. O teorema de Bernoulli proporciona a solución para un problema que está intimamente relacionado co que eu chamei (seguindo a von Mises) o «problema de Bernoulli», a saber, o problema do valor de αnF (m). Como se indicou no apartado 56, pódese dicir que un segmento n ten unha propiedade «m» cando contén precisamente m uns; a frecuencia relativa de uns neste segmento (finito) é, obviamente, m/n. Podemos definir agora: un segmento n de α ten a propiedade «Δp» se e só se a frecuencia relativa dos seus uns se desvía menos de δ do valor αnF (1) = p, isto é, a probabilidade de uns na sucesión α; aquí δ é calquera pequena fracción que escollamos, tan próxima a cero como queiramos (pero diferente de cero). Podemos expresar esta situación dicindo: un segmento n ten a propiedade «Δp» se e só se |m| n – p | < δ ; se non, o segmento ten a propiedade «Δp». Agora, o teorema de Bernoulli contesta a interrogante do valor de frecuencia, ou probabilidade, de segmentos deste tipo δ (de segmentos que posúen a propiedade «Δp») dentro das sucesións αn; responde así á pregunta do valor de αnF(Δp). Intuitivamente un pode adiviñar que se se fixa o valor de (sendo δ>0, e se n aumenta, entón a frecuencia destes segmen1 Von Mises distingue entre o teorema de Bernoulli (ou de Poisson) do seu inverso, que el denomina «teorema de Bayes» ou «segunda lei dos grandes números». 284 Karl Popper tos que teñen a propiedade Δp, e por tanto o valor de αnF(Δp), tamén aumentará (e que o seu aumento será monotónico). A proba de Bernoulli (que se pode atopar en calquera manual de cálculo de probabilidade) consiste en avaliar este aumento por medio dunha fórmula binomial. Bernoulli descubriu que se n aumenta sen límite, o valor de αnF(Δp) aproxímase ao valor máximo 1, para calquera valor fixado de δ, por pequeno que este sexa. Isto pódese representar por medio dos seguintes símbolos: lim αnF(Δp) = 1 n→∞ (para calquera valor de Δp) (1) Esta fórmula resulta de transformar a terceira fórmula binomial para sucesións de segmentos adxacentes. A segunda fórmula binomial análoga para sucesións de segmentos sobrepostos levaría inmediatamente, polo mesmo método, á correspondente fórmula lim α(n)F' (Δp) = 1 n→∞ (2) que é válida para sucesións de segmentos sobrepostos e selección ordinal normal partindo deles e, por tanto, para sucesións que teñen repercusións posteriores (que foron estudadas por Smoluchowski2). A propia fórmula (2) dá (1) en caso de que se seleccionen sucesións que non se sobrepoñan e que, polo tanto, son libres n. (2) pódese describir como unha variante do teorema de Bernoulli, así que o que eu vou dicir a seguir sobre Bernoulli tamén se aplica, mutatis mutandis, a esta variante. O teorema de Bernoulli, isto é, a fórmula (1), pódese expresar verbalmente como segue: chamémoslle «mostra adecuada» a un segmento finito longo, dunha lonxitude determinada, seleccionado dunha sucesión aleatoria α, se e só se a frecuencia dos uns deste segmento non se desvía de p (isto é, o valor 2 Cf. nota 3 do apartado 60 e nota 5 do apartado 64. 285 a lóxida da descuberta científica da probabilidade dos uns da sucesión aleatoria α) máis que unha pequena fracción determinada (que podemos escoller libremente). Poderemos dicir, logo, que a probabilidade de escoller unha mostra representativa se aproxima a 1 tanto como queiramos só con facer os segmentos en cuestión suficientemente longos*1. Nesta formulación a palabra probabilidade (ou valor de probabilidade) ten dúas ocorrencias. Como se debe interpretar ou traducir neste contexto? No sentido da miña definición de frecuencia, habería que interpretala como segue (márcanse en cursiva as dúas traducións da palabra «probabilidade» ao vocabulario da frecuencia): a inmensa maioría dos os segmentos finitos suficientemente longos serán 'mostras adecuadas', isto é, a súa frecuencia relativa desviarase do valor de frecuencia p da sucesión aleatoria en cuestión só nunha pequena cantidade determinada. Dito de xeito máis breve: a frecuencia p realízase, aproximadamente, en case todos os segmentos que sexan suficientemente longos (como se chega ao valor p é irrelevante para a presente argumentación; podería ser, por exemplo, o resultado dunha estimación hipotética). Tendo en conta que a frecuencia de Bernoulli aumenta monotonicamente segundo vai aumentando a lonxidude n do segmento e que diminúe monotonicamente segundo n diminúe e que, por tanto, o valor da frecuencia relativa se realiza comparativamente en segmentos curtos, tamén podemos afirmar o seguinte: O teorema de Bernoulli afirma que os segmentos curtos de sucesións «absolutamente libres» ou aleatorias mostrarán con frecuencia grandes desviacións de p e, por tanto, flutuacións relativamente grandes, mentres que os segmentos máis longos, *1 Esta oración foi reformulada (sen alterar o contido) na tradución ao inglés introducindo o concepto de 'mostra adecuada'. No orixinal alemán figuraba só a definición deste concepto, non esta expresión. 286 Karl Popper na maioría dos casos, mostrarán desviacións cada vez menores de p segundo aumente a lonxitude. En consecuencia, a maioría das desviacións en segmentos suficientemente longos reducirase tanto como queiramos. Noutras palabras, podemos facer que as grandes desviacións sexan tan raras como nós queiramos. Segundo isto, se se toma un segmento moi longo dunha sucesión aleatoria, co obxectivo de descubrir as frecuencias dentro das súas subsucesións mediante cómputos, ou talvez mediante outros métodos estatísticos ou empíricos, entón, na inmensa maioría dos casos obteremos o seguinte resultado: hai unha frecuencia media característica, de tal xeito que as frecuencias relativas en todo o segmento, e en case todos os subsegmentos longos, se desviarán só lixeiramente da media, mentres que nas frecuencias relativas dos subsegmentos máis pequenos haberá máis desviación con respecto á media, e canto máis curtos, máis frecuente será a desviación. Este feito, este comportamento estatisticamente determinado dos segmentos finitos, pódese denominar comportamento case-converxente, ou tamén se pode dicir que as sucesións aleatorias son estatisticamente estables*2. Así que o teorema de Bernoulli afirma que con frecuencia os segmentos máis pequenos de sucesións aleatorias mostran grandes flutuacións, mentres que os segmentos grandes sempre indican constancia ou converxencia no comportamento. Dito doutro xeito: obsérvase desorde e aleatoriedade nos pequenos, pero orde e constancia nos grandes. A este comportamento é ao que se refire a expresión lei dos grandes números. 62 O teorema de bernoulli e a interpretacion de enunciados de probabilidade Acabamos de ver que na formulación verbal do teorema de Bernoulli ocorre dúas veces a palabra «probabilidade». *2 Keynes afirma que chamarlle «Estabilidade de Frecuencias Relativas» sería máis apropiado que «Lei dos Grandes Números» (Cf. Treatise, p. 336). 287 a lóxida da descuberta científica Para un teórico de frecuencias non é difícil interpretar esta palabra, nas dúas ocorrencias, segundo a súa propia definición, pois pode ofrecer unha interpretación clara da fórmula de Bernoulli e a lei dos grandes números. Darán feito o mesmo os seguidores da teoría subxectiva na súa forma lóxica? un teórico subxectivo que queira definir a «probabilidade» como «grao de crenza racional» está no seu dereito, e ademais actúa con toda coherencia, cando interpreta as palabras «a probabilidade de... aproxímase a 1 tanto como queiramos» no sentido de «É case seguro1 que...» Mais este teórico acaba por complicar as cousas ao continuar a frase deste xeito: «... que a frecuencia relativa se desvíe menos dunha cantidade dada... do seu valor máis probable p» ou, en palabras de Keyness,2 «que a proporción das ocorrencias do acontecemento diverxerán menos dunha cantidade dada... da proporción máis probable p». Isto semella sensato, polo menos a primeira vista. Mais se interpretamos a palabra probable (que ás veces é suprimida) no senso da teoría subxectiva entón a frase quedaría así: «é case seguro que as frecuencias relativas se desvíen menos dunha cantidade dada... do valor p de grao de crenza racional», o cal me semella completamente absurdo*1. As frecuencias relativas só se poden 1 Von mises tamén usa a expresión «case seguro», mais para el débese definir no senso de «ter unha frecuencia próxima a [ou igual a] 1». 2 Keyness, A Treatise on Probability, 1921, p. 338. *A pasaxe anterior que está entre aspas houbo que a inserir aquí porque reinterpreta a pasaxe que citei da edición alemá de Keynes en que me baseei. *1 Paga a pena explicitar isto algo máis. Keynes afirma (na pasaxe inmediatamente anterior á que citamos antes): «Se a probabilidade da ocorrencia dun acontecemento baixo certas condicións é p, entón... a proporción máis probable das súas ocorrencias en relación co número total de ocasións é p...» Isto deberíase poder interpretar, segundo a súa propia teoría, por: «Se o grao de crenza racional na ocorrencia dun acontecemento é p, entón p tamén é unha proporción de ocorrencias, isto é, unha frecuencia relativa, sinaladamente aquela en que o noso grao de crenza racional é máis elevado». A miña obxección non é sobre o uso da expresión «crenza racional» (este uso tamén se pode interpretar como «É case seguro que...»). A miña obxección é sobre o feito de que p unhas veces sexa un grao de crenza racional e outras sexa unha frecuencia. Noutras verbas, eu non vexo por que unha frecuencia empírica teña que ser igual a un grao de crenza racional, nin que isto se poida probar por medio de ningún teorema, por moi profundo este que sexa. (Cf. tamén o apartado 49 e o apéndice *ix). 288 Karl Popper comparar, obviamente, con frecuencias relativas, e pódense desviar ou non desviarse de frecuencias tamén relativas. E non cabe ningunha dúbida de que non se pode admitir atribuírlle un sentido a p despois da dedución do teorema de Bernoulli diferente do sentido que se lle atribuíra antes da dedución3. Obsérvase, entón, que a teoría subxectiva non é capaz de interpretar a fórmula de Bernouli en termos da lei estatística dos grandes números. A dedución de leis estatísticas só é posible no marco da teoría de frecuencias. Partindo dunha teoría subxectiva en senso estrito nunca chegaremos a enunciados estatísticos, nin sequera usando de ponte o teorema de Bernoulli*2 para salvar a distancia. 63 O teorema de bernoulli e o problema da converxencia Desde o punto de vista da epistemoloxía, non resulta satisfactoria a dedución da lei dos grandes números esbozada anteriormente, pois non quedou suficientemente claro que papel desempeñaba o axioma de converxencia na nosa análise. En efecto, xa introducín tacitamente un axioma deste tipo ao limitar a miña investigación a frecuencias matemáticas con límites de frecuencia (cf. apartado 57). En consecuencia, un pódese sentir tentado de pensar que o noso resultado (a dedución da lei dos grandes números) é trivial, pois o feito de que as sucesións «absolutamente libres» sexan estatisticamente 3 Quen primeiro sinalou isto nunha situación semellante foi von Mises en Wahrscheinlichkeit, Statistik und Wahrheit, 1928, p. 85 (2a edición 1936, p. 136; as palabras aquí relevantes non están na tradución inglesa). Pódese sinalar ademais que as frecuencias relativas non se poden comparar con «graos de certeza» do noso saber, porque a ordenación de tales graos de certeza é convencional e non necesita realizarse mediante correlacións dos graos con fraccións que oscilan entre 0 e 1. Só se a medida dos graos subxectivos de certeza se define mediante correspondencias con frecuencias relativas (e só neste caso) se podería aceptar a dedución da lei de grandes números dentro do marco da teoría subxectiva (cf. apartado 73). *2 Aínda que si é posible usar o teorema de Bernoulli como ponte entre a interpretación obxectiva en termos de «propensións» e a estatística. Cf. apartados *49 a *57 do Postscript. 289 a lóxida da descuberta científica estables pódese considerar unha implicación da súa converxencia, que era xa fora asumida axiomaticamente, cando non implicitamente Mais, como von Mises mostrou claramente, isto sería unha equivocación, pois hai sucesións que cumpren o axioma de converxencia aínda que o teorema de Bernoulli non sexa válido para elas, debido a que cunha frecuencia próxima a 1 ocorren segmentos, de calquera lonxitude, que se poden desviar de p nunha cantidade calquera (a existencia do límite p é nestes casos debida ao feito de que as desviacións, aínda que aumenten sen límite, se anulan mutuamente). Tales sucesións semellan ser diverxentes en segmentos arbitrariamente grandes, aínda que as correspondentes sucesións de frecuencia sexan de feito converxentes. Así que a lei dos grandes números é calquera cousa menos unha consecuencia trivial do axioma de converxencia, e este axioma é claramente insuficiente para a súa dedución. Este é o motivo polo que non se pode prescindir do requisito de «liberdade absoluta»do meu axioma modificado de aleatoriedade. A reconstrución que fixemos da teoría indica, porén, a posibilidade de que a lei dos grandes números sexa independente do axioma de converxencia. Vimos que o teorema de Bernoulli se deduce da fórmula binomial. Ademais, mostrei que se pode deducir a primeira fórmula binomial para sucesións finitas e, por tanto, sen ningún axioma de converxencia. Basta con asumir que a sucesión de referencia α sexa polo menos libre n 1, asunción da que se deduce a validez do teorema de multiplicación especial, e con ela a da primeira fórmula binomial. Para facer a transición ata o límite, e obter o teorema de Bernoulli, só cómpre supoñer que poidamos facer n tan grande como queiramos. A partir disto pódese observar que o teorema de Bernoulli é válido, aproximadamente, mesmo para sucesións finitas, se son libres n para un n que sexa o suficientemente grande. 290 Karl Popper Semella, entón, que a dedución do teorema de Bernoulli non depende dun axioma que postule a existencia dun límite de frecuencia, senón que depende só da «liberdade absoluta» ou aleatoriedade. O concepto de límite xoga só un papel secundario: úsase co fin de aplicar algunha concepción de frecuencia relativa (que, para comezar, só se define para clases finitas, e sen a cal non se pode formular o concepto de liberdade n) a sucesións que se poden continuar infinitamente. Ademais, non se debería esquecer que o propio Bernoulli deduciu o seu teorema dentro do marco da teoría clásica, que non contén ningún axioma de converxencia. Tampouco se debía esquecer que a definición da probabilidade como límite de frecuencias só é unha interpretación (e non a única posible) do formalismo clásico. Tentarei xustificar a miña conxectura –a independencia do teorema de Bernoulli do axioma de converxencia –mediante a dedución deste teorema sen asumir nada máis que liberdade n (por definir apropiadamente)*1. E tentarei mostrar que é válida mesmo para aquelas sucesións matemáticas cuxas propiedades primarias non posúan límites de frecuencia. Só se se pode demostrar isto considerarei válida a miña dedución da lei dos grandes números desde a perspectiva epistemolóxica, pois é un «feito da experiencia» –ou polo menos iso se nos di ás veces– que as sucesións empíricas aleatorias mostran ese comportamento peculiar que eu describín como «cuasiconverxente» ou «estatisticamente estable» (cf. apartado 61). *1 Sigo a considerar perfectamente xustificada a miña vella dúbida sobre a asunción dun axioma de converxencia e a posibilidade de prescindir del: está xustificada polas argumentacións indicadas no apéndice iv, nota *2, e no apéndice *vi, onde se demostra que a aleatoriedade (definida polas «sucesións aleatorias máis curtas») implica converxencia e que, por tanto, non hai que a postular por separado. Ademais, a referencia que fixen ao formalismo clásico xustifícase polo desenvolvemento da teoría neoclásica (ou de teoría da medición) da probabilidade, tratada no capítulo *iii do Postscript. De feito, xustifícase polos «números normais» de Borel. Mais agora xa non estou de acordo coa opinión implícita na seguinte oración do texto, aínda que sigo a estar de acordo co resto dos parágrafos deste apartado. 291 a lóxida da descuberta científica rexistrando estatisticamente o comportamento de segmentos longos pódese establecer que as frecuencias relativas se aproximan progresivamente a un valor definido e que os intervalos entre os que flutúan as frecuencias relativas diminúen progresivamente. O denominado «feito empírico» este, tan comentado e analizado e con frecuencia considerado como a corroboración empírica da lei dos grandes números, pode ser interpretado desde varios puntos de vista. Os pensadores de tendencia indutiva considérano maiormente como unha lei fundamental da natureza, algo que non é reducible a ningún enunciado máis simple, unha particularidade do noso mundo que hai que aceptar sen máis. Estes pensadores pensan que, expresada dun xeito apropiado (por exemplo, na forma do axioma de converxencia), esta lei da natureza debíase converter na base da teoría da probabilidade, que así adoptaría o carácter dunha ciencia natural. A miña actitude sobre o denominado «feito empírico» este é moi diferente. Eu inclínome por pensar que é reducible ao carácter aleatorio das sucesións e que se pode deducir do feito de que estas sucesións son libres n. Considero que o grande logro de Bernoulli e Poisson no campo da teoría da probabilidade radica precisamente na descuberta dunha maneira de mostrar que este suposto «feito da experiencia» é unha tautoloxía e que da desorde nas sucesións pequenas (sempre que cumpran unha condición formulada apropiadamente de liberdade n), se deduce loxicamente unha especie de orde de estabilidade nas grandes. Se damos deducido o teorema de Bernoulli sen asumir un axioma de converxencia, entón teremos reducido o problema epistemolóxico da lei dos grandes números a unha cuestión de independencia axiomática e, por tanto, a unha cuestión puramente lóxica. Esta dedución tamén serviría para explicar por que o axioma de converxencia funciona bastante ben en todas as aplicacións prácticas (en intentos de calcular o comportamento aproximado de sucesións empíricas). Isto é 292 Karl Popper porque mesmo se non fose necesaria a restrición a sucesións converxentes, non cabe dúbida de que non pode ser incorrecto usar sucesións matemáticas converxentes para calcular o comportamento aproximado de sucesións empíricas que, por razóns lóxicas, sexan estatisticamente estables. 64 Eliminación do axioma de converxencia. Solución do «problema fundamental da teoría do azar» ata o de agora os límites de frecuencia non tiñan outra función na nosa reconstrución da teoría da probabilidade que proporcionar un concepto non ambiguo de frecuencia relativa aplicable a sucesións infinitas, de xeito que servíndonos del puidésemos definir o concepto de «liberdade absoluta» (de repercusións posteriores). Pois é á frecuencia relativa á que se lle esixe que sexa insensible á selección segundo os predecesores. Anteriormente restrinximos a nosa exploración a alternativas con límites de frecuencia, introducindo tacitamente, por tanto, un axioma de converxencia. Agora, para liberármonos deste axioma, eliminarei a restrición sen substituíla por ningunha outra. Isto significa que teremos que elaborar un concepto de frecuencia que poida asumir a función do descartado límite de frecuencia e que se poida aplicar a todas as sucesións de referencia infinitas*1. un concepto de frecuencia que cumpre estas condicións é o concepto de punto de acumulación da sucesión de frecuencias relativas (dise que un valor a é un punto de acumulación dunha sucesión se despois dun elemento dado hai elementos que se desvían de a menos dunha cantidade dada, por pequena que sexa). Que este concepto é aplicable sen restrición a todas as sucesións de referencia infinita pódese observar polo feito de *1 Para non postular converxencia, no seguinte parágrafo recorro ao que se pode demostrar: a existencia de puntos de acumulación. Todo isto tórnase innecesario se adoptamos o método descrito na nota *1 do apartado 57 e no apéndice *vi. 293 a lóxida da descuberta científica que para toda alternativa infinita debe existir polo menos un punto tal de acumulación para a sucesión de frecuencias relativas correspondente a ela. Como as frecuencias relativas nunca poden ser maiores de 1 nin menores de 0, unha sucesión delas só pode estar limitado por 1 e 0. E como sucesión limitada infinita, ten que ter (segundo un famoso teorema de Bolzano e Weierstrass) polo menos un punto de acumulación1. Dito de xeito abreviado, todo punto de acumulación da sucesión de frecuencias relativas correspondente a unha alternativa α denominarase «frecuencia media de α». logo podemos dicir: se unha sucesión α ten unha e só unha frecuencia media, entón esta é ao mesmo tempo o seu límite de frecuencia. E á inversa: se non ten límite de frecuencia, entón ten máis de unha2 frecuencia media. A idea dunha frecuencia media mostrarase moi apropiada para o noso obxectivo. Igual que anteriormente faciamos a estimación –unha estimación hipotética, talvez– de que p era o límite de frecuencia dunha sucesión α, agora traballamos coa estimación de que p é a frecuencia media de α. E sempre que tomemos certas precaucións3 imprescindibles, podemos facer cálculos servíndonos destas frecuencias medias estimadas, dun xeito análogo a como calculabamos os límites de frecuencia. Ademais, o concepto de frecuencia media é aplicable a todas as sucesións de referencia infinitas, sen ningunha restrición. Se agora tentamos interpretar o noso símbolo αF'(ß) como frecuencia media, en vez dun límite de frecuencia, e se modificamos a definición de probabilidade obxectiva segundo 1 Un feito que, sorprendentemente, non foi utilizado ata o de agora na teoría da probabilidade. 2 Pódese mostrar doadamente que se existe máis de unha frecuencia media nunha sucesión de referencia, entón os valores destas frecuencias medias forman un continuum. 3 O concepto de «selección independente» débese interpretar de xeito máis restrinxido do que se fixo ata o de agora pois, se non, non se pode probar a validez do teorema da multiplicación especial. Para máis detalles sobre isto, véxanse os meus traballos referidos na nota 3 do apartado 51. (*Isto agora xa foi superado polo apéndice *vi). 294 Karl Popper isto (apartado 59), a maioría das nosas fórmulas seguirán a ser deducibles. Porén, xorde unha dificultade: as frecuencias medias non son únicas. Se facemos a estimación ou a conxectura de que unha frecuencia media é αF' (ß) = p, entón isto non exclúe a posibilidade de que haxa valores de αF' (ß) distintos de p. Se postulamos que isto non ocorrerá, estamos a introducir, por implicación, o axioma de converxencia. Se, por outro lado, definimos a probabilidade obxectiva sen tal postulado de unicidade4, entón obtemos (en primeira instancia, polo menos) un concepto de probabilidade que é ambiguo, pois baixo certas circunstancias unha sucesión pode posuír ao mesmo tempo varias frecuencias medias que sexan «absolutamente libres» (cf. apartado c do apéndice iv). Mais isto a duras penas pode ser aceptable, pois estamos afeitos a traballar con probabilidades non ambiguas ou únicas, isto é, a asumir que para unha e a mesma propiedade pode haber unha e só unha probabilidade p, dentro de unha e a mesma sucesión de referencia. Así e todo, a dificultade de definir un concepto de probabilidade único sen o axioma do límite pódese superar doadamente. Podemos introducir o requisito de unicidade (o procedemento máis natural, está claro) como último paso, despois de postular que a sucesión será «totalmente libre». Isto lévanos a propoñer como solución para o noso problema a seguinte modificación da nosa definición de sucesións aleatorias e da probabilidade obxectiva. Sexa α unha alternativa (con unha ou varias frecuencias medias) e teñan os uns de α unha e só unha frecuencia media 4 Isto pódese facer porque ten que ser posible aplicar a teoría das clases finitas (coa excepción do teorema de unicidade) inmediatamente a frecuencias medias. Se unha sucesión α ten unha frecuencia media p, entón ten que conter –sexa cal sexa o termo co que comeza o cómputo– segmentos de calquera magnitude finita, a frecuencia dos cales se pode desviar de p tanto como nós queiramos. O cálculo pódese realizar para estes. Que p estea libre de repercusións posteriores quererá dicir, entón, que esta frecuencia media de α tamén é a frecuencia media de calquera selección de predecesores de α. 295 a lóxida da descuberta científica p que sexa «absolutamente libre»; entón dicimos que α é aleatoria e que p e á probabilidade obxectiva de uns dentro de α. Seranos útil dividir esta definición en dous requisitos axiomáticos*2: (1) requisito de aleatoriedade: para que unha alternativa sexa aleatoria, ten que haber polo menos unha frecuencia media «totalmente libre», isto é, a súa probabilidade obxectiva p. (2) requisito de unicidade: para unha e a mesma propiedade dunha e a mesma alternativa aleatoria, ten que haber unha e só unha probabilidade p. A coherencia do novo sistema axiomático está asegurada polo exemplo que construímos antes. É posible formar sucesións que, posuíndo unha e só unha probabilidade, non posúan límite de frecuencia (cf. apartado b do apéndice iv). Isto demostra que as novas esixencias axiomáticas son en realidade máis amplas, ou menos rigorosas, que as anteriores. Este feito resultará aínda máis claro se formulamos (como estamos en condicións de facer) os nosos anteriores axiomas da seguinte forma: (1) requisito de aleatoriedade: igual que arriba. (2) requisito de unicidade: igual que arriba. (2') Axioma de converxencia: para unha e a mesma propiedade dunha e a mesma alternativa aleatoria non existe frecuencia media posterior a parte da súa probabilidade p. Do sistema de requisitos proposto podemos deducir o teorema de Bernoulli e, con el, todos os teoremas do cálculo de probabilidade clásico. Isto resólvenos o problema: agora si é posible deducir a lei dos grandes números dentro do marco da teoría da frecuencia sen usar o axioma de converxencia. *2 É posible combinar o procedemento descrito na nota *1 do apartado 57 e nos apéndices iv e *vi con estes dous requisitos mantendo o requisito (1) e substituíndo o requisito (2) polo seguinte: (+2) Requisito de finitude: a sucesión débese converter, desde o comezo, en libre n canto antes, e para o n máis grande posible; noutras palabras, unha sucesión aleatoria debe ser (aproximadamente) o máis pequena posible. 296 Karl Popper Ademais, non só se manteñen inalteradas a fórmula (1) do apartado 61 e a formulación verbal do teorema de Bernoulli, senón que a interpretación que lle atribuímos tamén se mantén inalterada5: no caso dunha sucesión aleatoria sen límite de frecuencia continuará a ser certo que todas as sucesións suficientemente longas mostran pequenas desviacións con respecto a p. En tales sucesións (como as sucesións aleatorias con límites de frecuencia) ocorrerán ocasionalmente segmentos de calquera lonxitude con comportamento cuasidiverxente, isto é, segmentos que presenten unha desviación calquera con respecto a p. Pero tales segmentos serán comparativamente raros, pois teñen que ser compensados por partes extremadamente longas da sucesión en que todos (ou case todos) os segmentos se comportan de xeito cuasiconverxente. Como mostra a operación de cálculo, estes treitos terán que ser máis longos en varias ordes de magnitude, se se nos permite a expresión, que os segmentos que se comportan con diverxencia e que lles serven de compensación*3. Este é o lugar apropiado para resolver o problema fundamental da teoría do azar (como se lle chamou no apartado 49). É, en efecto, válida a inferencia aparentemente paradoxal consistente na aplicabilidade das regras do cálculo de probabilidade á impredicibilidade e a irregularidade de acontecementos singulares. É válida a condición de que sexamos capaces de expresar a irregularidade, cun grao considerable de aproximación, en termos dunha asunción hipotética de que só ocorre unha soa das frecuencias recorrentes –das «frecuencias medias»–en calquera selección segundo predecesores que non teñan repercusións posteriores. Con estas asuncións é posible probar que a lei dos grandes números é tautolóxica. É admisible e non con5 As fórmulas cuasibernoullianas (símbolo: F') tamén seguen a ser non ambiguas en sucesións aleatorias (segundo a nova definición), aínda que «F'» agora só simbolice unha frecuencia media. *3 Estou en total acordo co que vén a continuación, aínda que as referencias a «frecuencias medias» son redundantes se adoptamos o método descrito no apartado 57, nota *1 e no apéndice iv. 297 a lóxida da descuberta científica traditorio, como se ten dito ás veces6, soster a conclusión de que nunha sucesión irregular en que, por dicilo así, todo pode pasar en calquera momento –aínda que algunhas cousas só pasen raras veces– apareza unha certa regularidade ou estabilidade en subsucesións moi longas. E tampouco se pode dicir que esta conclusión sexa trivial, pois necesita ferramentas matemáticas específicas: o teorema de Bolzano e Weierstrass, o concepto de liberdade n e o teorema de Bernoulli. O paradoxo aparente dunha argumentación que pasa da impredicibilidade á predicibilidade, ou da ignorancia ao coñecemento, desaparece cando nos decatamos de que a asunción de irregularidade se pode formular como unha hipótese de frecuencia (a hipótese de liberdade de repercusións posteriores) e de que hai que a formular deste xeito se queremos demostrar a validez da argumentación. Agora tamén resulta claro por que as teorías anteriores non eran capaces de facerlle xustiza ao que eu chamo o «problema fundamental». É certo que a teoría subxectiva é capaz de deducir o teorema de Bernoulli, mais nunca o pode interpretar coherentemente en termos de frecuencias, unha vez pasada a moda da lei dos grandes números (cf. apartado 62). Por iso non pode explicar nunca o éxito estatístico de predicións de probabilidade. Por outra banda, a anterior teoría da frecuencia, polo seu axioma de converxencia, postula explicitamente regularidade en sucesións longas. Nesta teoría, pois, non xorde o problema da inferencia desde a irregularidade en sucesións curtas ata a regularidade nas longas, pois simplemente implica inferencia desde a estabilidade nas longas (axioma de converxencia), combinada coa irregularidade nas pequenas (axioma de alea6 Cf., por exemplo, Feigl, Erkenntnis 1, 1930, p. 254: «Na lei dos grandes números hai un intento de compatibilizar dúas afirmacións que, se se analizasen polo miúdo, mostraríanse mutuamente contraditorias. Por unha banda... dise que toda distribución e arranxo pode ocorrer unha vez. Por outra banda, estas ocorrencias... han aparecer cunha frecuencia correspondente». (Que aquí non hai incompatibilidade demóstrase pola construción de sucesións modelo; cf. apéndice iv). 298 Karl Popper toriedade) ata unha forma especial de estabilidade nas longas (teorema de Bernoulli, lei dos grandes números)*4. O axioma de converxencia non é unha compoñente necesaria dos fundamentos do cálculo de probabilidade. Con este resultado conclúo a miña análise do cálculo matemático7. Agora retorno ao tratamento de problemas máis especificamente metodolóxicos, en particular o problema de como decidir sobre enunciados de probabilidade. 65 O problema da decidibilidade Independentemente da maneira en que definamos o concepto de probabilidade ou das formulacións axiomáticas que escollamos, os enunciados de probabilidade non serán falsificables sempre que a fórmula binomial sexa deducible dentro do sistema. As hipóteses de probabilidade non descartan nada observable; as estimacións de probabilidade non poden contradicir, ou ser contraditas por, un enunciado básico. Tampouco poden ser contraditas por unha conxunción dun número finito de enunciados básicos nin, polo tanto, tampouco por un número finito de observacións. Supoñamos que se propón unha hipótese de equiprobabilidade para a alternativa α, por exemplo, que estimamos que os lanzamentos dunha determinada moeda sairán «1» ou «0» coa mesma frecuencia, de maneira que αF (1) = αF (0) = 1 2 , e supoñamos que descubrimos empiricamente que sae «1» unha vez tras outra sen excepción. Neste caso non cabe dúbida de que descartaremos a práctica a nosa estimación e consideraré- *4 O que se afirma neste parágrafo implicitamente aumenta a significación, para a solución do «problema fundamental», dunha teoría neoclásica interpretada obxectivamente. Unha teoría deste tipo descríbese no capítulo *iii do Postscript. 7 Cf. a nota 3 do apartado 51. Mirando retrospectivamente, gustaríame deixar claro que adoptei unha actitude conservadora con respecto aos catro puntos de von Mises (cf. final do apartado 50). Eu tamén defino a probabilidade só con referencia a sucesións aleatorias (que von Mises denomina «colectivos»). E tamén eu establezo un axioma (modificado) de aleatoriedade e sigo a von Mises sen reservas para determinar o cometido do cálculo de probabilidade. As diferenzas que temos son só sobre o axioma do límite, que eu mostrei que era superfluo e que substituín pola esixencia de unicidade, e sobre o axioma de aleatoriedade, que eu modifiquei de xeito que sexa posible construír sucesións modelo (apéndice iv). En consecuencia, a obxección de Kamke (cf. a nota 3 do apartado 53) deixa de ser válida. 299 a lóxida da descuberta científica mola falsificada. Pero nun sentido lóxico non cabe a falsificación, debido a que nós só podemos observar un número finito de lanzamentos. E malia que, segundo a fórmula binomial, a posibilidade de dar cun segmento finito moi longo que teña grandes desviacións de 1 2 é extremadamente baixa, sempre ten que ser maior que cero. unha ocorrencia suficientemente rara dun segmento finito, mesmo supoñendo que teña a desviación maior posible, non pode contradicir a estimación. De feito, debemos agardar que ocorra, pois isto é consecuencia da nosa estimación. Demóstrase ilusorio agardar que a rareza calculable dun segmento tal sexa unha maneira de falsificar a estimación de probabilidade, pois sempre se pode dicir, mesmo dunha ocorrencia frecuente dun segmento longo e con grande desviación, que non é máis que unha ocorrencia dun segmento aínda máis longo que ten unha desviación aínda meirande. Así que non hai sucesións de acontecementos (dados extensionalmente) e, por tanto, tampouco hai n-uplas finitas de enunciados básicos que poidan falsificar un enunciado de probabilidade. O único que podería contradicir unha estimación de probabilidade sería unha sucesión infinita de acontecementos (definida intensionalmente mediante unha regra). Mais isto significa, á vista das consideracións expostas no apartado 38 (cf. apartado 43), que as hipóteses de probabilidade son falsificables porque a súa dimensión é infinita. Deberíamos caracterizalas, en realidade, como carentes de información empírica, ou sexa, con contido empírico baleiro1. Mais esta opinión é claramente inaceptable á vista dos éxitos acadados pola física con predicións obtidas de estimacións hipotéticas de probabilidades (este argumento é o mesmo que se usou con anterioridade en contra da interpretación de enunciados de probabilidade como tautoloxías por parte da teoría subxectiva). A relevancia científica de moitas destas estimacións non é menor que a de calquera outra hipótese física (por 1 Mais non están baleiras de «contido lóxico» (cf. apartado 35), pois está claro que non todas as hipóteses de frecuencia son válidas tautoloxicamente para toda sucesión. 300 Karl Popper exemplo, as de carácter determinista). un físico está normalmente en condicións de decidir, coas probas dispoñibles, se é aceptable que unha hipótese de probabilidade concreta se poida considerar «confirmada empiricamente» ou se, pola contra, se debe rexeitar por ser «falsificada na práctica», isto é, por ser inservible para fins preditivos. Está bastante claro que esta «falsificación práctica» só se pode obter por medio dunha decisión metodolóxica de considerar descartados (ou prohibidos) os acontecementos altamente improbables. Pero con que dereito se poden descartar estes últimos? Onde se debe situar a liña divisoria? Onde comeza a «alta improbabilidade»? Non cabe dúbida de que, desde un punto de vista puramente lóxico, os enunciados de probabilidade non se poden falsificar, como tampouco cabe dúbida de que os usamos empiricamente, o cal pode semellar un golpe mortal para as miñas ideas básicas sobre o método, que dependen decisivamente do meu criterio de demarcación. Así e todo, tentarei responder as preguntas anteriores (que constitúen o problema da decidibilidade) mediante unha aplicación decidida destas mesmas ideas. Pero para facer isto terei que analizar primeiro a forma lóxica dos enunciados de probabilidade, tendo en consideración tanto as relacións lóxicas entre eles como as relacións que manteñen cos enunciados básicos*1. *1 Paréceme que a énfase que eu fago na irrefutabilidade das hipóteses de probabilidade (que culmina no apartado 67) foi algo saudable: destapou un problema que non se tratara con anterioridade (debido á énfase máis xeral na verificabilidade e non na falsificabilidade, e ao feito de que os enunciados de probabilidade, como se explica no apartado seguinte, son verificables dalgunha maneira ou «confirmables»). Mais a reforma que eu propoño na nota *1 do apartado 57 (véxase tamén a nota *2 do apartado 64) cambia totalmente a situación, debido a que esta reforma equivale á adopción dunha regra metodolóxica, como a que se propón máis abaixo no apartado 68, que fai falsificables as hipóteses de probabilidade. O problema da decidibilidade transfórmase no seguinte problema: debido a que se pode agardar que as sucesións empíricas só se aproximen ás sucesións aleatorias máis curtas, que é o que se debe considerar como aproximación, e que non? Claramente, a resposta é que a aproximación é unha cuestión de grao e que a determinación deste grao é un dos maiores problemas da estatística matemática. (Engadido no 1972. Unha nova solución aparece en D. Gillies. Véxase p. 443.) 301 a lóxida da descuberta científica 66 A forma lóxica dos enunciados de probabilidade Os enunciados de probabilidade non son falsificables. E tampouco son, claro está, verificables, polas mesmas razóns polas que outras hipóteses tampouco o son, á vista de que os resultados experimentais, por moi numerosos e favorables que sexan, nunca poden determinar finalmente que, no lanzamento de moedas, a frecuencia relativa de «caras» é 1 2 e sempre será 1 2 . Os enunciados de probabilidade e os enunciados básicos non poden, xa que logo, nin contradicírense entre si nin implicárense mutuamente. Malia isto, sería erróneo tirar a conclusión de que non existen relacións lóxicas entre enunciados de probabilidade e enunciados básicos. Tampouco sería correcto pensar que mentres que si se dan relacións lóxicas entre estes dous tipos de enunciados (debido a que as sucesións de observacións poden corresponder en maior ou menor medida cun enunciado de frecuencia), a análise destas relacións nos obrigaría a introducir unha lóxica probabilística1que corte amarras coa lóxica clásica. En contra destas opinións, eu sosteño que as relacións en cuestión se poden analizar na súa totalidade en termos das relacións lóxicas «clásicas» de deducibilidade e contradición*1. Partindo da non falsificabilidade e da non verificabilidade dos enunciados de probabilidade, pódese inferir que estes non teñen consecuencias falsificables e que eles mesmos non poden ser consecuencias de enunciados verificables. Pero non se exclúen as posibilidades inversas, pois podería ser (a) que teñan consecuencias verificables unilateralmente (consecuencias puramente existencias ou consecuencias do tipo «hai») ou (b) que eles mesmos sexan consecuencias de enunciados universais unilateralmente falsificables (enunciados do tipo «todo»). 1 Cf. apartado 89, en especial notas 3 e 6. *1 Aínda que non estou en desacordo con isto, agora son da idea de que os conceptos probabilísticos «case deducible» e «case contraditorio» son extremadamente útiles en relación co noso problema; véxase o apéndice *ix e o capítulo *iii do Postscript. 302 Karl Popper A posibilidade (b) dificilmente axudará a aclarar a relación lóxica entre enunciados de probabilidade e enunciados básicos, pois é obvio que un enunciado non falsificable, isto é, que di moi pouco, pode pertencer á clase de consecuencias dun enunciado que sexa falsificable e que, por tanto, diga máis. Maior interese para nós ten a posibilidade (a), que dista moito de ser trivial e que, de feito, resulta ser fundamental para a nosa análise da relación entre enunciados de probabilidade e enunciados básicos, debido a que de todo enunciado de probabilidade se pode deducir unha clase infinita de enunciados existenciais, pero non á inversa (así, o enunciado de probabilidade di máis que calquera destes enunciados existenciais). Por exemplo, sexa p unha probabilidade estimada, hipoteticamente, para unha alternativa determinada (e sexa 0 ≠ p ≠ 1); entón podemos deducir desta estimación, por exemplo, a consecuencia existencial de que ocorrerán na sucesión ceros e uns (tamén derivan moitas outras consecuencias moito menos simples, por exemplo, que ocorrerán os segmentos que se desvían só unha cantidade moi pequena con respecto a p). Mais podemos deducir moitas mais cousas desta estimación. Por exemplo, que aparecerá «repetidas veces» un elemento coa propiedade «1» e outro elemento coa propiedade «0», isto é, que tras calquera elemento x ocorrerá na mesma sucesión un elemento y que teña a propiedade «1», e tamén un elemento z que teña a propiedade «0». un enunciado con esta forma (para todo x hai un y coa propiedade β observable ou comprobable *2 Non era a miña intención, obviamente, soster que todo enunciado coa forma «para todo x, hai un y coa propiedade observable β» é non falsificable e, por tanto, non comprobable. Obviamente, o enunciado «para todo lanzamento que dea 1, hai un sucesor inmediato que dá 0» é á vez falsificable e resulta de feito falsificado. O que crea a non falsificabilidade non é só a forma «para todo x hai un y tal que...», senón o feito de que «hai» é ilimitado, ou sexa, que a ocorrencia de y se pode adiar alén de todo límite: no caso probabilístico, y pode, por dicilo así, ocorrer tan tarde como lle pareza. Un elemento «0» pode ocorrer inmediatamente ou despois de mil lanzamentos, ou despois dun número calquera de lanzamentos: este é o feito que provoca a non falsificabilidade. Se, por outra banda, a distancia do lugar de ocorrencia de y con respecto ao lugar de ocorrencia de x é limitada, entón o enunciado «para todo x hai un y tal que...» pode ser falsificable. 303 a lóxida da descuberta científica extensionalmente) é ao tempo non falsificable (porque non ten consecuencias falsificables) e non verificable (debido ao «todo» ou «para todo» que o convertía en hipotético)*2. Malia isto, pódese «confirmar» máis ou menos, no senso de que seremos quen de verificar moitas, poucas ou ningunha consecuencia existencial, así que mantén co enunciado básico a relación que semella característica dos enunciados de probabilidade. Os enunciados que teñan a forma anterior pódense denominar «enunciados existenciais universalizados» ou hipóteses existenciais (universalizadas). Eu sosteño que a relación das estimacións de probabilidade cos enunciados básicos, e a súa posibilidade de seren mellor ou peor «confirmadas», pódese comprender se se considera o feito de que partindo de todas as estimacións de probabilidade, as hipóteses existenciais son loxicamente deducibles. Isto apunta á cuestión de se os propios enunciados de probabilidade non poidan ter xa a forma, talvez, de hipóteses existenciais. Toda estimación de probabilidade (hipotética) implica a conxectura de que a sucesión empírica en cuestión é, aproximadamente, aleatoria ou de carácter casual. Ou sexa, implica a aplicabilidade (aproximada), e a validez, dos axiomas do cálculo de probabilidade. A nosa pregunta agora é, xa que logo, se estes axiomas representan o que eu chamei «hipóteses existenciais». Se examinamos os dous requisitos propostos no apartado 64, entón vemos que o requisito de aleatoriedade, de feito, ten a forma dunha hipótese existencial2. O requisito de unicidade, Este pouco precavido enunciado de meu (asumido tacitamente no apartado 15) levou a algúns, para sorpresa miña, a pensar que todos os enunciados (ou a «maioría», independentemente do que ela signifique) que teñen a forma «para todo x hai un y tal que...» son non falsificables, e isto foi usado reiteradamente como crítica do criterio de falsificabilidade. Véxase, por exemplo, Mind 54, 1945, p. 119 ss. O asunto este dos enunciados «todos e cada un» (este termo débeselle a J. W. N. Watkins) trátase con máis amplitude no Postscript; véxase en especial o apartado *24 e seguintes. 2 Pódese formular deste xeito: para todo ε positivo, para toda n-upla predecesora e todo elemento co número ordinal x hai un elemento, seleccionado segundo selección de predecesor, co número ordinal y > x tal que a frecuencia ata o termo y se desvía con respecto ao valor p determinado unha cantidade menor que ε. 304 Karl Popper por outra banda, non ten esta forma. Non a pode ter porque un enunciado que teña a forma de «hai só un...» ten que ter a forma dun enunciado universal (pódese interpretar como «Non hai máis que un...» ou por «Todos os... son idénticos»). A miña tese é que só o «constituínte existencial», como podemos denominalo, de estimacións de probabilidade (e, polo tanto, o requisito de aleatoriedade), pode establecer unha relación lóxica entre eles e os enunciados básicos. Segundo isto, o requisito de unicidade, como enunciado universal, non tería consecuencias extensionais en absoluto. Que existe un valor p coas propiedades requiridas, pódese «confirmar» extensionalmente, aínda que só provisionalmente, está claro, pero non que só exista un tal valor. Este último enunciado, que é universal, podería ser extensionalmente significativo só se o puidesen contradicir enunciados básicos, isto é, se os enunciados básicos puidesen determinar a existencia de máis dun tal valor. Como non poden (pois lembramos que a non falsificabilidade está ligada á fórmula binomial), o requisito de unicidade non pode ter significación intensional*3. Esta é a razón pola que as relacións lóxicas establecidas entre unha estimación de probabilidade e os enunciados básicos, e o grao de «confirmabilidade» das primeiras, non se ven afectadas se eliminamos o requisito de unicidade do sistema. Facendo isto, poderíamos darlle ao sistema unha hipótese existencial pura3. Mais nese caso teriamos que abandonar a unicidade das estimacións de probabilidade*4 e, por tanto, (no *3 A situación é totalmente diferente se se adopta o requisito (+2) da nota *2 do apartado 64 , que é empiricamente significativo, o cal fai falsificable as hipóteses de probabilidade (como se dixo na nota *1 do apartado 65). 3 A fórmula do cálculo de probabilidade tamén é deducible nesta axiomatización, só que as fórmulas hai que as interpretar como fórmulas existenciais. O teorema de Bernoulli, por exemplo, xa non afirmaría que o único valor de probabilidade para un determinado n de se sitúe preto de 1, senón só que (para un determinado n) entre os varios valores de probabilidade de hai polo menos un que se sitúa preto de 1. *4 Como se mostrou na nova nota *2 do apartado 64, pódese eliminar calquera requisito especial de unicidade sen sacrificar a unicidade totalmente. 305 a lóxida da descuberta científica que afecta á unicidade) obter algo diferente do cálculo normal de probabilidade. resulta obvio, logo, que o requisito de unicidade non é superfluo. Cal é, entón, a súa función lóxica? Mentres que o requisito de aleatoriedade axuda a establecer unha relación entre enunciados de probabilidade e enunciados básicos, o requisito de unicidade regula as relacións entre os varios enunciados de probabilidade. Sen o requisito de unicidade algúns destes últimos, como hipóteses existenciais, poderían ser deducibles doutros, pero nunca poderían ser mutuamente contraditorios. Só o requisito de unicidade asegura que os enunciados de probabilidade se poidan contradicir mutuamente, pois por este requisito adquiren a forma dunha conxunción cuxos compoñentes son un enunciado universal e unha hipótese existencial, e os enunciados que teñen esta forma poden manter entre si exactamente as mesmas relacións lóxicas fundamentais (equivalencia, deducibilidade e incompatibilidade) que poden manter os enunciados universais «normais» de calquera teoría (por exemplo, unha teoría falsificable). Se consideramos agora o axioma de converxencia, vemos que é como o requisito de unicidade no senso de que ten a forma dun enunciado universal non falsificable. Pero esixe máis que o noso requisito. Esta esixencia adicional, con todo, non pode ter significado extensional nin tampouco significado lóxico ou formal, senón que só pode ter significado intensional: é unha esixencia de exclusión de todas as sucesións definidas intensionalmente (isto é, matemáticas) sen límites de frecuencia. Mais desde o punto de vista das aplicacións, esta exclusión demostra non ter significado nin sequera intensional, pois na aplicación da teoría da probabilidade non manexamos, evidentemente, as propias sucesións matemáticas, senón estimacións hipotéticas sobre sucesións empíricas. A exclusión de sucesións sen límites de frecuencia podería, por tanto, 306 Karl Popper servir para nos advertir de que non consideremos esas sucesións empíricas como aleatorias, das que nós hipoteticamente asumimos que non teñen límites de frecuencia. Pero, que podemos facer nós en resposta a esta advertencia?4 Que tipo de consideracións ou conxecturas sobre a posible converxencia ou diverxencia de sucesións empíricas nos deberiamos permitir ou absternos de usar, en vista desta advertencia e de que os criterios de converxencia non lles son máis aplicables que os criterios de diverxencia? Todas estas preguntas5 comprometidas desaparecen unha vez que nos desfacemos do axioma de converxencia. A nosa análise lóxica deixa claras tanto a forma como a función dos varios requisitos parciais do sistema e mostra que razóns nos desaconsellan o axioma de aleatoriedade e aconsellan o requisito de unicidade. Mentres tanto, o problema da decidibilidade semella ser cada vez máis inquietante. Malia non estarmos obrigados a cualificar os nosos requisitos (ou axiomas) como «carentes de sentido»6, semella que nos vemos obrigados a caracterizalos como non empíricos. Mais esta caracterización dos enunciados de probabilidade (independentemente das palabras que usemos para expresala) non contradirá a idea central da nosa perspectiva? 4 Tanto o axioma de aleatoriedade coma o de unicidade pódense considerar como tales advertencias (intensionais). Por exemplo, o axioma de aleatoriedade prevennos contra a consideración de sucesións como aleatorias se supoñemos (non importa por que razóns) que certos sistemas de xogos de azar terán éxito con elas. O axioma de unicidade advírtenos de que non lle atribuamos a probabilidade q (onde ) a unha sucesión que nós supoñemos que se pode describir por medio da hipótese de que a súa probabilidade é igual a p. 5 Reservas semellantes levaron a Schlick a poñerlle obxeccións ao axioma do límite (Die Naturwissenschaften 19, 1931, p. 158). 6 Aquí os positivistas terían que recoñecer toda unha xerarquía de «carencias de sentido». Para el/a, as leis naturais non verificables «non teñen sentido» (cf. apartado 6 e as citas das notas 1 e 2) e, por tanto, menos sentido terán aínda as hipóteses de probabilidade, que nin son verificables nin falsificables. Dos nosos axiomas, o de unicidade, que non ten significado extensional, tería menos sentido que o axioma de irregularidade xa 'carente de sentido', que polo menos ten consecuencias extensionais. Menos sentido aínda tería o axioma do límite, pois nin sequera ten significado intensional. 307 a lóxida da descuberta científica 67 Un sistema probabilístico de metafísica especulativa O uso máis importante dos enunciados de probabilidade en física é este: certas regularidades físicas ou efectos físicos observables interprétanse como «macroleis», isto é, interprétanse ou explícanse como fenómenos xerais, ou comom resultados observables de «microacontecementos» hipotéticos e non directamente observables. As macroleis dedúcense de estimacións de probabilidade polo método seguinte: mostramos que as observacións que cadran coa regularidade observada en cuestión han ser agardadas cunha probabilidade moi próxima a 1, isto é, cunha probabilidade que se desvía de 1 nunha cantidade tan pequena como nós queiramos. unha vez mostrado isto, entón dicimos que pola nosa estimación de probabilidade «explicamos» o efecto observable en cuestión como un macroefecto. Mais se usamos estimacións de probabilidade deste xeito para a «explicación» de regularidades observables sen introducir precaucións especiais, entón podémonos ver envoltos en especulacións que, de acordo co uso xeral, se poden cualificar como típicas da Metafísica especulativa. Como os enunciados de probabilidade non son falsificables, sempre será posible «explicar» deste xeito, mediante estimacións de probabilidade, calquera regularidade que queiramos. Tómese, por exemplo, a lei da gravidade. Podemos arranxar estimacións de probabilidade hipotética para «explicar» esta lei do seguinte xeito. Seleccionamos acontecementos de calquera tipo que sirvan de acontecementos atómicos, por exemplo, o movemento dunha pequena partícula. Escollemos tamén o que vai ser unha propiedade primaria destes acontecementos, por exemplo, a dirección e a velocidade do movemento da partícula. Despois asumimos que os acontecementos mostran unha distribución aleatoria. Por último, calculamos a probabilidade de que todas as partículas se movan dentro dunha rexión espa308 Karl Popper cial determinada, e durante un período de tempo determinado (un «período cósmico» determinado), cunha precisión especificada, accidentalmente, do xeito requirido pola lei da gravidade. A probabilidade calculada, evidentemente, será moi pequena, en realidade case desprezable, pero non será igual a cero. Entón podemos preguntarnos pola lonxitude que tería que ter un segmento n da sucesión, noutras palabras, que duración se debe asumir para todo o proceso para que poidamos agardar, cunha probabilidade próxima a 1 (ou sen desviarse de 1 máis que un valor ε arbitrariamente pequeno), a ocorrencia dun tal período cósmico en que, como resultado dunha acumulación de accidentes, as nosas observacións cadren todas coa lei da gravidade. Para un valor tan próximo a 1 como escollamos, obtemos un número finito e definido, aínda que extremadamente grande. Entón podemos dicir: se asumimos que o segmento da sucesión sexa suficientemente longo (ou sexa, que o «mundo» dure o suficiente) entón a nosa asunción de aleatoriedade autorízanos a agardar a ocorrencia dun período cósmico en que a lei da gravidade semelle ser válida, malia que «na realidade» nunca ocorra nada máis que dispersión aleatoria. Este tipo de «explicación» por medio dunha suposición de aleatoriedade é aplicable a calquera regularidade que escollamos. De feito, deste xeito podemos «explicar» todo o noso mundo, con todas as súas regularidades observadas, como unha fase dun caos aleatorio ou como unha acumulación de coincidencias puramente accidentais. Paréceme claro que as especulacións deste tipo son «metafísicas» e que non teñen ningunha significación para a ciencia. Tamén me semella claro que isto está relacionado coa súa non falsificabilidade, co feito de que en calquera circunstancia sempre nos poderemos permitir facelas. O meu criterio de demarcación, por tanto, parece coincidir bastante co uso xeral da palabra «metafísica». 309 a lóxida da descuberta científica En consecuencia, as teorías sobre probabilidade, se se aplican sen precaucións especiais, non se deben considerar científicas. Debemos descartar o seu uso metafísico se queremos que sirvan para algo na práctica da ciencia empírica*1. 68 A probabilidade na física O problema da decidibilidade preocúpalle a un metodólogo, non a un físico*1. Se se lle pide que elabore unha teoría da probabilidade utilizable na práctica, o físico quizais poida ofrecer algo parecido a unha definición física da probabilidade, na liña do que segue: hai certos experimentos que, mesmo se se realizan baixo condicións controladas, levan a resultados diferentes. No caso dalgúns destes experimentos (os que son de «tipo casual», coma os lanzamentos dunha moeda), a repetición frecuente leva a resultados con frecuencias relativas que, continuando a repetición, aproxímanse progresivamente a un valor fixo que podemos chamar a probabilidade do acontecemento en cuestión. O *1 No momento de escribir isto, pensaba que especulacións do tipo das descritas serían doadamente identificables como inútiles pola súa aplicabilidade ilimitada. Mais parece que son máis tentadoras do que eu pensaba. Por exemplo, J. B. S. Haldane (en Nature 122, 1928, p. 808; cf. tamén Inequality of Man, p. 163 ss.) afirmou que se aceptamos a teoría da probabilidade da entropía, entón debemos aceptar como verdadeiro, ou case verdadeiro, que o mundo acabará por destruírse a si mesmo, só agardando o tempo suficiente. Este argumento repetírono frecuentemente outros, mais eu creo que é un exemplo perfecto do tipo de argumento criticado aquí, pois permitiríanos agardar, case con certeza, todo o que queiramos. Todo isto apunta aos perigos inherentes á forma existencial que os enunciados de probabilidade comparten coa maioría dos outros enunciados da metafísica. (Cf. apartado 15). *1 O problema comentado aquí foi tratado dun xeito claro e exhaustivo hai moito polos físicos P. e T. Ehrenfest, Encycl. d. Math, Wiss. 4th Teilband, Heft 6 (12-12-1911), apartado 30. Tratárono como un problema conceptual e epistemolóxico. Introduciron a idea de «hipóteses de probabilidade de primeira, segunda... k-ésima orde»: a hipótese de probabilidade de segunda orde, por exemplo, é unha estimación da frecuencia con que ocorren certas frecuencias nun total de totais. Porén, P. e T. Ehrenfest non operan con nada que corresponda á idea dun efecto reproducible, cuxo uso é aquí decisivo para resolver o problema que eles presentaron tan axeitadamente. Véxase en especial a oposición entre Boltzman e Planck a que eles se refiren nas notas 247 e seguintes, que se pode resolver usando a idea dun efecto reproducible. Isto é debido a que baixo condicións experimentais apropiadas, as flutuacións poden levar a efectos reproducibles, como demostrou tan brillantemente a teoría de Einstein do movemento Browniano. Véxase tamén a nosa nota *1 do apartado 65 e os apéndices *vi e *ix. 310 Karl Popper valor é «... determinable empiricamente mediante series longas de experimentos un grao calquera de aproximación»1, o cal explica, por certo, por que é posible falsificar unha estimación hipotética de probabilidade. Tanto os matemáticos como os lóxicos farán obxeccións ás definicións deste tipo, en particular as que se enumeran a seguir: (1) A definición non cadra co cálculo de probabilidade pois, segundo o teorema de Bernoulli, case todos os segmentos moi longos son estables estatisticamente, isto é, compórtanse como se fosen converxentes. Por esta razón, a probabilidade non se pode definir por esta estabilidade, isto é, polo comportamento cuasiconverxente, pois a expresión «case todos» (que debía aparecer na definición) non é máis que un sinónimo de «moi probable». A definición é, por tanto, circular, un feito que se pode ocultar doadamente (pero non eliminalo) quitando a palabra «case». A definición do físico cae nisto e por iso é inaceptable. (2) Cando se debe considerar que unha serie de experimentos é longa? Se non se nos dá un criterio para decidir o que é unha serie «longa», non podemos saber cando se logra, se é que se logra, unha aproximación á probabilidade. (3) Como podemos saber se xa se acadou a aproximación desexada? Aínda que a min me parece que estas obxeccións están xustificadas, sigo pensando que se pode manter a definición do físico. Para apoiar esta idea baseareime nos argumentos esbozados no apartado anterior, que demostraron que as hipóteses de probabilidade perden todo contido informativo cando se lles permite aplicación ilimitada. Pero o físico nunca as usaría deste xeito. Seguindo o exemplo do físico, eu tamén vou excluír a aplicación ilimitada de hipóteses de probabilidade: propoño 1 A cita é de Born-Jordan, Elementare Quantenmechanik, 1930, p. 306, cf. o comezo de Quantum Mechanics, de Dirac, p. 10 da 1a edición, 1930. Unha pasaxe semellante (lixeiramente abreviada) atópase na p. 14 da 3a edición, 1947. Véxase tamén Weyl, Gruppentheorie und Quantenmechanik, 2a edición, 1931, p. 66; tradución inglesa de H. P. Robertson: The Theory of Groups and Quantum Mechanics, 1931, p. 74 ss. 311 a lóxida da descuberta científica adoptar a decisión metodolóxica de non explicar nunca efectos físicos, isto é, regularidades reproducibles, como acumulacións de accidentes. Esta decisión, naturalmente, modifica o concepto de probabilidade, facéndoo máis restrinxido*2. Así que a obxección (1) non afecta á miña perspectiva, pois eu non afirmo a identidade entre os conceptos físico e matemático de probabilidade, senón que, polo contrario, eu négoa. Mais no lugar de (1) xorde unha nova obxección. (1') Cando se pode falar de «accidentes acumulados»? Presuntamente, no caso dunha probabilidade pequena, pero, cando hai que considerar que é «pequena» unha probabilidade? Pódese pensar que a proposta que acabo de facer descarta o método (tratado no apartado anterior) de fabricar unha probabilidade arbitrariamente grande a partir dunha pequena cambiando a formulación do problema matemático. Mais para levar a cabo tal decisión, temos que saber que é o que se debe considerar pequena. Nas seguintes páxinas demostrarase que a regra metodolóxica proposta cadra coa definición do físico e que as obxeccións (1'), (2) e (3) se poden contestar servíndonos dela. Para comezar, o que eu teño en mente é só un caso típico da aplicación do cálculo de probabilidade: o de certos macroefectos reproducibles que se poden describir coa axuda de (macro)leis precisas (coma a presión de gas) e que nós interpretamos (ou explicamos) que son consecuencia dunha acumulación moi grande de microprocesos, como as colisións moleculares. Outros casos típicos (como flutuacións estatísticas ou a estatística de procesos individuais aleatorios) pódense reducir a este sen moita dificultade*3. *2 A decisión ou regra metodolóxica formulada aquí restrinxe o concepto de probabilidade, do mesmo xeito que se restrinxe coa decisión de adoptar sucesións aleatorias máis curtas como modelos matemáticos de sucesións empíricas, cf. nota *1 do apartado 65. *3 Agora teño algunhas dúbidas sobre a expresión «sen moita dificultade», pois en todos os casos, excepto os dos macroefectos extremos comentados neste apartado, hai que usar métodos estatísticos moi sutís. Véxase tamén o apéndice *ix, especialmente a «Terceira Nota». 312 Karl Popper Tomemos un macroefecto deste tipo, descrito por unha lei suficientemente corroborada, que hai que reducir a sucesións aleatorias de microacontecementos. Supoñamos que a lei afirma que baixo certas condicións unha magnitude física ten o valor p. Supoñamos que o efecto é «preciso», para que non haxa flutuacións medibles, isto é, que non haxa desviacións con respecto a p alén dese intervalo ±φ (o intervalo de imprecisión; cf. apartado 37) dentro do cal as nosas medicións flutuarán de toda maneira, debido á imprecisión inherente nas técnicas de medición habituais. Nesta altura propoñemos a hipótese de que p é unha probabilidade dentro dunha sucesión α de microacontecementos, e ademais que os microacontecementos inflúen na produción do efecto. Entón (cf. apartado 61) podemos calcular para todo valor escollido δ, a probabilidade αnF(Δp), isto é, a probabilidade de que o valor medido cadre dentro do intervalo Δp. A probabilidade complementaria pódese representar polo símbolo «ε». Así, temos = ε. Segundo o teorema de Bernoulli, ε tende a cero segundo n vai aumentando sen límite. Supoñemos que é tan «pequeno» que é desprezable (a pregunta (1) sobre o significado de «pequeno» nesta asunción, tratarémola enseguida). O Δp hai que o interpretar, claramente, como o intervalo en que as medicións se aproximan ao valor p. Aquí obsérvase que as tres cantidades ε, n e Δp corresponden ás tres obxeccións (1'), (2) e (3). Δp ou δ pódese escoller arbitrariamente, o cal restrinxe a arbitrariedade da nosa escolla de ε e n. Como do que se trata é de deducir o macroefecto exacto p (±φ) non asumiremos que δ sexa máis grande que φ. En canto ao efecto reproducible p, a dedución será satisfactoria se a podemos levar a cabo para un valor δ ≤ φ (aquí φ está dado, pois vén determinado pola técnica de medición). Agora escollamos de tal xeito que sexa (aproximadamente) igual a φ. Así xa reducimos a pregunta (3) ás outras dúas preguntas, (1') e (2). Pola escolla de φ (ou sexa, de Δp) xa determinamos a relación entre n e ε, pois para todo n correspóndelle agora unica313 a lóxida da descuberta científica mente un valor de ε. Así, a pregunta (2) sobre cando se debe considerar que n é suficientemente longo, reduciuse a (1'), isto é, á cuestión de cando é ε pequeno? (e viceversa). Mais isto significa que se podían contestar as tres preguntas se fósemos quen de decidir cal é o valor concreto de ε que se debe considerar o suficientemente pequeno para ser «desprezable». A nosa regra metodolóxica equivale á decisión de desprezar os valores pequenos de , mais non estamos dispostos a comprometernos para sempre co mesmo valor definido de ε. Se lle preguntamos a un físico, isto é, se lle preguntamos que está disposto a ignorar (0.001, 0.000001, ...) probablemente respondería que ε non lle interesa en absoluto, que elixiu n e non ε, e que escollei n de tal xeito que se poida facer a correlación entre n e Δp independente de calquera cambio do valor de ε que se poidan escoller. A resposta do físico xustifícase polas peculiaridades matemáticas da distribución de Bernoulli: é posible determinar para todo n a dependencia funcional entre ε e Δp.*4 un exame desta función mostra que para todo («grande») n hai un valor característico Δp de tal que na veciñanza deste valor Δp é altamente insensible a cambios de ε. Esta insensibilidade aumenta segundo aumente n. Se tomamos un n dunha orde de magnitude *4 Os comentarios que veñen a continuación neste parágrafo (e algunhas das argumentacións posteriores deste apartado) clarifícanse e supéranse coas consideracións que aparecen no apéndice *ix; véxase, en particular, o punto 8 e seguintes da «Terceira Nota». Coa axuda dos métodos usados alí, pódese demostrar que case todas as posibles mostras estatísticas de grande dimensión n poñerán bastante en cuestión unha hipótese probabilística dada, isto é, outorgaranlle un alto grao negativo de corroboración, e nós poderiamos interpretar isto como refutación ou falsificación. Das restantes mostras, a maioría confirmarán a hipótese, isto é, outorgaranlle un alto grao positivo de corroboración. Comparativamente, poucas das mostras de grande tamaño n lle outorgarán un grao non decidido a unha hipótese de probabilidade (nin positiva nin negativa). Agardamos con isto estarmos en condicións de sermos quen de refutar unha hipótese probabilística, no senso indicado aquí, e quizais facelo con moita máis seguridade que no caso dunha hipótese non probabilística. A regra metodolóxica ou decisión de considerar (para un n grande) un grao negativo de corroboración como falsificación é, evidentemente, un caso específico da regra ou decisión metodolóxica tratada no presente apartado: a regra consistente en desprezar certas improbabilidades extremas. 314 Karl Popper que debiamos agardar no caso de fenómenos masivos extremos, entón, na veciñanza da seu valor característico, Δp é tan altamente insensible a cambios de ε que Δp case non cambia en absoluto se a orde de magnitude de ε cambia. O físico daríalle pouco valor se os límites de Δp estivesen definidos máis nitidamente. E no caso de fenómenos masivos típicos, a que se restrinxe esta investigación, Δp pode, lémbrese, considerarse que corresponde ao intervalo de precisión ±δ, que depende da nosa técnica de medición e que non ten extremos nítidos, senón o que eu denominei «extremos de condensación» no apartado 37. Diremos que n é grande cando a insensibilidade de Δp na veciñanza do seu valor característico, que podemos determinar, é polo menos tan grande que mesmo os cambios na orde de magnitude de ε fan que o valor de Δp flutúe só dentro dos extremos de condensación de ±δ (se n  ∞, entón Δp faise totalmente insensible). Mais se isto é así, entón non temos que preocuparnos pola determinación exacta de ε: basta coa decisión desprezar un pequeno, mesmo se non especificamos exactamente que é o que se debe considerar como «pequeno». Isto vén sendo equivalente á decisión de traballar cos valores característicos de Δp mencionados anteriormente, que son insensibles a cambios de ε. A regra que di que se deben desprezar as improbabilidades extremas (regra que só se fai suficientemente explícita á luz do que se dixo arriba) cumpre as esixencias da obxectividade científica. A obxección obvia a esta regra é que mesmo a meirande improbabilidade continúa a ser unha probabilidade, por moi pequena que sexa, e que, en consecuencia, mesmo os procesos máis improbables (isto é, aqueles que nós propoñemos desprezar) ocorrerán algún día. Mais esta obxección pódese rexeitar se lembramos a idea dun efecto físico reproducible, unha idea que está intimamente relacionada coa de obxectividade (cf. apartado 8). Eu non nego que poidan ocorrer acontecementos improbables. Por exemplo, eu non digo que as moléculas dun volume 315 a lóxida da descuberta científica pequeno de gas non poidan, talvez, durante un breve período de tempo, retirarse a unha parte do volume ou que nunca vaian ocorrer flutuacións espontáneas de presión nun volume maior. O que si afirmo eu é que as ocorrencias non serían efectos físicos pois, debido á súa enorme improbabilidade, non son reproducibles á vontade. Mesmo se un físico observase tal proceso por casualidade, non sería capaz de reproducilo e, por tanto, non sería capaz nunca de decidir que é o que ocorreu realmente neste caso, ou mesmo pode sospeitar se non se trataría dun erro na observación pola súa parte. Se, así e todo, observamos desviacións reproducibles dun macroefecto deducido dunha estimación de probabilidade do xeito indicado, entón deberemos asumir que a estimación de probabilidade foi falsificada. Tales consideracións axúdannos a comprender pronunciamentos como o de Eddington, en que este distingue dous tipos de leis físicas: «Algunhas cousas nunca ocorren no mundo físico porque son imposibles e outras porque son improbables. As leis que impiden as primeiras son leis físicas, as que impiden as segundas son leis secundarias»2. Aínda que esta formulación quizais sexa susceptible dalgunha crítica (eu preferiría absterme de afirmacións non comprobables sobre se ocorren ou non cousas extremadamente improbables), coincide bastante ben coa aplicación que fai o físico da teoría da probabilidade. Outros casos aos que se pode aplicar a teoría da probabilidade, como as flutuacións estatísticas ou a estatística de acontecementos aleatorios individuais, son redutibles ao caso que estamos comentando, o do macroefecto medible con precisión. Por flutuacións estatísticas entendo fenómenos como o movemento browniano, onde o intervalo de precisión de medición (±δ) é máis pequeno que o intervalo Δp característico do número n de microacontecementos que inflúen no efecto, por iso se agarda que as desviacións medibles con respecto a p sexan 2 Eddington, The Nature of the Physical World, 1928, p. 75. 316 Karl Popper altamente probables. O feito de que ocorran tales desviacións será comprobable, debido a que a propia flutuación se converte nun efecto reproducible. Para esta finalidade son aplicables as miñas argumentacións anteriores: as flutuacións que vaian alén de certa magnitude (alén de certo intervalo Δp) non deben ser reproducibles, segundo os meus requisitos metodolóxicos, nin tampouco sucesións de flutuacións nunha e a mesma dirección, etc. Argumentos correspondentes son aplicables á estatística de acontecementos aleatorios individuais. Vou facer agora un breve resumo dos meus argumentos en relación co problema da decidibilidade. A nosa pregunta era: como poden as hipóteses de probabilidade (que son non falsificables, como vimos) desempeñar o papel de leis naturais na ciencia empírica? A nosa resposta é esta: os enunciados de probabilidade, na medida en que non son falsificables, son metafísicos e non teñen significación empírica. Na media en que se usen como enunciados empíricos, farano como enunciados falsificables. Mais con esta resposta xorde outra pregunta: como é posible que os enunciados de probabilidade (que non son falsificables) se poidan usar como enunciados falsificables? (o feito de que se poidan usar deste xeito non se cuestiona: o físico sabe perfectamente cando considerar falsificada unha asunción de probabilidade). Esta pregunta, para nós, presenta dous aspectos. Por un lado, debemos facer que a posibilidade de usar enunciados de probabilidade sexa comprensible en termos da súa forma lóxica. Por outro lado, temos que analizar as regras que gobernan o seu uso como enunciados falsificables. Segundo o apartado 66, os enunciados básicos aceptados poden corresponder mellor ou peor cunha estimación de probabilidade proposta e poden representar mellor ou peor un segmento típico dunha sucesión de probabilidade. Isto ofrécenos a oportunidade de aplicar algún tipo de regra metodolóxica, por exemplo, unha regra que esixa que a correspondencia entre 317 a lóxida da descuberta científica enunciados básicos e estimacións de probabilidade se adecúe a un termo medio mínimo. Así, a regra pode marcar unha liña arbitraria e decretar que só se «permiten» segmentos razoablemente representativos (ou «mostras razoablemente representativas»), mentres que están «prohibidos» os segmentos non representativos. unha análise máis polo miúdo desta afirmación mostrábanos que a liña divisoria entre o que está permitido e o que está prohibido non ten por que marcarse tan arbitrariamente como podería parecer a primeira vista. En especial, non hai necesidade de a marcar de xeito «tolerante», pois é posible enmarcar a regra de tal xeito que a liña divisoria se determine, como ocorre con outras leis, pola precisión que as nosas medicións poidan acadar. A nosa regra metodolóxica, proposta de acordo co criterio de demarcación, non prohibe a ocorrencia de segmentos atípicos, nin prohibe a ocorrencia repetida de desviacións (que, xaora, son típicas de sucesións de probabilidade). O que esta regra prohibe é a ocorrencia reproducible e predicible de desviacións sistemáticas, como as desviacións nunha dirección concreta ou a ocorrencia de segmentos que son atípicos dunha maneira definida. Así que o que require non é unha correspondencia aproximada, senón a mellor correspondencia posible para todo o que é reproducible e comprobable, ou sexa, para todos os efectos reproducibles. 69 Lei e azar ás veces óese dicir que os movementos dos planetas obedecen leis estritas, mentres que o resultado do lanzamento dun dado dise que é fortuíto ou que está suxeito ao azar. Na miña opinión a diferenza entre os dous está no feito de que polo de agora só fomos quen de predicir con éxito o movemento dos planetas, pero non os resultados individuais no lanzamento dos dados. 318 Karl Popper Para poder deducir predicións fan falta leis e condicións iniciais. Se non dispoñemos de leis apropiadas ou se non se poden determinar as condicións iniciais, non pode funcionar o método científico da predición. No lanzamento de dados do que carecemos é, claramente, de coñecemento suficiente sobre as condicións iniciais. Con medicións suficientemente precisas das condicións iniciais, sería posible facer predicións neste caso tamén, mais as regras do xogo dos dados (que esixen bater sempre o dado nun vasiño) foron escollidas precisamente para evitar a medición das condicións iniciais. As regras de xogo e outras regras que determinan as condicións baixo as que van ter lugar os varios acontecementos dunha sucesión aleatoria denominareinas condicións do marco. Son requisitos do tipo de que os dados teñen que ser «regulares» (feitos de materiais homoxéneos), que hai que os bater ben antes de lanzalos, etc. hai outros casos en que as predicións poden non funcionar: talvez porque non foi posible formular leis apropiadas, ou talvez porque fracasasen todos os intentos de atopar unha lei, co cal totas as predicións serían falsificadas. En tales casos é posible que nos desesperemos por non sermos quen de atopar unha lei satisfactoria (mais é improbable que deixemos de intentalo a non ser que o problema non nos interese demasiado, que pode ocorrer, por exemplo, se nos conformamos con predicións de frecuencia). Con todo, en ningún caso, podemos dicir irrevogablemente que non existen leis nun campo concreto (esta é unha consecuencia da imposibilidade de verificación). Isto significa que desde a miña perspectiva o concepto de azar se converte en subxectivo*1. Eu falo de «azar» cando o noso coñecemento non é suficiente para a predición, como no caso do xogo dos dados, onde falamos de «azar» ou casualidade porque non temos coñe- *1 Isto non significa que eu faga aquí ningunha concesión á interpretación subxectiva da probabilidade, da desorde ou da aleatoriedade. 319 a lóxida da descuberta científica cemento das condicións iniciais (e é posible concibir que un físico equipado con bos instrumentos sexa quen de predicir un lanzamento que outros non poidan predicir). En oposición a esta perspectiva subxectiva, hai quen defende unha perspectiva obxectiva. Mais, tendo en conta que esta perspectiva obxectiva fai uso da idea metafísica de que os acontecementos están, ou non están, determinados en si mesmos, eu non me vou deter aquí no seu exame (cf. apartado 71 e 78). Se temos éxito nas nosas predicións, entón podemos falar de «leis», e se non o temos, non podemos saber nada sobre a existencia ou inexistencia de leis ou de irregularidades*2. En vez desta idea metafísica, se cadra paga máis a pena considerar estoutra perspectiva: pódese dicir que estamos ante unha «casualidade» no senso obxectivo cando se corroboran as nosas estimacións de probabilidade, do mesmo xeito que estamos ante regularidades causais cando se corroboran as nosas predicións deducidas de leis. A definición de casualidade implícita nesta perspectiva pode que non sexa totalmente inservible, mais débese subliñar con toda claridade que este concepto de casualidade non se opón ao concepto de lei: esta é a razón pola que denominei as sucesións de probabilidade como «aleatorias» ou de «tipo casual». En xeral, unha sucesión de resultados experimentais será de carácter casual se as condicións do marco que definen a sucesión difiren das condicións iniciais: cando os experimentos individuais, realizados baixo condicións de marco idénticas, procedan baixo condicións iniciais diferentes e que, por tanto, *2 Neste parágrafo descartei (polo seu carácter metafísico) unha teoría metafísica que agora, no Postscript, recomendo con entusiasmo porque me semella que abre novas perspectivas, suxire vías de resolución de dificultades serias e, se cadra, é verdade. Malia que cando escribín este libro era consciente de manter crenzas metafísicas, e malia que mesmo sinalei o valor de suxestión que as ideas metafísicas podían ter para a ciencia, non me decataba de que algunhas doutrinas metafísicas se podían argumentar racionalmente e tamén, malia seren irrefutables, que eran criticables. Véxase, en especial, o último apartado do Postscript. 320 Karl Popper darán resultados diferentes. Se hai ou non sucesións de carácter casual cuxos elementos non sexan predicibles de ningunha maneira, eu non o sei. Do feito de que unha sucesión sexa de carácter casual nin sequera podemos inferir que os seus elementos non sexan predicibles, nin que sexan «debidos á casualidade» no senso subxectivo de coñecemento insuficiente, así que moito menos poderemos inferir diso o feito «obxectivo» de que non hai «leis»*3. Non só é imposible inferir nada do carácter casual da sucesión sobre a conformidade ou non conformidade cunha lei dos acontecementos individuais: nin sequera é posible inferir da corroboración de estimacións de probabilidade que a sucesión en si sexa completamente irregular. Isto é debido a que sabemos que existen sucesións de carácter casual que se constrúen segundo unha regra matemática (cf. apéndice iv). O feito de que unha sucesión teña unha distribución Bernoulliana non é síntoma de ausencia de lei «por definición»1. No éxito de predicións de probabilidade non debemos ver máis que un síntoma da ausencia de leis simples na estrutura da sucesión (cf. apartados 43 e 58), en oposición aos acontecementos que a constitúen. Corrobórase unha suposición de liberdade de reprecusións posteriores, o cal é equivalente á hipótese de que non se poden descubrir tales leis simples, pero isto é todo. *3 Isto resultaría máis claro, paréceme, se se presentase o argumento como segue: nunca podemos repetir un experimento de xeito preciso, só podemos manter certas condicións constantes, dentro de certos límites. Non serve como argumento a favor da casualidade obxectiva, ou aleatoriedade ou ausencia de lei, que certos aspectos dos resultados se repitan, mentres que outros varíen irregularmente, especialmente se as condicións do experimento (como ocorre cando se fai xirar unha moeda) se deseñan co obxectivo de facer variar as condicións. Ata o de agora, continúo a estar de acordo co que dixen. Mais pode haber outros argumentos a favor da casualidade obxectiva: un deles débeselle a Alfred Landé («folla de Landé») e é altamente relevante neste contexto. Comentáse en profundidade no Postscript, apartados *90 e seguintes. 1 Como di Schlick en Die Kausalität in der gegenwärtigen Physik, Naturwissenschaften 19, 1931, p. 157. 321 a lóxida da descuberta científica 70 A deducibilidade de macroleis partindo de microleis Malia que foi duramente criticada en tempos recentes, hai unha doutrina que case se converteu nun prexuízo: a que afirma que todos os acontecementos observables se deben explicar como macroacontecementos, isto é, como termos medios, acumulacións ou sumas de certos microacontecementos (a doutrina ten semellanzas con certas formas de materialismo). Coma outras doutrinas deste tipo, isto semella ser unha hipostatización metafísica dunha regra metodolóxica que por si soa non ten nada de obxectable. refírome á regra que afirma que debemos intentar simplificar, xeneralizar ou unificar as teorías mediante o emprego de hipóteses explicativas do tipo das mencionadas (ou sexa, hipóteses que explican os efectos observables como sumas ou integracións de microacontecementos). Para avaliarmos tales intentos, sería un erro pensar que as hipóteses non estatísticas sobre microacontecementos e as súas leis de interacción poden ser suficientes para explicar macroaconotecementos, debido a que para iso se necesitan ademais estimacións de frecuencia hipotéticas, xa que as conclusións estatísticas só se poden deducir de premisas estatísticas. As estimacións de frecuencia son sempre hipóteses independentes que ás veces se nos ocorren cando estamos estudando as leis relativas aos microacontecementos, mais que nunca se poden deducir destas leis. As estimacións de frecuencia forman unha clase especial de hipóteses: son prohibicións que, por así dicir, afectan ás regularidades en xeral1. Von Mises expresou isto de xeito moi claro: «Nin sequera o teorema máis pequeno da teoría cinética dos gases se deduce soamente da física clásica, sen suposicións adicionais de tipo estatístico»2. 1 Con razón afirma A. March (Die Grundlagen der Quantenmechanik 1931, p. 250) que as partículas dun gas non se poden comportar «... como queiran; cada unha ten que comportarse de acordo co comportamento das outras. Pódese considerar que un dos principios fundamentais da teoría cuántica é que o todo é máis que a mera suma das partes». 2 Von Mises, Über kausale und statistische Gesetzmässigkeiten in der Physik, Erkenntnis 1, 1930, p. 207 (cf. Naturwissenschaften 18, 1930). 322 Karl Popper As estimacións estatísticas, ou estimacións de frecuencia, nunca se poden deducir simplemente de leis de tipo «determinista», porque para deducir predicións de tales leis necesítanse as condicións iniciais. En lugar destas, introdúcense suposicións sobre a distribución estatística das condicións iniciais (ou sexa, suposicións estatísticas concretas) en toda dedución en que as leis estatísticas se obteñen partindo de microsuposicións de carácter determinista ou «preciso»*1. Chama a atención que as suposicións de frecuencia da física teórica sexan en grande medida hipóteses de equiprobabilidade, mais isto non implica que sexan «evidentes» por si mesmas ou válidas a priori. Que están ben lonxe de selo pódese observar polas amplas diferenzas entre a estatística clásica, a estatística de Bose-Einstein e a de Fermi-Dirac, que mostran como as suposicións especiais se poden combinar cunha hipótese de equiprobabilidade, o cal leva en cada caso a definicións diferentes das sucesións de referencia e das propiedades primarias para as que se presupón igual distribución. O seguinte exemplo pode ilustrar, talvez, o feito de que as suposicións de frecuencia son indispensables mesmo cando nos sintamos inclinados a prescindir delas. Imaxinemos unha fervenza. Se cadra albiscamos algunha regularidade curiosa: o tamaño das correntes que forman a fervenza varía e, de vez en cando, cae un chorro que salpica por fóra, mais mentres ocorren todas estas variacións mani- *1 Esta tese, proposta por von Mises e adoptada por min, foi criticada por varios físicos, entre eles P. Jordan (véxase Anschauliche Quantentheorie, 1936, p. 282, onde Jordan usa como argumento contra a miña tese o feito de que recentemente se probasen certas formas da hipótese ergódica). Mais na forma en que as conclusións probabilísticas necesitan premisas probabilísticas (por exemplo, premisas da teoría da medición en que entran certas asuncións equiprobabilísticas), paréceme que os exemplos de Jordan reforzan a miña teoría, máis que invalidala. Outro que foi crítico con esta tese foi Albert Einstein, que a criticou no último parágrafo dunha interesante carta que reimprimimos aquí no apéndice *xii. Eu creo que Einstein daquela tiña en mente unha interpretación subxectiva da probabilidade e un principio de indiferenza (que na teoría subxectiva semella coma se non fose unha suposición sobre equiprobabilidades). Moito máis tarde Einstein adoptou, polo menos a xeito de proba, unha interpretación de frecuencia (da teoría cuántica). 323 a lóxida da descuberta científica féstase unha regularidade que apunta claramente a un efecto estatístico. Deixando a un lado algúns problemas non resoltos de hidrodinámica (sobre a formación de remuíños, etc.), en principio, somos quen de predicir o curso dun volume de auga (poñamos, un grupo de moléculas) co grao de precisión que se queira, sempre que se proporcionen condicións iniciais suficientemente precisas. Así, podemos supoñer que seriamos quen de predicir dunha molécula calquera, moi por riba da fervenza, en que punto pasará polo borde, en cal chegará ao fondo, etc. Deste xeito, en principio, pódese calcular o curso dun número calquera de partículas e, se se proporcionan condicións iniciais suficientes, deberiamos ser capaces de deducir cada unha das flutuacións estatísticas individuais da fervenza. Mais só se poderían obter esta ou aquela flutuación individual, non as regularidades estatísticas recorrentes de que falabamos anteriormente, e moito menos a distribución estatística xeral como tal. Para poder explicar estas, necesitamos estimacións estatísticas, ou polo menos a suposición de que certas condicións iniciais recorrerán reiteradamente en moitos grupos diferentes de partículas (o cal equivale e un enunciado universal). un resultado estatístico obtense se e só se facemos tales asuncións estatísticas específicas, por exemplo, asuncións sobre a distribución de frecuencia de condicións iniciais recorrentes. 71 Enunciados de probabilildade formalmente singulares Digo que un enunciado de probabilidade é «formalmente singular» cando asigna unha probabilidade a unha ocorrencia única ou a un elemento único dunha certa clase de ocorrencias*1, por exemplo, «a probabilidade de que saia cinco no seguinte lanzamento do dado é 1/6» ou «a probabilidade de que saia *1 Co termo formalistisch do orixinal alemán pretendíase transmitir a idea dun enunciado que é singular en forma (ou «formalmente singular») aínda que o seu significado se pode definir, en realidade, por enunciados estatísticos. 324 Karl Popper cinco nun lanzamento solto calquera (deste dado) é 1/6». Desde o punto de vista da teoría da frecuencia considérase que tales enunciados non son correctos de todo na súa formulación, pois as probabilidades non se poden asignar a ocorrencias únicas, senón a sucesións infinitas de ocorrencias ou acontecementos. É doado, con todo, interpretar que estes enunciados son correctos mediante a definición apropiada de probabilidades formalmente singulares coa axuda do concepto de probabilidade obxectiva ou frecuencia relativa. uso «αPk(ß)»para designar a probabilidade formalmente singular de que unha certa ocorrencia k teña a propiedade β, en tanto que elemento dunha sucesión α (en símbolos1, k ε α) e despois defino a probabilidade formalmente singular como segue: αPk(ß) = αF(β) | (k ε α) (Definición) Isto pódese expresar en palabras así: a probabilidade formalmente singular de que o acontecemento singular k teña a propiedade β (dado que k é un elemento da sucesión α), por definición, é igual á probabilidade da propiedade β na sucesión de referencia α. Esta definición, que de tan simple é case obvia, móstrasenos sorprendentemente útil. Mesmo nos pode axudar a aclarar algúns dos intricados problemas da teoría cuántica moderna (véxanse os apartados 75-76). Como mostra a definición, un enunciado de probabilidade formalmente singular sería incompleto se non fixese explícita a clase de referencia. Mais, malia que moitas veces α non se menciona explicitamente, normalmente sabemos de que α se trata. Así, o primeiro exemplo ofrecido anteriormente non especifica ningunha sucesión de referencia α, mais está bastante claro que se refire a todas as sucesións de lanzamentos con dados regulares. 1 O signo «...ε...», denominado cópula, quere dicir «... é un elemento da clase ...», ou tamén «... é un elemento da sucesión...» 325 a lóxida da descuberta científica En moitos casos pode haber varias sucesións de referencias diferentes para un acontecemento k. Nestes casos resultará obvio que sobre o mesmo acontecemento se poden facer diferentes enunciados de probabilidade formalmente singulares. Así, a probabilidade de que un individuo k morra nun período de tempo dado pode asumir valores moi diferentes segundo o consideremos como membro do seu grupo de idade, do seu grupo ocupacional, etc. Non é posible determinar unha regra sobre cal das varias posibles clases de referencia se debería escoller. (A clase de referencia máis restrinxida con frecuencia é a máis adecuada, sempre que sexa o suficientemente numerosa para permitir que a estimación de probabilidade se basee nunha extrapolación estatística razoable e mais que se apoie nunha cantidade suficiente de evidencia corroboradora). Non poucos dos chamados paradoxos da probabilidade desaparecen unha vez que nos decatamos de que se poden asignar diferentes probabilidades á mesma ocorrencia ou acontecemento, na medida en que é un elemento de diferentes clases de referencia. Por exemplo, ás veces dise que a probabilidade αPk(ß) dun acontecemento antes da súa ocorrencia é diferente da probabilidade do mesmo acontecemento despois de que ocorreu: antes, podía ser igual a 1/6, mentres que despois só pode ser igual a 1 ou 0. Esta opinión é, obviamente, bastante equivocada. αPk(ß) sempre é a mesma, antes e despois da ocorrencia. Nada cambiou, excepto que, sobre a base da información k ε β (ou k ε ) –información que nos pode ser proporcionada ao observar a ocorrencia– podemos escoller unha nova clase de referencia, en concreto β (ou ), e despois preguntar cal é o valor de ßPk(ß) = 0. O valor desta probabilidade, xaora, é 1, igual que Pk(ß) = 0. Os enunciados que nos informan sobre o resultado real de ocorrencias únicas (enunciados que non son sobre frecuencia, senón da forma «k ε φ») non poden cambiar a probabilidade destas ocorrencias. Poden, así e todo, indicarnos a escolla doutra clase de referencia. 326 Karl Popper O concepto dun enunciado de probabilidade formalmente singular ofrécenos unha especie de ponte coa teoría subxectiva e, por tanto, como veremos no apartado seguinte, tamén coa teoría do ámbito. Isto é debido a que podemos convir interpretar a probabilidade formalmente singular como «grao de crenza racional» (seguindo a Keyness), sempre que as nosas «crenzas racionais» estean guiadas por un enunciado de frecuencia obxectivo. Esta é, logo, a información da que dependen as nosas crenzas. Noutras palabras, pode ocorrer que non saibamos nada dun acontecemento excepto que pertence a unha clase de referencia na que se comprobase con éxito algunha estimación de probabilidade. Esta información non nos permite predicir cal será a propiedade do acontecemento en cuestión, mais permítenos expresar todo o que sabemos sobre el por medio dun enunciado de probabilidade formalmente singular que ten a aparencia dunha predición indefinida sobre o acontecemento particular en cuestión*2. Así que eu non fago obxeccións á interpretación subxectiva de enunciados de probabilidade sobre acontecementos únicos, isto é, a que sexan interpretados como predicións indefinidas: como confesións, por así dicir, do noso deficiente coñecemento sobre o acontecemento particular en cuestión (sobre o cal, desde logo, nada se deduce dun enunciado de frecuencia). Non fago obxeccións, enténdase, sempre que se recoñeza que os enunciados de frecuencia obxectivos son fundamentais, pois só estes son empiricamente comprobables. rexeito, con todo, calquera interpretación dos enunciados de probabilidade formalmente singulares (as predicións indefinidas) como enunciados sobre un estado de cousas obxectivo, que non sexa o estado de cousas *2 Na actualidade penso que a cuestión da relación entre as varias interpretacións da teoría da probabilidade se pode abordar dun xeito moito máis simple: proporcionando un sistema formal de axiomas ou postulados e probando que as varias interpretacións o cumpren. Así que considero superadas moitas das consideracións ofrecidas no resto deste capítulo (apartados 71 e 72). Véxase o apéndice *iv e os capítulos *ii, *iii e *v do Postscript. Mais continúo a estar de acordo coa meirande parte do que escribín, sempre que as clases de referencia sexan determinadas polas condicións que definen un experimento, de xeito que as 'frecuencias' se poidan considerar como resultado de propensións. 327 a lóxida da descuberta científica estatístico obxectivo. O que teño en mente é a idea de que un enunciado sobre a probabilidade 1/6 no lanzamento de dados non é unha simple confesión de que non sabemos nada definido (teoría subxectiva), senón máis ben unha afirmación sobre o próximo lanzamento (unha afirmación de que o resultado é á vez indeterminado e non determinado obxectivamente), algo que aínda está no ar*3. Considero errados todos estes intentos de interpretación obxectiva (tratados en profundidade por Jeans, entre outros). Por moito ar indeterminista que estas interpretacións pretendar atribuírense, todas implican a idea metafísica de que non só podemos deducir e comprobar predicións, senón tamén que tamén implican ademais a idea de que a natureza está máis ou menos «determinada» (ou «non determinada»), de tal xeito que o éxito (ou fracaso) das predicións hai que o explicar, non polas leis das que se deducen, senón, por riba de todo isto, polo feito de que a natureza está realmente constituída (ou non constituída) segundo estas leis*4. 72 A teoría do ámbito No apartado 34 afirmei que un enunciado que é falsificable nun grao superior a outro enunciado se pode describir como o que é loxicamente máis improbable, e que o enunciado menos falsificable é loxicamente máis probable. O enunciado loxicamente menos probable implica1 o loxicamente máis probable. Entre este concepto de probabilidade lóxica e o de probabilidade numérica formalmente singular hai afinidades. Algúns dos filósofos da probabilidade (Bolzano, von Kries, Waismann) tentaron *3 Hoxe en día non faría obxeccións á idea de que un acontecemento poida estar no ar e mesmo creo que a mellor interpretación da teoría da probabilidade é en termos dunha teoría da propensión dos acontecementos a resultar dun xeito ou doutro (véxase o Postscript). Mais teño que continuar a facer obxeccións á idea de que a teoría da probabilidade se deba interpretar así. Noutras palabras, considero a interpretación de propensións como unha conxectura sobre a estrutura do mundo. *4 Esta caracterización algo despectiva cadra perfectamente coas opinións que someto a discusión no «Epílogo metafísico» do Postscript, baixo o nome de «interpretación de propensión da probabilidade». 1 Normalmente (cf. apartado 35) 328 Karl Popper basear o cálculo da probabilidade no concepto de ámbito lóxico e, por tanto, nun concepto que (cf. apartado 37) coincide co de probabilidade lóxica. Ao levar isto a cabo, tamén tentaron achar as afinidades entre a probabilidade numérica e a lóxica. Waismann2 propuxo medir o grao de interrelación entre os ámbitos lóxicos de varios enunciados (as súas razóns, por dicilo así) por medio das frecuencias relativas correspondentes e, por tanto, considerar que as frecuencias determinan un sistema de medicións para os ámbitos. A min paréceme que é factible erguer unha teoría da probabilidade sobre este alicerce. De feito, podemos dicir que este plan vén sendo o mesmo que facer correspondencias entre frecuencias relativas e certas «predicións indefinidas», como fixemos nós no apartado anterior, cando definimos os enunciados de probabilidade formalmente singulares. Débese dicir, con todo, que este método de definir a probabilidade só é practicable cando xa se construíu previamente unha teoría de frecuencia. Se non, un tería que preguntarse como se definiron, á súa vez, as frecuencias usadas na definición do sistema de medición. En cambio, se xa dispoñemos dunha teoría de frecuencia, entón en realidade é superflua a introdución dunha teoría do ámbito. Mais, malia esta obxección, eu considero que ten sentido a aplicabilidade práctica da proposta de Waismann. Sempre resulta satisfactorio descubrir que unha teoría máis global poida salvar as distancias, que ao comezo semellaban insalvables, entre os varios intentos de abordar o problema, especialmente entre a interpretación obxectiva e a subxectiva. Así e todo, a proposta de Waismann esixe algunha lixeira modificación. O seu concepto de razón dos ámbitos (cf. nota 2 do apartado 48) non só presupón que os ámbitos se poden comparar coa axuda das súas relacións de subclase (ou as súas 2 Waismann, Logische Analyse des Wahrscheinlichkeitsbegriffes, Erkenntnis 1, 1930, p. 128 ss. 329 a lóxida da descuberta científica relacións de implicación), mais tamén presupón, de xeito máis xeral, que se poden facer comparables mesmo os ámbitos que só se sobrepoñen parcialmente (ámbitos de enunciados non comparables). Esta última suposición, no entanto, que implica considerables dificultades, é superflua. É posible mostrar que en tales casos (tal coma os casos de aleatoriedade), a comparación de subclases e a de frecuencias teñen que producir resultados análogos. Isto xustifica que se fagan correlacións de frecuencias con ámbitos co obxectivo de medir estes últimos. Ao realizar isto estamos facendo que os enunciados en cuestión (non comparables polo método da subclase) sexan comparables. Indico a grandes trazos como se pode xustificar este modo de proceder. Se entre dúas clases de propiedades γ e β existe unha relación de subclase γ  β entón temos: (k)[Fsb (k ε γ) ≥ Fsb (k ε ß)] (cf. apartado 33) de xeito que a probabilidade lóxica ou o ámbito do enunciado (k ε γ) ten que ser máis pequeno que, ou igual a, o de (k ε β). Só será igual se hai unha clase de referencia α (que pode ser a clase universal) con respecto á que é válida a seguinte regra, que se pode dicir que ten a forma dunha «lei da natureza»: (x) {[x ε (α . ß)]  (x ε γ)} Se esta «lei da natureza» non é válida, de xeito que teríamos que asumir aleatoriedade neste aspecto, entón é válida a desigualdade. Mais neste caso obtemos, sempre que α sexa numerable e aceptable como sucesión de referencia: αF(γ) < αF(β) Isto significa que, no caso da aleatoriedade, unha comparación de ámbitos ten que levar á mesma desigualdade que unha 330 Karl Popper comparación de frecuencias relativas. Segundo isto, se temos aleatoriedade, podemos facer correlacións entre frecuencias relativas e ámbitos, para que os ámbitos sexan medibles. Mais isto é xustamente o que fixemos nós, malia que indirectamente, no apartado 71, cando definimos o enunciado de probabilidade formalmente singular. De feito, partindo das suposicións feitas, podiamos ter inferido directamente que αPk (γ) < αPk (β) Así que volvemos ao noso punto de partida, ao problema da interpretación da probabilidade. E agora vemos que o conflito entre teorías obxectivas e subxectivas, que ao comezo semellaba tan irredutible, se pode eliminar sen máis mediante a definición, que dalgún xeito é obvia, da probabilidade formalmente singular. 331 a lóxida da descuberta científica 9 ALGUNHAS OBSERVACIÓNS SOBRE A TEORÍA CUÁNTICA A análise que fixemos da probabilidade puxo ao noso dispor instrumentos que agora podemos poñer a proba aplicándoos a un dos problemas actuais da ciencia moderna. Servíndome deles, tentarei analizar e explicar algúns dos puntos máis escuros da teoría cuántica moderna. O meu intento, algo atrevido, de abordar, con métodos filosóficos e lóxicos, un dos problemas centrais da física, está condenado a ser observado con desconfianza por parte dun físico. Malia admitir que este escepticismo é san e que o físico ten boas razóns para desconfiar, eu agardo ser quen de disipar a súa desconfianza. Débese lembrar que en toda disciplina científica poden xurdir cuestións que son maiormente lóxicas. Non cabe ningunha dúbida de que os teóricos ou teóricas da física cuántica teñen participado activamente en discusións epistemolóxicas. Isto pode ser unha indicación de que eles mesmos intúen que a solución dalgúns dos problemas aínda non resoltos da teoría cuántica se pode atopar na terra de ninguén situada entre a lóxica e a física. Comezarei por adiantar as principais conclusións que se tirarán da miña análise: (1) hai algunhas fórmulas matemáticas da teoría cuántica que heisenberg interpretou en termos do seu principio de incerteza, isto é, como enunciados sobre ámbitos de incerteza debido aos límites de precisión que podemos acadar nas nosas medicións. Estas fórmulas, como tentarei demostrar, deben ser interpretadas como enunciados de probabilidade formalmente singulares (cf. apartado 71), o cal significa, á súa vez, que teñen que interpretar estatisticamente. As fórmulas en cuestión, interpretadas deste xeito, afirman que se manteñen certas 332 Karl Popper relacións entre certos ámbitos de «dispersión», «diseminación» ou «varianza» estatística (aquí denominarémolas «relacións de dispersión estatística»). (2) As medicións dun maior grao de precisión do que permite o principio de incerteza non son incompatibles, como tentarei demostrar, co sistema de fórmulas da teoría cuántica ou coa súa interpretación estatística. Así, a teoría cuántica non sería refutada necesariamente aínda que algún día fosen posibles medicións de tal grao de precisión. (3) A existencia de límites de precisión atinxible, afirmada por heisenberg, non sería, xa que logo, unha consecuencia lóxica deducible das fórmulas da teoría. Sería máis ben unha suposición separada ou adicional. (4) Tentarei demostrar, ademais, que a suposición adicional de heisenberg en realidade contradí as fórmulas da teoría cuántica se estas se interpretan estatisticamente. Pois non só son compatibles as medicións máis precisas coa teoría cuántica, senón que mesmo é posible describir experimentos imaxinarios que mostran a posibilidade de medicións máis precisas. Na miña opinión esta contradición é a que crea todas esas dificultades que ameazan a admirable estrutura da moderna física cuántica ata o punto de que Thirring chegou a afirmar que a teoría cuántica «continúa a ser un misterio impenetrable para os seus propios creadores, segundo eles mesmos admitiron»1. O que vén a continuación poderíase caracterizar, se cadra, como unha investigación sobre os fundamentos da teoría cuántica.2 Tentarei evitar todo argumento matemático e, cunha soa 1 H. Thirring, «Die Wandlung des Begriffssystems der Physik» (en Krise und Neuaufbau in den exakten Wissenschaften, Fünf Wiener Vorträge, de Mark, Thirring, Hahn, Nobeling, Menger; Verlag Deuticke, Wien e Leipzig, 1933, p. 30). 2 No que segue limítome a tratar a interpretación da física cuántica, mais omito problemas relativos aos campos de onda (a teoría de Dirac de emisión e absorción, a «segunda cuantización» das ecuacións de campo de Maxwell-Dirac. Menciono esta restrición porque aquí hai problemas, como a interpretación da equivalencia entre un campo de onda e un gas corpuscular, aos que son aplicables os meus argumentos (se é que o son) só en caso de seren adaptados a estes problemas con sumo coidado. 333 a lóxida da descuberta científica excepción, toda fórmula matemática. Isto é posible porque eu non cuestiono a corrección do sistema de fórmulas matemáticas da teoría cuántica. Só me vou ocupar das consecuencias lóxicas da súa interpretación física, que se debe a Born. En canto á polémica sobre a «causalidade», a miña proposta difire da metafísica indeterminista tan popular hoxe en día. O que a distingue da metafísica determinista, ata hai pouco en voga entre os físicos, non é tanto a súa maior lucidez, senón a súa maior esterilidade. En aras da claridade, a miña crítica resultará dura ás veces. Así que quero deixar ben claro que considero que o que conseguiron os creadores da moderna teoría cuántica é un dos maiores logos de toda a historia da ciencia*1. 73 O programa de heisenberg e as relacións de incerteza Cando tentou establecer a teoría atómica sobre novas bases, heisenberg comezou cun programa epistemolóxico1: liberar a teoría de «non observables», isto é, de magnitudes inaccesibles para a observación empírica. liberala, poderiamos dicir, de elementos metafísicos. Na teoría de Bohr, que lle serviu de precedente á de heisenberg, aparecían tales magnitudes non observables: non había nada que fose observable pola experimentación que correspondese ás órbitas dos electróns ou mesmo ás frecuencias das súas revolucións (pois as frecuencias emitidas que se podían observar como liñas espectrais non se podían identificar coas frecuencias das revolucións do electrón). heisenberg *1 Non cambiei de opinión con respecto a isto, nin tampouco con respecto aos puntos fundamentais da miña crítica. Mais si cambiei as miñas interpretacións da teoría cuántica e mais da teoría da probabilidade. A miña concepción actual atópase no Postscript, onde defendo, independentemente da teoría cuántica, o indeterminismo. Excepto o apartado 77 (que está baseado nun erro), continúo considerando importante o presente capítulo, en especial o apartado 76. 1 W. Heisenberg, Zeitschrift für Physik 33, 1925, p. 879. No que segue fago referencia sobre todo á obra de Heisenberg Die physikalischen Prinzipien der Quantentehrorie, 1930. Tradución inglesa de C. Eckart e F. C. Hoyt: The Physical Principles of the Quantum Theory, Chicago, 1930. 334 Karl Popper agardaba poder curar as deficiencias da teoría de Bohr mediante a eliminación destas magnitudes non observables. hai certa semellanza entre esta situación e a situación á que se enfrontou Einstein cando tentou reinterpretar a hipótese de contracción de lorentz-Fitzgerald. Esta hipótese tentaba explicar o resultado negativo dos experimentos de Michelson e Morley facendo uso de magnitudes non observables coma os movementos relativos ao éter inmóbil de lorentz, isto é, magnitudes inaccesibles á comprobación experimental. Tanto neste caso coma no da teoría de Bohr, as teorías que había que reformar explicaban certos procesos naturais observables, mais as dúas usaban a insatisfactoria suposición de que existen acontecementos físicos e magnitudes definidas fisicamente que a natureza é consigue ocultarnos facéndoos totalmente inaccesibles a comprobacións por observación. Einstein mostrou como se podían eliminar os acontecementos non observables na teoría de lorentz. Poderiamos sentirnos tentados de dicir o mesmo con respecto á teoría de heisenberg, ou polo menos con respecto ao seu contido matemático. Mais neste último caso semella que aínda hai moito que mellorar. Mesmo desde o punto de vista da interpretación do propio heisenberg da súa teoría, non parece que o seu programa fose levado a cabo por completo. A natureza continúa a ocultarnos renartemente algunha das magnitudes incorporadas na teoría. Este estado de cousas reliciónase co denominado principio de incerteza formulado por heisenberg, que talvez se podería explicar como se indica a seguir. Toda medición física implica un intercambio de enerxía entre o obxecto medido e o aparato de medición (que pode ser o propio observador). Por exemplo, pódese dirixir un raio de luz a un obxecto e parte da luz dispersa reflectida polo obxecto podería ser absorbida polo aparato de medición. un tal intercambio de enerxía alterará o estado do obxecto que, despois de ser medido, estará nun estado diferente ao anterior. Así que a medición proporciona, por dicilo 335 a lóxida da descuberta científica así, coñecemento sobre un estado que se destruíu ao realizar o propio proceso de medición. Esta interferencia por parte do proceso de medición no obxecto medido pódese desprezar no caso de obxectos macroscópicos, mais non no caso de obxectos atómicos, pois estes poden resultar fortemente afectados, por exemplo mediante a irradiación de luz. É imposible, xa que logo, inferir do resultado dunha medición o estado preciso dun obxecto atómico inmediatamente despois de ser medido. Por tanto, a medición non pode servir como base para predicións. É certo que sempre é posible determinar, por medio de novas medicións, o estado do obxecto despois da medición anterior, mais o sistema volve a verse interferido dun xeito incalculable. E tamén é certo que podemos facer arranxos nas nosas medicións de tal xeito que determinadas características do estado que queremos medir –por exemplo, o momento dunha partícula– non se vexan afectadas. Mais isto só se pode facer ao prezo de interferir máis marcadamente noutras magnitudes características do estado que queremos medir (neste caso, a posición da partícula). Se dúas magnitudes están correlacionadas mutuamente deste xeito, o teorema sostén que entón non se poden medir simultaneamente os dous con precisión, aínda que por separado si que se poida medir cada un deles con precisión. Así, se aumentamos a precisión dunha das dúas medicións (poñamos, o momento px, reducindo así o ámbito ou intervalo de erro ∆px), entón estamos abocados a diminuír a precisión da medición da coordenada de posición x, isto é, ampliar o intervalo ∆x. Deste xeito, a maior precisión que se pode conseguir, segundo heisenberg, está limitada pola relación de incerteza:2 ∆x . ∆px ≥ h 4π . relacións semellantes valen para as outras coordenadas. A fórmula dinos que o produto dos dous intervalos de erro é polo 2 Para a dedución desta fórmula cf. nota 2 do apartado 75. 336 Karl Popper menos da orde de magnitude de h, onde h é o quantum de acción de Plank. Desta fórmula dedúcese que para conseguir unha medición completamente precisa de unha das dúas magnitudes ten que ser ao prezo da indeterminación completa da outra. Segundo as relacións de incerteza de heisenberg, toda medición da posición afecta a medición do correspondente compoñente do momento. Así que en principio sería imposible predicir a traxectoria dunha partícula: «Na nova mecánica, o concepto de «traxectoria» non ten ningún sentido definido en absoluto...»3 Mais aquí xorde a primeira dificultade. As relacións de incerteza aplícanse só ás magnitudes (características de estados físicos) que pertencen á partícula despois de facer a medición. A posición e o momento dun electrón ata o instante da medición pódense determinar, en principio, cunha precisión ilimitada. Isto dedúcese do propio feito de que, con todo, sempre sexa posible realizar varias operacións de medición sucesivas. Por tanto, combinando os resultados de (a) dúas medicións de posición, (b) medición de posición precedida de medición de momento e (c) medición de posición seguida de medición de momento, sería posible calcular, coa axuda dos datos obtidos, as coordenadas precisas de momento e posición para todo o período entre as dúas medicións (inicialmente, podemos limitar as nosas consideracións só a este período4). Mais estes cálculos precisos, segundo heisenberg, non serven para nada á hora da predición: sería imposible, logo, sometelos a comprobación. E isto é así porque os cálculos son válidos para a traxectoria percorrida entre os dous experimentos só se o segundo é o sucesor inmediato do primeiro, no senso de que non ocorreu entre eles ningunha interferencia. Calquera comprobación que se puidese arranxar para comprobar a traxectoria percorrida entre os dous 3 March, Die Grundlagen der Quantenmechanik, 1931, p. 55. 4 Mostrarei en detalle no apartado 77 e no apéndice vi que o caso (b) nos permitirá en certas circunstancias calcular o pasado do electrón antes de facer a primeira medición (a próxima cita de Heisenberg semella aludir a este feito). *Agora considero esta nota equivocada, o mesmo que o apartado 77. 337 a lóxida da descuberta científica experimentos verase abocada a interferir tanto na traxectoria que os nosos cálculos sobre a traxectoria exacta xa non teñen validez. Sobre estes cálculos exactos heisenberg afirma o seguinte: «... se debemos atribuírlle ou non algunha realidade física aos cálculos sobre a historia pasada do electrón é puramente unha cuestión de gusto»5. O que el quere dicir con isto é claramente que, desde o punto de vista dun físico, tales cálculos non comprobables de traxectorias non teñen ningunha significación. Sobre esta pasaxe de heisenberg, Schlick comenta: «Eu diríao dun xeito aínda máis enfático, estando como estou totalmente de acordo coas opinións de Bohr e de heisenberg, que a min me semellan irrebatibles. Se un enunciado relativo á posición dun electrón, en dimensións atómicas, non é verificable, entón non lle podemos atribuír ningún sentido, polo cal é imposible falar da «traxectoria» percorrida por unha partícula entre dous puntos en que esta foi observada»6 (afirmacións semellantes atópanse en March,7 Weyl8 e outros). Con todo, como se acaba de dicir, é posible calcular tal traxectoria metafísica ou «sen sentido» en termos do novo formalismo. E isto proba que heisenberg non foi quen de levar a cabo o seu propio programa, pois esta situación só permite dúas interpretacións. A primeira sería que a partícula ten unha posición exacta e un momento exacto (e por tanto tamén unha traxectoria exacta) mais que é imposible para nós medir as dúas magnitudes simultaneamente. Se isto é así, entón a natureza seguiría empeñada en manter certas magnitudes físicas ocultas para a nosa observación: non a posición, nin o momento por separado da partícula, senón a combinación destas dúas 5 Heisenberg, Die Physikalischen Prinzipien der Quantentheorie (1930), p. 15. (Na tradución inglesa, p. 20, pon claramente que «é unha cuestión de crenza persoal»). 6 Schlick, Die Kausalität in der gegenwärtigen Physik, Die Naturwissenschaften 19, 1931, p. 159. 7 March, ob. cit. passim (por exemplo p. 1 ss. e p. 57). 8 Weyl, Gruppentheorie und Quantenmechanik, 2a ed. 1931, p. 68 (cf. a última cita do apartado 75, infra: «... o significado destes conceptos...»). *O parágrafo a que nos referimos parece que foi omitido na tradución inglesa, The Theory of Groups and Quantum Mechanics, 1931. 338 Karl Popper magnitudes, a posición cum momentum ou «traxectoria». Esta interpretación considera que o principio de incerteza é unha limitación no noso coñecemento e, xa que logo, que é subxectiva. A outra posible interpretación, que é obxectiva, afirma que é inaceptable, incorrecto ou metafísico atribuírlle á partícula nada parecido unha «posición cum momento» definidas con precisión, ou sexa, a unha «traxectoria»: o que ocorre sería simplemente que non ten «traxectoria», só ten ou ben unha posición exacta combinada cun momento inexacto, ou un momento exacto combinado cunha posición inexacta. Mais se aceptamos esta interpretación, entón o formalismo da teoría volve conter elementos metafísicos pois, como vimos, é posible calcular exactamente a «traxectoria» ou «posición cum momento» para aqueles períodos de tempo durante os cales, en principio, sería imposible comprobala mediante a observación. resulta iluminador ver como os campións da relación de incerteza vacilan entre a perspectiva subxectiva e a obxectiva. Schlick, por exemplo, inmediatamente despois de soster, como vimos, a perspectiva obxectiva, afirma: «Dos acontecementos naturais é imposible afirmar sensatamente cousas como «vaguidade» ou «imprecisión». Só aos nosos pensamentos se lles poden aplicar cualificacións deste estilo (máis concretamente, se non sabemos cales enunciados... son verdadeiros)», unha afirmación que vai dirixida, obviamente, contra a propia interpretación obxectiva que asume que non é o noso coñecemento, senón o momento da partícula, o que se volve «borroso» ou «evanescente», por así dicir, ao medirmos con precisión a súa posición*1. Vacilacións semellantes aparecen en moitos outros autores. Independentemente de que se escolla a perspectiva obxectiva ou a subxectiva, o feito é que o programa de *1 A expresión «evanescente» («smeared» en inglés) débese a Schrödinger. O problema da existencia ou inexistencia obxectiva dunha «traxectoria» (se a traxectoria se volve «evanescente» porque se «esvae» realmente ou se é, polo contrario, porque non é coñecida completamente) paréceme fundamental. A súa importancia incrementouse co experimento de Einstein, Podolsky e Rosen, tratado nos apéndices *xi e *xii. 339 a lóxida da descuberta científica heisenberg continúa sen levarse a cabo plenamente, pois el non foi quen de excluír, como el mesmo proxectara, todo elemento metafísico da teoría atómica. Por tanto, non se vai gañar nada co intento de heisenberg de fundir as dúas interpretacións opostas nunha afirmación coma esta: «...unha física «obxectiva» neste sentido, isto é, unha división ríxida do mundo entre suxeito e obxecto en realidade xa deixou de ser posible»9. Polo momento, heisenberg non realizou o seu propio cometido: non purgou a teoría cuántica dos seus elementos metafísicos. 74 Un breve esbozo da interpretación estatística da teoría cuántica heisenberg, na dedución das relacións de incerteza, segue a Bohr cando recorre á idea de que os procesos atómicos se poden representar tanto pola «imaxe de teoría cuántica dunha partícula» coma pola «imaxe de teoría cuántica dunha onda». Esta idea ten que ver co feito de que a moderna teoría cuántica avanzou por dous camiños diferentes. heisenberg comezou pola teoría clásica de partículas do electrón que el reinterpretou segundo a teoría cuántica, mentres que Schrödinger comezou pola teoría (tamén «clásica») das ondas de De Broglie: relacionou con cada electrón un «paquete de ondas», isto é, un grupo de oscilacións que por interferencia se reforzan mutuamente dentro dunha zona pequena e que se eliminan mutuamente fóra dela. Schrödinger demostrou máis tarde que a súa mecánica de ondas levaba a resultados matematicamente equivalentes aos da mecánica de partículas de heisenberg. O paradoxo da equivalencia de dúas imaxes tan diferentes no fundamental como as de partícula e onda foi resolto pola interpretación estatística que fixo Born das dúas teorías. Born demostrou que a teoría das ondas tamén se podía conside9 Heisenberg, Physikalische Prinzipien, p. 49. 340 Karl Popper rar unha teoría de partículas, pois a ecuación das ondas de Schrödinger pódese interpretar no sentido de que nos proporciona a probabilidade de localizar a partícula dentro dunha zona dada do espazo (a probabilidade determínase polo cadrado da amplitude da onda; é grande dentro do paquete de ondas onde estas se reforzan mutuamente, e desaparece fóra del). Varios aspectos da propia situación do problema indicaban que a teoría cuántica se debía interpretar estatisticamente. A seu cometido máis importante (a dedución dos espectros atómicos) había que o considerar un cometido estatístico deste a hipótese dos fotóns de Einstein (ou quanta de luz), dado que esta hipótese interpretaba os efectos luminosos observados como fenómenos masivos, debidos á influencia de moitos fotóns. «Os métodos experimentais da física atómica, ... guiados pola experiencia, convertéronse exclusivamente en cuestións estatísticas. A mecánica cuántica, que proporciona a teoría sistemática das regularidades observadas, correspóndese en todos os sus aspectos co estado presente da física experimental, pois limítase desde o comezo a formular preguntas estatísticas e a dar respostas estatísticas»1. A teoría cuántica só obtén resultados que difiren da mecánica clásica na súa aplicación a problemas de física atómica. Na súa aplicación a procesos macroscópicos as súas fórmulas producen resultados que se aproximan moito aos da mecánica clásica. «Segundo a teoría cuántica, as leis da mecánica clásica son válidas se se consideran enunciados sobre as relacións entre medias estatísticas», afirmou March2. Noutras palabras, as fórmulas clásicas pódense deducir como macroleis. Nalgunhas exposicións faise o intento de explicar a interpretación estatística da teoría cuántica polo feito de que a precisión atinxible na medición de magnitudes físicas está limitada 1 Born-Jordan, Elementare Quantenmechanik, 1930, p. 322 ss. 2 March, Die Grundlagen der Quantenmechanik, 1931, p. 170. 341 a lóxida da descuberta científica polas relacións de incerteza de heisenberg. Arguméntase que, debido á incerteza das medicións en calquera experimento atómico, «... o resultado non será determinado en xeral, isto é, se o experimento se repite moitas veces baixo condicións idénticas, pódense obter moitos resultados diferentes. Se o experimento se repite unha grande cantidade de veces, observarase que cada resultado particular obterase nunha fracción definida do número total de veces, de xeito que se pode dicir que hai unha probabilidade definida de obtelo cada vez que se faga o experimento» (Dirac)3. Facendo referencia á relación de incerteza, March tamén afirma: «Entre o presente e o futuro mantéñense... só relacións de probabilidade, do cal se deduce claramente que a nova mecánica ten que ter carácter de teoría estatística»4. Non me parece aceptable esta análise das relacións entre fórmulas de incerteza e a interpretación estatística do teoría cuántica. A min paréceme que a relación lóxica é xustamente ao revés, pois as fórmulas de incerteza pódense deducir da ecuación das ondas de Schrödinger (que hai que interpretar estatisticamente), mais esta última non se pode deducir das fórmulas de incerteza. Se imos dar conta debidamente destas relacións de deducibilidade, entón haberá que revisar a interpretación das fórmulas de incerteza. 75 Reinterpretación estatística das fórmulas de incerteza desde heisenberg dáse por sentado que calquera medición simultánea de posición e momento unha precisión que exceda 3 Dirac, Quantum Mechanics, 1930, p. 10. *(Da 1a edición). Unha pasaxe paralela, algo máis enfática, ocorre na páxina 14 da 3a edición. «... en xeral o resultado non estará determinado, isto é, se o experimento se repite moitas veces baixo condicións idénticas obteranse moitos resultados diferentes. Hai unha lei da natureza que di, con todo, que se un experimento se repite unha grande cantidade de veces, cada resultado particular obterase nunha fracción definida do número total de veces, de xeito que hai unha probabilidade definida de que se obteña». 4 March, Die Grundlagen der Quantenmechanik, p. 3. 342 Karl Popper a permitida polas súas relacións de incerteza contradirá a teoría cuántica. Existe a crenza de que a «prohibición» de medicións exactas se pode deducir loxicamente da teoría cuántica ou da mecánica de ondas. Desde esta perspectiva, habería que considerar falsificada a teoría se se puidesen levar a cabo experimentos que desen como resultado medicións de «precisión prohibida»1. Eu considero que este punto de vista é falso. É certo que as fórmulas de heisenberg (∆x . ∆px ≥ h4π etc.) son resultado de conclusións lóxicas da teoría2, mais a interpretación destas fórmulas como regras que limitan a precisión atinxible na medición, no senso de heisenberg, non é unha dedución lóxica da teoría. Por tanto, medicións máis exactas que as que son permisibles segundo heisenberg non poden contradicir loxicamente a teoría cuántica ou mecánica de ondas. En consecuencia, farei unha distinción drástica entre as fórmulas, que denominarei abreviadamente «fórmulas de heisenberg», e a súa interpretación (tamén debida a heisenberg) como relacións de incerteza, isto é, como enunciados que impoñen limitacións sobre a precisión atinxible na medición. Cando se realiza a dedución matemática das fórmulas de heisenberg, hai que empregar a ecuación das ondas ou algunha suposición equivalente, isto é, unha suposición que se poida interpretar estatisticamente (como vimos no apartado anterior). Pero se se adopta esta interpretación, entón non cabe dúbida de que a descrición dunha partícula illada como un paquete 1 Abstéñome de criticar aquí a idea, moi espallada e bastante inxenua, de que os argumentos de Heisenberg ofrecen proba concluínte da imposibilidade de todas estas medicións; cf., por exemplo, Jeans (The New Background of Science, 1933, p. 1933; 2a edición, 1934, p. 237): «A ciencia non atopou saída para este dilema. Ao contrario, demostrou que non hai saída». Está claro que nunca se poderá fornecer tal proba e que o principio de incerteza podería, como moito, ser deducible das hipóteses da mecánica cuántica e de ondas e podería ser refutada conxuntamente con elas. En asuntos deste tipo, afirmacións plausibles coma a de Jeans poden facilmente facer que nos desorientemos. 2 Weyl ofrece unha dedución lóxica estrita: Gruppentheorie und Quantenmechanik, 2a edición, pp. 68 e 345; tradución inglesa, pp. 77 e 397 ss. 343 a lóxida da descuberta científica de ondas non é máis que un enunciado de probabilidade formalmente singular (cf. apartado 71). A amplitude de onda determina, como vimos, a probabilidade de detectar a partícula nun certo lugar; e este tipo de enunciado de probabilidade (o tipo dos que se refiren só a unha partícula illada ou a un acontevcemento illado) é precisamente aquel que nós denominamos «formalmente singular». Aceptando a interpretación estatística da teoría cuántica, entón un estará abocado a interpretar aqueles enunciados (coma as fórmulas de heisenberg) que se poiden deducir dos enunciados de probabilidade formalmente singulares da teoría, á súa vez, como enunciados de probabilidade e, de novo, como formalmente singulares, se son válidos para unha partícula illada. En última instancia, por tanto, débense interpretar como aseveracións estatísticas. En contra da interpretación subxectiva («Canto máis precisamente midamos a posición dunha partícula, menos poderemos saber sobre o seu momento»), eu propoño que se debería aceptar como fundamental a interpretación obxectiva e estatística das relacións de incerteza. Isto poderíase expresar aproximadamente como segue. Dado un agregado de partículas e unha selección (no senso dunha separación física) daquelas que, nun certo instante e cun certo grao de precisión dado, teñen unha certa posición x, observaremos que os seus momentos px mostrarán dispersión aleatoria; e o ámbito de dispersión, ∆px, será así tanto maior canto menor sexa ∆x, isto é, o ámbito de dispersión ou imprecisión permitido ás posicións. E viceversa: se seleccionamos ou separamos aquelas partículas cuxos momentos px caen todos dentro dun ámbito escollido ∆px, entón veremos que as súas posicións se espallan de xeito aleatorio, dentro dun ámbito ∆x que será tanto maior canto menor sexa ∆px, isto é, o ámbito de dispersión ou imprecisión permitido aos momentos. Por último: se tentamos seleccionar aquelas partículas que teñen á vez as propiedades ∆x e ∆px, entón podemos realizar fisicamente tal selección (isto é, separar fisicamente 344 Karl Popper as partículas) só con que os dous ámbitos se fagan o suficientemente grandes para cumprir a ecuación ∆x . ∆px ≥ h4π . Esta interpretación obxectiva das fórmulas de heisenberg considera que estas afirman que existen determinadas relacións entre certos ámbitos de dispersión; eu referireime a elas, se son interpretadas deste xeito, como relacións estatísticas de dispersión*1. Polo de agora, na miña interpretación estatística non fixen mención da medición, só falei de selección física3. Así que agora cómprenos aclarar a relación entre estes dous conceptos. Falo de selección física ou separación física se, por exemplo, illamos, dunha corrente de partículas, todas menos aquelas que pasen por unha abertura estreita ∆x, isto é, por un ámbito ∆x permitido para a súa posición. E direi que as partículas que pertencen ao raio así illado foron seleccionadas fisicamente, ou tecnicamente, segundo a súa propiedade ∆x. Eu soamente chamo «selección física» a este proceso, ou o seu resultado, o raio das partículas illado física ou tecnicamente, en contraste con unha selección meramente «mental» ou «imaxinada», como a que facemos cando falamos da clase de todas aquelas partículas que pasaron, ou pasarán, polo ámbito ∆p, isto é, dunha clase dentro dunha clase máis ampla de partículas da que non foi fisicamente illada. Toda selección física se pode considerar, xaora, como unha medición, e pode en realidade ser usada como tal4. Se, digamos, *1 Continúo mantendo a interpretación obxectiva explicada aquí, aínda que cun cambio importante. Cando neste parágrafo falo dun «agregado de partículas», agora tería que falar dun «agregado (ou sucesión) de repeticións dun experimento realizado con unha partícula (ou un sistema de partículas)». E o mesmo ocorrería nos seguintes parágrafos: por exemplo, deberíase reinterpretar que o «raio» das partículas consiste en experimentos repetidos con (unha ou varias) partículas, seleccionadas mediante o illamento ou exclusión das partículas que non se queren. 3 Tamén Weyl, entre outros, fala de «seleccións»; véxase Gruppentheorie und Quantenmechanik, p. 67 ss., tradución inglesa p. 76 e ss. Mais el non fai contraste, como eu fago, entre medición e selección. 4 Por «medición» entendo, de acordo co uso lingüístico aceptado polos físicos, non só operacións directas de medición, senón tamén medicións obtidas indirectamente mediante cálculos (en física estas últimas son practicamente as únicas medicións que ocorren). 345 a lóxida da descuberta científica se selecciona un raio de partículas illando ou excluíndo todas aquelas que non pasen por un certo ámbito posicional (selección de situación) e se máis tarde se mide o momento de unha destas partículas, entón podemos considerar a selección de situación como unha medición de posición, porque isto infórmanos de que a partícula pasou por unha certa posición (aínda que ás veces poida que non saibamos cando estivo alí, ou que só o saibamos por outra medición). Por outro lado, non debemos considerar toda medición como unha selección física. Imaxínese, por exemplo, un raio monocromático de electróns que voan en dirección x. usando un contador de Geiger, podemos entón rexistrar os electróns que cheguen a unha certa posición. Polos intervalos de tempo que hai entre os impactos contra o contador, tamén podemos medir os intervalos espaciais, isto é, medimos a súa posición na dirección x ata o momento do impacto. Mais ao tomar estas medicións non facemos unha selección física das partículas segundo a súa posición na dirección x (de feito, estas medicións darán unha distribución completamente aleatoria das posicións na dirección x). Así que, na súa aplicación física, as nosas relacións estatísticas de dispersión veñen sendo o seguinte: se un intenta, polos medios físicos que sexan, obter un agregado de partículas o máis homoxéneo posible, entón este intento atopará un obstáculo seguro nestas relacións de dispersión. Por exemplo, podemos obter por selección física un raio monocromático plano (digamos, un raio de electróns de igual momento). Mais, se intentamos facer aínda máis homoxéneo este agregado de electróns (talvez illando unha parte) co obxectivo de obter electróns que non só teñan o mesmo momento, senón que tamén pasasen por unha fenda estreita que determina un ámbito posicional ∆x, entón seguro que o noso intento fallará. E fallará porque toda selección segundo a posición das partículas supón unha interferencia no sistema que dará lugar a un incremento da dispersión dos compoñentes do momento px, de tal xeito que a 346 Karl Popper dispersión aumentará (de acordo coa lei expresada pola fórmula de heisenberg) segundo se vaia estreitando a fenda. E á inversa: se se nos dá un raio seleccionado segundo a posición facéndoo pasar por unha fenda, e se intentamos facelo «paralelo» (ou «plano») e monocromático, entón temos que destruír a selección segundo a posición, pois non podemos evitar aumentar a anchura do raio (no caso ideal –por exemplo, se os compoñentes px han ser todos igual a 0– a anchura tería que chegar a ser infinita). Se se aumenta todo o posible a homoxeneidade dunha selección (isto é, tanto como permitan as fórmulas de heisenberg, de xeito que sexa válido o signo de igualdade nestas fórmulas), entón esta selección pódese dicir que é un caso puro5. usando esta terminoloxía, podemos formular as relacións estatísticas de dispersión así: non hai agregado de partículas máis homoxéneo que o caso puro*2. Ata o de agora non se tivo suficientemente en conta que á dedución matemática das fórmulas de heisenberg a partir das ecuacións fundamentais da teoría cuántica, debe corresponder, precisamente, unha dedución da interpretación das fórmulas de heisenberg a partir da interpretación destas ecuacións fundamentais. March, por exemplo, describiu esta situación xustamente ao revés (como se indicou no apartado anterior): a interpretación estatística da teoría cuántica aparece na súa exposición como unha consecuencia da limitación de heisenberg sobre a precisión atinxible. Weyl, por outra banda, ofrece unha dedución estrita das fórmulas de heisenberg a partir da 5 O termo débese a Weyl (Zeitschrift fur Physik 46, 1927, p. 1) e J. von Neumann (Göttinger Nachrichten, 1927, p. 245). Se, seguindo a Weyl (Gruppentheorie und Quantenmechanik, p. 70, tradución inglesa p. 79; cf. tamén Born-Jordan, Elementare Quanten-mechanik, p. 315), caracterizamos o caso puro como «... aquel que é imposible de xerar mediante unha combinación de dúas coleccións estatísticas diferentes del», entón casos puros que cumpran esta descrición non teñen por que ser seleccións puras de situación ou momento. Poderían ser xerados, por exemplo, se se realizase unha selección de situación cun grao de precisión determinado, e que o momento fose aínda atinxible coa maior precisión. *2 No caso da nota *1, xaora, habería que reformular isto: «Non hai posible enxeño experimental capaz de producir un agregado ou sucesión de experimentos con resultados máis homoxéneos que un caso puro». 347 a lóxida da descuberta científica ecuación das ondas, unha ecuación que el interpreta en termos estatísticos. Mais el interpreta as fórmulas (que deduciu dunha premisa interpretada estatisticamente) como limitacións sobre a precisión atinxible. E faino a pesar de que se decata de que esta interpretación das fórmulas vai, nalgúns aspectos, en contra da interpretación estatística de Born. Segundo Weyl, a interpretación de Born é sometida a «unha corrección» á luz das relacións de incerteza: «Non é só que a posición e a velocidade dunha partícula estean sometidas a leis estatísticas, estando precisamente determinadas en todos e cada un dos casos, senón que o propio sentido destes conceptos depende das medicións que se necesitan para determinalas, e a medición exacta da posición arrebátanos a posibilidade de determinar a velocidade»6. O conflicto que percibe Weyl entre a interpretación estatística de Bohr da teoría cuántica e as limitacións de heisenberg sobre a precisión atinxible existe en efecto, pero é aínda máis acusado do que Weyl pensa. Non só é imposible deducir as limitacións de precisión atinxible a partir da ecuación das ondas interpretada estatisticamente, senón que tampouco se pode considerar como un argumento decisivo, como unha especie de experimentum crucis ou experimento crucial a favor da interpretación estatística da teoría cuántica, o feito de que (algo que eu aínda teño por demostrar) nin os posibles experimentos nin os resultados experimentais reais concorden coa interpretación de heisenberg. 76 Un intento de eliminar elementos metafísicos invertendo o programa de heisenberg, con aplicacións Se comezamos coa suposición de que as fórmulas características da teoría cuántica son hipóteses de probabilidade, ou sexa, enunciados estatísticos, é difícil ver como se poderían deducir 6 Weyl, Gruppentheorie und Quantenmechanik, p. 68. *O parágrafo citado aquí semella que foi omitido na tradución inglesa. 348 Karl Popper acontecementos singulares ou illados dunha teoría estatística deste carácter (excepto, quizais, no caso de probabilidades igual a un ou a cero). Pensar que as medicións illadas poden contradicir as fórmulas da física cuántica semella loxicamente insostible, igual de insostible que pensar que un día se poderá detectar unha contradición entre un enunciado de probabilidade formalmente singular αPk (β) = p (coma tal, «a probabilidade de que ao lanzar o dado saia un 5 é igual a 1/6) e un dos seguintes dous enunciados: k ε β («no lanzamento saíu un cinco») ou k ε («no lanzamento non saíu un cinco»). Estas simples consideracións proporciónannos os medios para refutar calquera das supostas probas que foron deseñadas para demostrar que as medicións exactas de posición e momento contradirían a teoría cuántica, ou que talvez foron deseñadas para demostrar que a mera suposición de que tales medicións son fisicamente posibles ten que provocar contradicións dentro da teoría. Isto é debido a que unha tal proba ten que facer uso de consideracións de teoría cuántica aplicadas a partículas illadas, o cal implica que ten que facer uso de enunciados de probabilidade formalmente singulares e, aínda máis, que ten que ser posible traducir a proba (palabra por palabra, por dicilo así) á linguaxe estatística. Se facemos isto, descubrimos que non hai contradición entre as medicións illadas que se supón que son precisas e a teoría cuántica na súa interpretación estatística. A contradición entre estas medicións precisas e certos enunciados de probabilidade formalmente singulares é só aparente (no apéndice v examinarase un exemplo deste tipo de proba). Mais, malia que é incorrecto afirmar que a teoría cuántica descarta as medicións exactas, segue a ser correcto dicir que partindo de fórmulas que son características da teoría cuántica (sempre que se interpreten estatisticamente) non se poden deducir predicións singulares. (Tampouco conto a lei de conservación de enerxía, nin a lei de conservación de momento entre as fórmulas características da teoría cuántica). 349 a lóxida da descuberta científica Isto é así porque, tendo en conta as relacións de dispersión, temos que fracasar, moi especialmente, nos nosos intentos de xerar condicións iniciais precisas, mediante a manipulación experimental do sistema (isto é, polo que nós denominamos selección física). Pois ben, é verdade que a técnica normal de quen fai o experimento consiste en xerar ou construír condicións iniciais, o cal nos permite deducir das nosas relacións estatísticas de dispersión o teorema (que, con todo, só é válido para esta técnica experimental construtiva) de que da teoría cuántica só se poden obter predicións de frecuencia, nunca predicións singulares1. Este teorema é un resumo da miña actitude cara a todos os experimentos imaxinarios tratados por heisenberg (que segue nisto a Bohr) co obxecto de probar que é imposible facer medicións que teñan unha precisión prohibida polo seu principio de incerteza. O problema é o mesmo en todos os casos: a dispersión estatística fai imposible predicir cal será a traxectoria da partícula despois da operación de medición. Pode semellar que non se gaña moito coa nosa interpretación do principio de incerteza, pois nin sequera o propio heisenberg afirma (como tentei demostrar) moito máis que o feito de as nosas predicións estaren sometidas a este principio. Como nisto eu concordo con el ata certo punto, poderíase pensar que o único que estou a facer eu é discutir sobre unha miudeza lingüística e non sobre temas substanciais. Mais isto non lle faría moita xustiza á miña argumentación. En realidade, eu creo que a perspectiva de heisenberg e mais a miña son diametralmente opostas, como mostrarei en detalle no apartado seguinte. Mais ante diso tentarei aquí resolver as dificultades típicas inherentes á interpretación de heisenberg, tentando aclarar tamén como e por que xorden estas dificultades. Primeiro temos que examinar a dificultade que, como vimos, lle causa máis problemas ao programa de heisenberg: a oco1 A expresión «técnica experimental construtiva» úsaa Weyl, Gruppentheorie und Quantenmechanik, p. 67, tradución inglesa p. 76. 350 Karl Popper rrencia, no formalismo, de enunciados precisos de «posición cum momento»; noutras palabras, a aparición de cálculos exactos dunha traxectoria (cf. apartado 73) cuxa realidade física heisenberg se ve obrigado a poñer en dúbida, mentres que outros, coma Schlick, xa a rexeitan categoricamente. Mais os experimentos en cuestión, (a), (b) e (c) [véxase o apartado 73], pódense interpretar todos en termos estatísticos. Por exemplo, a combinación (c), isto é, unha medición de posición seguida por unha medición de momento, pódese realizar mediante un experimento coma o seguinte: seleccionamos un raio segundo a posición servíndonos dun diafragma que teña unha fenda estreita (medición de posición). Despois medimos o momento daquelas partículas que se desprazaban desde a fenda nunha dirección concreta (esta segunda medición xerará, xaora, unha nova dispersión das posicións). Os dous experimentos xuntos, logo, determinarán con precisión a traxectoria de todas aquelas partículas que pertencen á segunda selección, na medida en que esta traxectoria se sitúa entre as dúas medicións: pódese calcular con precisión tanto a posición coma o momento entre estas dúas medicións. Estas medicións e cálculos, que corresponden precisamente a aqueles elementos que heisenberg considera superfluos, na miña interpretación da teoría son calquera cousa menos superfluos. É certo que non serven como condicións iniciais ou como base para a dedución de predicións mais, con todo, seguen a ser indispensables: son necesarios para comprobar as nosas predicións, que son predicións estatísticas. Isto é porque o que afirman as nosas relacións de dispersión é que os momentos se teñen que dispersar cando se determinan as posicións máis exactamente, e viceversa. Esta é unha precisión que non sería comprobable, ou falsificable, se non estivésemos en condicións de medir e calcular, coa axuda de experimentos do tipo dos descritos, os varios momentos dispersos que ocorren inmediatamente despois de facer calquera selección segundo a posición*1. Interpretada estatisticamente, por tanto, a teoría non descarta a posibilidade de medicións illadas exactas. Aínda máis: se estas medicións fosen imposibles, a teoría non sería com351 a lóxida da descuberta científica probable e, por tanto, sería metafísica. Vemos, por tanto, que a realización do programa de heisenberg, que consistía na eliminación de elementos metafísicos, conséguese aquí mediante un método que é o oposto ao de heisenberg. Mentres que el tentaba excluír magnitudes que consideraba inadmisibles (aínda que sen conseguilo enteiramente), eu invirto o intento, por dicilo así, demostrando que o formalismo que contén estas magnitudes é correcto precisamente porque as magnitudes non son metafísicas. unha vez que abandonamos o dogma incorporado na limitación imposta por heisenberg sobre a precisión atinxible, xa non hai razón para dubidar da significación física destas magnitudes. As relacións de dispersión son predicións de frecuencia sobre traxectorias e, por tanto, estas traxectorias teñen que ser medibles (exactamente do mesmo xeito que, por exemplo, se teñen que ser calculables empiricamente os lanzamentos dun dado co resultado cinco) se queremos ser capaces de comprobar as nosas predicións de frecuencia sobre esas traxectorias (ou sobre eses lanzamentos). O rexeitamento por parte de heisenberg do concepto de traxectoria, e o que el chama «magnitudes non observables», *1 Sigo considerando este parágrafo (e tamén a primeira oración do próximo parágrafo) como un dos máis importantes desta discusión, un parágrafo co cal continúo concordando completamente. Como segue a haber malentendidos, vou explicar isto de xeito máis completo. As relacións de dispersión afirman que, se facemos arranxos para conseguir unha selección nítida da posición (mediante unha fenda nunha pantalla, por exemplo), entón dispersaranse os momentos como consecuencia (máis que convertérense en «indeterminados», os momentos illados convértense en «impredicibles», de tal xeito que podemos predicir que se espallarán). Esta é unha predición que temos que comprobar medindo os momentos singulares, para determinar a súa distribución estatística. Estas medicións dos momentos singulares (que provocarán unha nova dispersión, mais non hai necesidade de explicar isto agora) darán en cada caso resultados tan precisos como queiramos e, en calquera caso, moito máis precisos que ∆p, isto é, a anchura media da zona de dispersión. Estas medicións dos varios momentos illados permitirannos calcular os seus valores retrospectivamente no lugar onde a posición fora seleccionada (e medida) pola fenda. Este «cálculo da historia pasada» da partícula (cf. nota 3 do apartado 73) é esencial; sen el, non poderiamos afirmar que estabamos a medir os momentos inmediatamente despois de seleccionar as posicións e, por tanto, non poderiamos afirmar que estabamos a comprobar as relacións de dispersión, que é o que se fai realmente con calquera experimento que mostre un incremento da dispersión como consecuencia dunha diminución do ancho da fenda. Así que o único que se volve «borroso» ou «evanescente» é a precisión da predición como consecuencia das relacións de dispersión, mais nunca a precisión da medición. 352 Karl Popper mostran claramente a influencia das ideas filosóficas, especialmente das ideas positivistas. Baixo esta mesma influencia, March afirma: «Se cadra podemos dicir, sen medo a que se nos malinterprete, ... que para o físico un corpo só é real no instante en que o observa. Naturalmente, ninguén está tan tolo como para afirmar que un corpo deixa de existir no momento en que lle damos as costas, mais si é certo que nese momento deixa de ser un obxecto de investigación para o físico, porque non hai posibilidade de dicir nada sobre el que se basee en experimentos»2. Noutras palabras, a hipótese de que un corpo se desprace nunha traxectoria ou outra mentres non está sendo observado non é verificable. Isto é obvio, xaora, pero non ten interese ningún. En cambio, o que si é importante é que esta hipótese e outras semellantes son falsificables: baseándonos na hipótese de que un corpo se despraza ao longo dunha certa traxectoria, seremos capaces de predicir que ese corpo será observable nesta ou naquela posición, o cal constitúe unha predición que se pode refutar. Veremos no próximo apartado que a teoría cuántica non exclúe este tipo de procedemento. Pero, en realidade, o que acabamos de dicir xa é máis que suficiente*2, pois libéranos de todas aquelas dificultades que tiñan que ver coa «carencia de sentido» do concepto de traxectoria. Decatarémonos do que isto supón para despexar a atmosfera se lembramos as conclusións drásticas que se tiraron do suposto fracaso do concepto de traxectoria. Schlick formúlaas así: «Talvez a maneira máis concisa de describir a situación que estamos considerando sexa dicir (como fan os máis eminentes 2 March, Die Grundlagen der Quantenmechanik, p. 1. *Opinión parecida é a de Reichenbach, que eu critico no Postscript, apartado *13. *2 O comezo desta oración (desde «Pero, en realidade,» ata «suficiente») non estaba no texto orixinal alemán. Incluíno porque agora xa non creo no argumento do «próximo apartado» (77), a que me refería na frase anterior, e porque, de feito, o que segue é completamente independente do próximo apartado: baséase no argumento que se acaba de dar, segundo o cal os cálculos da traxectoria pasada do electrón son necesarios para comprobar as predicións estatísticas da teoría, de xeito que estes cálculos están lonxe de «carecer de sentido». 353 a lóxida da descuberta científica investigadores dos problemas cuánticos) que a validez dos conceptos espacio-temporais correntes se limita á esfera do observable macroscopicamente e que non é aplicable ás dimensións atómicas»3. Aquí é probable que Schick estea aludindo a Bohr, quen afirmara: «Por tanto, débese asumir que, no relativo ao problema xeral da teoría cuántica, non se trata simplemente de cambiar as teorías mecánica e electrodinámica, un cambio que se pode describir perfectamente en termos dos conceptos físicos normais, senón dun fracaso máis profundo das nosas imaxes espacio-temporais usadas ata o de agora na descrición de fenómenos naturais»44. heisenberg adoptou esta idea de Bohr, en particular a renuncia ás descricións espacio-temporais, como base do seu programa de investigación. O éxito que heisenberg acadou creou a impresión de que esta renuncia era produtiva, pero en realidade o programa nunca foi plenamente levado a cabo. O uso frecuente e inevitable, malia que subrepticio, de conceptos espacio-temporais agora parece xustificable visto á luz da nosa análise, unha análise que demostrou que as relacións de dispersión estatística son enunciados sobre a dispersión de «posición cum momento» e que, en consecuencia, son enunciados sobre as traxectorias. Agora que xa demostramos que as relacións de incerteza son enunciados de probabilidade formalmente singulares, podemos tentar desenmarañar o nobelo das súas interpretacións obxectivas e subxectivas. No apartado 71 xa mostramos que todo enunciado de probabilidade formalmente singular tamén se pode interpretar subxectivamente, como predición indefinida, ou sexa, como un enunciado sobre a incerteza do noso coñecemento. Tamén vimos baixo que condicións estará condenado ao fracaso o intento de interpretar obxectivamente un enunciado deste tipo. Estará condenado ao fracaso se o que se pretende 3 Schlick, Die Kausalität in der gegenwärtigen Physik, Die Naturwissenschaften 19, 1931, p. 159. 4 Bohr, Die Naturwissenschaften 14, 1926, p. 1. 354 Karl Popper é substituír unha interpretación estatística obxectiva por unha interpretación obxectiva singular, atribuíndo a incerteza directamente ao acontecemento singular*3. Con todo, se as fórmulas de heisenberg se interpretan (directamente) nun senso subxectivo, entón ponse en perigo a posición da física como ciencia obxectiva, pois para ser coherentes habería que interpretar subxectivamente as ondas de probabilidade de Schrödinger. Esta conclusión tíraa Jeans5, quen afirma: «Dito de maneira abreviada, a imaxe corpuscular dinos que o noso coñecemento do electrón é indeterminado; a imaxe ondulatoria dinos que o electrón é en si indeterminado, independentemente de que se realicen experimentos con el ou non. Así e todo, o contido do principio de incerteza ten que ser exactamente o mesmo nos dous casos. Só hai unha maneira de facer que así sexa: temos que supoñer que a imaxe ondulatoria ofrece unha representación que non é de natureza obxectiva, senón só do noso coñecemento da natureza...» Así pois, as ondas de Schrödinger son, para Jeans, ondas de probabilidade subxectiva, ondas do noso coñecemento. E con isto toda a teoría subxectiva da probabilidade invade o reino da física. Os argumentos que eu rexeitei (o uso do teorema de Bernoulli como «ponte» entre a ignorancia e o coñecemento estatístico e outros argumentos semellantes [cf. apartado 62]) son aquí inevitables. Jeans formula a actitude subxectivista da física moderna como segue: «heisenberg atacou o enigma do universo físico mediante o abandono do enigma principal por irresoluble –a natureza do universo obxectivo– para centrarse no rompecabezas menor de coordinar as nosas observacións do *3 Este é un dos aspectos sobre os que cambiei de opinión. Cf. o Postscript, capítulo *v. Pero a miña argumentación principal a favor dunha interpretación obxectiva non se ve afectada. Segundo a miña perspectiva actual, a teoría de Schrödinger pódese e débese interpretar non só como obxectiva e singular, senón á vez como probabilística. 5 Jeans, The New Background of Science (1933, p. 236; 2a edición 1934, p. 240). No texto de Jeans, comeza un novo parágrafo coa segunda oración, isto é, coas palabras: «Mais o contido». Para a cita que segue ao final deste parágrafo, véxase ob. cit., p. 237 (2a edición, p. 241). 355 a lóxida da descuberta científica universo. Así que non sorprende que a imaxe ondulatoria que finalmente xurdiu demostre referirse só ao noso coñecemento do universo tal como se obtén por medio das nosas observacións». Non cabe dúbida de que tales conclusións resultarán altamente aceptables para os/as positivistas, mais as miñas propias ideas sobre a obxectividade continúan intactas. Os enunciados estatísticos da teoría cuántica deben ser comprobables intersubxectivamente igual que calquera outro enunciado da física. E a miña sinxela análise non só conserva a posibilidade de descricións espacio-temporais, senón tamén o carácter obxectivo da física. É interesante que exista unha equivalencia para esta interpretación subxectiva das ondas de Schrödinger: unha interpretación non estatística e, por tanto, unha interpretación directamente obxectiva (isto é, singular). O propio Schrödinger, no famoso Collected Papers on Wave-Mechanics, propuxo unha interpretación dese estilo para a súa ecuación das ondas (que, como vimos, é un enunciado de probabilidade formalmente singular). Intentou identificar a partícula inmediatamente co propio paquete de ondas, mais este intento levouno dereitiño ás dificultades características deste tipo de interpretación, ou sexa, a asignación de incerteza aos propios obxectos físicos (incertezas obxectivadas). Schrödinger viuse obrigado a supoñer que a carga do electrón era «borrosa» ou «evanescente» no espazo (cunha densidade de carga determinada pola amplitude de onda), unha suposición que resultou ser incompatible coa estrutura atómica da electricidade6. A interpretación estatística de Bohr resolveu o problema, mais a conexión lóxica entre as interpretacións estatística e non estatística seguía sen clarificarse. Por esta vía seguía sen recoñecerse o carácter peculiar doutros enunciados de probabilidade formalmente singulares (como as relacións de incerteza), o cal podía continuar debilitando a base física da teoría. 6 Cf., por exemplo, Weyl, Gruppentheorie und Quantenmechanik, p. 193; tradución inglesa, p. 216 ss. 356 Karl Popper Vou rematar cunha aplicación do que se dixo neste apartado a un experimento imaxinario proposto por Einstein7 ao que Jeans8 se referiu como «unha das partes máis difíciles da nova teoría cuántica», aínda que eu creo que a nosa interpretación mostra que é algo perfectamente claro, se non trivial*4. Imaxinemos un espello translúcido, isto é, un espello que reflicte parte da luz e que permite que outra parte o atravese. A probabilidade formalmente singular de que un fotón dado (ou quantum de luz) atravese o espello, αPk (β), pódese considerar igual á probabilidade de ser reflectido. Temos, xa que logo, αPk (β) = αPk ( ) = 12 . Esta estimación de probabilidade defínese, como sabemos, por probabilidades estatísticas obxectivas, isto é, é equivalente á hipótese de que unha metade dunha clase dada α de quanta de luz pasará a través do espello mentres que a outra metade será reflectida. Agora permitamos que un fotón k incida sobre o espello e despois supoñamos que se determinou experimentalmente que este fotón foi reflectido. Neste caso as probabilidades semellan cambiar radicalmente, por dicilo así, e de xeito descontinuo. É coma se antes do experimento os dous fosen iguais a 1 2 , mentres que despois de saberse que foi reflectido, os dous se convertesen de socato en 0 e 1, respectivamente. Este exemplo, xaora, é realmente o mesmo que o proporcionado no apartado 71*5. E malamente axuda a clarificar esta situación 7 Cf. Heisenberg, Physikalische Prinzipien, p. 29 (tradución inglesa de C. Eckart e F. C. Hoyt: The Physical Principles of the Quantum Theory, Chicago, 1930, p. 39). 8 Jeans, The New Background of Science (1933, p. 242; 2a edición, p. 246). *4 O problema que vén a seguir fíxose famoso coa denominación de «problema da redución (descontinua) do paquete de ondas». Algúns físicos de primeira liña dixéronme en 1934 que concordaban coa miña solución trivial, mais o problema continúa a ter un papel desconcertante na discusión da teoría cuántica, vinte anos despois. Volvo tratar isto en profundidade nos apartados *100 e *115 do Postscript. *5 Isto é, as probabilidades «cambian» só na medida en que α se substitúe por . Así, αP(ß) mantense igual a 1 2 ; mais P(ß) é igual a 0, o mesmo que é P( ) igual a 1. 357 a lóxida da descuberta científica se este experimento se describe, como fai heisenberg9, en termos coma os seguintes: «Polo experimento [isto é, a medición pola que atopamos o fotón reflectido], exércese unha especie de acción física (unha redución dos paquetes de ondas) desde o lugar onde se atopa a metade reflectida do paquete de ondas cara a outro lugar –tan afastado como queiramos –onde resulta estar a outra metade do paquete». A esta descrición engade heisenberg: «Esta acción física propágase con velocidade superior á da luz». Isto non axuda moito, xa que as nosas probabilidades orixinais, αPk (β) e αPk ( ), continúan sendo igual a 12 . Todo o que ocorreu foi que se escolleu unha nova clase de referencia (β ou , en lugar de α), unha escolla feita seguindo a clara indicación do experimento, isto é, pola información k ε β ou k ε , respectivamente. Afirmar que as consecuencias lóxicas desta escolla (ou, talvez, as consecuencias lóxicas desta información) se propagan con «velocidade superior á da luz» ten máis ou menos a mesma utilidade que dicir que dous máis dous pasa a ser, con velocidade superior á da luz, catro. un comentario posterior de heisenberg, onde afirma que este tipo de propagación dunha acción física non se pode usar para transmitir sinais, sendo certo, non mellora nada esta situación. O destino deste experimento imaxinario lémbranos a urxente necesidade de distinguir e de definir os conceptos de probabilidade estatística e de probabilidade formalmente singular. Tamén demostra que o problema de interpretación a que deu lugar a teoría cuántica só se pode abordar mediante unha análise lóxica da interpretación dos enunciados de probabilidade. 9 Heisenberg, Physikalische Prinzipien, p. 29 (tradución inglesa: The Physical Principles of the Quantum Theory, Chicago, 1930, p. 39). Von Laue, por outra banda, en Korpuskularund Wellentheorie, Handbuch d. Radiologie 6 (2a edición, p. 79 da separata) afirma acertadamente: «Mais se cadra é un erro facer correlacións entre a onda con un corpúsculo illado. Se asumimos que a onda, en principio, está relacionada con un agregado de corpos iguais mais mutuamente independentes, esvaécese a conclusión paradoxal». *Einstein adoptou nos seus últimos artigos unha interpretación semellante: cf. nota ** infra. 358 Karl Popper 77 Experimentos decisivos** Con isto xa levei a cabo as dúas primeiras partes do meu programa, esbozado na introdución que precede o apartado 73. Mostrei (1) que as fórmulas de heisenberg se poden interpretar estatisticamente e, polo tanto, (2) que interpretalas como limitacións sobre a precisión atinxible non se deduce loxicamente da teoría cuántica. Por tanto, lograr un grao máis elevado de precisión nas nosas medicións*1 non abonda para contradicir a teoría cuántica. Alguén podería retrucar: «Polo de agora, todo ben. Non nego que se poida ver deste xeito a mecánica cuántica, mais continúo pensando que os argumentos que vostede presentou nin sequera tocan o cerne físico da teoría de heisenberg, que defende a imposibilidade de facer predicións singulares exactas». Se se lle pide que amplíe a súa tese por medio dun exemplo físico, o meu opoñente talvez continúe a súa argumentación como segue: «Imaxínese un feixe de electróns, como o dun tubo catódico. Supóñase que a dirección do feixe é a dirección x. Podemos obter varias seleccións físicas deste feixe. Por exemplo, podemos seleccionar ou separar un grupo de electróns segundo a súa posición na dirección x (isto é, segundo as súas coordenadas x nun instante determinado). Isto poderíase facer, se cadra, por medio dun diafragma que abrimos un instantiño moi breve. Deste xeito obteriamos un grupo de electróns cunha ** O experimento imaxinario descrito neste apartado, pp. 238 a 242, está baseado nun erro. (Véxanse tamén as notas *3 e *4, infra.). O erro foi sinalado primeiro por Weizsäker (Naturwissenschaften 22, 1934, p. 807), por Heisenberg (en cartas), e por Einstein nunha carta reimpresa neste volume no apéndice *xii. Retirei, logo, este experimento, mais xa non o considero «decisivo». Non é só que os meus argumentos ata a p. 238 queden intactos, senón que tamén podemos substituír o meu experimento invalidado polo famoso experimento imaxinario descrito por A. Einstein, B. Podolsky e N. Rosen, Physical Review 47, pp. 777-780. A resposta de Neils Bohr a este experimento seméllame que cambia o problema: véxase o apéndice *ix, infra., e tamén o meu artigo «Quantum Mechanics Without 'The Observer'», no volume Quantum Theory and Reality, editado por Mario Bunge, 1967, pp. 7-44. *1 O punto (3) do meu programa, de feito, xa foi tratado. 359 a lóxida da descuberta científica extensión moi pequena na dirección x. Segundo as relacións de dispersión, os momentos de varios electróns deste grupo diferirían amplamente na dirección x (e, por tanto, tamén a súa enerxía). Como vostede afirmou acertadamente, tales enunciados sobre dispersión pódense comprobar. Isto pódese facer medindo os momentos e as enerxías dos electróns illados e, como sabemos a posición, obteremos, xa que logo, tanto a posición coma o momento. unha medición deste tipo pódese realizar, por exemplo, facendo que os electróns choquen nunha placa, co cal se excitararían os átomos desta; entón atoparemos, entre outras cousas, átomos que teñen un grao de excitación que require unha enerxía extra con respecto á enerxía media destes electróns. Admito, por tanto, que vostede tiña razón ao subliñar que tales medicións eran á vez posibles e significativas. Mais, e agora vén a miña obxección, ao facermos tal medición temos que alterar necesariamente o sistema que estamos a examinar, isto é, ou ben os electróns illados, ou ben todo o feixe de electróns, se medimos moitos, como ocorre no noso exemplo. É verdade que a teoría non sería contradita desde un punto de vista lóxico se puidésemos coñecer os momentos dos varios electróns do grupo antes de alteralo (enténdase, sempre que isto non nos permita usar esta información para efectuar unha selección prohibida). Mais non hai maneira de obter tal información sobre os electróns illados sen os alterar. Para rematar, continúa a ser certo que as predicións singulares precisas son imposibles». A esta obxección o primeiro que eu debía responder é que non me sorprendería que fose correcta. Despois de todo, é obvio que dunha teoría estatística nunca se poden deducir predicións singulares exactas, só predicións singulares «indefinidas» (isto é, formalmente singulares). Mais o que eu si podo afirmar a estas alturas é que, aínda que a teoría non proporciona tales predicións, tampouco as descarta. Soamente se podería dicir que as predicións singulares son imposibles se se puidese 360 Karl Popper afirmar categoricamente que alterar o sistema ou interferir nel dalgunha maneira impiden todo tipo de medición preditiva. O meu opoñente dirá: «Pero iso é xusto o que eu digo. Eu sosteño, precisamente, a imposibilidade de tal medición. Vostede supón que é posible medir a enerxía dun destes electróns en movemento sen modificar a súa traxectoria ou a do grupo de electróns. Esta é precisamente a suposición que a min me parece insostible, pois supoñendo que eu tivese un aparato co que realizar tales medicións, entón eu debía poder, con este aparato ou un semellante, ser quen de xerar agregados de electróns en que todos (a) estivesen limitados en canto á posición, e (b) tivesen o mesmo momento. Vostede tamén pensa, xaora, que a existencia de tales agregados contradiría a teoría cuántica, pois son descartados polas súas «relacións de dispersión», como vostede as denomina. Así que o único que podería contestar vostede é que é posible concibir un aparato que nos permita tomar medicións, pero non facer seleccións. Eu admito que esta resposta é loxicamente admisible, mais como físico só podo dicir que os meus instintos se revelan contra a idea de que se poden medir os momentos dos electróns mentres non se sexa quen de eliminar, por exemplo, todos aqueles que teñan un momento que exceda (ou que non chegue a) unha cantidade determinada». A miña primeira resposta a esta obxección sería que todo iso semella bastante convincente. Mais non se proporciona ningunha proba rigorosa (nin se pode proporcionar, como veremos axiña) da idea de que, se é posible unha medición preditiva, tamén teña que ser posible a correspondente selección ou separación física. Ningún deses argumentos proba que as predicións precisas contradirían a teoría cuántica. Todos introducen unha hipótese adicional, pois o enunciado (que corresponde á perspectiva de heisenberg) que afirma que son imposibles as predicións singulares resulta ser equivalente á hipótese de que as medicións preditivas e as seleccións físicas están inseparable361 a lóxida da descuberta científica mente ligadas. E a miña concepción ten que chocar por forza contra este novo sistema teórico consistente na conxunción da teoría cuántica con esta hipótese de ligadura auxiliar1. Con isto complétase o punto (3) do meu programa. Mais o punto (4) aínda está pendente de desenvolvemento, isto é, aínda temos que demostrar que é contraditorio o sistema que combina a teoría cuántica interpretada estatisticamente (incluíndo, supoñemos, as leis de conservación do momento e a enerxía) coa «hipótese de ligadura». Supoño que hai unha convicción fondamente arraigada segundo a cal as medicións preditivas e a selección física sempre van unidas. Talvez sexa a sobrevivencia desta convicción a que explique que nunca se elaborasen os sinxelos argumentos que serían necesarios para soster o contrario. Gustaríame destacar que as consideracións, maiormente físicas, que vou presentar a continuación non forman parte das premisas da miña análise lóxica das relacións de incerteza, aínda que se si se podería considerar que son froito delas. De feito, a análise realizada ata aquí é totalmente independente do que vén a seguir, especialmente do experimento físico imaxinario que se describe máis abaixo*2, co cal se pretende establecer a posibilidade de predicións arbitrariamente precisas da traxectoria de partículas illadas. Como introdución a este experimento imaxinario, comentarei primeiro varios experimentos máis sinxelos. Con isto preténdese mostrar que se poden facer predicións de traxectoria de precisión arbitraria, e que ademais se poden comprobar. De momento terei en conta soamente predicións que non se refiren a partícu1 A hipótese auxiliar aquí comentada pode aparecer, claro está, noutra forma diferente. A razón pola que escollín esta forma particular para a discusión e a análise crítica é que a obxección que sostén esta ligadura entre medición e selección física foi presentada (en conversas e mais en cartas) como unha crítica á concepción defendida aquí. *2 Parece que os que me criticaron, e que con razón rexeitaron a idea deste experimento imaxinario, tamén xulgaron que con iso xa refutaran a análise anterior, a pesar da advertencia feita aquí. 362 Karl Popper las illadas definidas, senón a (todas as) partículas dentro dunha pequena zona espacio-temporal (∆x.∆y.∆z.∆t). En cada caso só hai unha certa probabilidade de que haxa partículas nesa zona. Imaxinemos de novo un feixe (un electrón ou feixe de luz) de partículas que circulan na dirección x. Pero esta vez supoñamos que é monocromático, de maneira que todas as partículas circulen por traxectorias paralelas en dirección x co mesmo momento. Os compoñentes nas outras direccións do momento tamén serán coñecidos, isto é, sábese que son igual a cero. Agora, en lugar de determinar a posición na dirección x dun grupo de partículas por medio dunha selección física (isto é, en lugar de illar o grupo de partículas do resto do feixe por medios técnicos, como fixemos antes), esta vez bastaranos con diferenciar este grupo do resto simplemente concentrando a nosa atención nel. Por exemplo, podemos centrar a atención en todas aquelas partículas que teñen (cunha precisión dada) nun instante dado a coordenada de situación x, e que por tanto non se espallan máis alá dun pequeno ámbito arbitrariamente escollido ∆x. De cada unha destas partículas coñecemos con precisión o momento. Por tanto, coñecemos con precisión para cada instante futuro onde vai estar este grupo de partículas (está claro que a mera existencia de tal grupo de partículas non contradí a teoría cuántica, só a súa existencia por separado, isto é, a posibilidade de seleccionalo fisicamente, contradiría a teoría). Podemos levar a cabo o mesmo tipo de selección imaxinaria en relación co resto das coordenadas espaciais. O feixe monocromático seleccionado fisicamente tería que ser moi ancho nas direccións y e z (infinitamente ancho no caso dun feixe monocromático ideal) porque nestas direccións suponse que o momento é seleccionado con precisión, ou sexa, é igual a cero, de maneira que as posicións nestas direccións teñen que estar moi espalladas. Mentres, podemos centrar a atención nun raio parcial moi estreito. De novo, non só coñeceremos así a posición, senón tamén o momento de cada partícula deste 363 a lóxida da descuberta científica raio. Así seremos quen de predicir sobre cada unha das partículas deste estreito raio (que seleccionamos, por así dicir, na imaxinación) en que punto e con que momento chegará a unha placa fotográfica situada na súa traxectoria e, obviamente, esta predición pódese comprobar empiricamente (igual que no experimento anterior). Partindo doutros tipos de agregados, pódense facer seleccións imaxinarias análogas á que acabamos de facer a partir dun «caso puro» dun tipo concreto. Por exemplo, podemos tomar un feixe monocromático do cal se fai unha selección física por medio dunha fenda moi pequena ∆y (tomando, xa que logo, como punto de partida físico unha selección física que corresponde á selección imaxinada do exemplo anterior). Non coñecemos de ningunha das partículas en que dirección irán despois de pasar pola fenda, mais se consideramos unha dirección definida podemos calcular con precisión o compoñente do momento de todas as partículas que tomasen esta dirección concreta. Así, as partículas que despois de pasar pola fenda se desprazan nunha dirección definida forman de novo unha selección imaxinada. Por tanto, podemos predicir tanto a súa posición como o seu momento, ou sexa, as súas traxectorias e, de novo, poñendo unha placa fotográfica na súa traxectoria, tamén podemos comprobar as nosas predicións. En principio, a situación é a mesma (malia que as comprobacións empíricas sexan dalgún xeito máis difíciles) no caso do primeiro exemplo que comentamos, a saber: a selección de partículas segundo a súa posición na dirección en que circulan. Se xeramos unha selección física que corresponda a este caso, entón diferentes partículas circularán con velocidades diferentes, debido á dispersión dos momentos. O grupo de partículas estenderase nun ámbito cada vez maior na dirección x segundo vaia avanzando (o paquete farase máis ancho). Agora podemos calcular o momento dunha parte das partículas (seleccionadas 364 Karl Popper na imaxinación) que, nun instante dado, estarán nunha posición dada na dirección x: o momento será tanto maior canto máis lonxe estea o grupo parcial seleccionado (e viceversa). A comprobación empírica da predición obtida desta maneira poderíase realizar mediante a substitución da placa fotográfica por unha banda móbil dunha cinta fotográfica. Como de cada punto da banda sabemos o tempo da súa exposición ao impacto dos electróns, tamén podemos predicir de cada punto da banda con que momento ocorrerán os impactos. Estas predicións poderíanse comprobar, por exemplo, poñendo un filtro en fronte da banda móbil ou en fronte do contador Geiger (un filtro no caso de raios luminosos, no caso de electróns un campo eléctrico en ángulo recto coa dirección do raio) seguido por unha selección segundo a dirección, permitindo que só pasen aquelas partículas que teñen un momento dado mínimo. Entón poderiamos saber se estas partículas chegaron en realidade no tempo predito ou non. A precisión das medicións empregadas nestas comprobacións non está limitada polas relacións de incerteza. Suponse que estas son aplicables, como vimos, sobre todo a aquelas medicións que se usan para a dedución de predicións, non para comprobar estas. Isto é, suponse que son aplicables a medicións preditivas, máis que a medicións non preditivas. Nos apartados 73 e 76 examinei tres casos de tales medicións «non preditivas»: (a) medición de dúas posicións, (b) medición de posición precedida ou (c) seguida por unha medición de momento. A medición comentada anteriormente, consistente en poñer un filtro en fronte dunha banda do filme dun contador Geiger exemplifica (b), isto é, unha selección segundo o momento seguida por unha medición de posición. Isto suponse que é o caso que permite, segundo heisenberg (apartado 73), «un cálculo sobre o pasado do electrón», pois mentres nos casos (a) e (c) só son posibles as medicións entre dúas medi365 a lóxida da descuberta científica cións, no caso (b) é posible calcular a traxectoria anterior á primeira medición, sempre que esta medición sexa unha selección segundo un momento dado, debido a que tal selección afecta a posición da partícula*3. heisenberg, como sabemos, cuestiona a «realidade física» desta medición, porque só nos permite calcular o momento da partícula despois de chegar a unha posición medida con precisión e a un tempo tamén medido con precisión: a medición semella carecer de contido preditivo porque non se pode deducir dela ningunha conclusión comprobable. Aínda así, vou basear o meu experimento imaxinario, dirixido a determinar a posibilidade de predicir precisamente a posición e momento dunha partícula definida, neste método de medición concreto que a primeira vista parece non preditivo. xa que vou tirar consecuencias tan transcendentais do presuposto de que son posibles medicións precisas «non preditivas» deste tipo, é conveniente xustificar por que este presuposto é admisible. Isto faise no apéndice vi. Co experimento imaxinario que facemos a continuación, eu cuestiono abertamente a estratexia argumental que usaron Bohr e heisenberg para xustificar a interpretación das fórmulas de heisenberg como limitacións sobre a precisión atinxible. Eles intentaron xustificar esta interpretación mostrando que non se pode crear ningún experimento imaxinario que produza medicións preditivas máis exactas. Mais é evidente que este método argumentativo non exclúe a posibilidade de *3 Este enunciado (que tentei basear na argumentación desenvolvida no apéndice vi) foi criticado acertadamente por Einstein (cf. apéndice *xii) e demostrou ser falso, polo que o meu experimento imaxinario non ten validez. O aspecto principal é que as medicións non preditivas determinan a traxectoria dunha partícula soamente entre dúas medicións, como unha medición de momento seguida por unha de posición (ou viceversa); non é posible, segundo a teoría cuántica, proxectar unha traxectoria moito máis atrás, isto é, á zona temporal anterior á primeira destas medicións. Así que o último parágrafo do apéndice vi está errado e non podemos saber da partícula que chega a x (véxase o que se di máis abaixo) se procede de P ou doutro sitio. Véxase tamén a nota ** da páxina 232. 366 Karl Popper que algún día se poida crear un experimento que (usando leis e efectos físicos coñecidos) demostre que tales medicións son posibles. Deuse por válido sen máis que un tal experimento contradiría o formalismo da teoría cuántica e parece que esta convicción determinou a dirección da busca de tales experimentos. A pesar disto, a miña análise, levando a cabo os puntos (1) e (2) do meu programa, preparou o camiño para crear un experimento imaxinario que demostre, en concordancia total coa teoría cuántica, que é posible realizar medicións con tal precisión. Para levar a cabo este experimento, farei uso da «selección imaxinaria», coma antes, pero a selección será de tal xeito que, se realmente existe unha partícula que sexa caracterizada pola selección, estaremos en condicións de sabelo. O meu experimento, dalgún xeito, constitúe unha especie de idealización dos experimentos de Compton-Simon e BotheGeiger2. Como o que pretendemos é obter predicións singulares, non podemos operar soamente con suposicións estatísticas. haberá que usar tamén as leis non estatísticas da conservación de enerxía e momento. Podemos explotar o feito de que estas leis nos permiten calcular o que ocorre cando chocan as partículas, sempre que se nos proporcionen dúas das catro magnitudes que describen a colisión (isto é, dos momentos a1 e b1 antes, e a2 e b2 despois da colisión) e dun compoñente3 dunha terceira (o método de cálculo é ben coñecido por formar parte da teoría do efecto Compton4). Imaxinemos agora o seguinte arranxo experimental (véxase a figura 2). 2 Compton e Simon, Physical Review 25, 1924, p. 439; Bothe e Geiger, Zeitschrift für Physik 32, 1925, p. 639; cf. tamén Compton, X-Rays and Electrons, 1927; Ergebnisse der exakten Naturwissenschaft 5, 1926, p. 267 ss.; Haas, Atomtheorie, 1929, p. 229 ss. 3 Enténdase aquí «compoñente» no senso máis amplo (como magnitude de dirección ou como magnitude absoluta). 4 Cf. Haas, ob. cit. 367 a lóxida da descuberta científica Figura 2 Cruzamos dous raios de partículas (dos que un, como moito, pode ser un raio de luz, e o outro pode ser, como moito, electricamente non neutral5) que son ambos casos puros no senso de que o raio A é monocromático, isto é, unha selección segundo o momento a1, mentres que o raio B pasa por unha fenda estreita F e por tanto está sometido a unha selección física segundo a posición. Pódese supoñer que as partículas B teñen o momento (absoluto) b1. Algunhas das partículas destes dous raios van chocar. Agora imaxinamos dous raios parciais [A] e [B] que se cruzan na posición P. O momento de [A] é coñecido: é a1. O momento do raio parcial [B] é calculable unha vez que lle decidimos unha dirección definida: sexa esta b1. Agora escollemos unha dirección PX. reparando naquelas partículas do raio parcial [A] que despois da colisión circulan na dirección PX, podemos calcular o seu momento a2, e tamén b2, isto é, o momento das partículas con que chocaron despois da colisión. 5 O que teño en mente é un raio luminoso de calquera tipo de raio corpuscular (negatón, positón ou neutrón). En principio, porén, poderíanse usar dous raios corpusculares, dos que un polo menos é un raio neutrón. (Incidentalmente, as palabras «negatrón» (inglés negatron) e «positrón» (inglés positron), de uso xa corrente, seméllanme monstruosidades lingüísticas, pois tampouco dicimos «positrivo» nin «protrón») 368 Karl Popper Para cada partícula [A] que se desviou no punto P co momento a2, na dirección X, ten que corresponder unha segunda partícula, de [B], que se desviou en P co momento b2, na dirección calculable PY. Agora situamos un aparato en X (por exemplo, un contador Geiger ou unha banda móbil de filme) que rexistra os impactos de partículas que proceden de P na zona arbitrariamente restrinxida X. Entón podemos dicir: segundo facemos este rexistro dunha partícula, sabemos ao mesmo tempo que unha segunda partícula ten que estar circulando desde P co momento b2 cara a Y. E tamén sabemos por ese rexistro onde estaba esta segunda partícula en calquera momento dado, pois podemos calcular, partindo do tempo do impacto da primeira partícula en X e da súa velocidade coñecida, o momento da súa colisión con P. usando outro contador Geiger en Y (ou a banda móbil de filme), podemos comprobar as nosas predicións para a segunda partícula*4. A precisión destas predicións, xunto coas medicións realizadas para comprobalas, non está sometida, en principio, a ningunha das limitacions debidas ao principio de incerteza, en relación tanto coa coordenada de posición como co compoñente do momento na dirección PY. Isto é debido a que o meu experimento imaxinario reduce a cuestión da precisión coa que se poden facer predicións sobre unha partícula B desviada en P á cuestión da precisión atinxible na toma de medicións en X. *4 Einstein, Podolsky e Rosen usaron un argumento máis frouxo pero válido: supoñamos que é válida a interpretación de Heisenberg, de xeito que só poidamos medir á vontade ou ben a posición ou ben o momento da primeira partícula en X. Entón, se medimos a posición da primeira partícula, podemos calcular a posición da segunda partícula; e se medimos o momento da primeira partícula, podemos calcular o momento da segunda partícula. Pero como podemos escoller (se medir posición ou momento) en calquera instante, mesmo despois da colisión das dúas partículas, non é razoable asumir que a segunda partícula se vise afectada ou interferida polos cambios nos arranxos experimentais que son resultado da nosa escolla. Segundo isto, podemos calcular, coa precisión que queiramos, ou ben posición ou ben momento da segunda partícula sen interferir nela, algo que se pode expresar dicindo que a segunda partícula ten á vez posición precisa e momento preciso. (Einstein dixo que tanto a posición coma o momento son «reais», polo cal foi alcumado de «reaccionario»). Véxase tamén a nota da p. 232 e os apéndices *xi e *xii. 369 a lóxida da descuberta científica Estas, ao comezo, semellaban medicións non preditivas do tempo, posición e momento da correspondente primeira partícula [A]. O momento desta partícula na dirección PX, xunto co tempo do seu impacto en X, isto é, a súa posición na dirección PS, pódense medir co grao de predición que queiramos (cf. apéndice vi) se facemos unha selección de momento mediante a interposición, por exemplo, dun campo eléctrico ou un filtro en fronte do contador Geiger, antes de medirmos a posición. Pero, como consecuencia disto (como se mostrará máis polo miúdo no apéndice vii) podemos facer predicións co grao de precisión que queiramos sobre a partícula B que circula na dirección PY. Este experimento imaxinario permítenos ver non só que se poden facer predicións singulares precisas, senón tamén baixo que condicións se poden facer ou, mellor dito, baixo que condicións son compatibles coa teoría cuántica. Pódense facer soamente se podemos obter información sobre o estado da partícula sen sermos capaces de crear este estado á vontade. Deste xeito obtemos a información despois do acontecemento, por dicilo así, pois no momento de obtela a partícula xa terá asumido un estado en movemento. Malia isto, podemos facer uso desta información para deducir dela predicións comprobables (se a partícula B en cuestión é un fotón, por exemplo, seriamos quen de calcular o tempo da súa chegada a Sirio). Os impactos de partículas que chegan a X sucederanse a intervalos irregulares de tempo, o cal significa que as partículas do raio parcial B sobre o que estamos facendo as predicións tamén se sucederán tras intervalos de tempo irregulares. Contradiríase a teoría cuántica se se puidese alterar este estado de cousas, por exemplo, facendo regulares estes intervalos de tempo. Así que, se se nos permite a expresión, somos quen de apuntar ao obxectivo e mais de predeterminar a forza da bala, e tamén podemos calcular (e isto antes de que a bala chegue ao obxectivo Y) o tempo exacto en que se disparou o tiro en P. Con todo, non podemos escoller libremente o momento do disparo, senón que 370 Karl Popper temos que agardar a que a bala arrinque. E tampouco podemos impedir que haxa disparos incontrolados na dirección do noso obxectivo (dende a veciñanza de P). Está claro que este experimento e a interpretación de heisenberg son incompatibles. Mais como a posibilidade de levar a cabo este experimento se pode deducir da interpretación estatística da física cuántica (coa adición das leis da enerxía e momento), parecería que a interpretación de heisenberg, ao contradicila, debía tamén contradicir a interpretación estatística da teoría cuántica. á vista dos experimentos de ComptonSimon e Bothe-Geiger, parece que é posible levar a cabo o noso experimento. Pódese considerar unha especie de experiment crucis ou experimento crucial para decidir entre a concepción de heisenberg e unha interpretación estatística coherente da teoría cuántica. 78 Metafísica indeterminista O cometido dos científicos da natureza é buscar leis que lles permitan deducir predicións. Este cometido pódese dividir en dúas partes. Por unha banda, teñen que intentar descubrir leis que lles permitan deducir predicións illadas (leis «causais» ou «deterministas», ou «enunciados de precisión»). Por outra banda, teñen que intentar propoñer hipóteses sobre frecuencias, isto é, leis que afirmen probabilidades, co obxectivo de deducir predicións de frecuencia. Non hai nada que faga que estes dous cometidos sexan mutuamente incompatibles. Non é certo que non se poiden facer hipóteses de frecuencia cando se fan enunciados de precisión, pois algúns enunciados de precisión son, como vimos, macroleis deducibles de suposicións de frecuencia. Como tampouco é certo que cando nun campo concreto os enunciados de probabilidade estean suficientemente confirmados, esteamos autorizados a concluír que neste campo non se poden facer enunciados de precisión. Malia que todo isto 371 a lóxida da descuberta científica semella bastante evidente, a segunda destas dúas conclusións, que nós rexeitamos, foi defendida en numerosísimas ocasións. unha e outra vez topamos coa crenza de que onde impera o azar, descártase a regularidade. xa fixen un exame crítico desta crenza no apartado 69. A xulgar polo estado presente de desenvolvemento da ciencia, o dualismo entre macro e microleis (refírome especificamente ao feito de operarmos con ambas) non vai ser doado de superar. Máis posibilidades ten, desde o punto de vista lóxico, a redución de todos os enunciados de precisión coñecidos (interpretándoos como macroleis) a enunciados de frecuencia. A redución inversa non é posible, pois dos enunciados de precisión nunca se poden deducir enunciados de probabilidade, como vimos no apartado 70. Os enunciados de probabilidade necesitan as súas propias suposicións de carácter especificamente estatístico. Os cálculos de probabilidade soamente se poden realizar a partir de estimacións de probabilidade*1. Así é como está a situación desde o punto de vista lóxico. Desde a perspectiva lóxica non se favorece nin unha visión determinista nin unha indeterminista. E se algunha vez fose posible traballar na física só con enunciados de probabilidade, nin sequera daquela estariamos autorizados a tirar conclusións indeterministas, o cal significa que nin sequera daquela estariamos autorizados a afirmar que «non hai leis precisas na natureza, leis das que se poidan deducir predicións sobre o curso de procesos elementais ou singulares». Os científicos nunca permitirán que nada lles impida continuar á procura de leis, incluídas as leis deste tipo. E por moito éxito que teñamos coas nosas operacións de estimacións de probabilidade, non debemos concluír que a busca de leis de precisión sexa en balde. *1 A esta opinión oponse Einstein ao final da súa carta, incluída aquí no apéndice *xii. Mais eu sigo pensando que é verdade. 372 Karl Popper Estas reflexións non son, de maneira ningunha, resultado do experimento imaxinario descrito no apartado 77, senón que é máis ben todo o contrario. Supoñamos que as relacións de incerteza non son refutadas por este experimento (por calquera razón, por exemplo, que o experimentum crucis descrito no apéndice vi resultase contrario á teoría cuántica): mesmo neste caso só se poderían comprobar en tanto que enunciados de frecuencia e só se poderían corroborar en tanto que enunciados de frecuencia. Así que en ningún caso estariamos autorizados a tirar conclusións indeterministas a partir do feito de que estes enunciados fosen suficientemente corroborados*2. Existen leis estritas que regulen o mundo ou non? Eu considero que unha pregunta coma esta é metafísica. As leis que nós atopamos son sempre hipóteses, o cal significa que sempre poden ser superadas e, posiblemente, que talvez se poidan deducir de estimacións de probabilidade. Así e todo, negar a causalidade sería como intentar convencer ao teórico de que abandone a súa busca, e tal intento nunca poderá estar baseado en nada parecido a unha demostración probada. O denominado «principio da causalidade» ou «lei da causalidade», en calquera das súas posibles formulacións, é moi diferente en carácter dunha lei natural, polo que eu non podo estar de acordo con Schlick cando afirma: «... a lei da causalidade pódese comprobar en canto á súa veracidade, exactamente no mesmo sentido que calquera outra lei natural»1. *2 Continúo crendo que esta análise é fundamentalmente correcta: do éxito de predicións de frecuencia sobre lanzamentos de moeda non podemos concluír que os lanzamentos singulares sexan indeterminados. Pero podemos argumentar a favor, digamos, dunha perspectiva metafísica indeterminista sinalando dificultades e contradicións que esta perspectiva pode ser capaz de disolver. 1 Schlick (Die Kausalität in der gegenwärten Physik, Die Naturwissenschaften 19, 1931, p. 155) escribe (cito a pasaxe completa; cf. tamén as miñas notas 7 e 8 do apartado 4): «Os nosos intentos de atopar un enunciado comprobable equivalente ao principio de causalidade fracasaron; os nosos intentos de formulalo só nos levaron a pseudo-enunciados. Este resultado, porén, non é sorpresa ningunha, pois xa sinalamos que a verdade da lei da causalidade se pode comprobar do mesmo xeito que a de calquera outra lei natural. Mais tamén sinalamos que estas leis naturais, á súa vez, se son analizadas rigorosamente, non semellan ter o carácter de enunciados que sexan verdadeiros ou falsos, senón que resultan 373 a lóxida da descuberta científica A crenza na causalidade é metafísica*3. Non é máis que unha típica hipostatización metafísica dunha regra metodolóxica suficientemente xustificada: a decisión do científico de nunca abandonar definitivamente a busca de leis. A crenza metafísica na causalidade semella, entón, máis fértil nas súas varias manifestacións que en calquera metafísica indeterminista defendida por heisenberg. De feito, podemos ver que os comentarios de heisenberg tiveron un efecto inhibidor sobre a investigación. Non hai que ir moi lonxe para atopar algunhas conexións, mais, se se está repetindo constantemente que a busca de tales conexións «non ten sentido», é doado que estas poidan pasar inadvertidas. As fórmulas de heisenberg –como outros enunciados semellantes que soamente se poden corroborar polas súas consecuencias estatísticas– non levan necesariamente a conclusións indeterministas. Mais isto por si mesmo non proba que non poida haber outro enunciado empírico que xustifique esta ou semellantes conclusións: por exemplo, a conclusión de que a regra metodolóxica mencionada (a decisión de nunca abandonar definitivamente a busca de leis) non pode cumprir o seu obxectivo, talvez porque resulte inútil, carente de sentido ou «imposible» (cf. nota 2 do apartado 12) buscar leis e predicións singulares. Pero non pode haber un enunciado empírico que teña consecuencias metodolóxicas que nos forcen a abandonar a busca de leis, debido a que un enunciado que supostamente está libre de elementos metafísicos soamente pode dar lugar a conclusións indeterministas se estas son falsificables*4. Mais soamente se pode demostrar que son falsas estas últimas se damos formulado leis e se damos deducido predicións a partir ser só regras para a (trans-)formación de tales enunciados». Schlick xa sostivera antes que o principio de causalidade se debería situar ao mesmo nivel que as leis naturais. Pero como naquela época el consideraba as leis naturais como enunciados xenuínos, tamén consideraba «o principio de causalidade... como unha hipótese empiricamente comprobable». Cf. Allgemeine Erkenntnislehre, 2a edición, 1925, p. 374. *3 Compárese coas opinións expresadas aquí e no resto deste capítulo co capítulo *iv do Postscript. *4 Isto, aínda que é válido como resposta a un positivista, resulta enganoso con esta formulación, pois un enunciado falsificable pode ter todo tipo de consecuencias loxicamente febles, incluíndo as non falsificables (cf. o cuarto parágrafo do apartado 66). 374 Karl Popper delas que estean corroboradas. Por tanto, supoñendo que estas conclusións indeterministas sexan hipóteses empíricas, deberiamos intentar comprobalas por todos os medios, isto é, debiamos intentar falsificalas. E isto quere dicir que deberiamos andar á procura de leis e predicións. En consecuencia, non podemos obedecer a exhortación a abandonar a busca sen rexeitar o carácter empírico destas hipóteses. Isto demostra que sería contraditorio pensar que podería existir unha hipótese empírica que nos forzase a abandonar a busca de leis. Non pretendo demostrar aquí en detalle como todos estes intentos de impoñer o indeterminismo revelan un modo de pensamento que só se pode describir como determinista, no senso metafísico (heisenberg, por exemplo, intenta dar unha explicación causal que xustifique que as explicacións causais son imposibles*5). limitareime a lembrarlle ao lector/a sobre os intentos que se fixeron para demostrar que as relacións de incerteza fechan certas vías de posible investigación, da mesma maneira que as fecha o principio da constancia da velocidade da luz: a analoxía entre as dúas constantes c e h, a velocidade da luz e a constante de Plank, foi interpretada no senso de que as dúas establecen un límite, en principio, ás posibilidades de investigación. As cuestións que pretendesen aventurarse alén destas barreiras foron desbotadas polo coñecido método de rexeitar co cualificativo de «pseudoproblemas» aqueles problemas que sexan difíciles de abordar. Na miña opinión existe, xaora, unha analoxía entre as constantes c e h, pero unha analoxía que asegura que a constante h non é un obstáculo maior para a investigación que a constante c. O principio da constancia da velocidade da luz (e da imposibilidade de exceder esta velocidade) non nos impide buscar outras velocidades que sexan maiores que a da luz, pois o principio só afirma que non atoparemos ningunha, isto é, que non seremos capaces de xerar sinais que viaxen máis rápido que a luz. De xeito análogo, as fórmulas de heisenberg non se debían *5 O seu argumento, dito de xeito resumido, é que a causalidade se interrompe debido á nosa interferencia co obxecto observado, isto é, debido a certas interaccións causais. 375 a lóxida da descuberta científica interpretar no senso de prohibir ir á busca de casos «superpuros», pois as fórmulas só afirman que non atoparemos ningún e, en especial, que non seremos capaces de xerar ningún caso dese tipo. As leis que prohiben velocidades superiores á da luz e os casos «superpuros» supoñen un desafío para as investigadoras e investigadores indagaren no prohibido, pois só poden comprobar os enunciados empíricos mediante intentos de falsificación. Desde un punto de vista histórico, é perfectamente comprensible a emerxencia da metafísica indeterminista, pois durante moito tempo os físicos creron na metafísica determinista. E como a cuestión lóxica non era comprendida na súa integridade, resulta inevitable que fracaso dos varios intentos de deducir os espectros de luz (que son efectos estatísticos) dun modelo mecánico do átomo ocasionase unha crise para o determinismo. hoxe en día vemos claramente que este fracaso era inevitable, pois é imposible deducir leis metafísicas dun modelo (mecánico) non estatístico do átomo. Mais naquela altura (polo 1924, a época da teoría de Bohr, Kramers e Slater) era difícil que non parecese que no mecanismo de cada átomo illado as probabilidades estaban substituíndo as leis estritas. O edificio determinista derrubábase, sobre todo porque os enunciados de probabilidade se expresaban como enunciados formalmente singulares. Sobre as ruínas do determinismo abrollou o indeterminismo, apoiándose no principio de incerteza de heisenberg. Mais abrollou, como agora vemos, a partir da mesma incomprensión sobre o significado dos enunciados de probabilidade formalmente singulares. A lección que se tira de todo isto é que deberiamos intentar atopar leis estritas (prohibicións) que poidan fracasar na experiencia. Mais tamén que nos deberiamos abster de emitir prohibicións que establezan límites ás posibilidades da investigación*6. *6 Máis recentemente reformulei as miñas ideas sobre estes asuntos (despois de 33 anos) no artigo «Quantum Mechanics «Without 'The Observer'», no volume Quantum Theory and Reality, editado por Mario Bunge, 1967, pp. 7-44. 376 Karl Popper 10 A CORROBORACIÓN, OU COMO UNHA TEORÍA SUPERA COMPROBACIÓNS As teorías non son verificables, pero pódense «corroborar». Intentouse moitas veces dicir que as teorías non son nin verdadeiras nin falsas, senón que son máis ou menos probables. A lóxica indutiva, de xeito máis especial, desenvolveuse como unha lóxica que pode asignar non só os valores «verdadeiro» e «falso» aos enunciados, senón que tamén asigna graos de probabilidade; este tipo de lóxica aquí denominarémola lóxica da probabilidade. Segundo aqueles que cren na lóxica da probabilidade, a indución debería determinar o grao de probabilidade dun enunciado. un principio de indución debería ou ben asegurarse de que o enunciado inducido sexa «probablemente válido» ou ben convertelo en probable, á súa vez, pois o propio principio de indución podería ser só «probablemente válido». Con todo, na miña opinión, o problema das hipóteses de probabilidade foi erroneamente concibido. En lugar de discutir a «probabilidade» dunha hipótese, o que deberiamos é intentar valorar as comprobacións que resistiu ou superou, isto é, deberiamos intentar avaliar en que medida foi capaz de demostrar que é apta para sobrevivir despois de ser sometida a comprobacións. Dito abreviadamente, deberiamos tentar avaliar en que medida unha hipótese foi «corroborada»*1. *1 Introducín os termos corroboración (en inglés corroboration, en alemán Bewährung) e, en especial, grao de corroboración (alemán Grad der Bewährung, Bewärhrungsgrad) neste libro porque quería un termo neutral para describir o grao en que unha hipótese foi sometida a comprobacións rigorosas, ou sexa, en que medida «demostrou o que vale». Por «neutral» quero dicir un termo que non prexulgue a cuestión de se, someténdose a probas, a hipótese se converte en «máis probable», no senso do cálculo de probabilidade. Noutras palabras, introducín o termo «grao de corroboración», sobre todo, para estar en condicións de tratar o problema de se o «grao de corroboración» se podía identificar coa «probabilidade» (ou ben no senso da frecuencia ou no de Keynes, por exemplo). Carnap traduciu o meu termo «grao de corroboración» (Grad der Bewährung), que primeiro introducira eu nas discusións do círculo de Viena, como «grao de confirmación» 377 a lóxida da descuberta científica 79 Sobre a chamada verificación de hipóteses Obviouse decote o feito de que as teorías non son verificables. Dise moitas veces que unha teoría se verifica cando algunhas das predicións deducidas dela foron verificadas. Talvez se admita que a verificación non é totalmente impecable desde on punto de vista lóxico e quizais admitan tamén que un enunciado non se pode establecer definitivamente só con establecer algunhas das súas consecuencias. Mais maiormente considérase que estas obxeccións son consecuencia dun innecesario exceso de escrúpulos. Dise que é certo, mesmo que é trivial, que non podemos ter a seguridade de saber se mañá vai saír o sol. Mais esta incerteza pódese desprezar: as teorías non só se poden mellorar, senón que tamén se poden falsificar mediante novos experimentos e isto ofrécelle ao científico unha seria posibilidade que se pode facer real en calquera momento. Mais por agora nunca houbo que considerar falsificada unha teoría debido ao fallo repentino dunha lei suficientemente confirmada. Nunca ocorre que os experimentos vellos dean resultados novos. O que ocorre é simplemente que os novos experimentos cuestionan unha teoría vella. A teoría vella, mesmo cando é superada, con frecuencia mantén a súa validez como unha especie de caso límite da nova teoría: aínda é aplicable, polo menos cun alto grao de aproximación, naqueles casos en que antes (véxase o seu «Testability and Meaning», Philosophy of Science 3, 1936, p. 427 en especial), que axiña acadou ampla aceptación. A min non me gustaba moito este termo polas súas asociacións (firmeza, afirmar, establecer firmemente, probar, verificar, confirmar, considerar fóra de dúbida; un equivalente próximo a «confirmar» (inglés to confirm) é erhärten ou bestätigen, máis que bewähren). Así que lle propuxen a Carnap nunha carta (escrita, paréceme, alá polo 1939) usar o termo «corroboración» (que me fora suxerido polo Profesor H. N. Parton). Mais como Carnap rexeitou a miña proposta, eu acabei por aceptar o uso proposto por el, na convicción de que o máis importante non son as palabras. Por iso eu mesmo usei o termo «confirmación» durante un tempo en varias das miñas publicacións. Mais ocorre que eu estaba equivocado: as asociacións da palabra «confirmación» si que eran relevantes, desafortunadamente, e fixéronse notar: «grao de confirmación» pasou a usarse enseguida (incluído o propio Carnap) como sinónimo (ou «explicación») de «probabilidade». Por iso o abandonei definitivamente e substituíno por «grao de corroboración». Véxase tamén o apéndice *ix e o apartado *29 do Postscript. 378 Karl Popper funcionaba. Ou sexa, as regularidades que son directamente comprobables mediante experimentos non cambian. É certo que se pode concibir, ou sexa, que é loxicamente posible, que esas regularidades cambien, mais esta posibilidade é ignorada por parte da ciencia empírica e non afecta os seus métodos. Ao contrario, o método científico presupón a inmutabilidade dos procesos naturais ou «principio de uniformidade da natureza». hai algo de certo no argumento anterior, mais este non afecta para nada a miña tese. Manifesta unha fe metafísica na existencia de regularidades no noso mundo (unha fe que eu comparto, pois sen ela a acción práctica é dificilmente concibible)*1. Así e todo, a cuestión a que agora nos enfrontamos –a cuestión que mostra a relevancia da non verificabilidade de teorías no presente contexto– sitúase nun plano completamente diferente. En coherencia coa actitude que adoptei con relación a outras cuestións metafísicas, eu abstéñome de argumentar a favor ou en contra da fe na existencia de regularidades no noso mundo. O que eu vou intentar mostrar é que a non verificabilidade das teorías é metodoloxicamente importante. Se nos situamos neste plano, si que estou en contra do argumento anteriormente presentado. En consecuencia, tomarei en consideración pola súa relevancia só un dos aspectos deste argumento: a referencia ao denominado «principio da uniformidade da natureza». Este principio, paréceme, expresa dun xeito moi superficial unha importante regra metodolóxica, unha regra que se podería deducir con proveito dunha concepción que sosteña, precisamente, a non verificabilidade das teorías*2. Supoñamos que mañá non vai saír o sol (e que, malia isto, nós imos continuar a vivir e a realizar os nosos proxectos e intereses científicos). Se ocorrese tal cousa, a ciencia tería que ten- *1 Cf. apéndice *x e tamén o apartado *15 do Postscript. *2 Refírome á regra de que calquera novo sistema de hipóteses debería dar como resultado, ou explicar, as vellas regularidades corroboradas. Véxase tamén o apartado 3 (terceiro parágrafo) do Postscript. 379 a lóxida da descuberta científica tar explicala, isto é, deducila das súas leis. As teorías existentes, posiblemente, terían que ser sometidas a revisión drástica. Mais as teorías revisadas non só terían que dar conta do novo estado de cousas, senón que as nosas experiencias anteriores tamén terían que ser deducibles das novas teorías. Desde o punto de vista metodolóxico, vese que o principio de uniformidade da natureza substitúese aquí polo de invariancia das leis naturais, con respecto ao espazo e ao tempo. Eu creo, por tanto, que sería un erro soster que as irregularidades naturais non cambian (este sería o tipo de enunciado sobre o que non se pode argumentar a favor nin en contra). O que deberiamos dicir é, máis ben, que é parte da nosa definición das leis naturais se postulamos que han ser invariantes con respecto ao espazo e ao tempo e, por tanto, tamén se postulamos que non han ter excepcións. Así que desde un punto de vista metodolóxico, a posibilidade de falsificar unha lei corroborada non carece, de ningunha maneira, de significación. Esta posibilidade axúdanos a descubrir que é o que lles esiximos ás leis naturais e que é o que agardamos delas. O «principio da uniformidade da natureza» pódese considerar, de novo, como unha interpretación metafísica dunha regra metodolóxica, do mesmo xeito que o seu parente próximo, a «lei da causalidade». O noso intento de substituír enunciados metafísicos deste tipo por principios de método lévanos ao «principio de indución», que supostamente regula o método da indución e, por tanto, o da verificación de teorías. Mais este intento fracasa porque o principio de indución é el mesmo metafísico en carácter. Como sinalei no apartado 1, a asunción de que o principio de indución é empírico leva á regresión infinita. Só se podería introducir, xa que logo, como proposición primitiva (ou postulado, ou axioma). Isto non importaría tanto, se non fose porque o principio de indución tería que ser considerado, en calquera caso, como un enunciado non falsificable. Pois se este principio (que supostamente serve para validar a inferencia de 380 Karl Popper teorías) fose el mesmo falsificable, entón quedaría falsificado coa primeira teoría falsificada, porque esta teoría sería entón unha conclusión, deducida coa axuda do principio de indución; e, xaora, este principio, como premisa, sería falsificado polo modus tollens cada vez que unha teoría deducida del fose falsificada*3. Mais isto significa que un principio falsificable de indución sería falsificado de novo con cada avance da ciencia. Faría falta, por tanto, introducir un principio de indución que se supoña que non é falsificable. Mais isto viría sendo equivalente á noción errónea dun enunciado sintético que fose a priori válido, isto é, un enunciado irrefutable sobre a realidade. Así, se intentamos converter a nosa fe metafísica na uniformidade da natureza e a verificabilidade das teorías nunha teoría do coñecemento baseada na lóxica indutiva, só nos queda a escolla entre unha regresión infinita ou o apriorismo. 80 A probabilidade dunha hipótese e a probabilidade dos acontecementos: crítica da lóxica da probabilidade mesmo se se admite que as teorías nunca se verifican definitivamente, non daremos conseguido nunca que sexan máis ou menos seguras, isto é, máis ou menos probables? Despois de todo, se cadra é posible que a cuestión da probabilidade dunha hipótese se poida reducir, por exemplo, á cuestión da probabilidade dos acontecementos, polo cal se cadra é posible facela susceptible de manexo matemático e lóxico*1. *3 Esta premisa da dedución da teoría (segundo a perspectiva indutiva comentada aquí) comprende o principio de indución e mais os enunciados de observación. Aquí suponse tacitamente que estes últimos son reproducibles e inamovibles, de xeito que non poden eles ser acusados do fracaso da teoría. *1 Este apartado (80) contén fundamentalmente unha crítica do intento de Reichenbach de interpretar a probabilidade de hipóteses en termos dunha teoría frecuencial da probabilidade dos acontecementos. No apartado 83 hai unha crítica da perspectiva de Keyness. *Nótese que a pretensión de Reichenbach é reducir a probabilidade dun enunciado ou hipótese (o que Carnap chamou moitos anos despois probabilidade1) a unha frecuencia (probabilidade2). 381 a lóxida da descuberta científica Coma a lóxica indutiva en xeral, a teoría da probabilidade de hipóteses semella que xurdiu dunha confusión entre cuestións lóxicas e psicolóxicas. Sábese que as nosas sensacións subxectivas de convicción son de diferentes intensidades, polo que é probable que o grao de seguridade con que agardamos o cumprimento dunha predición e a ulterior corroboración dunha hipótese dependa, entre outras cousas, da maneira en que esta hipótese fose capaz ata ese momento de superar comprobacións, ou sexa, da súa corroboración pasada. Ora ben, ata os propios defensores da lóxica da probabilidade recoñecen que estas cuestións psicolóxicas non pertencen á epistemoloxía nin á metodoloxía. Con todo, sobre a base de decisións indutivistas, para eles non só é posible asignar graos de probabilidade ás propias hipóteses senón que tamén é posible reducir este concepto ao de probabilidade dos acontecementos. A probabilidade dunha hipótese é xeralmente considerada un simple caso especial do problema xeral da probabilidade dun enunciado, a cal, á súa vez, se considera que non é outra cousa que a probabilidade dun acontecemento, expresada nunha terminoloxía particular. Por exemplo, reichenbach escribe: «Asignarmos probabilidade aos enunciados ou aos acontecementos é só unha cuestión de terminoloxía. Ata o de agora considerábase como probabilidade dos acontecementos que se lle asignase a probabilidade 1/6 a que saíse un lado concreto dun dado. Mais tamén poderiamos dicir igualmente que ao que se lle asignou a probabilidade 1/6 é ao enunciado «sairá o lado que teña o 1»1. Esta identificación da probabilidade dos acontecementos coa probabilidade dos enunciados pódese comprender mellor se lembramos o que se dixo no apartado 23, onde se definiu o concepto de «acontecemento» como unha clase de enunciados singulares. xa que logo, tamén se debería poder falar da probabilidade de enunciados en lugar da probabilidade de acontecementos. Se 1 Reichenbach, Erkenntnis 1, 1930, p. 171 ss. 382 Karl Popper pensamos nunha «alternativa» ou, mellor dito, nos seus elementos, representados por enunciados, entón podemos describir a aparición de 'cara' mediante o enunciado «k é cara» e a non aparición desta mediante a negación deste enunciado. Deste xeito obtemos unha sucesión de enunciados da forma ... onde o enunciado ás veces se cualifica de «verdadeiro» e ás veces (colocando unha raia encima do seu nome) de «falso». Pódese interpretar que a probabilidade nunha alternativa é a «frecuencia de verdade»2 relativa dos enunciados nunha sucesión de enunciados (máis que a frecuencia relativa dunha propiedade). Ao concepto de probabilidade así transformado podémoslle chamar, se se quere, «probabilidade de enunciados» ou «probabilidade de frecuencias». E podemos demostrar que hai unha relación moi estreita entre este concepto e o de «verdade», pois se unha sucesión de enunciados se fai cada vez máis curta ata que ao final contén só un elemento, só un enunciado único ou singular, entón a probabilidade, ou «frecuencia de verdade» da sucesión, pode asumir só un dos dous valores 1 e 0, segundo o enunciado singular sexa verdadeiro ou falso. A verdade ou falsidade dun enunciado pódese considerar como un caso límite de probabilidade. E á inversa, a probabilidade pódese considerar como unha xeneralización do concepto de verdade, na medida en que inclúe este último como un caso límite. Por último, é posible definir operacións con frecuencias de verdade de tal maneira que as operacións de verdade normais da lóxica clásica se convertan en casos límite destas operacións. O cálculo destas operacións pódese denominar lóxica da probabilidade3. 2 Segundo Keyness (A Treatise on Probability, 1921, p. 101 ss.), a expresión «frecuencia de verdade» débese a Whitehead; cf. a próxima nota. 3 Estou a esbozar aquí a elaboración da lóxica da probabilidade desenvolta por Reichenbach (Wahrscheinlichkeitslogik, Sitzungsberichte der Preussischen Akademie der Wissenschaften, Physik-mathem. Klasse 29, 1932, p. 476 ss.), quen segue a E. L. Post (American Journal of Mathematics 43, 1921, p. 184) e, ao mesmo tempo, a teoría da frecuencia de von Mises. A versión de Whitehead (comentada por Keyness, ob. cit., p. 101 ss.) da teoría da frecuencia é semellante. 383 a lóxida da descuberta científica Pero pódese realmente identificar a probabilidade de hipóteses coa probabilidade de enunciados, segundo esa definición e, polo tanto, indirectamente coa probabilidade de acontecementos? Eu creo que esta identificación é resultado dunha confusión. A idea é que a probabilidade dunha hipótese, debido a que obviamente é un tipo de probabilidade dun enunciado, ten que aparecer baixo a etiqueta «probabilidade de enunciados» no senso que acabamos de definir. Mais resulta que esta conclusión non está xustificada, polo cal a terminoloxía é altamente inadecuada. Despois de todo, se cadra é mellor non usar nunca a expresión «probabilidade de enunciados» se o que temos en mente é a probabilidade de acontecementos*2. Sexa isto como for, eu sosteño que as cuestións que xorden do concepto de probabilidade de hipóteses nin sequera se chegan a tocar minimamente mediante consideracións baseadas na lóxica da probabilidade. Se un di que unha hipótese é probable, en lugar de dicir que é verdadeira, entón o que eu afirmo é que este enunciado non se pode interpretar, baixo ningunha circunstancia, como un enunciado sobre a probabilidade dos acontecementos. Se un intenta reducir a idea da probabilidade de hipóteses a unha idea de frecuencia de verdade mediante o uso do concepto de sucesión de enunciados, entón un enfróntase inmediatamente á pregunta: con referencia a que sucesión de enunciados se lle pode asignar un valor de probabilidade a unha hipótese? reichenbach identifica sen máis unha «aseveracións da ciencia natural» (que para el é unha hipótese científica) cunha sucesión *2 Continúo pensando (a) que a denominada «probabilidade de hipóteses» non se pode interpretar como frecuencia de verdade, (b) que é preferible chamarlle «probabilidade dun acontecemento» a aquela que se define por unha frecuencia relativa (sexa unha frecuencia de verdade ou a frecuencia dun acontecemento), (c) que a denominada «probabilidade dunha hipótese» (no senso da súa aceptabilidade) non é un caso especial da «probabilidade de enunciados». E hoxe considería a «probabilidade de enunciados» como unha interpretación (a interpretación lóxica) entre moitas posibles interpretacións do cálculo formal de probabilidade, máis que como frecuencia de verdade. (Cf. apéndices *ii, *iv e *ix e mais o Postscript). 384 Karl Popper de referencia de enunciados. Di reichenbach: «... as aseveracións da ciencia natural, que nunca son enunciados singulares, son en realidade sucesións de enunciados ás que, en sentido estrito, non debíamos asignar o grao de probabilidade 1, senón un valor de probabilidade menor. Só a lóxica da probabilidade, logo, proporciona unha forma lóxica capaz de representar estritamente o concepto de coñecemento propio da ciencia natural»4. Intentemos agora, logo, seguir por un momento a proposta de que as propias hipóteses son sucesións de enunciados. unha maneira de interpretar a proposta sería tomar, como elementos dunha tal sucesión, os varios enunciados singulares que poidan ou ben contradicir a hipótese ou ben concordar con ela. A probabilidade desta hipótese determinaríase, logo, mediante a frecuencia de verdade daqueles enunciados que concorden con ela. Mais isto daríalle á hipótese unha probabilidade de se, como media, é refutada por un de cada dous enunciados singulares desta sucesión. Para evitarmos esta conclusión devastadora, podemos intentar outros dous recursos máis*3. O primeiro sería asignarlle á hipótese unha certa probabilidade (talvez non moi precisa) baseada nunha estimación que fose resultado de dividir o número de comprobacións a que foi sometida entre o número de todas as probas a que aínda non foi sometida. Mais isto non leva a ningures, pois esta estimación pódese contabilizar con precisión, e o resultado é sempre que a probabilidade é cero. O segundo e último recurso sería intentar basear a estimación no resultado de dividir o número das comprobacións que deron resultado favorable entre o número das que deron un resultado indiferente, ou sexa, unha estimación que non dese lugar a unha decisión clara (deste xeito si que se podería obter algo parecido a unha medición da sensación subxectiva de fiabilidade con que observa os resultados o autor do experimento). Mais este último experimento tampouco serve, mesmo se ignoramos o feito de 4 Reichenbach, Wahrscheinlichkeistlogik (ob. cit., p. 488, p. 15 da reimpresión). *3 Aquí suponse que a estas alturas xa decidimos que sempre que haxa unha falsificación clara, atribuirémoslle á hipótese a probabilidade cero, de xeito que a discusión limítase agora a aqueles casos en que non se obtivo unha falsificación clara. 385 a lóxida da descuberta científica que con este tipo de estimación afastámonos moito do concepto de frecuencia de verdade, igual que do concepto de probabilidade de acontecementos (estes conceptos baséanse no resultado de dividir os enunciados verdadeiros polos falsos e non podemos igualar un enunciado indiferente a un que sexa obxectivamente falso). A razón pola que tamén falla este último intento é que a definición proposta faría que a probabilidade dunha hipótese fose inútil por ser subxectiva de máis: a probabilidade dunha hipótese dependería da destreza e a formación de quen fai o experimento, máis que de resultados comprobables por comprobación e obxectivamente reproducibles. Con todo, creo que é imposible de toda maneira aceptar a proposta de que unha hipótese se poida considerar como unha sucesión de acontecementos. Sería posible se os enunciados universais tivesen a forma: «Para todo valor de k é verdade que no lugar k ocorre isto e aquilo». Se os enunciados universais tivesen esta forma, entón poderiamos considerar os enunciados básicos (aqueles que ou ben contradín o enunciado universal ou ben concordan con el) como elementos dunha sucesión de enunciados: a sucesión que se ha considerar como enunciado universal. Ora ben, como vimos (cf. apartados 15 e 28), os enunciados universais non teñen esta forma. Os enunciados básicos nunca se poden deducir unicamente de enunciados universais*4. Estes últimos non se poden considerar, xa que logo, sucesións de enunciados básicos. Así e todo, se intentamos ter en conta a sucesión das negacións de enunciados básicos que son deducibles de enunciados universais, entón a estimación *4 Como expliquei no apartado 28, os enunciados singulares que se poden deducir dunha teoría (os «enunciados exemplificadores») non teñen o carácter de enunciados básicos ou de enunciados de observación. Porén, se decidimos tomar esta sucesión de acontecementos e basear a probabilidade na frecuencia de verdade desta sucesión, entón a probabilidade sempre será igual a 1, por moito que se falsificase a teoría pois, como se demostrou no apartado 28, nota *1, case calquera teoría é «verificada» por case todos os exemplos (isto é, por case todos os lugares k). A discusión que vén a seguir contén un argumento moi semellante (tamén baseado en «enunciados exemplificadores», isto é, enunciados básicos negados), concibido para mostrar que a probabilidade dunha hipótese, se se basea nestes enunciados básicos negados, sempre sería igual a un. 386 Karl Popper para toda hipótese coherente levará á mesma probabilidade, ou sexa, 1. Pois daquela teriamos que considerar a proporción de enunciados básicos negados non falsificados que se poden deducir (ou outros enunciados deducibles) con respecto aos falsificados. Isto significa que, en lugar de considerar unha frecuencia de verdade, teriamos que considerar o valor complementario dunha frecuencia de falsidade. Este valor, con todo, sería igual a 1, pois tanto a clase de enunciados deducibles como a clase das negacións de enunciados básicos deducibles son infinitas. Por outro lado, non pode haber máis que, como máximo, un número finito de enunciados básicos falsificadores aceptados. Desta maneira, mesmo ignorando o feito de que os enunciados universais nunca son sucesións de acontecementos, e mesmo intentando interpretalos como se fosen algo dese estilo para logo facer correlacións deles con sucesións de enunciados singulares completamente decidibles, nin así logramos un resultado aceptable. Aínda nos queda por examinar outra posibilidade bastante diferente de explicar a probabilidade dunha hipótese en termos de sucesións de enunciados. lémbrese que dicíamos que unha ocorrencia singular dada era «probable» (no senso de «enunciado de probabilidade formalmente singular») cando era un elemento dunha sucesión de ocorrencias cunha certa probabilidade. De xeito semellante, pódese intentar dicir que é «probable» se é un elemento dunha sucesión de hipóteses cunha certa frecuencia de verdade. Mais este intento fracasa, por razóns distintas da dificultade de determinar a sucesión de referencia (pódese escoller de moitas maneiras; cf. apartado 71). Non se pode falar dunha frecuencia de verdade nunha sucesión de hipóteses pola simple razón de que nunca se pode saber se unha hipótese é verdadeira. Se fose posible saber isto, entón xa non faría falta para nada o concepto de probabilidade dunha hipótese. Agora podemos intentar, coma antes, tomar como punto de partida o complemento da frecuencia de falsidade dentro dunha sucesión 387 a lóxida da descuberta científica de hipóteses. Mais se, por exemplo, definimos a probabilidade dunha hipótese servíndonos do resultado de partir as hipóteses non falsificadas entre as falsificadas da sucesión, entón, coma antes, a probabilidade de toda hipótese dentro de toda sucesión de referencia infinita será igual a 1. E nin sequera escollendo unha sucesión de referencia finita nos situaría nunha posición mellor. Supoñamos que podemos asignar aos elementos dunha sucesión (finita) de hipóteses un grao de probabilidade entre 0 e 1 segundo este procedemento (poñamos, o valor 3⁄4). (Isto pódese facer se dispoñemos da información de que se falsificaron certas hipóteses pertencentes á sucesión). Na medida en que estas hipóteses falsificadas sexan elementos dunha sucesión, teriamos que asignarlles, só por esta información, non o valor 0, senón 3⁄4. De xeito xeral, a probabilidade dunha hipótese diminuiría en 1/n como consecuencia da información de que é falsa, onde n é o número de hipóteses da sucesión de referencia. Todo isto contradí claramente o proxecto de expresar, en termos de probabilidade de hipóteses, o grao de fiabilidade que hai que asignarlle a unha hipótese en vista de datos favorables ou contrarios. Paréceme que isto esgota as posibilidades de basear o concepto da probabilidade dunha hipótese no de frecuencia de enunciados verdadeiros (ou na frecuencia de falsos) e, en consecuencia, na teoría frecuencial da probabilidade de acontecementos*5. *5 Os meus anteriores intentos de comprender a críptica afirmación de Reichenbach de que a probabilidade de hipóteses se debe medir por unha frecuencia de verdade, poderíanse resumir como segue (un resumo semellante, con críticas, atópase no parágrafo penúltimo do apéndice *1): En xeral, pódese intentar definir de dúas maneiras a probabilidade dunha teoría. Unha consiste en contar o número de enunciados comprobables experimentalmente pertencentes á teoría para determinar a frecuencia relativa daqueles que resulten ser verdadeiros. Esta frecuencia relativa despois pódese considerar como unha medida da probabilidade da teoría. A este método pódeselle chamar probabilidade de primeiro tipo. En segundo lugar, pódese considerar a teoría como un elemento dunha clase de entidades ideolóxicas (poñamos, de entidades propostas por outros científicos) e despois podemos determinar as frecuencias relativas desta clase. A este método podémoslle chamar probabilidade de segundo tipo. 388 Karl Popper Creo que hai que considerar un completo fracaso o intento de identificar a probabilidade dunha hipótese coa probabilidade de acontecementos. Esta conclusión é independente de que se acepte ou non a afirmación (de reichenbach) de que todas as hipóteses da física, cando se observan de preto, non son «en realidade» máis que enunciados de probabilidade (sobre frecuencias medias dentro de sucesións de observacións que sempre mostran desviacións con respecto a un valor medio), como tamén é independente de que nos inclinemos ou non por facer unha distinción entre dous tipos diferentes de leis naturais: entre leis de «precisión» ou «deterministas», por unha banda, e «leis de probabilidade» ou «hipóteses de frecuencia», pola outra. Ambos os dous tipos son suposicións hipotéticas que, pola súa vez, nunca serán «probables»: só se poderán corroborar, no sentido de que poden «demostrar o que valen» ao sometérense ás nosas rigorosas comprobacións. Eu intentei, ademais, demostrar que cada unha destas dúas posibilidades de entender a idea de Reichenbach de frecuencia de verdade leva a resultados que resultarán inaceptables para os defensores da teoría probabilística da indución. Reichenbach, na súa resposta ás miñas críticas, criticou as miñas ideas, en lugar de defender as súas. No seu artigo sobre o meu libro (Erkenntnis 5, 1935, pp. 267-284), afirma que «os resultados do meu libro son totalmente insostibles» e atribúe isto a un fracaso do meu «método», por eu non «tirar todas as consecuencias» do meu sistema conceptual. O apartado iv do seu artigo (p. 274 e ss.) dedícase ao problema que nos ocupa, a probabilidade de hipóteses. Comeza así: «Neste sentido, débense engadir algunhas puntualizacións máis sobre a probabilidade das teorías, que deberían completar as escasas puntualizacións que ata o de agora fixen sobre o tema e que poden contribuír a botar algo de luz a escuridade que aínda rodea o asunto». Despois disto segue unha pasaxe que forma o segundo parágrafo da presente nota, encabezado pola expresión «En xeral» (a única que eu engadín ao texto de Reichenbach». Reichenbach non di nada sobre o feito de que o seu intento de eliminar «a escuridade que aínda rodea o asunto» non é máis que un resumo (aproximado, iso si) dalgunhas páxinas do libro que el está a criticar. Malia este silencio, a miña impresión é que teño que tomar como un cumprido, vindo dun autor con tanta experiencia no tema da probabilidade (alguén que, no momento de escribir a súa resposta ao meu libro, xa tiña publicados sobre o tema dous libros e unha ducia de artigos, todos eles cunha merecida boa reputación), o feito de que aceptase os resultados dos meus intentos de «tirar todas as consecuencias» sobre as súas «breves comunicacións sobre o tema». O éxito dos meus proxectos debeuse, creo, a unha regra do «método»: a que di que sempre debiamos intentar clarificar e reforzar a posición do noso opoñente o máximo posible antes de o criticar, se queremos que a nosa crítica valla para algo. 389 a lóxida da descuberta científica Como se explica que os que cren na lóxica probabilística chegasen á conclusión contraria? Cabe preguntarse onde reside o erro cometido por Jeans cando comeza por afirmar (algo co que en principio eu concordo plenamente) que «non podemos coñecer nada... con certeza», pero que a continuación engade: »Como moito só poderemos falar de probabilidades. [E] as predicións da nova teoría cuántica cadran tan ben [coas observacións] que as posibilidades de que o esquema teña algunha correspondencia coa realidade son enormes. En realidade, podemos dicir que é case seguro que o esquema sexa cuantitativamente verdadeiro...»5 Non cabe dúbida de que o erro máis común consiste en crer que as estimacións hipotéticas de frecuencias, ou sexa, hipóteses sobre probabilidades, poden á súa vez ser só probables. Noutras palabras, o erro consiste en asignarlles ás hipóteses de probabilidade algún grao dunha suposta probabilidade de hipóteses. Poderiamos elaborar un argumento persuasivo a favor desta conclusión errónea se lembramos que as hipóteses sobre probabilidades non son, no relativo á súa forma lóxica (e sen referencia ao noso requisito metodolóxico da falsificabilidade), nin verificables nin falsificables (cf. apartados 65 a 68). Non son verificables porque son enunciados universais, e estritamente tampouco son falsificables porque nunca se poden contradicir mediante enunciados básicos. Son, xa que logo, como dixo reichenbach, completamente indecidibles6. Mais si que poden, como tentei demostrar, ser mellor ou peor «confirmadas», o cal significa que poden concordar máis ou menos con enunciados básicos aceptados. Polo visto é neste punto onde entra a lóxica da probabilidade. A simetría entre verificabilidade e 5 Jeans, The New Background of Science, 1934, p. 58 (el só escribiu en cursiva a expresión «con certeza»). 6 Reichenbach, Erkenntnis 1, 1930, p. 169 (cf. tamén a resposta de Reichenbach á miña nota en Erkenntnis 3, 1933, p. 426 ss.) Ideas semellantes sobre graos de probabilidade ou certeza do coñecemento indutivo ocorren decote (cf., por exemplo, Our Knowledge of the External World, 1914, p. 225 ss. e The Analysis of Matter, 1927, p. 141 e 398. 390 Karl Popper falsificabilidade aceptada pola lóxica indutivista clásica indica que talvez se poidan facer correlacións entre unha escala de graos de validez e estes enunciados de probabilidade «indecidibles», algo do estilo de «graos continuos de probabilidade cuxos límites superior e inferior son verdadeiro e falso»7, para citar de novo a reichenbach. Así e todo, eu creo que os enunciados de probabilidade, só por seren completamente indecidibles, son metafísicos a menos que os fagamos falsificables aceptando unha regra metodolóxica. Así, o simple resultado da súa non falsificabilidade non é que poidan ser mellor ou peor corroborados, senón que non poden ser empiricamente corroborados en absoluto. Pois, se non –en vista de que non descartan nada e de que, por tanto, son compatibles con todos os enunciados básicos– poderíase dicir que son «corroborados» por todo enunciado básico escollido arbitrariamente (de calquera grao de composición) sempre que este describa a ocorrencia dalgún caso relevante. Eu creo que a física soamente usa enunciados de probabilidade do xeito que eu os tratei con bastante detalle antes en relación coa teoría da probabilidade e, máis concretamente, creo que usa suposicións de probabilidade, igual que outras hipóteses, como enunciados falsificables. Con todo, non quixera inmiscirme en disputas sobre os procedementos «reais» dos físicos, pois isto seguirá sendo en boa medida unha cuestión interpretable. Temos aquí unha moi boa ilustración do contraste entre a miña perspectiva e a que denominei no apartado 10 perspectiva «naturalista». Pódese mostrar, en primeiro lugar, a coherencia lóxica interna da miña perspectiva e, en segundo lugar, que está libre das dificultades que ameazan outras perspectivas. É certo que talvez sexa imposible demostrar que a miña perspectiva é a correcta, polo que se cadra resultan estériles as polémicas cos 7 Reichenbach, Erkenntnis 1, 1930, p. 186 (cf. nota 4 do apartado 1). 391 a lóxida da descuberta científica defensores doutra lóxica da ciencia. Todo o que se pode demostrar é que a miña achega a este problema concreto é consecuencia da concepción da ciencia que eu levo tempo defendendo*6. 81 Lóxica indutiva e lóxica da probabilidade A probabilidade de hipóteses non se pode reducir á probabilidade de acontecementos. Esa é a conclusión que xorde do exame realizado no apartado anterior. Pero, non podería ocorrer que unha achega diferente levase a unha definición satisfactoria da idea de probabilidade de hipóteses? Non creo que sexa posible elaborar un concepto de probabilidade de hipóteses que se poida interpretar en termos de «grao de validez» da hipótese, en analoxía cos conceptos «verdadeiro» e «falso» (e que, ademais, estea tan intimamente relacionado co concepto de «probabilidade obxectiva», isto é, da frecuencia relativa, para xustificar o uso da palabra «probabilidade»)1. Porén, adoptarei agora, só a efectos desta argumentación, a suposición de que tal concepto se elaborou con éxito, co obxectivo de facer a seguinte pregunta: como afectaría isto o problema da indución? Supoñamos que se afirma que unha hipótese (poñamos, a teoría de Schrödinger) é «probable» nalgún sentido: ou ben no sentido de que «ten un certo grao numérico de probabilidade», *6 Os dous últimos parágrafos foron provocados pola achega «naturalista» adoptada ás veces por Reichenbach, Neurath e outros; cf. apartado 10, supra. 1 (Engadido durante a fase de corrección de probas do libro). É concibible que para facer estimacións de graos de corroboración, un atope un sistema formal que mostre algunhas analoxías formais limitadas co cálculo de probabilidade (isto é, co teorema de Bayes), sen que teña, así e todo, nada en común coa teoría da frecuencia. Malia isto, acepto que é imposible abordar o problema da indución por medio de tales métodos con algunha esperanza de éxito. *Véxase tamén a nota 3 do apartado 57 do Postscript. *Desde 1938, sosteño a opinión de que «para xustificar o uso da palabra probabilidade», como se di no texto, teriamos que demostrar que se cumpren os axiomas do cálculo formal (cf. apéndices *ii a *v, especialmente o apartado *28 do Postscript). Isto incluiría, xaora, o cumprimento do teorema de Bayes. En canto ás analoxías formais entre o teorema de Bayes sobre a probabilidade e certos teoremas sobre o grao de corroboración, véxase o apéndice *ix, punto 9 (vii) da «Primeira Nota» e os puntos (12) e (13) do apartado *32 do Postscript. 392 Karl Popper ou simplemente que é «probable» sen máis, sen especificación de grao. O enunciado que describe a teoría de Schrödinger como «probable» podémolo denominar avaliación. unha avaliación ten que ser, xaora, un enunciado sintético (unha afirmación sobre a «realidade»), do mesmo xeito que o enunciado «A teoría de Schrödinger é verdadeira» ou «A teoría de Schrödinger é falsa». Todos estes enunciados din algo, obviamente, sobre a adecuación da teoría e, por tanto, é obvio que non son tautolóxicos*1. Dise que unha teoría é adecuada ou inadecuada, ou que é adecuada en certo grao. Ademais, unha avaliación da teoría de Schrödinger ten que ser un enunciado sintético non verificable, o mesmo que a propia teoría, debido a que a «probabilidade» dunha teoría (isto é, a probabilidade de que a teoría siga sendo aceptable) non se pode deducir, parece, de enunciados básicos de carácter definitivo. Así que nos vemos obrigados a preguntar: como se pode xustificar a avaliación? Como se pode comprobar? (xorde así de novo o problema da indución; véxase o apartado 1). *1 O enunciado de probabilidade «p(S,e) = r», que se le «A teoría de Schrödinger, dada a proba e, ten a probabilidade r» (un enunciado de probabilidade lóxica relativa ou condicional) pode, certamente, ser tautolóxico (sempre que os valores de e e r se escollan para cadraren mutuamente: se e consiste só en información procedente da observación, r será igual a cero nun universo suficientemente grande). Mais a «valoración», no noso sentido, tería unha forma diferente (véxase o apartado 84, infra, especialmente o texto da nota *2), por exemplo, a seguinte: Pk(S) = r, onde k é a data de hoxe ou, dito en palabras, «A teoría de Schrödinger ten hoxe (á vista de todas as probas dispoñibles agora) unha probabilidade de r». Para obter esta valoración, pk(S) = r, a partir de (i) o enunciado tautolóxico de probabilidade relativa p(S,e) = r, e (ii) o enunciado «e é o total de probas dispoñibles hoxe», temos que aplicar un principio de inferencia (denominada «regra de absolución» no Postscript, apartados *43 e *51). Este principio de inferencia seméllase moito ao modus ponens e pode parecer, por tanto, que se debería considerar analítico. Mais se o consideramos analítico, isto vén equivalendo á decisión de considerar pk definido por (i) e (ii) xuntos ou, en calquera caso, que non signifique máis que (i) e (ii); mais neste caso non se pode interpretar que pk teña ningunha significación práctica: con certeza que non se pode interpretar como unha medida práctica de aceptabilidade. Isto obsérvase mellor se consideramos que nun universo suficientemente grande, pk(t,e)  0 para toda teoría universal t, sempre que e consista só en enunciados singulares (cf. apéndices *vii e *viii). Mais na práctica é certo que aceptamos unhas teorías e rexeitamos outras. Se, por outra banda, interpretamos pk como grao de adecuación ou aceptabilidade, entón o mencionado principio de inferencia (a «regra de absolución» que, nesta interpretación, se volve o exemplo típico dun «principio de indución») é simplemente falso e, por tanto, claramente non analítico. 393 a lóxida da descuberta científica En canto á propia avaliación, poderase afirmar que é «verdadeira» ou, se tal, que é «probable». Se se considera «verdadeira», entón ten que ser un enunciado sintético verdadeiro que non foi empiricamente verificado, un enunciado sintético que é verdade a priori. Se se considera «probable», entón fainos falta unha nova avaliación: unha avaliación da avaliación, por dicilo así, unha avaliación de nivel superior. Pero isto significa que estamos atrapados nunha regresión infinita. O recurso á teoría da probabilidade da hipótese é incapaz de mellorar a precariedade lóxica da lóxica indutiva. A maioría dos que cren na lóxica de probabilidade sosteñen a opinión de que á avaliación se chega por medio dun «principio de indución» que asigna probabilidades ás hipóteses inducidas. Pero se lle asignan unha probabilidade a este principio de indución, á súa vez, entón continúa a regresión infinita. Se, por outra banda, lle asignan a etiqueta de «verdadeira» entón quédalles a escolla entre a regresión infinita e o apriorismo. heymans afirma: «Dunha vez por todas, a teoría da probabilidade é incapaz de explicar argumentos indutivos, precisamente debido ao mesmo problema que ameaza as dúas outra (a aplicación empírica da teoría da probabilidade). Nos dous casos a conclusión vai alén do que se dá nas premisas»2. Así que non se gaña moito substituíndo a palabra «verdadeira» pola palabra «probable» e a palabra «falsa» pola palabra «improbable». Soamente tendo en conta a asimetría entre verificación e falsificación (a asimetría que resulta da relación lóxica entre teorías e enunciados básicos) é posible evitar as trampas do problema da indución. 2 Heymans, Gesetze und Elemente des wissenschaftlichen Denkens (1890, 1894), p. 290 ss.; 3a edición, 1915, p. 272. O argumento de Heymans foi anticipado por Hume no seu panfleto anónimo, An Abstract of a Book lately published entitled A Treatise of Human Nature, 1740. Non me cabe ningunha dúbida que Heymans non coñecía este panfleto que foi redescuberto e atribuído a Hume por J. M. Keyness e P. Sraffa e publicado por eles en 1938. Eu non sabía que Hume ou Heymans anticiparan os meus argumentos contra a teoría probabilística da indución cando os presentei en 1931 nun libro anterior, aínda sen publicar, que foi lido por varios membros do Círculo de Viena. O feito de que a pasaxe de Heymans fora anticipada por Hume sinaloumo J. O. Wisdom; cf. o seu Foundations of Inference in Natural Science, 1952, p. 218. A pasaxe de Hume cítase máis abaixo, no apéndice *vii, no texto a que se refire a nota 6 (p. 386). 394 Karl Popper Quen crea na lóxica da probabilidade pode intentar responder á miña crítica dicindo que procede dunha mentalidade «ligada ao marco da lóxica clásica» e que, polo tanto, é incapaz de seguir os métodos de razoamento da lóxica da probabilidade. Eu admito abertamente que son incapaz de seguir estas maneiras de razoar. 82 A teoría positiva da corroboración: como unha hipótese pode «demostrar a súa validez» Preguntarase alguén se as obxeccións que eu fixen aquí contra a teoría probabilística da indución non poderían volverse tamén contra a miña propia perspectiva. Ben podería parecer que si, pois estas obxeccións están baseadas na idea de avaliación e non podo negar que eu mesmo fago uso desta idea. Eu falo da corroboración dunha teoría e a corroboración só se pode expresar como unha avaliación (neste senso, non hai diferenza entre corroboración e probabilidade). Ademais, eu tamén sosteño que non se pode afirmar que as hipóteses sexan enunciados «verdadeiros», senón que son «conxecturas provisionais» (ou algo polo estilo), e esta perspectiva só se pode expresar por medio dunha avaliación destas hipóteses. A segunda parte desta obxección pódese contestar doadamente. A avaliación das hipóteses que eu me vexo obrigado a facer, que caracteriza as hipóteses como «conxecturas provisionais» (ou algo polo estilo), ten o estatus dunha tautoloxía. Por tanto, non dá lugar ao tipo de dificultades a que dá lugar a lóxica indutiva, pois esta descrición só é unha paráfrase ou interpretación da afirmación (da que é equivalente por definición) de que os enunciados estritamente universais, isto é, as teorías, non se poden deducir dos enunciados singulares. A situación é semellante con relación á primeira parte da obxección relativa ás avaliacións que afirman que unha teoría está corroborada. A avaliación da corroboración non é unha hipótese, mais pódese deducir se nos dan a teoría e mais os enunciados básicos aceptados. A avaliación sostén que estes enunciados básicos non contradín a teoría, e isto faino coa 395 a lóxida da descuberta científica debida atención ao grao de comprobabilidade da teoría e á rigorosidade das probas a que se someteu a teoría nun período especificado de tempo. Dicimos que unha teoría se considera «corroborada» na medida en que supera estas probas. A avaliación que afirma a corroboración (a avaliación corroborativa) establece certas relacións fundamentais, a saber, a compatibilidade e a incompatibilidade. Consideramos a incompatibilidade como falsificación da teoría. Mais a soa compatibilidade non pode facer que lle atribuamos á teoría un grao positivo de corroboración: o simple feito de que unha teoría non fose aínda falsificada non se pode considerar, obviamente, como suficiente. Pois nada é máis doado que elaborar varios sistemas teóricos que sexan compatibles cun sistema dado de enunciados básicos aceptados (isto tamén é aplicable a todos os sistemas «metafísicos»). Poderíase soster, talvez, que se lle debería outorgar un grao positivo de corroboración se é compatible co sistema de enunciados básicos aceptados e se, ademais, parte deste sistema se pode deducir da teoría. Ou tamén se podería soster, tendo en conta que os enunciados básicos non son deducibles dun sistema puramente teórico (aínda que a súa negación si poida), que se debería adoptar a seguinte regra: débeselle atribuír a unha teoría un grao positivo de corroboración se é compatible cos enunciados básicos aceptados e se, ademais, unha subclase non baleira destes enunciados básicos é deducible da teoría xunto cos outros enunciados básicos aceptados*1. *1 A definición provisional de «corroboración positiva» dada aquí (mais rexeitada por insuficiente no próximo parágrafo do texto porque non se refire explicitamente aos resultados de probas rigorosas, isto é, de intentos de refutación) é de interese polo menos en dous sentidos. Primeiro, está en íntima relación co meu criterio de demarcación, especialmente con aquela formulación a que engadín a nota *1 do apartado 21. De feito, as dúas concordan excepto na restrición a enunciados básicos aceptados incluída na presente definición. Por tanto, se omitimos esta restrición, a presente definición convértese no meu criterio de demarcación. En segundo lugar, en vez de omitir esta restrición, se restrinximos aínda máis a clase dos enunciados básicos aceptados deducidos, esixindo que se acepten como resultados de intentos sinceros de refutar a teoría, entón a nosa definición vólvese unha definición adecuada de «corroboración positiva», aínda que non, claro está, de «grao de corroboración». O argumento que apoia esta afirmación está implícito no texto que vén a seguir. Ademais, os enunciados básicos así aceptados pódense describir como «enunciados corroboradores» da teoría. 396 Karl Popper Non teño obxeccións serias que facerlle a esta última formulación, excepto que me semella insuficiente como caracterización adecuada do grao positivo de corroboración dunha teoría, pois nós pretendemos dicir se as teorías están mellor ou peor corroboradas. Mais o grao de corroboración dunha teoría non se pode establecer, con toda certeza, simplemente contando o número de exemplos corroboradores, isto é, os enunciados básicos aceptados que son deducibles do xeito indicado. Pode ocorrer que unha teoría semelle estar moito peor corroborada que outra, aínda que con ela deducísemos moitísimos enunciados básicos, e só uns cantos usando a segunda. Por exemplo, podemos comparar a hipótese «Todos os corvos son negros» coa hipótese (mencionada no apartado 37) «a carga electrónica ten o valor determinado por Millikan». Aínda que supostamente atopamos moitos máis enunciados básicos no caso dunha hipótese do tipo da primeira, consideraremos que a hipótese de Millikan é a mellor corroborada das dúas. Isto demostra que non é tanto o número de exemplos corroboradores o que determina o grao de corroboración como a rigorosidade das varias comprobacións a que se pode someter, e de feito xa se someteu, a hipótese en cuestión. Mais a rigorosidade das probas, á súa vez, depende do grao de comprobabilidade, e por tanto da simplicidade da hipótese: a hipótese que sexa falsificable nun grao maior, ou a hipótese máis simple, é tamén a que é corroborable nun grao máis alto1. O grao de corroboración Nótese que os «enunciados exemplificadores» (isto é, enunciados básicos negados; véxase o apartado 28) non se pode dicir que corroboren ou confirmen enunciados da teoría que exemplifican, debido ao feito de que sabemos que toda lei universal se exemplifica case en todas partes, como se indica na nota *1 do apartado 28 (véxase tamén a nota *4 do apartado 80 e texto a que remite). 1 Neste punto tamén hai acordo entre a miña perspectiva sobre a simplicidade e a de Weyl; cf. a nota 7 do apartado 42. *Isto é consecuencia da idea, debida a Jeffreys, Wrinch e Weyl (cf. a nota 7 do apartado 42), de que a escaseza de parámetros dunha función é unha indicación da súa simplicidade, considerada ao lado da miña idea (cf. apartado 38 ss.) de que a escaseza de parámetros se pode usar como indicación da comprobabilidade ou improbabilidade, unha idea que aqueles autores rexeitan (véxanse tamén as notas *1 e *2 do apartado 43). 397 a lóxida da descuberta científica realmente logrado non depende só do grao de falsificabilidade: pode ser que un enunciado sexa falsificable nun maior grao, aínda estando moi pouco corroborado, ou mesmo ser falsificado. E se cadra, sen ser falsificado, pode ser superado por unha teoría con máis comprobabilidade da que aquel (ou unha aproximación suficiente) se pode deducir (tamén neste caso diminúe o seu grao de corroboración). O grao de corroboración de dous enunciados non pode ser comparable en todos os casos, o mesmo que o grao de falsificabilidade: non podemos definir un grao numericamente calculable de corroboración, pois só se pode falar aproximadamente en termos de grao positivo de corroboración, graos negativos de corroboración, etc.*2 Mais podemos establecer varias regras, por exemplo, a regra que di que non se debe continuar outorgándolle un grao positivo de corroboración a unha teoría que xa foi falsificada mediante un experimento intersubxectivamente comprobable baseado nunha hipótese falsificadora (cf. apartados 8 e 22). (Baixo certas circunstancias podemos, porén, atribuír un grao positivo de corroboración a outra teoría, aínda seguindo unha liña de pensamento semellante. un exemplo é a teoría do fotón de Einstein, co seu parentesco coa teoría corpuscular da luz). En xeral consideramos definitiva unha falsificación comprobable intersubxectivamente (sempre que estea ben comprobada): deste xeito percíbese a asimetría entre verificación e falsificación de teorías. Cada un destes aspectos metodolóxicos contribúe ao seu xeito ao desenvolvemento histórico da ciencia como proceso de aproximacións progresivas. unha avaliación corroborativa feita en data posterior (isto é, 2 No que se refire ás aplicacións prácticas das teorías, isto segue parecéndome correcto. Mais agora creo que é posible definir o «grao de corroboración» de tal maneira que se poidan comparar graos de corroboración (por exemplo, a teoría da gravidade de Newton e a de Einstein). Ademais, esta definición fai posible mesmo atribuír graos numéricos de corroboración a hipóteses estatísticas e, talvez, mesmo a outros enunciados sempre que poidamos atribuírlles graos de probabilidade lóxica (absoluta ou relativa) a eles e aos enunciados de proba ou evidencia. Véxase tamén o apéndice *ix. 398 Karl Popper unha avaliación feita despois de engadir novos enunciados básicos aos xa aceptados) pode substituír un grao positivo de corroboración por un negativo, pero non á inversa. E aínda que eu creo que na historia da ciencia sempre é a teoría e non o experimento, a teoría e non a observación, a que abre a vía do coñecemento novo, tamén creo que sempre é o experimento o que nos salva de seguir pistas que non levan a ningures, o que nos axuda a saír das rutinas e o que nos desafía para atoparmos novas vías. Así é como o grao de falsificabilidade ou de simplicidade dunha teoría entra na avaliación da súa corroboración. E esta avaliación pódese considerar como unha das relacións lóxicas entre a teoría e os enunciados básicos aceptados: como unha avaliación que ten en conta a rigorosidade das probas a que foi sometida a teoría. 83 Corroborabilidade, comprobabilidade e probabilidade lóxica*1 Para avaliar o grao de corroboración dunha teoría tense en conta o seu grao de falsificabilidade. Canto máis comprobable sexa unha teoría, mellor será de corroborar. A comprobabilidade, porén, é inversa ao concepto de probabilidade lóxica, de xeito que tamén podemos dicir que unha avaliación da corroboración ten en conta a probabilidade lóxica do enunciado en cuestión. E isto, á súa vez, como se mostrou no apartado 72, está relacionado co concepto de probabilidade obxectiva: a probabilidade de acontecementos. Así, tendo en conta a probabilidade lóxica, o concepto de corroboración relaciónase, aínda que sexa só indirecta e debilmente, co de probabilidade de acontecemen- *1 Se se acepta a terminoloxía que eu expliquei por primeira vez nunha nota en Mind, 1938, entón debíase engadir a palabra «absoluta» á expresión «probabilidade lóxica» en todos os contextos (en contraste coa probabilidade lóxica «relativa» ou «condicional»); cf. apéndices *ii, *iv e *ix. 399 a lóxida da descuberta científica tos. Podemos pensar que quizais haxa unha conexión aquí coa doutrina da probabilidade de hipóteses criticada anteriormente. Cando se intenta avaliar o grao de corroboración dunha teoría podemos razoar como segue. O seu grao de corroboración aumentará co número de exemplos corroboradores. Normalmente atribúeselles moita máis importancia aos primeiros casos corroboradores que aos posteriores, pois unha vez que unha teoría foi corroborada, os exemplos posteriores elevan o seu grao de corroboración moi pouquiño. Esta regra non serve se os novos casos son moi diferentes dos anteriores, isto é, se corroboran a teoría nun novo campo de aplicación. Neste último caso, aumentarán o grao de corroboración considerablemente. O grao de corroboración dunha teoría que ten un máis algo grao de universalidade pode, por tanto, ser maior que o dunha teoría que teña un menor grao de universalidade (e, por tanto, un menor grao de falsificabilidade). De xeito semellante, as teorías cun maior grao de precisión pódense corroborar mellor que as que sexan menos precisas. unha das razóns polas que non lle atribuímos un grao positivo de corroboración ás típicas profecías dos quirománticos e os adiviños é que as súas predicións son tan cautelosas e imprecisas que a probabilidade lóxica de que sexan correctas é extremadamente alta. E se nos din que tiveron éxito predicións máis precisas deste tipo, predicións, logo, loxicamente menos probables, entón polo xeral inclinámonos por poñer en dúbida non tanto o seu éxito coma a súa suposta improbabilidade lóxica: como tendemos a crer que tales profecías non son corroborables, o seu baixo grao de corroborabilidade tendemos a atribuílo ao seu baixo grao de comprobabilidade. Se comparamos estas opinións miñas co que está implícito na lóxica probabilística (indutiva), obtemos un resultado verdadeiramente destacable. Segundo o meu punto de vista, a corroborabilidade dunha teoría, e tamén o grao de corroboración dunha teoría que de feito pasou probas rigorosas, é 400 Karl Popper inversamente proporcional, por así dicilo*2, á súa probabilidade lóxica, pois ambas aumentan segundo aumenta o seu grao de comprobabilidade e simplicidade. Pero a perspectiva implícita na lóxica probabilística é exactamente a oposta. Para os seus defensores, a probabilidade dunha hipótese aumenta en proporción directa coa probabilidade lóxica, aínda que non hai dúbida de que a súa intención é que a súa «probabilidade dunha hipótese» represente máis ou menos o mesmo que eu intento indicar mediante o «grao de corroboración»*3. Entre os que argumentan dese xeito está Keynes, quen usa a expresión «probabilidade a priori» para o que eu chamo «probabilidade lóxica» (véxase a nota 1 do apartado 34). El fai a seguinte puntualización1, perfectamente relevante, con respecto á *2 No texto puxen «por así dicilo» porque daquela non cría en probabilidades lóxicas (absolutas) numéricas. Como consecuencia disto, cando estaba a escribir o texto, dubidaba entre a idea de que o grao de corroborabilidade é complementario da probabilidade lóxica (absoluta) e a idea de que é inversamente proporcional. Noutras palabras, dubidaba entre unha definición de C(g), isto é, o grao de corroborabilidade, mediante C(g) = 1-P(g), que faría a corroborabilidade igual ao contido, ou mediante C(g) = 1/P(g), onde P(g) é a probabilidade lóxica absoluta de g. De feito, pódense adoptar definicións que leven a unha destas consecuencias e as dúas semellan bastante satisfactorias intuitivamente; isto explica, se cadra, esta oscilación pola miña parte. Hai poderosas razóns a favor do primeiro método e, se non, tamén a favor dunha escala logarítmica aplicada ao segundo método. Véxase o apéndice *ix. *3 As últimas liñas deste parágrafo, especialmente desde a oración que está en cursiva en diante (que non estaba en cursiva no alemán) conteñen a elemento crucial da miña crítica da teoría probabilística da indución. Poderíase resumir como segue: Necesitamos hipóteses simples: hipóteses de contido elevado e un alto grao de comprobabilidade. Estas hipóteses son tamén as que son altamente corroborables, pois o grao de corroborabilidade dunha hipótese depende maiormente da rigorosidade das probas e, por tanto, da súa comprobabilidade. Agora sabemos que a comprobabilidade é o mesmo que elevada improbabilidade lóxica (absoluta) ou baixa probabilidade lóxica (absoluta). Mais se as dúas hipóteses, h1 e h2, son comparables con respecto ao seu contido e, por tanto, con respecto á súa probabilidade lóxica (absoluta), entón ocorre o seguinte: supoñamos que a probabilidade lóxica (absoluta) de h1 é máis pequena que a de h2. Entón, sexa cal sexa a proba p, a probabilidade lóxica (relativa) de h1, dado p, nunca pode ser superior á de h2, dado p. Por tanto, a hipótese máis comprobable e mellor corroborable nunca pode obter unha probabilidade maior, sobre a base da proba dada, que a menos comprobable. Mais isto implica que o grao de corroboración non pode ser o mesmo que a probabilidade. Este é o resultado crucial. Os meus últimos comentarios do texto principal tiran as consecuencias deste resultado: se o que se valora é a alta probabilidade, entón tes que dicir moi pouco ou, mellor aínda, nada de nada: as tautoloxías sempre terán a máis alta probabilidade. 1 Keynes, A Treatise on Probability, 1921, p. 224 ss. A condición de Keynes φ e conclusión f corresponden (cf. nota 6 do apartado 14) á nosa función φ de enunciado condicionante e a nosa función f de enunciado consecuente (cf. tamén o apartado 36). Nótese que 401 a lóxida da descuberta científica «xeneralización» x (isto é, unha hipótese) coa «condición», antecedente ou prótase φ e a «conclusión», consecuente ou apódose f: «Canto máis exhaustiva sexa a condición φ e menos exhaustiva sexa a conclusión f, maior probabilidade a priori*4 atribuímos á xeneralización x. Con todo aumento en φ aumenta esta probabilidade, e diminúe con todo aumento en f'». Como dixen, isto é perfectamente relevante, aínda que Keyness non traza unha distinción drástica*5 entre o que el chama «probabilidade dunha xeneralización» (que corresponde ao que aquí se chama «probabilidade dunha hipótese») e a súa «probabilidade a priori». Por tanto, en contraste co meu grao de corroboración, a probabilidade dunha hipótese de Keynes aumenta coa súa probabilidade lóxica a priori. Keynes, con todo, ten a intención de que a súa «probabilidade» indique o mesmo que a miña «corroboración», como se pode observar polo feito de que a súa «probabilidade» aumenta co número de casos corroboradores, e tamén (e máis importante) polo aumento da diversidade entre eles. Pero Keynes pasa por algo o feito de que as teorías que teñan casos corroboradores que pertenzan a campos de aplicacións con amplas diferenzas terán normalmente un equivalente alto grao de universalidade. De aquí que os seus dous requisitos para obter unha alta probabilidade (a menor universalidade posible e a maior diversidade posible de casos) polo regular sexan incompatibles. Keynes consideraba máis exhaustivas a condición e a conclusión se o seu contido, ou a súa intensión (máis que a súa extensión), era maior (refírome á relación inversa que existe entre a intensión e a extensión dun termo). *4 Keynes segue a algúns lóxicos eminentes de Cambridge ao escribir à priori e à posteriori; un só pode dicir: à propos de rien, a non ser, quizais, a propósito de à propos. *5 Keynes permite, de feito, a distinción entre a probabilidade a priori da «xeneralización» x (ou «lóxica absoluta», como agora lle chamo eu) e a probabilidade con respecto a unha mostra dada dunha proba h e, nesta medida, o que digo no texto principal ten que ser revisado. El fai a distinción asumindo, de xeito correcto aínda que quizais implícito (véxase p. 225 do Treatise), que se φ = φ1φ2 e f = f1f2, entón as probabilidades apriorísticas dos varios x son: x(φ,f1) ≥ x(φ,f) ≥ x(φ1,f). E el demostra, correctamente, que as probabilidades a posteriori destas hipóteses x (relativas a calquera mostra de proba h) cambia do mesmo xeito que as súas probabilidades a priori. Así, mentres que as súas probabilidades cambian como probabilidades lóxicas (absolutas), a miña tese central é que os graos de corroborabilidade (e de corroboración) cambian na dirección oposta. 402 Karl Popper Expresado na miña terminoloxía, a teoría de Keynes implica que a corroboración (ou a probabilidade de hipóteses) diminúe coa comprobabilidade. El chegou a esta posición pola súa crenza na lóxica indutiva*6. A lóxica indutiva tende a elaborar hipóteses científicas tan seguras como sexa posible. Outórgaselle significación científica só na medida en que poidan ser xustificadas pola experiencia. Considérase que unha teoría ten valor científico soamente pola proximidade lóxica (cf. nota 2 do apartado 48 e texto a que remite) entre a teoría e os enunciados empíricos. Mais isto o que significa non é que o contido dunha teoría deba afastarse o menos posible do que se estableza empiricamente*7. Esta perspectiva está intimamente relacionada coa tendencia a negar o valor da predición. Keynes afirma2: «A peculiar virtude da predición é imaxinaria. Os aspectos esenciais son o número de casos examinados e a analoxía entre eles, polo que a cuestión de se unha hipótese concreta foi proposta antes ou despois do seu exame é irrelevante». Con relación ás hipóteses que foron «propostas a priori» (isto é, propostas antes de termos suficientes razóns indutivas en que apoialas), escribe Keynes: «... se non é máis que unha conxectura, o afortunado feito de que preceda algúns ou todos os casos que a verifican non engade nada en absoluto ao seu valor». Esta concepción da predición é certamente coherente. Mais fai que un se pregunte pola utilidade de facer xeneralizacións. Que posibles razóns pode haber para elaborar todas estas teorías e hipóteses? Desde a perspectiva da lóxica indutiva estas actividades son bastante incomprensibles. Se o que máis se valora é o coñecemento máis seguro dispoñible (e se as predicións en canto tales non fan *6 Véxase o Postscript, capítulo *ii. Na miña teoría da corroboración (en oposición directa ás teorías da probabilidade de Keynes, Jeffreys e Carnap) a corroboración non diminúe coa comprobabilidade, senón que tende a aumentar con ela. *7 Isto tamén se pode expresar por medio da inaceptable regra: «escóllase sempre a hipótese que sexa máis ad hoc!». 2 Keynes, ob. cit., p. 305. 403 a lóxida da descuberta científica ningunha contribución á corroboración), non hai razón para non se conformar cos nosos enunciados básicos*8. Outra perspectiva que dá lugar a preguntas semellantes é a de Kaila3. Mentres que eu creo que son as teorías simples, e aquelas que fan escaso uso de hipóteses auxiliares (cf. apartado 46) as que se poden corroborar ben, soamente pola súa improbabilidade lóxica, Kaila interpreta isto precisamente en sentido contrario a como o fago eu, por razóns semellantes ás de Keynes. El tamén observa que lle asignamos unha alta probabilidade (na nosa terminoloxía, unha alta «probabilidade de hipóteses») ás teorías simples, especialmente aquelas que necesitan poucas hipóteses auxiliares. Mais as razóns que el dá son as opostas ás miñas. El non lle asigna, como eu fago, unha alta probabilidade a estas teorías porque sexan rigorosamente comprobables ou loxicamente improbables, isto é, porque teñan, a priori por dicilo así, moitas ocasións de entrar en conflito con enunciados básicos. Ao contrario, el asígnalles esta alta probabilidade ás teorías simples con poucas hipóteses auxiliares porque lle parece que un sistema con poucas hipóteses terá a priori menos oportunidades de entrar en conflito coa realidade que un sistema que conteña moitas hipóteses. De novo, un pregúntase por que se ía un molestar en elaborar estas aventureiras teorías. Se evitamos o conflito coa realidade, para que invocala facendo afirmacións sobre ela? O método máis seguro sería adoptar un sistema sen hipótese ningunha («en boca cerrada non entran moscas»). *8 Carnap (Logical Foundations of Probability, 1950) cre no valor práctico das predicións; malia isto, tira parte das conclusións mencionadas aquí de que deberiamos conformarnos cos enunciados básicos. Afirma que as teorías (el fala de «leis») non son «indispensables» para a ciencia, nin sequera para facer predicións, pois sempre nos podemos amañar con enunciados singulares. Carnap escribe (p. 575): «Con todo, resulta conveniente, xaora, enunciar leis universais en libros de física, bioloxía, psicoloxía, etc.» Mais non é unha cuestión de conveniencia, senón de curiosidade científica. Hai científicos que queren explicar o mundo: o seu obxectivo é atopar teorías explicativas satisfactorias (moi comprobables, isto é, teorías simples) e comprobalas (véxase tamén o apéndice *x e o apartado *15 do Postscript). 3 Kaila, Die Principien der Wahrscheinlichkeitslogik (Annales Universitatis Aboensis, Turku, 1926), p. 140. 404 Karl Popper A miña propia regra que esixe que as hipóteses auxiliares se usen o menos posible («o principio de parsimonia no uso de hipóteses») non ten nada en común con consideracións coma as de Keila. A min non me interesa soamente reducir o número de enunciados, senón que tamén me interesa a súa simplicidade no senso de alta comprobabilidade. É este interese o que leva, por unha banda, á regra de que as hipóteses auxiliares se deben usar o menos posible e, por outra banda, á esixencia de que o número dos nosos axiomas (das nosas hipóteses máis fundamentais) debe ser baixo. Este último requisito xorde da esixencia de que se deberían preferir os enunciados nun alto nivel de universalidade e que un sistema de moitos «axiomas» deberíase deducir, se fose posible, doutro con menos «axiomas» (e por tanto debería ser explicable por este), axiomas que teñan un nivel máis alto de universalidade. 84 Puntualizacións sobre o uso dos conceptos «verdadeiro» e «corroborado» na lóxica da ciencia esbozada aquí é posible prescindir do uso dos conceptos «verdadeiro» e «falso»*1. No seu lugar *1 Pouco despois de escribir isto, tiven a sorte de coñecer a Alfred Tarski, quen me explicou as ideas fundamentais da súa teoría da verdade. É unha grande mágoa que a súa teoría (unha das dúas grandes descubertas feitas no campo da lóxica desde os Principia Mathematica) continúe a ser incorrectamente comprendida. Nunca se subliña abondo que a idea de verdade de Tarski (da que proporcionou un método de definición con respecto ás linguaxes formalizadas) é a mesma que Aristóteles tiña en mente, unha idea que coincide coa que, en realidade, ten a meirande parte da xente (agás os pragmatistas): a idea de que a verdade é a correspondencia cos feitos (ou coa realidade). Mais, que quereremos dicir scando afirmamos que un enunciado corresponde aos feitos (ou á realidade)? Unha vez que nos decatamos de que esta correspondencia non pode ser de semellanza estrutural, o cometido de elucidar esta correspondencia semella imposible de realizar e, como consecuencia, é posible que sospeitemos do concepto de verdade e que prefiramos non usalo. Tarski resolveu este problema aparentemente irresoluble (con respecto ás linguaxes formalizadas) mediante o uso dunha metalinguaxe semántica, reducindo a idea de correspondencia á de «cumprimento» ou «satisfactoriedade». Como resultado das ensinanzas de Tarski, xa non dubido en falar de «verdade» e «falsidade». E resulta que a miña perspectiva, igual que a de todo o mundo (excepto a dos pragmatistas), está en liña coa teoría da verdade absoluta de Tarski. Malia que as miñas ideas sobre a lóxica formal e a súa filosofía se viron revolucionadas pola teoría de Tarski, as miñas ideas sobre a ciencia e a súa filosofía non se viron afectadas, aínda que si clarificadas. 405 a lóxida da descuberta científica pódense usar consideracións lóxicas sobre relacións de deducibilidade. Así que non teremos que dicir: «A predición p é verdadeira sempre que a teoría t e o enunciado básico b sexan verdadeiros». En lugar disto, podemos dicir que o enunciado p se deduce da conxunción (non contraditoria) de t e b. Dun xeito semellante pódese describir a teoría da falsificación. Non haberá que dicir que a teoría é «falsa», só que a contradín un certo conxunto de enunciados básicos aceptados. Nin tampouco teremos necesidade de dicir se os enunciados básicos son «verdadeiros» ou «falsos», pois podemos interpretar a súa aceptabilidade como resultado dunha decisión convencional e os enunciados aceptados como resultado desta decisión. Isto non quere dicir que teñamos prohibido usar os conceptos «verdadeiro» e «falso» nin que o seu uso dea lugar a particulares dificultades. O propio feito de que poidamos prescindir deles mostra que non poden dar lugar a ningún problema fundamental novo. O uso dos conceptos «verdadeiro» e «falso» é análogo ao uso de conceptos tales como tautoloxía, contradición, conxunción, implicación e outros deste estilo. Todos estes son conceptos lóxicos1, non empíricos. Describen ou avalían un enunciado independentemente dos cambios que ocorran no mundo empírico. Mentres que supoñemos que as propiedades Algunhas das críticas actuais á teoría de Tarski seméllanme fóra de lugar. Tense dito, por exemplo, que a súa definición é artificial e complexa; mais, como el define a verdade con respecto a linguaxes formalizadas, a verdade ten que basearse nunha definición dunha fórmula correctamente formada en tal linguaxe e terá, precisamente, o mesmo grao de «artificialidade» e «complexidade» ca esta definición. Tamén se ten dito que só as proposicións ou enunciados poden ser verdadeiros ou falsos, non as oracións. Se cadra «oración» non é a tradución máis idónea da terminoloxía orixinal de Tarski (persoalmente prefiro falar de «enunciado» en vez de «oración»; véxase, por exemplo, o meu artigo «Note on Tarski's Definition of Truth», Mind 64, 1955, p. 388, nota 1). Mais o propio Tarski deixou dito claramente que non se pode dicir que unha fórmula non interpretada (ou unha cadea de símbolos) sexa verdadeira ou falsa e que estes cualificativos só son aplicables a fórmulas interpretadas (a «oracións con significado», como aparece na tradución inglesa). As melloras terminolóxicas sempre resultan de proveito, mais criticar unha teoría só por razóns terminolóxicas é puro escurantismo. 1 (Engadido en 1934 durante a corrección de probas) Carnap diría, probablemente, «conceptos sintácticos» (cf. o seu libro Logical Syntax of Language). 406 Karl Popper dos obxectos físicos (de obxectos «xenidénticos» no senso de lewin) mudan co paso do tempo, nós decidimos usar estes predicados lóxicos de tal xeito que as propiedades lóxicas dos enunciados se fagan intemporais: se un enunciado é unha tautoloxía, entón será sempre unha tautoloxía. Esta mesma intemporalidade tamén a vinculamos cos conceptos «verdadeiro» e «falso», de acordo co uso corrente. No uso común non se di que un enunciado fose onte perfectamente válido ou «verdadeiro», pero que hoxe xa é «falso». Se hoxe avaliamos como falso un enunciado que onte avaliabamos como verdadeiro, entón implicitamente estamos afirmando hoxe que onte estabamos enganados: afirmamos que o enunciado xa era falso onte (eternamente falso), mais que nós o «tomamos erradamente por verdadeiro». Aquí podemos ver claramente a diferenza entre verdade e corroboración. Avaliar un enunciado como corroborado ou non corroborado tamén é unha avaliación lóxica e, polo tanto, intemporal, debido a que afirma que existe unha determinada relación lóxica entre un sistema teórico e un sistema de enunciados básicos aceptados. Pero nunca podemos dicir simplemente dun enunciado que está «corroborado» como tal ou en si (do xeito que podemos dicir que é «verdadeiro»). Só podemos dicir que está corroborado con respecto a algún sistema de enunciados básicos, un sistema aceptado ata un momento determinado no tempo. «A corroboración que unha teoría recibiu ata onte» non é loxicamente idéntica á «corroboración que unha teoría recibiu ata hoxe». Así que temos que poñerlle, diriamos, un subíndice a toda avaliación de corroboración que caracterice o sistema de enunciados básicos a que se refire a corroboración (por exemplo, pola data da súa aceptación)*2. A corroboración non é, en consecuencia, un «valor de verdade», ou sexa, non se pode situar á mesma altura que os conceptos «verdadeiro» e «falso» (que están libres de subíndi- *2 Cf. nota *1 do apartado 81. 407 a lóxida da descuberta científica ces temporais), debido a que para un mesmo enunciado pode haber unha variedade de valores de corroboración, polo cal todos poderían, en principio, ser «correctos» ou «verdadeiros» ao mesmo tempo. Isto é así porque os valores son loxicamente deducibles da teoría e os varios conxuntos de enunciados básicos aceptados en diversos períodos de tempo. Os comentarios anteriores tamén poden axudar a elucidar o contraste entre a miña perspectiva e a dos pragmatistas, que propoñen definir a «verdade» en termos do éxito dunha teoría e, en consecuencia, da súa utilidade, da súa confirmación ou da súa corroboración. Se a intención dos pragmatistas fose simplemente afirmar que unha avaliación lóxica do éxito dunha teoría non pode ser máis que unha avaliación da súa corroboración, eu podía concordar. Pero eu creo que estaría lonxe de ser útil identificar o concepto de corroboración co de verdade*3. Isto tamén se evita no uso lingüístico ordinario, pois ben se podería dicir que unha teoría case non foi corroborada para nada ata o de agora, ou que aínda está sen corroborar. Mais non deberiamos dicir que unha teoría ata o de agora é escasamente verdade, ou que aínda é falsa. 85 O camiño da ciencia pódese discernir algo semellante a unha dirección xeral na evolución da física, unha dirección que vai de teorías dun baixo nivel de universalidade a outras de nivel máis elevado. A isto normalmente chámaselle dirección «indutiva» e poderíase pensar que o feito de que a física evolucionase nesta dirección «indutiva» pode ser un bo argumento a favor do método indutivo. Mais un avance na dirección indutiva non consiste necesariamente nunha sucesión de inferencias indutivas. De feito, xa *3 Así, se quixésemos definir «verdadeiro» como «útil» (como propoñen algúns pragmatistas) ou, se non, como «acertado», «confirmado» ou «corroborado», só teriamos que introducir un concepto «absoluto» e «intemporal» para desempeñar o papel de «verdade». 408 Karl Popper mostramos que se pode explicar en termos bastante diferentes: en termos de grao de comprobabilidade e de corroborabilidade. Pois unha teoría que está ben corroborada só pode ser superada por outra que teña un nivel máis alto de universalidade, isto é, por unha teoría que sexa mellor comprobable e que, ademais, conteña a teoría antiga e ben corroborada, ou polo menos unha boa aproximación a ela. Se cadra é mellor, por tanto, describir esta tendencia (o avance cara a teorías dun grao de universalidade cada vez maior) como «cuasiindutiva». O proceso cuasiindutivo deberíase considerar como segue. Propóñense teorías con certo nivel de universalidade e contrástanse dedutivamente; despois, propóñense teorías dun nivel superior de universalidade, que á vez se comproban coa axuda das dos niveis previos de universalidade e así sucesivamente. Os métodos de comprobación baséanse invariablemente en inferencias dedutivas do nivel máis alto ao nivel máis baixo*1; por outro lado, os niveis de universalidade acádanse, na orde temporal, procedendo dos niveis inferiores aos superiores. un poderíase preguntar: «Por que non inventar teorías do nivel superior de universalidade directamente? Por que agardar por esta evolución cuasiindutiva? Non será, despois de todo, porque contén un elemento indutivo?» Eu creo que non. unha e outra vez preséntanse propostas (conxecturas ou teorías) de todos os niveis de universalidade. Aquelas teorías que están nun nivel de universalidade demasiado elevado, por dicilo así (isto é, demasiado afastadas do nivel acadado pola ciencia comprobable do momento) dan lugar, talvez, a un «sistema metafísico». Neste caso, mesmo que deste sistema fosen deducibles enunciados (aínda que só fosen semi-deducibles, coma no caso do sistema de Spinoza) que pertencesen ao sistema científico imperante, non haberá entre eles ningún enunciado novo com- *1 As «inferencias dedutivas do nivel superior ao inferior» son, claro está, explicacións (no senso do apartado 12); así, as hipóteses do nivel superior son explicativas con respecto ás de nivel inferior. 409 a lóxida da descuberta científica probable, o cal significa que non se pode deseñar ningún experimento crucial para comprobar o sistema en cuestión*2. Se, por outra banda, se pode deseñar un experimento crucial, entón o sistema conterá, como primeira aproximación, algunha teoría ben corroborada e ao mesmo tempo algo novo que poida ser comprobado. Deste xeito o sistema non será «metafísico», claro está. Neste caso, o sistema en cuestión pódese considerar como un novo avance na evolución cuasiindutiva da ciencia. Isto explica por que, polo regular, o vínculo coa ciencia do momento establéceno aquelas teorías que se propoñan como intento de dar resposta á situación actual do problema, isto é, ás dificultades, contradicións e falsificacións actuais. Ao propoñeren unha solución para estas dificultades, estas teorías talvez preparen o terreo para un experimento crucial. Para obter unha imaxe ou modelo desta evolución cuasiindutiva da ciencia, as varias ideas ou hipóteses pódense visualizar como partículas suspendidas nun fluído. A ciencia comprobable é a precipitación destas partículas no fondo do recipiente: van sedimentando en capas (de universalidade). O grosor do depósito vai aumentando co número destas capas, e cada nova capa corresponde a unha teoría máis universal que as que ten debaixo. Como resultado deste proceso, as ideas que anteriormente flotaban nas rexións metafísicas superiores pódense alcanzar ás veces mediante o crecemento da ciencia, entrando en contacto con ela e así asentándose. Exemplos de tales ideas son o atomismo, a idea dun «principio» físico único ou elemento último (do que derivan os outros), a teoría do movemento da terra (á que se opoñía Bacon por considerala ficticia), a antiga teoría corpuscular da luz, a teoría da electricidade como fluído (recuperada como hipótese da nube de electróns *2 Nótese que por experimento crucial quero dicir aquel que é deseñado para refutar unha teoría (se for posible), máis concretamente, o que está deseñado para dar lugar a unha decisión entre dúas teorías alternativas, refutando (polo menos) unha delas, sen que isto implique, claro está, probar a outra (véxase tamén a nota x do apartado 22 e o apéndice *ix). 410 Karl Popper para a condución de metais). É posible que todas estas ideas e conceptos metafísicos, mesmo nas súas formas máis antigas, axudasen a proporcionar unha orde na representación humana do mundo e nalgúns casos poida que mesmo desen lugar a predicións acertadas. Mais unha idea deste tipo adquire estatus científico soamente cando se presenta en forma falsificable, isto é, só cando é posible decidir empiricamente entre ela e algunha outra teoría rival. A miña investigación seguiu as pegadas das consecuencias varias das decisións e convencións (en particular, o criterio de demarcación) adoptadas ao comezo deste libro. Botando a ollada atrás, podemos intentar albiscar unha imaxe exhaustiva da concepción da ciencia e a descuberta científica que foi xurdindo (o que teño en mente aquí non é unha imaxe da ciencia como fenómeno biolóxico, como instrumento de adaptación, ou como método aproximativo de produción, senón que o que teño en mente os seus aspectos epistemolóxicos). A ciencia non é un sistema de enunciados certos e suficientemente establecidos, nin é tampouco un sistema que avance ininterrompidamente cara a un estado de finalidade. A nosa ciencia non é coñecemento (epist m ): nunca pode afirmar que acadase a verdade, nin sequera un substituto dela como a probabilidade. Así e todo, o valor da ciencia non é a simple supervivencia biolóxica. Non é só un instrumento útil, pois aínda que nunca pode acadar a verdade nin a probabilidade, o desexo de coñecer e a busca da verdade continúan sendo as motivacións máis potentes da descuberta científica. Nós non coñecemos, só podemos facer suposicións. E as nosas suposicións están guiadas pola nosa fe, metafísica e non científica (aínda que explicable bioloxicamente), na existencia de leis, de regularidades que poidamos desvelar ou descubrir. Coma Bacon, podemos dicir que a nosa ciencia contemporánea («o método de razoar que as persoas agora aplican normalmente 411 a lóxida da descuberta científica á natureza») está formada por «anticipacións, apresuradas e prematuras» e por «prexuízos»1. Mais estas nosas conxecturas ou «anticipacións», imaxinativas e atrevidas, están coidadosamente controladas por sobrias e sistemáticas comprobacións. Despois de seren propostas, as nosas «anticipacións» non se sosteñen dogmaticamente. O método científico de investigación non consiste en defender estas para probar que tiñamos razón. Máis ben ocorre o contrario, pois o que pretendemos é derrocalas. usando todas as armas do noso arsenal lóxico, matemático e técnico, intentamos probar que as nosas anticipacións eran falsas, co obxectivo de substituílas por novas anticipacións inxustificadas e inxustificables, por novos «prexuízos precipitados e prematuros», como despectivamente lles chamou Bacon*3. É posible interpretar os métodos da ciencia de xeito máis prosaico. Poderíase dicir que «... o progreso só sobrevén de dúas maneiras: acumulando novas experiencias de percepción ou mediante unha mellor organización daquelas que xa están dispoñibles»2. Mais esta descrición do progreso cien1 Bacon, Novum Organum I, 26. *3 A «anticipación» de Bacon (anticipatio, Novum Organum I, 26) significa case o mesmo que as «hipóteses» na miña terminoloxía. Bacon sostiña que, para preparar a mente para a intuición da verdadeira esencia ou natureza dunha cousa, había que depurala de todas as anticipacións, os prexuízos e os ídolos, debido a que a fonte de todo erro é a impureza das nosas mentes: a Natureza en si non mente. A principal función da indución eliminadora, igual que en Aristóteles, é axudar á purificación da mente (véxase tamén o meu libro Open Society, capítulo 24, nota 59 do capítulo 10, nota 33 do capítulo 11, onde se describe brevemente a teoría aristotélica da indución). Purgar a mente de prexuízos concíbese como unha especie de ritual, recomendado para o científico que desexe preparar a súa mente para a interpretación (ou lectura desprexuizada) do Libro da Natureza, exactamente igual ao xeito en que o místico purifica a súa alma para preparala para a visión de Deus (cf. a Introdución do meu libro Conjectures and Refutations (1963) 1965). 2 P. Frank, Das Kausalgesetz und seine Grenzen, 1932. *Esta idea de que o progreso da ciencia se debe á acumulación de experiencias de percepción aínda está amplamente difundida hoxe (cf. o meu segundo Prólogo, 1958). A negación desta idea pola miña parte está intimamente relacionada co rexeitamento da doutrina que di que a ciencia e o coñecemento están abocados a avanzar debido a que as nosas experiencias están abocadas a acumulárense. En oposición a isto, eu creo que o avance da ciencia depende da competición libre do pensamento e, por tanto, da liberdade, e que deixará de avanzar se se destrúe a liberdade (aínda que pode moi ben continuar durante algún tempo nalgunhas disciplinas, especialmente na tecnoloxía). Esta idea desenvólvese de xeito máis completo no meu libro 412 Karl Popper tífico, sen ser realmente incorrecta, non semella ser de todo acertada. lembra demasiado a indución de Bacon, con aquel esmero na acumulación dunha «infinidade de uvas, maduras e da temporada»3, das que el agardaba que fluíse o viño da ciencia, evocando tamén o seu mito dun método científico que comezase pola observación e o experimento e logo procedese á elaboración de teorías. (Este método lendario, por acaso, aínda é o que serve de inspiración a algunhas das novas ciencias que intentan poñelo en práctica debido á idea xeneralizada de que é o método da física experimental). O avance da ciencia non se debe ao feito de que se acumulen cada vez máis experiencias de percepción ao longo do tempo. Tampouco non é debido a que cada vez fagamos un mellor uso dos nosos sentidos. A ciencia non se pode extraer mediante destilación de experiencias sensoriais non interpretadas, por moita dedicación que poñamos en reunilas e clasificalas. A única maneira, o único órgano, o único instrumento que temos de interpretar a natureza son as ideas atrevidas, as anticipacións inxustificadas e o pensamento especulativo. E temos que nos arriscar a facelas se queremos gañar o premio. Aqueles científicos que non estean dispostos a expoñer as súas ideas ao risco de seren refutadas non participan no xogo científico. Mesmo someter sobria e coidadosamente as nosas ideas a comprobacións pola experiencia é algo inspirado nas nosas ideas: a experimentación é un tipo de acción programada onde cada paso está orientado pola teoría. Non é que tropecemos coas nosas experiencias, nin que deixemos que discorran sobre nós coma unha corrente. Ao contrario, temos que ser activos: temos que «facer» as nosas experiencias. Sempre somos nós os que formulamos as preguntas que lle facemos á natureza, somos nós Poverty of Historicism (apartado 32), onde tamén argumento (no Limiar) que o incremento do noso coñecemento é impredicible por métodos científicos e que, como consecuencia, a traxectoria futura da nosa historia tamén é impredicible. 3 Bacon, Novum Organum I, 123. 413 a lóxida da descuberta científica os que unha e outra vez facemos estas preguntas para intentar obter como resposta un si ou un non rotundos (pois a natureza non dá respostas a non ser que a forcemos a dalas). E, por último, tamén somos nós, poñéndolle rigorosos exames (despois de moitos e complexos intentos de que nos responda cun «non» inequívoco), os que decidimos a resposta á pregunta que lle facemos á natureza. Estou totalmente de acordo con Weyl4 cando afirma: «Quero que conste dunha vez para sempre a miña admiración polo traballo de quen fai unha experimentación no seu intento de obter feitos interpretables dunha Natureza remisa, que tan ben sabe responder cun decidido Non ás nosas teorías ou, ás veces, cun inaudible Si». O vello ideal do epist m , un coñecemento demostrable e absolutamente certo, demostrou ser un ídolo. A esixencia de obxectividade científica fai inevitable que todo enunciado científico deba seguir sendo provisional sempre. Pode ser corroborado, si, mais toda corroboración é relativa a outros enunciados que tamén son provisionais. Só nas nosas experiencias subxectivas, na nosa fe subxectiva, podemos estar «absolutamente seguros»5. Coa caída do ídolo da certeza (incluíndo a dos graos de certeza imperfecta ou probabilidade) cae tamén unha das defensas do escurantismo que obstaculizan o camiño do avance científico, pois a adoración deste ídolo non só tolle o atrevemento das nosas preguntas, senón tamén o rigor e a integridade das nosas comprobacións. A perspectiva equivocada da ciencia maniféstase sintomaticamente no desexo de acertar, pois non é a posesión do coñecemento, da verdade irrefutable, o que converte a alguén en persoa de ciencia, senón a busca persistente e irrenunciablemente crítica da verdade. 4 Weyl, Gruppentheorie und Quantenmechanik, 1931, p. 2. Tradución inglesa de H. P. Robertson, The Theory of Groups and Quantum Mechanics, 1931, p. xx. 5 Cf., por exemplo, a nota 3 do apartado 30. Esta última matización é, claro está, de tipo psicolóxico, máis que epistemolóxico; cf. apartados 7 e 8. 414 Karl Popper Deberíamos, logo, adoptar unha actitude de resignación? Temos que conformarnos con dicir que a ciencia só pode cumprir o seu cometido biolóxico, isto é, que só pode demostrar o que vale en aplicacións prácticas que a poidan corroborar? Son irresolubles os seus problemas intelectuais? Eu creo que non. A ciencia nunca pretende acadar o obxectivo ilusorio de facer definitivas, nin sequera probables, as súas respostas. A ciencia avanza cara a un obxectivo infinito mais atinxible: o de descubrir sempre problemas novos, cada vez máis profundos e máis xerais, e someter as nosas respostas sempre provisionais a comprobacións novas e cada vez máis rigorosas. Este é o final do texto do libro orixinal. Os apéndices i-vii tamén formaban parte da edición orixinal. Addenda, 1972 No capítulo precedente do meu libro (que era o último capítulo) pretendía deixar claro que por grao de corroboración dunha teoría eu quero dicir un breve informe que resuma a maneira en que a teoría resistiu comprobacións e o grao de rigorosidade destas probas. Nunca me arredei desta idea: véxase, por exemplo, o comezo dos novos apéndices *vii, p. 378; *ix, p. 406; e especialmente o último apartado (*14) de *ix, p. 441 ss. Quixera engadir aquí o seguinte: (1) O problema lóxico e metodolóxico da indución non é irresoluble, mais o meu libro ofrece unha solución negativa: (a) Nunca podemos xustificar racionalmente unha teoría, isto é, crermos na verdade dunha teoría, ou crermos que sexa probablemente certa. Esta solución negativa é compatible coa seguinte solución positiva, contida na regra que recomenda preferir teorías que estean mellor corroboradas; (b) ás veces podemos xustificar racionalmente a preferencia por unha teoría en vista da súa corroboración, isto é, do estado presente da 415 a lóxida da descuberta científica discusión crítica das teorías que compiten con ela, que son discutidas criticamente e comparadas co obxectivo de avaliar a súa proximidade á verdade (verosimilitude). O estado actual do debate pódese expresar, en principio, en termos de graos de corroboración. O grao de corroboración non é, con todo, unha medida da verosimilitude (tal medida tería que ser intemporal), senón só un informe sobre o que fomos capaces de determinar, ata un certo momento no tempo, sobre o que afirman as distintas teorías alternativas, trala preceptiva comparación, avaliando as razóns dispoñibles a favor e en contra da verosimilitude destas teorías. (2) un problema metafísico que xorde da idea da verosimilitude é se existen xenuínas regularidades na natureza. A miña resposta é afirmativa. un argumento (non científico, talvez só «transcendental»; véxase pp. 384-5) favorable a esta resposta é o seguinte: se non houbese regularidades manifestas na natureza, entón non poderían existir nin as observacións nin a linguaxe: nin linguaxe descritiva nin argumentativa. (3) A forza desta resposta depende dalgún tipo de realismo de sentido común. (4) O problema pragmático da indución resólvese por si só: a preferencia práctica pola teoría que, á luz do debate racional, semelle estar máis próxima á verdade é unha preferencia arriscada mais racional. (5) O problema psicolóxico (por que iamos crer que a teoría, escollida deste xeito, continuará a ser merecente da nosa confianza?) (6) Non todos os posibles «problemas de indución» se resolven desta maneira (véxase tamén o meu próximo libro: Objective Knowledge: An Evolutionary Approach). 416 Karl Popper APÉNDICE I Definición da dimensión dunha teoría (cf. apartados 38 e 39) A definición que se dá a seguir débese considerar provisional*1. É un intento de definir a dimensión dunha teoría para facela coincidir coa dimensión do conxunto de curvas que resulta ao representar nunha folla cuadriculada o campo de aplicación da teoría. Para comezar, preséntase unha dificultade polo feito de que non deberiamos asumir que se defina para o campo nin unha métrica, nin sequera unha tipoloxía, en particular, non deberiamos asumir que está definida ningunha relación de veciñanza. Eu admito que a definición que propoño esquiva esta dificultade, máis que superala. A posibilidade de esquivala ten que ver co feito de que unha teoría sempre prohibe acontecementos homotípicos, como nós os denominados antes (isto é, unha clase de ocorrencias que difiren só nas súas coordenadas espacio-temporais; cf. apartados 23 e 31). Por este motivo, as coordenadas espacio-temporais aparecerán, polo xeral, no esquema que xera o campo de aplicación e, en consecuencia, o campo dos enunciados relativamente atómicos mostrará, en xeral, unha orde topolóxica ou métrica. A proposta de definición afirma: unha teoría t dise que é «d-dimensional con respecto ao campo de aplicación C» se e *1 Unha definición simplificada e lixeiramente máis xeral é esta: supoñamos que A e X son dous conxuntos de enunciados (intuitivamente, A é un conxunto de leis universais, X un conxunto, normalmente infinito, de enunciados singulares). Dicimos entón que X é un campo (homoxéneo) de aplicación con respecto a A (en símbolos: X = FA) se, e só se, para todo enunciado a en A existe un número natural d(a) = n que cumpra as dúas condicións seguintes: (i) calquera conxunción cn de n enunciados diferentes de X é compatible con a; (ii) para calquera tal conxunción cn existen dous enunciados x e y en X de tal xeito que x.cn sexa incompatible con a e y.cn é deducible de a.cn, pero non de a nin de cn. d(a) denomínase a dimensión de a, ou o grao de composición de a, con respecto a X = FA; e 1/d(a) ou, poñamos, 1/(d(a) + 1), pódese considerar a medida da simplicidade de a. O problema desenvólvese en máis detalle no apéndice *viii. 417 a lóxida da descuberta científica só se se manteñen as seguintes relacións entre t e C: hai un número d tal que (a) a teoría non entra en conflito con ningunha d-upla do campo e (b) calquera d-upla dada xunto coa teoría divide todos os enunciados restantes relativamente atómicos unicamente en dúas subclases A e B, de tal maneira que se cumpran as seguintes condicións: (α) todo enunciado da clase A forma, cando se une coa d-upla dada, unha «d + 1–upla falsificadora», isto é, un falsificador potencial da teoría; (β) a clase B, por outro lado, é a suma de unha ou máis, mais sempre un número finito, subclases infinitas [B1] tales que a conxunción de calquera número de enunciados que pertenzan a calquera destas subclases [B1] sexan compatibles coa conxunción da d-upla dada da teoría. Con esta definición preténdese excluír a posibilidade de unha teoría ter dous campos de aplicación, de tal xeito que os enunciados relativamente atómicos dun campo resulten da conxunción dos enunciados relativamente atómicos do outro (isto hai que impedilo se o campo de aplicación vai ser identificable co da súa representación gráfica; cf. apartado 39). Engadiría que por medio desta definición o problema dos enunciados atómicos (cf. nota 2 do apartado 38) se resolve dun xeito que se pode considerar «dedutivista», pois a propia teoría determina que enunciados singulares son relativamente atómicos (con respecto á teoría). O campo de aplicación defínese mediante a propia teoría, o mesmo que os enunciados que, debido á súa forma lóxica, teñen igual estatus con respecto á teoría. Así que o problema dos enunciados atómicos non se resolve por medio da descuberta de enunciados que teñan algunha forma elemental, a partir dos cales se constrúan indutivamente outros enunciados máis compostos, ou que se obteñan polo método de funcións de verdade. Ao contrario, os enunciados relativamente atómicos (e con eles os singulares) aparecen como unha especie de precipitación, por dicilo así, ou como unha especie de depósito (relativamente) sólido, establecido polos enunciados universais da teoría. 418 Karl Popper APÉNDICE II O cálculo xeral de frecuencia en clases finitas (cf. apartados 52 e 53)*1 O Teorema Xeral da Multiplicación: designamos a clase de referencia finita por medio de «α» e as dúas clases de propiedade por «β» e «γ». O noso primeiro problema é determinar a frecuencia daqueles elementos que pertenzan a β e a γ. A solución vén dada pola fórmula (1) αF''(β.γ) = αF'' (β).α. β F''(γ) ou, como β e γ se poden conmutar: (1') αF''(β.γ) = α.γF'' (β).αF''(γ) A proba resulta inmediatamente da definición dada no apartado 52. De (1) obtemos, por substitución, de acordo con esta definición: (1,1) N (α.β.γ) = N (α.β) = N (α.β.γ) N (α) N (α) N (α.β) o cal demostra ser unha identidade despois da simplificación de «N(α.β)». (Compárese esta demostración coa de (2s) e coa de reichenbach en Mathematische Zeitschrift 34, p. 593). Se asumimos independencia (cf. apartado 53), isto é (1s) α. βF''(γ) = αF''(γ) Obtemos de (1) o teorema especial da multiplicación (1s) αF''(β.γ) = αF'' (β).αF''(γ) *1 Desde aquela elaborei o contido deste apéndice en forma de tratamento axiomático da probabilidade. Véxanse os apéndices *iii a *v. 419 a lóxida da descuberta científica Coa axuda da equivalencia de (1) e (1'), pódese probar a simetría da relación de independencia (cf. nota 4 do apartado 53). Os teoremas da adición tratan sobre a frecuencia dos elementos que pertencen a β ou a γ. Se designamos a combinación disxuntiva destas clases co símbolo «β + γ», onde o signo «+», cando se coloca entre designacións de clase, non significa adición aritmética, senón «ou» non exclusivo, entón o teorema xeral da adición é: (2) αF''(β.γ) = αF'' (β) + αF''(γ) – αF''(β.γ) Este enunciado dedúcese da definición do apartado 52 se usamos a fórmula universalmente válida do cálculo de clases (2,2) α.(β + γ) = (α.β) + (α.γ) e a fórmula (que tamén é universalmente válida) (2,1) N(β + γ) = N(β) + N(γ) – N(β.γ) Baixo a asunción de que, dentro de α, β e γ non teñen ningún elemento en común, unha condicion que se pode simbolizar mediante a fórmula (2s) N (α.β.γ) = 0 obtemos de (2) o teorema especial da adición (2s) αF''(β + γ) = αF''(β) + αF''(γ) O teorema especial da adición é válido para todas as propiedades que sexan propiedades primarias dentro dunha clase α, pois as propiedades primarias son mutuamente exclusivas. A suma das frecuencias relativas destas propiedades primarias é sempre, xaora, igual a 1. 420 Karl Popper Os teoremas da división enuncian a frecuencia dunha propiedade γ dentro dunha clase seleccionada de α con respecto á propiedade β. A fórmula xeral obtense inmediatamente por inversión de (1). (3) α.β F''(γ) = αF''(β.γ) / αF''(β) Se transformamos o teorema xeral da división (3) coa axuda do teorema especial da multiplicación obtemos (3s) α. β F''(γ) = αF''(γ) Nesta fórmula recoñecemos de novo a condición (1s); vemos así que a independencia se pode describir como un caso especial de selección. Os varios teoremas que se poden relacionar co nome de Bayes son casos especiais do teorema da división. Baixo a suposición de que (α.γ) é unha subclase de β, ou en símbolos (3bs) α.γ  β obtemos de (3) a primeira forma (especial) da regra de Bayes (3bs) α.β F''(γ) = αF''(γ) / αF''(β) Podemos evitar a suposición (3bs) introducindo, en lugar de «β», a suma das clases β1, β2, ... βn. usaremos, en analoxía co uso que fixemos antes de «+» entre designacións de clase, o signo «Σ» diante de designacións de clase; logo podemos escribir unha segunda forma (universalmente válida) do teorema de Bayes como segue: (3b) α.ΣβiF''(βi) / αF''(Σβi) Ao numerador desta fórmula podémoslle aplicar o teorema especial da adición (2s) se asumimos que o β1 non ten membros en común con α. Esta asunción pódese escribir: 421 a lóxida da descuberta científica (3/2) N (α . βi.γj) (i≠j) Baixo esa asunción obtemos a terceira forma (especial) do teorema de Bayes, que sempre é aplicable a propiedades primarias β1: (3/2s) α.ΣβiF'' (βi) = αF''(βi) / (ΣαF''(βi)). A cuarta, e máis importante, forma especial do teorema de Bayes pódese obter das dúas últimas fórmulas xunto coas súas asuncións correspondentes (3/2s) e 4bs): (4bs) α.γ  Σβi que sempre se cumpre se αΣβi se cumpre. Substituíndo en (3/2s) «βi» por «βiγ», aplicamos na parte esquerda do resultado a fórmula (4bs.1) α.Σβi.γ = α.γ (4bs) Na parte dereita do resultado aplicamos (1'), tanto ao numerador coma ao denominador. Así obtemos: (4s) α.γF''(βi) = αβiF''(γ). αF''(β1) / Σ(α.βiF''(γ). αF''(βi)) Así, se βi é un sistema exclusivo de clases de propiedade, de calquera clase de propiedade que (dentro de α) forme parte de βi, entón (4s) dá a frecuencia de cada unha das propiedades βi dentro dunha selección con respecto a γ. 422 Karl Popper APÉNDICE III Dedución da primeira forma da fórmula binomial (para sucesións finitas de segmentos sobrepostos, cf. apartado 56) A primeira fórmula binomial*1 (1) α(n)F"(m) = nCmpmqn–m onde p = αF''(1), q = αF''(0), m ≤ n, se pode dicir que se demostrou baixo a asunción de que α é (polo menos) libre n 1 (prescindindo de erros que xurdan no último momento; cf. apartado 56), se podemos mostrar que (2) α(n)F"(σm) = p mqn–m onde «σm» designa unha n-upla concreta (malia que fose arbitrariamente escolleita) que contén m uns. (Co símbolo preténdese indicar que o que está dado é o arranxo completo desta n-upla, isto é, non só o número de uns, senón tamén as súas posicións na n-upla). Supoñamos que (2) é válido para todo n, m e σ (isto é, os varios arranxos dos uns). Entón haberá, segundo un coñecido teorema do cálculo combinatorio, nCm maneiras distintas de distribuír m uns en n lugares e, visto o teorema especial da adición, poderiamos, entón, afirmar (1). Supoñamos que se probou (2) para calquera n, isto é, para un n particular e para todo m e todo σ que sexan compatibles con este n. Agora mostramos que, dada esta suposición, tamén deberá ser válida para n + 1, isto é, probaremos (3,0) α(n+1)F"(σm+0) = p mqn+1–m e (3,1) α(n+1)F"(σm+1) = p m+1q(n+1)–(m+1) *1 Nótese que é unha maneira alternativa de escribir o coeficiente binomial nCm, isto é, o número de maneiras en que m cousas poden ser situadas en n lugares, sempre que m ≤ n. 423 a lóxida da descuberta científica onde «σm+0» ou «σm+1», respectivamente, se refire a aquelas sucesións de lonxitude n + 1 que resultan de σm engadindo ao final un cero ou un un. Supoñamos, para toda lonxitude n de n-uplas (ou segmentos) consideradas, que α é (polo menos) libre n 1 (de repercusións posteriores); así, para un segmento de lonxitude n + 1, hai que considerar que α é polo menos libre n. Designemos mediante « m» a propiedade de ser un sucesor dunha n-upla σm. Entón podemos afirmar (4,0) αF"( m.0) = αF"( m) . αF"(0) = αF"( m) . q (4,1) αF"( m.1) = αF"( m) . αF"(1) = αF"( m) . q Agora consideramos que ten que haber, obviamente, tantos σm, isto é, sucesores da sucesión «σm» en α, como hai sucesións σm en α(n), e por tanto que (5) αF"( m) = α(n)F"( m) Con isto podemos transformar o segundo membro de (4). Pola mesma razón temos (6,0) αF"( m.0) = α(n+1)F"(σm+0) (6,1) αF"( m.1) = α(n+1)F"(σm+1) Con estas podemos substituír o primeiro membro de (4). Isto é, substituíndo (5) e (6) en (4) obtemos (7,0) α(n+1)F"(σm+0) = α(n)F"( m) . q (7,1) α(n+1)F"(σm+1) = α(n)F"( m) . p Así vemos que, asumindo que (2) é válido para algún n (e todos os arranxos σm que lle pertencen), podemos deducir (3) por indución matemática. Que (2) é, de feito, válido para n = 2 e para todo σm (onde m ≤ 2) obsérvase asumindo primeiro m = 1 e despois m = 0. Entón podemos afirmar (3) e, en consecuencia, (2) e (1). 424 Karl Popper APÉNDICE IV un método para construír modelos de sucesións aleatorias (cf. apartados 58, 64 e 66) Supoñemos (coma no apartado 65) que para cada número finito n dado pódese construír un período xerador que sexa libre n (de repercusións posteriores) e que mostra distribución equitativa. En todos eses períodos, toda x-upla combinatoriamente posible (para x ≤ n + 1) de uns e ceros aparecerá polo menos unha vez*1. (a) Construímos unha sucesión modelo que é «absolutamente libre» (de repercusións posteriores) do seguinte xeito. Anotamos un período libre n para un n escollido arbitrariamente. Este período terá un número finito de termos –digamos n. Agora anotamos un novo período que sexa polo menos libre n1 1. Supoñamos que o novo período ten a lonxitude n2. Neste novo período, debe ocorrer polo menos unha sucesión que sexa idéntica ao período dado anterior de lonxitude n1; e volvemos a arranxar o novo período de tal maneira que comece con esta sucesión (isto sempre é posible, de acordo coa análise do apartado 55). A isto chamámoslle o segundo período. Agora anotamos outro período que sexa polo menos libre n2 1 e buscamos neste terceiro período aquela sucesión que sexa idéntica ao *1 Hai varios métodos de construción aplicables á tarefa de construír un período xerador para unha sucesión libre n con equidistribución. Un método sinxelo é o seguinte. Facendo x = n + 1, primeiro construímos a táboa de todas as 2x posibles x-uplas de uns e ceros (ordenadas mediante algunha regra lexicográfica, por exemplo, segundo a magnitude). Despois comezamos o noso período anotando a última destas x-uplas, que contén x uns, quitándoa da táboa. A continuación seguimos a esta regra: engadir sempre un cero ao segmento inicial se está permitido; se non, engadir un un; e sempre quitar da táboa a última x-upla creada do período inicial. (Neste contexto, «se está permitido» significa «se a así creada última x-upla do período inicial non ocorreu aínda e, por tanto, non se quitou da táboa». Hai que continuar deste xeito ata que todas as x-uplas da lista sexan retiradas: o resultado é unha sucesión da lonxitude 2x + x – 1, que comprende (a) un período xerador, da lonxitude 2x = 2n+1, dunha alternativa libre n á que (b) se engadiron n elementos do período seguinte. Unha sucesión así construída pódese denominar a sucesión libre-n máis curta, pois pódese ver doadamente que non pode haber un período xerador máis curto dunha sucesión libre n periódica que a que ten lonxitude 2n+1. O Dr. L. R. B. Elton e eu mesmo atopamos probas da validez da regra de construción dada aquí. Temos a intención de publicar xuntos un artigo sobre isto. 425 a lóxida da descuberta científica segundo período (despois do novo arranxo), e despois volvemos a arranxar o terceiro período para que comece co segundo, etc. Deste xeito obtemos unha sucesión cunha lonxitude que aumenta moi rápido e que ten por período inicial aquel que fose anotado primeiro. Este período, á súa vez, convértese na sucesión inicial do segundo período, e así sucesivamente. Determinando unha sucesión inicial concreta aínda con máis condicións, por exemplo, que os períodos que se van anotar nunca poden ser máis longos do necesario (para que sexan exactamente libres ni 1, e non só polo menos libres ni 1), este método de construción pódese mellorar ata ser non ambiguo e definir unha sucesión definida, de xeito que poidamos calcular para cada termo da sucesión se é un un ou un cero*2. Así que *2 Collendo un exemplo concreto desta construción (a construción da sucesión aleatoria máis curta, como eu propoño chamarlle agora) podemos comezar co período (0) 01 da lonxitude n0 = 2. (Podemos dicir que este período xera unha alternativa libre 0). Despois temos que construír un período que sexa libre n0 1, isto é, libre 1. O método da nota *1 dá «1100» como período xerador dunha alternativa libre 1; e isto agora hai que o volver a arranxar para comezar coa sucesión «01» que eu chamei (0). O resultado do arranxo é (1) 0110 con n1 = 4. A continuación construímos o período libre n1 1 (isto é, libre 3) determinado polo método da nota *1. É este: 1111000010011010 Volvemos a arranxalo para que comece coa sucesión inicial (1), o cal dá (2) 0110101111000010 Como n2 = 16, a continuación temos que construír, polo método da nota *1, un período libre 15 (3) da lonxitude 216 = 65.536. Unha vez construído este período libre 15 (3), seremos capaces de descubrir onde ocorre, neste longo período, a nosa sucesión (2). Despois volvemos a arranxar (3) para que comece con (2), e pasamos a construír (4), da lonxitude 265.536. A unha sucesión construída desta maneira pódeselle chamar a «sucesión aleatoria máis curta» (1) porque cada paso na súa construción consiste na construción, para un n, dun período libre n máis curto (cf. nota *1, supra.), e (2) porque está construída de tal xeito que, sexa cal sexa a fase da súa construción, sempre comezará cun período libre n máis curto. En consecuencia, este método asegura que todo cacho inicial da lonxitude m = 22. ..2 2 é un período libre n máis curto para o n máis longo posible (isto é, para n = (log2m) – 1). Esta propiedade da «curtidade» é moi importante, pois sempre podemos obter sucesións libres n, ou absolutamente libres, con equidistribución que comecen por un segmento finito de calquera lonxitude escollida m, tal que este segmento finito non teña 426 Karl Popper temos unha sucesión (definida), construída segundo unha regra matemática, cunhas frecuencias cuxos límites son αF'(1) = αF'(0) = 1 2 usando o procedemento empregado na proba da terceira forma da fórmula binomial (apartado 60) ou do teorema de Bernoulli (apartado 61), pódese demostrar (con calquera grao de aproximación), para un valor calquera de frecuencia que nós escollamos, que existen sucesións que son «absolutamente libres», só con que supoñamos (como acabamos de probar) que existe polo menos unha sucesión que sexa absolutamente libre. (b) un método análogo de construción pódese usar para mostrar que existen sucesións que posúen unha frecuencia media «absolutamente libre» (cf. apartado 64), aínda que non teñan límite de frecuencia. Só temos que mudar o procedemento (a) de tal maneira que despois de un número dado de aumentos na lonxitude, sempre engadamos á sucesión un «bloque» finito (ou «iteración»), de uns, por exemplo. Este bloque faise tan longo para atinxir unha frecuencia p distinta de . Despois de atinxir esta frecuencia, toda a sucesión agora anotada (que agora pode ter a lonxitude mi) considérase como a sucesión inicial dun período que é libre mi 1 (con distribución equitativa), etc. (c) Por último, é posible construír dun xeito análogo un modelo dunha sucesión que teña máis de unha frecuencia media «absolutamente libre». Segundo (a), hai sucesións que non teñen distribución equitativa e son «absolutamente libres». carácter aleatorio senón que conteña, poñamos, só ceros, só uns ou calquera outro arranxo intuitivamente «regular», o cal mostra que para as aplicacións, a esixencia de liberdade n, ou mesmo de liberdade absoluta, non é suficiente e débese substituír por unha esixencia da orde de liberdade n que sexa evidente desde o comezo, que é, precisamente, o que se consegue coa sucesión aleatoria «máis curta», da maneira máis radical posible. Só estas sucesións poden establecer un estándar ideal de aleatoriedade. Para as sucesións «máis curtas», pódese probar a converxencia inmediatamente, en contraste cos exemplos de (b) e (c). Véxase tamén o apéndice *vi. 427 a lóxida da descuberta científica Así que non temos máis que combinar dúas sucesións tales, (A) e (B) (coas frecuencias p e q), da seguinte maneira. Anotamos unha sucesión inicial de (A), despois buscamos en (B) ata atopar nela esta sucesión, volvemos a arranxar o período de (B) que precede este punto de xeito que comece coa sucesión anotada; despois usamos todo este período rearranxado de (B) como sucesión inicial. A continuación buscamos en (A) ata atopar a sucesión anotada, rearranxamos (A), e así por diante. Desta maneira obtemos unha sucesión onde ocorren reiteradamente termos ata os que a sucesión é libre ni para a frecuencia relativa p da sucesión (A), pero nos que tamén ocorren reiteradamente termos ata os que a sucesión é libre ni para a frecuencia q de (B). Como neste caso os números ni aumentan sen límite, obtemos un modo de construción dunha sucesión que ten dúas «frecuencias medias» distintas que son ambas «absolutamente libres» (pois determinaramos (A) e (B) de tal maneira que os seus límites de frecuencia fosen distintos). Nota: a aplicabilidade do teorema especial da multiplicación ao problema clásico de lanzar dous dados x e Y ao mesmo tempo (e problemas relacionados) está asegurado se, por exemplo, facemos a estimación hipotética de que a «sucesión de combinación» (como a podemos denominar) é aleatoria, isto é, a sucesión α que ten os lanzamentos de x como termos impares e os lanzamentos de Y como termos pares. 428 Karl Popper APÉNDICE V Exame dunha obxección. O experimento das dúas fendas (cf. apartado 76)*1 Co experimento imaxinario que se describe a continuación en (a), preténdese refutar a miña afirmación de que as medicións simultáneas (non preditivas) e arbitrariamente exactas de posición e momento dunha partícula son compatibles coa teoría cuántica. (a) Supoñamos que A é un átomo que emite radiacións e que a súa luz cae nunha pantalla P despois de pasar por dúas fendas, F1 e F2. Segundo heisenberg, neste caso podemos medir exactamente a posición de A ou o momento da radiación, pero non as dúas cousas. Se medimos exactamente a posición (unha operación que fai que o momento se volva «borroso» ou «evanescente»), podemos asumir que a luz se emite desde A en ondas esféricas. Mais se medimos o momento exactamente, por exemplo medindo os refluxos debidos á emisión de fotóns (facendo «borrosa» ou «evanescente» a posición), entón somos capaces de calcular a dirección exacta e o momento dos fotóns emitidos. Neste caso teremos que considerar a radiación como corpuscular («agullas de radiación»). Así, ás dúas operacións de medida corresponden a dous tipos diferentes de radiación, de maneira que obtemos dous resultados experimentais diferentes. Se medimos exactamente a posición, obtemos un patrón de interferencia na pantalla: unha fonte de luz en forma de punto (se se pode calcular a posición exactamente é que ten forma *1 Véxase tamén o apéndice *xi e o Postscript, capítulo *v, apartado *110. Hoxe en día a miña idea é que o experimento das dúas fendas hai que o considerar de xeito diferente, mais a interpretación que se propón neste apéndice aínda conserva algún interese. As puntualizacións da sección (e) paréceme que constitúen unha crítica válida ao intento de explicar o dualismo entre partícula e onda en termos de «complementariedade», un intento que semella que foi abandonado definitivamente por parte dalgúns físicos en tempos máis recentes. 429 a lóxida da descuberta científica de punto) emite luz coherente. Por outro lado, se medimos exactamente o momento, non obtemos ningún patrón de interferencia (aparecen na pantalla reflexos de luz ou escintileos, sen patrón de interferencia, despois de os fotóns pasaren polas fendas, conforme ao feito de que a posición se fai «borrosa» ou «evanescente» e a que unha fonte de luz sen forma de punto non emite luz coherentemente). Supoñendo que puidésemos medir exactamente a posición e o momento, entón o átomo tería que emitir, por un lado, segundo a teoría das ondas, ondas esféricas continuas que producirían patróns de interferencia; por outro lado, tería que emitir un feixe corpuscular e incoherente de fotóns (se fósemos quen de calcular a traxectoria de cada fotón, nunca habería «interferencias», en vista do feito de que os fotóns non se destrúen mutuamente nin interactúan). A suposición de que realicen as medicións exactas de posición e mais momento tomadas simultaneamente leva, pois, a dúas predicións mutuamente contraditorias: por un lado, leva á predición de que aparecerán patróns de interferencia e, por outro, á predición de que non aparecerán patróns de interferencia. (b) Agora vou reinterpretar este experimento imaxinario estatisticamente. Primeiro tratarei o intento de medir exactamente a posición. Substitúo o átomo único que emite radiación por un conxunto de átomos de tal maneira que emitan luz coherente, que se propaga en forma de ondas esféricas. Este resultado obtense mediante o uso dunha segunda pantalla furada cunha abertura pequeniña A situada de tal maneira entre o conxunto de átomos e a primeira pantalla que a abertura A estea exactamente na posición que anteriormente ocupaba o átomo único A que emitía radiación. O conxunto de átomos emite unha luz que, despois de someterse a selección segundo unha dada posición pasando por unha abertura A, se espalla na forma de ondas esféricas continuas. Desta maneira substituímos o átomo illado, cuxa posición está determinada exactamente, por un caso estatístico de pura selección posicional. 430 Karl Popper (c) De xeito semellante, o átomo que ten exactamente medido o momento, pero con posición «borrosa» ou «evanescente», será substituído por unha selección pura segundo un momento dado ou, noutras palabras, por un raio monocromático de fotóns que se desprazan por liñas paralelas desde unha fonte de luz (sen forma de punto). En cada un destes dous casos obtemos o resultado experimental correcto: patróns de interferencia no caso (b) e ausencia de patróns de interferencia no caso (c). (d) Como imos interpretar o terceiro caso, que se supón que dá lugar a dúas predicións mutuamente contraditorias? Para descubrir isto, imaxinemos que xa observamos a traxectoria do átomo A, o cal quere dicir á vez posición e momento. Despois deberiamos observar que o átomo emite fotóns illados e que retrocede con cada emisión. Cada vez que recúa cambia a outra posición e cada vez o cambio é cara a unha dirección nova. Supoñendo que o átomo irradie deste xeito durante un período de tempo (non nos preguntamos se tamén absorbe enerxía durante este período), adoptará varias posicións diferentes neste período, abranguendo un considerable volume espacial. Por este motivo non se nos permite substituír un átomo por un conxunto de átomos en forma de punto: só o podemos substituír por un conxunto de átomos distribuídos nun considerable volume espacial. Ademais, como o átomo irradia en todas direccións, temos que substituílo por un conxunto de átomos que irradien en todas as direccións. Así non obtemos un caso puro, nin radiación coherente. E tampouco patróns de interferencia. Obxeccións semellantes ás examinadas aquí pódense examinar estatisticamente na liña deste exemplo. (e) En relación coa nosa análise deste experimento imaxinario, gustaríame dicir que o argumento (a), en contra do que podería supoñerse a primeira vista, sería insuficiente en calquera caso para elucidar o chamado problema da complementariedade (ou o dualismo entre onda e partícula). Intenta facer 431 a lóxida da descuberta científica isto mostrando que o átomo é capaz de emitir só ou ben ondas coherentes ou ben fotóns coherentes e que, por tanto, non hai contradición, porque os dous experimentos exclúense mutuamente. Pero non é certo que os dous experimentos se exclúan mutuamente, pois podemos combinar, xaora, unha medición de posición non demasiado exacta cunha medición non demasiado exacta do momento, e neste caso o átomo nin emite ondas completamente coherentes nin fotóns completamente incoherentes. Claramente, a miña interpretación estatística non ten ningunha dificultade ao enfrontarse a estes casos intermedios, malia que nunca se pretendese resolver con ela o problema do dualismo entre ondas e partículas. Eu supoño que unha solución realmente satisfactoria para este problema malamente será posible dentro do marco da física cuántica estatística (a teoría de partículas de heisenberg e Schrödinger segundo a interpretou Born en 1925-1926), pero eu creo que talvez se poida resolver no marco da teoría cuántica dos campos de onda ou na «segunda cuantización» (a teoría da emisión e a absorción de Dirac e mais a teoría do campo de onda da materia de Dirac, Jordan, Pauli, Klein, Mie, Wigner, 1927-1928. Cf. nota 2 á miña introdución do apartado 73). 432 Karl Popper APÉNDICE VI Sobre un procedemento non preditivo de medición (cf. apartado 77)*1 Supoñemos que un feixe non monocromático de partículas (por exemplo, un feixe de luz) que se despraza ao longo de traxectorias paralelas en dirección x se somete a selección dos seus momentos mediante a interposición dun filtro. (Se o feixe se compón de electróns teremos que usar, en lugar dun filtro, un campo eléctrico perpendicular á dirección do feixe para analizar o espectro). Supoñemos, con heisenberg, que este procedemento deixa inalterados os momentos (ou, máis precisamente, os seus compoñentes na dirección x) e tamén, en consecuencia, as velocidades (dos seus compoñentes x) das partículas seleccionadas. *1 Heisenberg, que fala de medir ou observar máis que de seleccionar, presenta o problema, en forma de descrición dun experimento imaxinario, como segue: se queremos observar a posición do electrón, temos que usar luz de alta frecuencia que interactuará fortemente con ela, alterando así o seu momento. Se queremos observar o seu momento, entón temos que usar luz de baixa frecuencia que deixa o momento (practicamente) inalterado, pero que non nos serve para determinar a posición. É importante que nesta discusión a incerteza do momento se deba á alteración, mentres que a incerteza da posición non sexa debida a nada diso. Máis ben é o resultado de evitar unha forte alteración do sistema (véxase o apéndice *xi, punto 9). O meu antigo argumento (que se baseaba nesta observación) era como segue: como a determinación do momento deixa este inalterado porque interactúa pouco co sistema, tamén deberá deixar inalterada a posición, aínda que non a revele. Mais a posición non revelada pódese revelar despois mediante unha segunda medición; e como a primeira medición deixara o estado do electrón (practicamente) inalterado, podemos calcular o pasado do electrón non só entre as dúas medicións, senón tamén antes da primeira medición. Non vexo a maneira en que Heisenberg poida evitar esta conclusión sen modificar esencialmente o seu argumento (noutras verbas, sigo crendo que o meu argumento e o meu experimento do apartado 77 se poden usar para sinalar unha incoherencia na argumentación de Heisenberg sobre a observación dun electrón). Mais agora si que creo que eu estaba equivocado cando supoñía que o que valía para as «observacións» ou medicións imaxinarias de Heisenberg tamén tiña que valer para as miñas «seleccións». Como demostra Einstein (no apéndice *xii), non vale para un filtro que actúa sobre un fotón. Nin tampouco vale para o campo eléctrico perpendicular á dirección dun feixe de electróns, mencionado (igual que o filtro) no primeiro parágrafo do presente apéndice. A anchura do feixe ten que ser considerable se os electróns se han de desprazar en paralelo ao eixe x e, como consecuencia, a súa posición antes da súa entrada no campo non se pode calcular con precisión despois de seren desviados polo campo. Isto invalida o argumento deste apéndice e o do seguinte, e tamén o do apartado 77. 433 a lóxida da descuberta científica Detrás do filtro poñemos un contador de Geiger (ou unha banda móbil de película fotográfica) para medir o tempo de chegada das partículas, o cal nos permite (porque coñecemos a velocidade das partículas) calcular as súas coordenadas x para calquera instante anterior ao tempo de chegaren. Podemos considerar agora dúas posibles suposicións. Por un lado, se asumimos que as coordenadas x das posicións das partículas non foron alteradas pola medición dos seus momentos, entón a medición de posición e momento pódese estender ao tempo anterior á selección de momento (polo filtro). Se, por outro lado, se asume que a selección segundo o momento interfire nas coordenadas x das posicións das partículas, podemos calcular exactamente as súas traxectorias só para o intervalo de tempo que hai entre as dúas medicións. Supoñer que a posición das partículas na dirección do seu movemento se pode alterar de maneira impredicible mediante unha selección segundo un momento dado significa o mesmo que asumir que a coordenada de posición dunha partícula se alteraría dalgunha maneira non calculable por esta selección. Mais como a velocidade da partícula permaneceu inalterada, esta suposición debe ser equivalente á de que, debido a esta selección, a partícula ten que ter saltado descontinuamente (con velocidade superior á da luz) a un punto diferente da súa traxectoria. Así e todo, esta suposición é incompatible coa teoría cuántica tal e como esta é aceptada na actualidade, pois aínda que a teoría permite saltos descontinuos, só os permite no caso de partículas dentro dun átomo (dentro do ámbito dos valores Eigen descontinuos, pero non no caso de partículas libres dentro dun ámbito de valores Eigen continuos). Supostamente é posible elaborar unha teoría (para escapar das conclusións a que chegamos anteriormente ou para conservar o principio de indeterminación) que altere a teoría cuántica de tal xeito que a suposición dunha alteración da 434 Karl Popper posición mediante a selección do momento sexa compatible con ela; mais mesmo esta teoría –que eu chamaría «teoría da indeterminación»– só podería tirar consecuencias estatísticas do principio de indeterminación, polo que só se podería corroborar estatisticamente. Nesta teoría, o principio de indeterminación só sería un enunciado de probabilidade formalmente singular, malia que o seu contido iría alén do que eu denominei «relacións estatísticas de dispersión». Pois, como se mostrará máis abaixo por medio dun exemplo, estas últimas son incompatibles coa suposición de que seleccionar o momento non altera a posición. Por iso esta última asunción non nos permite inferir a existencia dun «caso super-puro» coma o que prohiben as relacións de dispersión. Este enunciado mostra que o método de medición que examinei non afecta a interpretación estatística das fórmulas de heisenberg. Pódese dicir que ocupa, na miña interpretación estatística, o mesmo «lugar lóxico», por dicilo así, que o enunciado de heisenberg que, na súa interpretación, nega a realidade física das medicións exactas. De feito, o meu enunciado poderíase considerar unha tradución do enunciado de heisenberg á linguaxe estatística. Que o enunciado en cuestión é correcto pódese observar polas consideracións seguintes. Podemos intentar obter unha «clase super-pura» invertendo a orde dos pasos do experimento: seleccionando primeiro, poñamos, a posición na dirección x (a dirección do desprazamento) coa axuda dun diafragma, só posteriormente seleccionando o momento coa axuda dun filtro. Pódese pensar que isto é factible pois, como resultado da medición de posición, aparecerían toda clase de momentos, a partir dos cales o filtro (sen alterar a posición) seleccionará só aqueles que lles cadrou caer dentro dun ámbito pequeno. Pois se se selecciona un grupo de partículas mediante un «diafragma instantáneo», do xeito indicado, entón os paquetes de ondas de Schrödinger (obtidos pola superposición de ondas de frecuencias varias) só nos dan probabilidades, que hai que interpretar 435 a lóxida da descuberta científica estatisticamente, da ocorrencia de partículas neste grupo que ten o momento dado. Para calquera ámbito finito de momentos px, esta probabilidade tende a cero, sempre que fagamos a anchura do tren de onda infinitamente pequena, isto é, sempre que midamos a posición con precisión arbitraria (abrindo o diafragma instantáneo un período de tempo arbitrariamente curto). Do mesmo xeito, a probabilidade tende a cero nun período finito de tempo durante o cal se abre o obturador instantáneo, isto é, para calquera valor do ámbito de posición x, sempre que px tenda a 0. Canto máis exactamente seleccionemos a posición e o momento, máis improbable será que atopemos partícula ningunha detrás do filtro, e isto sen sermos capaces de predicir por adiantado en cal dos experimentos se atoparán partículas alí. Por tanto, non podemos impedir que estas partículas só aparezan en intervalos espallados aleatoriamente e, en consecuencia, non seremos quen de xerar desta maneira un agregado de partículas que sexa máis homoxéneo que un caso puro. Parece que hai un experimento crucial relativamente simple para decidir entre a «teoría da indeterminación» (descrita anteriormente) e a teoría cuántica. Segundo a primeira, os fotóns chegarían a unha pantalla situada detrás dun filtro altamente selectivo (ou espectrógrafo) despois mesmo da extinción da fonte de luz, durante un período de tempo; ademais, este «brillo posterior» producido polo filtro duraría tanto máis canto máis altamente selectivo fose o filtro*2. *2 Isto é precisamente o que ocorrerá, segundo as puntualizacións de Einstein, incluídas aquí no apéndice *xii. Véxase tamén a crítica de C. F. Weizsäcker do meu experimento imaxinario en Die Naturwissenschaften 22, 1934, p. 807. 436 Karl Popper APÉNDICE VII Puntualizacións sobre un experimento imaxinario (cf. apartado 77)*1 Podemos comezar pola suposición de que a1 e |b1| se miden, ou seleccionan, cun grao arbitrario de precisión. Visto o resultado obtivo no apéndice vi, podemos asumir que o momento absoluto |a2| da partícula que chega a X procedente da dirección PX se pode medir cun grao arbitrario de precisión. Segundo isto, |b2| pódese determinar tan precisamente como queiramos (usando o principio de conservación de enerxía). Ademais, a posición de F e X, e os instantes da chegada das partículas [A] a X, pódense medir con precisión arbitraria. Só nos fai falta investigar a situación con respecto ás indeterminacións a2 e b2, que xorden como consecuencia das indeterminacións das direccións correspondentes, e mais o vector P conectado coa indeterminación da posición de P, que tamén xorde como consecuencia da indeterminación dunha dirección, isto é, a dirección PX. Se o feixe PX pasa por unha fenda en X, entón ocorrerá a indeterminación direccional φ, como consecuencia da difracción que se dá na fenda. Este ángulo φ podémolo facer o pequeno que queiramos só con facer |a2| suficientemente grande; pois temos (1) φ  hr.|a2| onde r é a anchura da fenda. Mais é imposible con este método diminuír |∆a2|; só diminuiría aumentando r, o cal levaría a un aumento de |∆P|; pois temos (2) |∆a2|  φ |a2| *1 Para unha crítica dalgunhas das suposicións subxacentes no apartado 77 e neste apéndice, véxase a nota *1 do apéndice vi. 437 a lóxida da descuberta científica que á vista de (1) dá lugar a (3) | a2|  h r demostrando que |∆a2| non depende de |a2|. Debido ao feito de que para calquera r seleccionado podemos facer φ tan pequeno como queiramos aumentando |a2|, tamén podemos facer o compoñente a2 na dirección PX, que designamos por medio de «( a2)x», o pequeno que queiramos; e podémolo facer sen interferirmos coa medición da posición de P, pois esta posición tamén devén máis precisa ao aumentar |a2| e diminuír r. Agora gustaríanos demostrar que o correspondente argumento tamén vale para ( b2)y, isto é, para o compoñente PY de b2. Como podemos poñer b1 = 0 (segundo o noso suposto), obtemos da conservación de momentos (4) b2 = b1 = a2 Para calquera a1, |b1|, |a2| dados, b1 depende directamente de φ, o que significa que podemos ter un arranxo tal que sexa válido (5) | b1|  | a1|  h r e, por tanto, tamén (6) | b1|  | a2|  h r Ademais, en analoxía con (2), obtemos (7) b2  ψ.|b2|, onde «ψ» designa a indeterminación da dirección de b2. Por tanto, vistos (4) e (5), obtemos (8) ψ  | b1|  | a2| = h b2 r.|b2| ; 438 Karl Popper Mais isto quere dicir: por moi pequeno que fagamos r, sempre podemos facer ψ, e con el ( b2)y, o pequeno que queiramos usando valores suficientemente altos para o momento |b2|; e isto sen interferir, de novo, na precisión da medición da posición P. Isto demostra que é posible facermos cada un dos dous factores do produto ( P)y.( b2)y o pequenos que queiramos, independentemente dos outros. Mais para a refutación da afirmación de heisenberg sobre os límites de precisión atinxibles, sería suficiente con demostrar que un destes dous factores se pode facer o pequeno que queiramos sen facer que o outro aumente sen límites. Ademais, hai que dicir que mediante unha escolla apropiada da dirección PX é posible determinar a distancia PX de tal maneira que P e b2 sexan paralelos e, por tanto, (para un φ suficientemente pequeno), perpendiculares a PY.1 En consecuencia, tanto a precisión do momento nesta dirección coma, aínda máis, a precisión da posición (nesta mesma dirección) vólvense independentes da precisión da medición da posición de P. (Esta última, se usamos valores altos de a2, depende maiormente do pequeno que sexa r). Ambos os dous dependen soamente da precisión das medicións de posición e momento da partícula que chega a X procedente da dirección PX, e do pequeno que sexa ψ. (Isto corresponde ao feito de que a precisión (a2)x da partícula que chega a X depende do pequeno que sexa φ). Pódese ver que, con respecto á precisión das medicións, hai completa simetría entre a medición aparentemente non preditiva da partícula [A] cando chega a X e predición da traxectoria da partícula [B] cando sae de P. 1 Foi Schiff quen me sinalou, no curso dun debate sobre o meu experimento imaxinario, que un exame do grao de exactitude dunha medición tomada nunha dirección perpendicular a s pode ser relevante. Gustaríame deixar constancia aquí do meu agradecemento ao Dr. K. Schiff pola nosa proveitosa colaboración durante case un ano. 439 a lóxida da descuberta científica Nota sobre os novos apéndices, edición de 1959 Malia decatarme, para a miña sorpresa, de que aínda sigo a concordar con case todas as ideas filosóficas expresadas no libro, mesmo coas relativas á probabilidade (tema sobre o que as miñas ideas cambiaron máis que sobre ningún outro), deume a impresión de que debería engadirlle parte do novo material que se foi acumulando cos anos. había unha cantidade considerable de material, debido a que nunca deixei de traballar nos problemas tratados no libro, mais non foi posible incluír nestes novos apéndices todos os resultados relevantes que fun obtendo. Neste sentido, debo mencionar un resultado dos que non foron incluídos aquí: a interpretación da probabilidade como propensión, como eu a denomino. A exposición e discusión desta interpretación foi crecendo ata se converter, contra as miñas intencións orixinais, no compoñente principal dun novo libro. O título deste novo libro é Postscript: After Twenty Years. É unha continuación do presente libro, pois a maior parte dos seus contidos están relacionados cos deste, a parte da propia teoría da probabilidade. Neste sentido, teño que mencionar outros dous artigos de meu que se poderían incluír aquí se non houbese xa demasiados apéndices. Titúlanse «Three Views Concerning human Knowledge» e «Philosophy of Science: A Personal report»1. Os dous primeiros apéndices novos conteñen notas breves publicadas entre 1933 e 1938, ambos estreitamente relacionadas con este libro. Temo que a súa lectura non resulte moi fluída: os contidos están excesivamente comprimidos e non fun quen de facelos máis lexibles sen facer algúns cambios que diminuirían o seu valor como documentos. 1 Publicados, respectivamente, en Contemporary British Philosophy 3, editado por H. D. Lewis, 1956, pp. 355-388, e en British Philosophy in the Mid-Century, editado por C. A. Mace, 1957, pp. 153-191. Os dous artigos foron incluídos en Conjectures and Refutations, 1963, 1965 (capítulos 1 e 3). 440 Karl Popper Os apéndices *ii a *v teñen moito de técnico, demasiado, polo menos para o meu gusto. Mais estes detalles técnicos son necesarios, paréceme, para resolver o seguinte problema filosófico: é o grao de corroboración ou aceptabilidade dunha teoría o mesmo que a probabilidade, como pensaron moitos filósofos? Ou, noutras palabras, obedece as regras do cálculo de probabilidade? Eu fixera esta pregunta no libro e a miña resposta era negativa. A isto algúns filósofos responderon que o que eles entendían por probabilidade (por corroboración ou por confirmación) era diferente do que entendía eu. Para xustificar o meu rexeitamento desta resposta evasiva (que ameaza con reducir a teoría do coñecemento a unha simple cuestión verbal), fíxose necesario entrar en detalles técnicos: había que formular as regras («axiomas») do cálculo de probabilidade e había que mostrar que papel desempeñaba cada unha delas. Para non prexulgar a cuestión de se o grao de corroboración é ou non unha das interpretacións posibles do cálculo de probabilidade, hai que entender o cálculo no sentido máis amplo e admitir só aquelas regras que sexan esenciais. Comecei estas investigacións no 1935 e no apéndice *ii inclúese unha breve nota sobre algunhas das miñas investigacións anteriores. Nos apéndices *iv e *v ofrécese un esbozo das miñas conclusións máis recentes. En todos estes novos apéndices sostense que, a parte das interpretacións clásicas, lóxicas e frecuenciais da probabilidade, todas elas tratadas no libro, existen moitas outras interpretacións diferentes da idea de probabilidade e mais do cálculo matemático da probabilidade. Estas últimas preparan o camiño para o que despois eu denominei interpretación da probabilidade como propensión22. 2 2 Cf. o meu artigo «The Propensity Interpretation of Probability and the Quantum Theory», en Observation and Interpretation, editado por S. Körner, 1957, pp. 65-70 e 88 ss. Véxanse tamén os dous artigos mencionados na nota anterior, en especial pp. 388 e 188, respectivamente. *Desde a primeira edición inglesa deste libro, publicáronse outros dous artigos meus sobre a propensión: 441 a lóxida da descuberta científica Mais eu non só tiña que examinar as regras do cálculo de probabilidade, senón que tamén tiña que formular regras para a avaliación de probas, isto é, para o grao de corroboración. Isto fíxose nunha serie de tres artigos, incluídos aquí no apéndice *ix. Os apéndices *vii e *viii forman unha especie de elo de unión entre a miña análise da probabilidade e a da corroboración. Os apéndices restantes serán de interese, agardo, tanto para filósofos como para científicos, en especial os que tratan sobre desorde obxectiva e experimentos imaxinarios. O apéndice xii contén unha carta de Albert Einstein, publicada aquí por primeira vez, co permiso dos testamenteiros da súa obra. «The Propensity interpretation of Probability», en The British Journal for the Philosophy of Science 10, 1959, pp. 25-42. «Quantum Mechanics without 'The Observer'», en Quantum Theory and Reality, editado por Mario Bunge, 1967, pp. 7-44 (en especial pp. 28-44). 442 Karl Popper APÉNDICE *I Dúas notas sobre a indución e a demarcación, 1933-1934 A primeira das dúas notas incluídas aquí é unha carta ao director de Erkenntnis. A segunda é o texto da miña participación nun debate nun congreso de filosofía en 1934 en Praga, publicado en 1935 en Erkenntnis, como unha parte do informe sobre este congreso. 1 Esta carta ao director publicouse en 1933 en Erkenntnis 3 (isto é, Annalen der Philosophie 11), no 4-6, p. 426 ss. Para facilitar a lectura dividín algúns dos parágrafos orixinais. A carta escribiuse porque daquela as miñas ideas estaban a ser debatidas profusamente por parte dos membros do Círculo de Viena, mesmo por escrito (cf. nota 3), aínda que ningún dos meus manuscritos (que foran lidos por parte dalgúns membros do Círculo) foran publicados, en parte debido ao seu volume: o meu libro Logik der Forschung houbo que o reducir a unha fracción do seu volume orixinario para facelo aceptable para publicación. A énfase que poño na miña carta na diferenza entre o problema do criterio de demarcación e o pseudo-problema do criterio de significado (e no contraste entre as miñas ideas e as de Schlick e Wittgenstein) é debida ao feito de que mesmo daquela as miñas ideas eran comentadas, por parte do Círculo, asumindo equivocadamente que eu defendía a substitución do criterio de verificabilidade do significado polo criterio da falsificabilidade do significado, cando, en realidade, eu non me estaba a ocupar do problema do significado, senón do da demarcación. Como mostra a carta, intentei corrixir esta interpretación errada das miñas ideas xa en 1933. Tamén o intentei en Logik der Forschung e continuei 443 a lóxida da descuberta científica facéndoo desde aquela ata a actualidade. Pero parece que os meus amigos positivistas son incapaces de ver a diferenza. Estes malentendidos son os que fixeron que na carta incidise no contraste entre as miñas ideas e as do Círculo de Viena. Como consecuencia disto, algunhas persoas pensaron, outra vez equivocadamente, que eu concibira as miñas ideas orixinalmente como unha crítica de Wittgenstein. En realidade, eu xa formulara o problema da demarcación e o criterio da falsificabilidade ou comprobabilidade no outono de 1919, anos antes de que as ideas de Wittgenstein se convertesen en tema de discusión en Viena (cf. o meu artigo «Philosphy of Science: A Personal report», recollido en Conjectures and Refutations). Isto explica por que, así que souben do novo criterio de verificabilidade do significado proposto polo Círculo, eu insistía en sinalar o contraste entre este e o meu criterio de falsificabilidade, que é un criterio de demarcación, deseñado para diferenciar sistemas de enunciados científicos daqueles outros sistemas, perfectamente significativos, de enunciados metafísicos (en canto aos absurdos carentes de sentido, eu non pretendo que o meu criterio sexa aplicable a eles). Esta é a carta de 1933: Un criterio do carácter empírico dos sistemas teóricos (1) Cuestión Preliminar. O Problema da Indución de Hume (a cuestión da validez das leis naturais) xorde dunha contradición manifesta entre o principio do empirismo (o principio de que só a «experiencia» pode decidir sobre a verdade ou falsidade dun enunciado real) e a constatación, por parte de hume, de que os argumentos indutivos (ou xeneralizadores) non son válidos. A Schlick1, por influencia de Wittgenstein, parécelle que esta contradición se pode resolver adoptando o presuposto de 1 Schlick, Die Naturwissenschaften 19, 1931, no 7, p. 156. 444 Karl Popper que as leis naturais «non son enunciados xenuínos», senón «regras para a transformación de enunciados»*1, isto é, que son un tipo particular de «pseudo-enunciado». Este intento de resolver o problema (solución que a min me parece verbal, en todo caso) comparte con todos os outros intentos, coma o apriorismo, o convencionalismo, etc., un certo presuposto infundado: a suposición de que todos os enunciados xenuínos teñen que ser, en principio, decidibles, isto é, verificables e falsificables. Máis en concreto, que ten que ser posible para todos os enunciados xenuínos tanto unha verificación empírica (definitiva) coma unha falsificación empírica (definitiva). Se se abandona este suposto, faise posible resolver dun xeito simple a contradición que constitúe o problema da indución. Podemos interpretar, coherentemente, que as leis naturais ou teorías son enunciados xenuínos parcialmente decidibles, isto é, non son verificables por razóns lóxicas, senón só falsificables dun xeito asimétrico: son enunciados que se someten a comprobacións mediante intentos sistemáticos de os falsificar. A solución proposta aquí ten a vantaxe de que, ademais, vai preparando o terreo para a solución do segundo problema, que é o fundamental, da teoría do coñecemento (ou a teoría do método empírico). O que eu teño en mente é o seguinte: (2) Problema Principal. O problema da demarcación (o problema kantiano dos límites do coñecemento científico) pódese definir como o problema de atopar un criterio polo que podermos distinguir entre aseveracións (enunciados, sistemas de enunciados) pertencentes ás ciencias empíricas e aseveracións que se poden caracterizar como «metafísicas». *1 Para comprendermos o que quere dicir Schlick, se cadra é mellor dicir «regras para a formación ou transformación de enunciados». En alemán reza Anweisungen zur Bildung von Aussagen. Aquí Anweisungen claramente pódese traducir por 'regras' [rules en inglés], mais Bildung non tiña daquela ningunha das connotacións técnicas que levaron despois a facer unha clara diferenciación entre 'formación' e 'transformación' de enunciados. 445 a lóxida da descuberta científica Segundo a solución proposta por Wittgenstein*2, esta demarcación conséguese servíndose da idea de «significado» ou «sentido»: toda proposición que teña sentido ou significado debe ser unha función de verdade de proposicións «atómicas», isto é, debe ser completamente reducible, desde o punto de vista lóxico, a enunciados singulares de observación (ou deducible deles). Se algún enunciado non resulta ser reducible deste xeito, entón «carece de sentido», é «absurdo», «metafísico» ou é unha «pseudo-proposición». Segundo isto, a metafísica sería o absurdo ou a carencia de sentido. Pode dar a impresión de que os positivistas, ao trazaren esta liña de demarcación, foron quen de librarse da metafísica de xeito máis radical que os antimetafísicos anteriores. Mais con estes métodos o que se aniquila non é só a metafísica, senón tamén a ciencia natural, pois as leis da natureza non son máis reducibles a enunciados de observación que os enunciados metafísicos (lémbrese o problema da indución!). Se se aplica con coherencia o principio de Wittgenstein, semellaría que as leis naturais son «pseudo-proposicións sen sentido» e, en consecuencia, que son tamén «metafísicas». Polo tanto, vemos como se nos esfarela este intento de trazar esa liña de demarcación. O dogma do significado ou sentido, e os pseudo-problemas a que deu lugar, pódese eliminar se adoptamos como criterio de demarcación o criterio da falsificabilidade, isto é, da decidibilidade (polo menos ) unilateral, asimétrica ou parcial. Segundo este criterio, os enunciados, ou sistemas de enunciados, transmiten información sobre o mundo empírico soamente se son capaces de entraren en conflito coa experiencia ou, máis precisamente, se poden ser sistematicamente comprobados, isto é, se poden ser sometidos (segundo unha «decisión metodolóxica») a comprobacións que poidan dar lugar á súa refutación2. *2 Wittgenstein, Tractatus Logico-Philosophicus (1922). 2 Sobre este procedemento de comprobabilidade fala Carnap en Erkenntnis 3, p. 223 ss. («procedemento B»). Véxase tamén Dubislav, Die Definition, 3a edición, p. 100 ss. 446 Karl Popper Deste xeito, o recoñecemento de enunciados unilateralmente decidibles permítenos resolver non só o problema da indución (nótese que só hai un tipo de argumento que vai na dirección da indución: o modus tollens dedutivo), senón tamén o problema fundamental da demarcación, un problema que é o que deu lugar a case todos os outros problemas da epistemoloxía. O noso criterio de falsificabilidade distingue con suficiente precisión os sistemas teóricos das ciencias empíricas dos da metafísica (e tamén dos sistemas convencionais e tautolóxicos), sen afirmar que a metafísica careza de sentido (a cal, desde un punto de vista histórico, se pode considerar a fonte de onde emanan as teorías das ciencias empíricas). Variando un pouco e xeneralizando unha coñecida puntualización de Einstein3, as ciencias empíricas poderíanse caracterizar como segue: na medida en que un enunciado científico fale da realidade, ten que ser falsificable; e na medida en que non é falsificable, é que non fala sobre a realidade. unha análise lóxica mostraría que o papel da falsificabilidade (unilateral) como criterio da ciencia empírica é formalmente análogo ao da non contraditoriedade da ciencia en xeral. un sistema contraditorio non é capaz de producir, de todos os enunciados posibles, un subconxunto propio; de xeito semellante, un sistema non falsificable non é capaz de producir, de todos os enunciados «empíricos» posibles (de todos os enunciados sintéticos singulares), un subconxunto propio4. *(Engadido en 1957) Resulta que esta referencia non era ao traballo de Carnap, senón ao meu propio traballo, ao que Carnap alude e recoñece no seu artigo. Carnap recoñeceu suficientemente que eu era o autor do que el describía alí como «procedemento B» (Verfahren B). 3 Einstein, Geometrie und Erfahrung, 1921, p. 3 ss. *(Engadido en 1957) Einstein dixo: «Na medida en que os enunciados da matemática falan sobre a realidade, non son verdadeiros e, na medida en que son verdadeiros, é que non falan da realidade». 4 Unha exposición máis completa publicarase axiña en forma de libro (en Schiften zur wissenschaftlichen Weltauffasung, editado por Frank e Schlick e publicado por Springer en Viena). *(Engadido 1957): Esta referencia era do meu libro, Logik der Forschung, daquela en proceso de impresión (publicouse en 1934, pero, de acordo co costume continental, coa data de publicación «1935», e eu mesmo o citei decote con esta data). 447 a lóxida da descuberta científica 2 A segunda nota contén uns comentarios que fixen despois dunha conferencia que reichenbach deu en Praga nun congreso de filosofía no verán de 1934 (cando o meu libro estaba en fase de probas). Erkenntnis publicou máis tarde un informe sobre este congreso e a miña contribución, incluída aquí en versión traducida, publicouse en Erkenntnis 5, 1935, p. 170 ss. Sobre a denominada «lóxica da indución» e a «probabilidade de hipóteses» Eu non creo que sexa posible elaborar unha teoría do que tradicionalmente se denominou «indución» (uso que tamén segue, por exemplo, reichenbach). Pola contra, creo que unha tal teoría (xa use a lóxica clásica ou a lóxica probabilística) debe, por razóns puramente lóxicas, dar lugar ou ben a unha regresión infinita ou a operar cun principio apriorístico de indución, un principio sintético que non se pode probar empiricamente. Se distinguimos, con reichenbach, entre «procedemento de descuberta» e «procedemento de xustificación» dunha hipótese, entón temos que dicir que o primeiro (o procedemento de descuberta dunha hipótese) non se pode reconstruír racionalmente. Pero a análise do procedemento de xustificación de hipóteses non dá lugar, na miña opinión, a nada que se poida dicir que pertence á lóxica indutiva. Isto é debido a que unha teoría da indución é superflua, non ten función ningunha na lóxica da ciencia. As teoría científicas nunca se poden «xustificar» ou verificar. Malia isto, unha hipótese A pode, baixo certas circunstancias, conseguir máis do que a hipótese B, talvez porque B entra en contradición con certos resultados de observacións e, por tanto, é «falsificada» por eles, mentres que A non está falsificada; ou quizais porque servíndose de A pódense deducir un número maior de predicións que servíndose de B. O máximo 448 Karl Popper que se pode dicir dunha hipótese é que ata o momento presente demostrou que era válida e mais que tivo máis éxito que outras hipóteses, aínda que, en principio, nunca se poderá xustificar ou verificar, nin sequera demostrar que é probable. Esta avaliación da hipótese descansa só nas consecuencias dedutivas (predicións) que se poden tirar da hipótese. Non hai necesidade nin de mencionar a indución. O erro cometido normalmente neste eido pódese explicar historicamente. Considerábase que a ciencia era un sistema de coñecementos, uns coñecementos tan certos como fose posible acadar. Supoñíase que a «indución» garantía a verdade deste coñecemento. Máis tarde fíxose evidente que a verdade absolutamente certa non era atinxible. Por iso se pasou a buscar, en lugar diso, unha versión rebaixada da certeza ou a verdade: a «probabilidade». Mais falar de «probabilidade» en lugar de «verdade» non nos axuda a escapar da regresión infinita nin do apriorismo5. Desde este punto de vista, vese que non serve para nada e que resulta enganoso empregar o concepto de probabilidade en relación con hipóteses científicas. O concepto de probabilidade úsase na física e na teoría dos xogos de azar dun xeito particular, que se podería definir satisfactoriamente coa axuda do concepto de frecuencia relativa (seguindo a von Mises)2. Os intentos de reichenbach de ampliar este concepto ata incluír a chamada «probabilidade indutiva» ou «probabilidade de hipóteses» están condenadas ao fracaso, na miña opinión, aínda que eu non teño nada que obxectar á idea proposta por el de «frecuencia de verdade» dentro dunha sucesión de enunciados6. As hipóteses non poden ser interpretadas satisfactoriamente como sucesións de 5 Cf. Popper, Logik der Forschung, por exemplo, p. 188 ss. *(da edición orixinal); isto é, apartados 80 e 81. 6 Este concepto débeselle a Whitehead. 449 a lóxida da descuberta científica enunciados7 e, mesmo se un acepta esta interpretación, nada se gaña: o único que se consegue son varias definicións manifestamente insatisfactorias da probabilidade dunha hipótese. Por exemplo, chégase a unha definición que atribúe unha probabilidade 1⁄2 (en lugar de 0) a unha hipótese que foi falsificada mil veces, pois esta atribución habería que facela se a hipótese resulta falsificada polos resultados de unha proba de cada dúas. Poderíase considerar, quizais, a posibilidade de interpretar a hipótese, en vez de como unha sucesión de enunciados, como un elemento dunha sucesión de hipóteses8, atribuíndolle un certo valor de probabilidade en canto que elemento de tal sucesión (non sobre a base dunha «frecuencia de verdade», senón sobre a base dunha «frecuencia de falsidade» dentro da sucesión). Mais este intento tampouco resulta satisfactorio, pois unhas consideracións bastante simples dan como resultado que é imposible chegar deste xeito a un concepto de probabilidade que cumpra sequera a esixencia máis modesta de que unha observación falsificadora produza un marcado descenso na probabilidade da hipótese. Eu creo que teremos que nos afacer á idea de que non se debe considerar a ciencia como un «corpo de coñecementos», senón como un sistema de hipóteses, isto é, un sistema de conxecturas ou anticipacións que en principio non poden ser xustificadas, mais coas que traballamos sempre que superen comprobacións, pero das cales nunca poderemos dicir xustificadamente que sabemos que son «verdadeiras», nin «máis ou menos certas», nin sequera «probables». 7 Reichenbach interpreta «as afirmacións das ciencias naturais» como sucesións de enunciados en Wahrscheinlichkeistlogik, p. 15. (Ber. D. Preuss. Akad., phys.-math. Klasse, 29, 1932, p. 488). 8 Isto correspondería á idea sostida por Grelling nesta discusión, cf. Erkenntnis 5, p. 168 ss. 450 Karl Popper APÉNDICE *II unha nota sobre a probabilidade, 1938 A seguinte nota, «un conxunto de axiomas independentes de probabilidade», foi publicada por primeira vez en Mind, N. S., 47, 1938, p. 275 ss. É breve e, desgrazadamente, non está moi ben escrita. Foi a miña primeira publicación orixinal en inglés e ademais non puiden corrixir as probas porque nunca me chegaron (eu daquela estaba en Nova Celandia). A nota introdutoria do texto, aquí reimpresa, afirma claramente, e creo que por primeira vez, que a teoría matemática da probabilidade se debía construír como un sistema formal, isto é, un sistema que debería ser susceptible de moitas interpretacións diferentes, entre elas, por exemplo: (1) a interpretación clásica, (2) a interpretación de frecuencia e (3) a interpretación lóxica (agora denominada ás veces a interpretación «semántica»). unha das razóns polas que quixen elaborar unha teoría formal que non dependese da escolla dunha interpretación particular era que eu pretendía mostrar máis adiante que o que no libro denominei «grao de corroboración» (ou de «confirmación» ou de «aceptabilidade») non era a probabilidade, pois as súas propiedades eran incompatibles co cálculo formal de probabilidade (cf. apéndice *ix e o Postscript, apartados *27 a *32). Outra motivo para escribir esta nota era que eu quería demostrar que o que no libro chamara «probabilidade lóxica» era a interpretación lóxica dunha «probabilidade absoluta», isto é, dunha probabilidade p(x,y), con y tautolóxico. lembrando que unha tautoloxía se pode escribir non-(x e non-x), ou , nos símbolos usados na miña nota, podemos definir a probabilidade absoluta de x (para o que podemos escribir «p(x)» ou «pa(x)») en termos de probabilidade relativa como segue: p(x) = p (x, ), ou pa(x) = p (x, ) = p(x, ) 451 a lóxida da descuberta científica unha definición semellante dáse na miña nota. Cando escribín esta nota non coñecía o libro de Kolmogorov, Foundations of Probability, aínda que fora publicado en alemán por primeira vez en 1933. Kolmogorov tiña obxectivos moi semellantes, mais o seu sistema é menos «formal» que o meu e, por tanto, é susceptible de menos interpretacións. A diferenza máis importante é esta: el interpreta os argumentos do funtor de probabilidade como conxuntos e, en consecuencia, asume que teñen membros (ou «elementos»). No meu sistema non se fixo unha suposición correspondente: na miña teoría non se asume absolutamente nada sobre estes argumentos (que eu chamo «elementos») excepto que as súas probabilidades se comportan do xeito requirido polos axiomas. O sistema de Kolmogorov pódese considerar, porén, como unha das interpretacións do meu (véxanse tamén os meus comentarios sobre este tema no apéndice *iv). O sistema axiomático real que aparece contra o final da miña nota é algo torpe, polo que pouco despois da súa publicación substituíno por un máis simple e máis elegante. Ambos sistemas, o vello e o novo, foron formulados en termos de produto (ou conxunción) e complemento (negación), igual que os meus sistemas posteriores. Daquela, aínda non dera deducido a lei distributiva das máis simples (como de A1 a A3 e B2, infra.), polo que a formulei como axioma. Pero, formulada en termos de produto e complemento, a lei distributiva resulta bastante torpe. Omitín, por tanto, a parte final da nota, que contiña o vello sistema axiomático. En lugar del, incluirei aquí o meu sistema máis simple (cf. Brit. Journal Phil. Sc., l. cit.), baseado, igual que o vello, na probabilidade absoluta. É deducible, xaora, do sistema baseado na probabilidade relativa dado no apéndice *iv. Aquí formulo o sistema na orde correspondente á miña anterior nota: A1 p(xy)  p(yx) (Conmutación) A2 p((xy)z)  p(x(yz)) (Asociación) 452 Karl Popper A3 p(xx)  p(x) (Tautoloxía) A4 hai polo menos un x e un y tales que p(x)  p(y) (Existencia) B1 p(x)  p(xy) (Monotonía) B2 p(x) = p(xy) + p(x ) (Complemento) B3 p(y)  p(x), e p(xy) p(x) p(y) (Independencia)*1 A seguir vén a miña vella nota de 1938, con algunhas correccións estilísticas engadidas. Un conxunto de axiomas independentes de probabilidade Desde o punto de vista formal da «axiomática», a probabilidade pódese describir como un funtor1 de dous termos (isto é, unha función numérica de dous argumentos, pero que eles mesmos non necesitan ter valores numéricos), cuxos argumentos son nomes variables ou constantes (que se poden interpretar, por exemplo, como nomes de predicados ou como nomes de enunciados segundo a interpretación escollida). Se queremos aceptar para os dous argumentos as mesmas regras de substitución e a mesma interpretación, entón este funtor pódese representar por «p(x1, x2)» que se pode ler como «a probabilidade de x1 con respecto a x2». É desexable construír un sistema de axiomas, s1, en que «p(x1, x2)» aparece como funtor primitivo (non definido) e que estea construído de tal maneira que poida ser interpretado igual de ben por calquera das interpretacións propostas. As tres *1 Sen B3 o límite superior de p(x) non está fixado: p(x) = k, onde k se pode escoller arbitrariamente. Despois obtemos: x é independente de y se e só se p(xy) = p(x)p(y)/k; mais isto é unha torpeza a non ser que escollamos k = 1. B3, que leva a k = 1, indica este motivo para escoller k = 1. Se en B3 poñemos «p(y) ≠ 0» en lugar de «p(y) HAIQUECOLOCAR O SÍMBOLO DA PENÚLTIMA LIÑA DA NOTA *1 DA PÁXINA 321≥ p(x)», entón A4 é redundante. 1 Sobre a terminoloxía, véxase Carnap, Logical Syntax of Language (1937) e Tarski, Erkenntnis 5, 175 (1935). 453 a lóxida da descuberta científica interpretacións que máis se debateron son: (1) a definición2 clásica da probabilidade que resulta de dividir os casos favorables entre os casos igualmente posibles, (2) a teoría da frecuencia3 que define a probabilidade como a frecuencia relativa dunha certa clase de ocorrencias dentro doutra clase e (3) a teoría lóxica4 que define a probabilidade como o grao dunha relación lóxica entre enunciados (que é igual a 1 se x1 é consecuencia lóxica de x2 e que é igual a 0 se a negación de x1 é igual á consecuencia lóxica de x2). Ao construír tal sistema s1, capaz de ser interpretado por calquera das interpretacións mencionadas (e por algunhas outras tamén), é aconsellable introducir, coa axuda dun grupo especial de axiomas (véxase infra., Grupo A), certas funcións non definidas dos argumentos, por exemplo, a conxunción («x1 e x2», simbolizadas aquí por «x1x2») e a negación («non-x1», simbolizado por « 1»). Así, podemos expresar simbolicamente unha idea como «x1 e non x1» servíndonos de «x1 1», e a súa negación por « ». (Se (3), isto é, se se adopta a interpretación lóxica, «x1 1» como o nome dun enunciado que é a conxunción do enunciado denominado «x1» e a súa negación). Supoñendo que as regras de substitución estean correctamente formuladas, pódese probar para calquera x1, x2 e x3: . Así, o valor de depende soamente da única variable real x1. Isto xustifica5 a seguinte definición explícita dun novo funtor «pa(x1)», que se pode denominar «probabilidade absoluta»: Df1 pa (x1) = p . 2 Véxase, por exemplo, Levy-Roth, Elements of Probability, p. 17 (1936). 3 Véxase Popper, Logik der Forschung, 94-153 (1935). 4 Véxase Keyness, A Treatise on Probability (1921); un sistema máis satisfactorio foi fornecido por Mazurkiewicz, C. R. Soc. d. Sc. et de L., Varsovie, 25, Cl. III (1932); véxase Tarski, l. cit. 5 Véxase Carnap, l. cit., 24. *Sería máis doado escribir Df1 (sen «xustificación») como segue: pa(x1) = p . 454 Karl Popper (un exemplo dunha interpretación de «pa(x1)» no senso de (3), ou sexa, da interpretación lóxica, é o concepto de «probabilidade lóxica» tal como eu o usei nunha publicación anterior)6. Agora é posible proceder a toda a construción desde o outro cabo: en lugar de introducir «p(x1, x2)» como concepto primitivo (funtor primitivo) dun sistema axiomático s1 e definir «pa(x1)» explicitamente, podemos construír outro sistema axiomático s2 en que «pa(x1)» apareza como variable primitiva (indefinida) e despois podemos pasar a definir «pa(x1, x2)» explicitamente, coa axuda de «pa(x1)», como segue: Df2 p(x1, x2) = pa(x1x2) pa(x2) As fórmulas adoptadas en s1 como axiomas (e Df1) agora son teoremas en s2, isto é, pódense deducir servíndose do novo sistema de axiomas s2. Pódese demostrar que os dous métodos descritos (a escolla de s1 e Df1, ou s2 e Df2, respectivamente) non son igualmente apropiados do punto de vista da axiomática formal. O segundo método é mellor que o primeiro en certos aspectos, o máis importante dos cales é que é posible formular en s2 un axioma de unicidade que é moito máis forte que o correspondente axioma de s1 (se a xeneralidade de s1 non é restrinxida). Isto débese ao feito de que se pa(x2) = 0, o valor de p(x1, x2) vólvese indeterminado*2. A seguir axúntase un sistema de axiomas independentes, s2, como se describiu anteriormente (é doado construír un sistema s1 coa axuda del mesmo). Combinado coa definición Df2, é 6 Véxase Popper, l. cit., 71, 151. *2 O sistema absoluto (s2) ten unha vantaxe sobre o sistema relativo (s1) só na medida en que a probabilidade relativa p(x, y) se considere indeterminada se pa(y) = 0. Con posterioridade elaborei un sistema (véxase o apéndice *iv) en que se determinan as probabilidades relativas mesmo no caso pa(y) = 0. Este é o motivo polo que agora considero o sistema relativo superior ao absoluto (debo dicir tamén que agora considero unha mala escolla o termo «axioma de unicidade». Ao que eu pretendía aludir era, supoño, a algo semellante ao postulado 2 ou ao axioma A2 do sistema do apéndice *iv. 455 a lóxida da descuberta científica suficiente para a dedución da teoría matemática da probabilidade. Os axiomas pódense dividir en 2 grupos: o Grupo A está formado polos axiomas das operacións con conectores (conxunción e negación) do argumento e é practicamente unha adaptación do sistema de postulados para a denominada «lóxica da álxebra»7. O Grupo B dá os axiomas característicos da medición de probabilidade. Os axiomas son: [Aquí viña (con varias grallas) o complicado sistema axiomático que posteriormente substituín polo sistema máis simple que acabo de presentar]. Christchurch, Nova Celandia, 20 de novembro de 1937. 7 Véxase Huntington, Trans. Amer. Mathem. Soc., 5, 292 (1904) e Whitehead-Russel, Principia Mathematica, I, onde hai cinco proposicións (22.51, 22.52, 22.68, 24.26, 24.1) que corresponden aos cinco axiomas do Grupo A, tal como se presentan aquí. 456 Karl Popper APÉNDICE *III Sobre o uso heurístico da definición clásica de probabilidade, en especial para deducir o teorema xeral da multiplicación A definición clásica da probabilidade como número de casos favorables dividido polo número de casos igualmente posibles ten un considerable valor heurístico. O seu principal problema é que é aplicable a dados homoxéneos ou simétricos, pero non aos dados irregulares, ou sexa que non permite a diferenza de peso dos casos posibles. Mais nalgúns casos especiais hai medios e maneiras de superar esta dificultade, pois é precisamente nestes casos onde a definición vella ten valor heurístico: toda definición satisfactoria terá que coincidir coa definición vella onde se poida superar a dificultade de asignar pesos e, por tanto, a fortiori, naqueles casos en que a vella definición resulte aplicable. (1) A definición clásica será aplicable en todos os casos en que facemos a conxectura de que estamos ante pesos iguais ou posibilidades iguais e, por tanto, con iguais probabilidades. (2) Será aplicable en todos os casos en que poidamos transformar o noso problema para obter pesos iguais, posibilidades iguais ou probabilidades iguais. (3) Será aplicable, con lixeiras modificacións, sempre que se poida asignar unha función de peso ás varias posibilidades. (4) Será aplicable, ou terá valor heurístico, na maioría dos casos en que unha estimación lasa que funciona con posibilidades iguais dea unha solución que se aproxime ás probabilidades cero ou un. (5) Será de grande valor heurístico en casos en que se poidan introducir pesos en forma de probabilidades. Considérese, por exemplo, o seguinte problema: temos que calcular a probabilidade de que saia un número par nos lanzamentos dun dado 457 a lóxida da descuberta científica cando non se contan os lanzamentos en que sae o número seis, ao consideralo un «non lanzamento». A definición clásica, está claro, dá 2/5. Agora supoñamos que o dado ten algunha irregularidade e que se nos dan as probabilidades (desiguais) p(1), p(2), ..., p(6). Aínda así podemos calcular que a probabilidade requirida é igual a p(2) + p(4) = p(2) + p(4) p(1) + p(2) + p(3) + p(4) + p(5) 1 – p(6) Isto é, podemos modificar a definición clásica de xeito que dea lugar á seguinte regra simple: Dadas as probabilidades de todos os casos (mutuamente excluíntes), a probabilidade requirida é a suma das probabilidades de todos os casos favorables (mutuamente excluíntes), dividido pola suma das probabilidades de todos os casos posibles (mutuamente excluíntes). Está claro que tamén podemos expresar esta regra, para casos excluíntes e non excluíntes, como segue: A probabilidade requirida sempre é igual á probabilidade da disxunción de todos os casos favorables (excluíntes ou non excluíntes), dividido pola probabilidade da disxunción de todos os casos posibles (excluíntes ou non excluíntes). (6) Estas regras pódense usar para unha dedución heurística da definición da probabilidade relativa e do teorema xeral da multiplicación. usando o último exemplo que puxemos, designemos «par» por medio de «a» e «outro distinto de seis» por medio de «b». Entón o problema de determinar a probabilidade dun lanzamento par se ignoramos os lanzamentos en que saia seis é claramente o mesmo que o problema de determinar p(a, b), isto é, a probabilidade de a, dado b, ou a probabilidade de atopar un a entre os b. O cálculo pódese continuar deste xeito: en vez de escribir «p(2) + p(4)», podemos escribir, máis en xeral, «p(ab)», isto é, 458 Karl Popper a probabilidade de que saia un número par distinto de seis. E, en vez de escribir «p(1) + (p2) + ... + p(5)» ou, o que vén sendo o mesmo, «1 – p(6)», podemos escribir «p(b)», isto é, a probabilidade de que saia un número distinto de seis. Está claro que estes cálculos son bastante xerais e, asumindo p(b) ≠ 0, damos coa fórmula: (1) p (a, b) = p(ab) / p(b) ou coa fórmula (máis xeral porque ten sentido aínda que p(b) = 0): (2) p(ab) = p(a, b) p(b). Este é o teorema xeral da multiplicación para a probabilidade absoluta do produto ab. Substitituíndo «b» por «bc», obtemos (2):1 p(abc) = p(a, bc) p(bc) e, por tanto, aplicando (2) a p(bc): p(abc) = p(a, bc) p(bc) p(c) ou, asumindo p(c) ≠ 0, p(abc) = p(a, bc) p(b, c) p(c) Isto, en vista de (1), é o mesmo que (3) p(a, bc) = p(a, bc) p(b, c) Este é o teorema xeral da multiplicación para a probabilidade relativa do produto ab. (7) A derivación esbozada aquí pódese formalizar doadamente. A proba formalizada terá que comezar por un sistema 1 Omito as parénteses arredor de «bc» porque aquí o meu interese é heurístico máis que formal e porque o problema da lei de asociación se trata en profundidade nos dous próximos apéndices. 459 a lóxida da descuberta científica axiomático en vez de por unha definición. Isto é unha consecuencia do feito de que o uso heurístico pola nosa parte da definición clásica consiste en introducir posibilidades ponderadas (que é practicamente o mesmo que probabilidades) no que era a definiens clásica. O resultado desta modificación non se pode considerar como unha definición propiamente dita, pois ten que establecer relacións entre varias probabilidades, o cal equivale á construción dun sistema de axiomas. Se queremos formalizar esta dedución (que fai uso implícito das leis de asociación e de adición de probabilidades), entón temos que introducir no sistema axiomático regras para esas operacións. un exemplo é o noso sistema axiomático de probabilidades absolutas, como se describiu no apéndice *ii. Por tanto, se formalizamos a nosa derivación de (3), podemos obter (3) como moito só coa condición «sempre que p(c) ≠ 0», como se verá claramente pola nosa derivación heurística. Mais (3) pode ter significación mesmo sen esta condición, se podemos construír un sistema axiomático en que p(a, b) ten, xeralmente, significado, mesmo se p(b) = 0. Está claro que non podemos, nunha teoría deste tipo, deducir (3) da maneira esbozada aquí; mais, en lugar disto, podemos adoptar (3) como axioma e tomar a presente dedución (véxase tamén a fórmula (1) do vello apéndice ii) como xustificación heurística da introdución deste axioma. Isto faise no sistema descrito no próximo apéndice (apéndice *iv). 460 Karl Popper APÉNDICE *IV A teoría formal da probabilidade á vista do feito de que un enunciado de probabilidade coma «p(a,b) = r» se pode interpretar de moitas maneiras, pareceume desexable construír un sistema puramente «formal», «abstracto» ou «autónomo», no senso de que os seus elementos (representados por «a», «b», ...) se poden interpretar de moitas maneiras, de xeito que non esteamos abocados a ningunha destas interpretacións particulares. O meu primeiro sistema axiomático formal deste tipo propúxeno nunha Nota para Mind en 1938 (incluída aquí no apéndice *ii). Desde aquela construín moitos outros sistemas simplificados1. hai tres principais características que distinguen unha teoría deste tipo doutras. (i) É formal, isto é, non presupón ningunha interpretación particular, aínda que permite, polo menos, todas as interpretacións coñecidas. (ii) É autónoma, ou sexa, acéptase o principio de que as conclusións de probabilidade se poden deducir doutras premisas de probabilidade; noutras palabras, acéptase o principio de que o cálculo de probabilidades é un 1 En Brit. Journ. Phil. of Science 6, 1955, p. 53 e 57 ss. e na primeira nota do Apéndice do meu artigo «Philosophy of Science: A Personal Report», en British Philosophy in MidCentury, editado por C. A. Mace, 1956. Nótese que os sistemas tratados aquí son «formais», abstractos» ou «autónomos» no sentido explicado, mais para unha «formalización» completa, teriamos que inserir o noso sistema nalgún formalismo matemático (a «álxebra elemental» de Tarski sería suficiente). Un pódese preguntar se será posible un procedemento de decisión para un sistema que conteña, por exemplo, a álxebra elemental de Tarski e o noso sistema de fórmulas A1, B e C+. A resposta é negativa, porque ao noso sistema pódenselle engadir fórmulas que indiquen cantos elementos a, b, ... hai en S. Así, temos no noso sistema un teorema: Existe un elemento a de S tal que p(a, ) ≠ p p( , a). A isto podemos agora engadir a fórmula: (0) Para todo elemento a de S, p(a, ) ≠ p p( , a). Mais se se engade esta fórmula ao noso sistema, entón pódese probar que hai exactamente dous elementos en S. Os exemplos mediante os cales probamos, máis adiante, a coherencia dos nosos axiomas mostran, porén, que pode haber un número calquera de elementos en S. Isto mostra que (0), e todas as fórmulas semellantes que determinen o número de elementos de S, non se pode deducir, como tampouco se poden deducir as negacións destas fórmulas. Por tanto, o noso sistema é incompleto. 461 a lóxida da descuberta científica método de transformación de probabilidades noutras probabilidades. (iii) É simétrico, isto é, está construído de tal maneira que sempre que haxa a probabilidade p(b, a) (probabilidade de b dado a) entón tamén haberá sempre a probabilidade p(a, b), mesmo cando a probabilidade absoluta de b, p(b), é igual a cero, isto é, cando p(b) = p(b, ) = 0. A parte dos meus propios intentos neste eido, é estraño constatar que non houbese unha teoría deste tipo ata daquela. Outros autores intentaron construír unha teoría «abstracta» ou «formal», por exemplo Kolmogorov, mais as súas construcións sempre presupoñían unha interpretación máis ou menos concreta. Por exemplo, asumían que nunha ecuación como p(a, b) = r os «elementos» a e b son enunciados ou sistemas de enunciados, ou asumían que a e b eran conxuntos ou sistemas de conxuntos ou, tal vez, que eran propiedades ou clases finitas (grupos) de cousas. Kolmogorov escribe2: «A teoría da probabilidade, como disciplina matemática, pódese e débese elaborar a partir de axiomas exactamente igual que a xeometría e a álxebra» e refírese á «introdución de conceptos básicos de xeometría nas Foundations of Geometry de hilbert» e a sistemas abstractos semellantes. Mais el asume que, en «p(a, b)» (usando os meus símbolos, non os seus), a e b son conxuntos, excluíndo así, entre outras, a interpretación lóxica de que a e b son enunciados (ou «proposicións», se se quere). «O que representan os membros deste conxunto non ten importancia», afirma el acertadamente, mais esta puntualización non é suficiente para determinar o carácter formal da teoría que el pretende conseguir, debido a que nal2 Todas as citas proceden da páxina 1 de A. Kolmogorov, Foundation of the Theory of Probability, 1950 (1a edición elemá 1933). 462 Karl Popper gunhas interpretacións a e b non teñen membros nin nada que se poida facer corresponder cos membros. Todo isto ten consecuencias serias en relación coa construción real do propio sistema axiomático. Quen interprete os elementos a e b como enunciados ou proposicións presupón que o cálculo de composición de enunciados (o cálculo proposicional) é válido para estes elementos. De maneira semellante, Kolmogorov asume que as operacións de adición, multiplicación e complementación de conxuntos valen para os seus elementos, pois interprétaos como conxuntos. Máis concretamente, sempre se presupón (decote só tacitamente), que as leis alxébricas coma a lei de asociación (a) (ab)c = a (bc), a lei de conmutación (b) ab = ba ou a lei de idempotencia (c) a = aa son válidas para os elementos do sistema, isto é, para os argumentos da función p (..., ...). Presupoñendo isto, tácita ou explicitamente, establécense varios axiomas ou postulados para a probabilidade relativa, p(a, b) isto é, para a probabilidade de a, dada a información b; ou, se non, para a probabilidade absoluta, p(a) isto é, para a probabilidade de a (sen información dada ou só información tautolóxica). Mais este procedemento é propenso a ocultar o sorprendente feito, altamente relevante, de que só algúns dos axiomas ou postulados adoptados para a probabilidade relativa, p(a, b), garan463 a lóxida da descuberta científica ten que todas as leis da álxebra de Bool sexan válidas para os elementos. Por exemplo, una forma da lei de asociación é autorizada polas seguintes dúas fórmulas (cf. o apéndice anterior, *iii), (d) p (ab) = p(a, b) p(b) (e) p (ab, c) = p(a, bc) p(b, c) das cales a primeira, (d), tamén dá lugar a unha especie de definición de probabilidade relativa en termos de probabilidade absoluta, (d') Se p(b) = 0 entón p(a, b) = p(ab) / p(b), mentres que a segunda, a fórmula correspondente para probabilidades relativas, é ben coñecida como «lei xeral da multiplicación». Estas dúas fórmulas, (d) e (e), implican, sen ulteriores suposicións (excepto a substituibilidade de probabilidades iguais), a seguinte forma da lei de asociación: (f) p ((ab, c) = p(a(b, c)). Mais este interesante feito3 pasa inadvertido se se introduce (f) mediante a asunción da identidade alxébrica (a) (a lei de asociación) antes de comezar a elaborar o cálculo de probabilidade, pois de (a) (ab)c = a(bc) podemos obter (f) simplemente mediante a substitución na identidade p (x) = p(x). 3 A dedución é como segue: (1) p((ab)c) = p(ab, c)p(c) d (2) p((ab)c) = p(a, bc)p(b,c)p(c) 1, e (3) p(a(bc)) = p(a(b,c)p(bc) d (4) p(a(bc)) = p(a, bc)p(b, c)p(c) 3, d (5) p((ab)c) = p(a(b, c) 2, 4 464 Karl Popper Así que a deducibilidade de (f) a partir de (d) e (e) pasa inadvertida. Noutras palabras, non se ve o feito de que a asunción (a) é completamente redundante se operamos cun sistema axiomático que contén, ou implica, (d) e (e); e que ao asumir (a), ademais de (d) e (e), impedimos podermos descubrir que tipo de relacións están implicadas polos nosos axiomas ou postulados, o cal era un dos obxectivos principais do método axiomático. Como consecuencia, tampouco se advertíu que (d) e (e), malia que impliquen (f), isto é, unha ecuación en termos de probabilidade absoluta, por si mesmos tampouco implican (g) e (h), que son as fórmulas correspondentes en termos de probabilidade relativa: (g) p((ab)c, d) = p(a(bc), d) (h) p(a, (bc)d) = p(a, b(cd)). Para deducir estas fórmulas (véxase o apéndice *v, (41) a (62)), fai falta moito máis que (d) e (e), un feito que ten interese considerable desde un punto de vista axiomático. Puxen este exemplo para mostrar que Kolmogorov non leva a cabo o seu proxecto. O mesmo ocorre con todos os outros sistemas que coñezo. Nos meus propios sistemas de postulados de probabilidade, pódense deducir todos os teoremas da álxebra de Bool. E a álxebra de Bool, á súa vez, pódese interpretar de moitas maneiras: como álxebra de conxuntos, de predicados ou de enunciados (ou proposicións), etc. Outro punto de considerable importancia é o problema do sistema «simétrico». Como xa se dixo, é posible definir a probabilidade relativa en termos de probabilidade absoluta de (d'), como segue: (d') Se p(b) ≠ 0 entón p(a, b) = p(ab) / p(b) O antecedente «Se p(b) ≠ 0» é inevitable aquí porque a división por 0 non é unha operación definida. Como consecuencia, a 465 a lóxida da descuberta científica maioría das fórmulas da probabilidade relativa pódense enunciar, nos sistemas habituais, só en forma condicional, análoga a (d'). Por exemplo, na maioría dos sistemas, (g) non é válido e deberíase substituír pola fórmula condicional moito máis feble (g–): (g–) Se p(d) ≠ 0 entón p((ab)c)d = p(a(bc), d) e unha condición análoga deberíase engadir antes de (h). Isto pasárono por alto algúns autores (por exemplo, Jeffreys e tamén von Wright, quen usa condicións equivalentes a b ≠ 0, mais isto non asegura p(b) ≠ 0, en especial porque o seu sistema contén un «axioma de continuidade»). Os sistemas deles, consecuentemente, son incoherentes tal como foron formulados ata o de agora, aínda que ás veces se poida facer algún remendo. Outros autores decatáronse disto pero, como consecuencia, os seus sistemas son moi febles (polo menos en comparación co meu): pode ocorrer nos sistemas estes que p(a, b) = r sexa unha fórmula que teña sentido, mentres que, ao mesmo tempo e para os mesmos elementos p(b, a) = r non teña sentido, isto é, que non estea definida propiamente ou que nin sequera sexa definible porque p(a) = 0. Mais un sistema deste tipo non só é feble, senón que tamén é inadecuado para moitos obxectivos importantes. Por exemplo, non é aplicable propiamente a enunciados cunha probabilidade absoluta de cero, aínda que esta aplicación sexa moi importante: as leis universais, por exemplo, podemos supoñer aquí (cf. apéndices *vii e *viii), teñen probabilidade cero. Se tomamos dúas teorías universais, s e t, poñamos, tal que s é deducible de t, entón poderiamos afirmar que p(s, t) = 1 466 Karl Popper Mais se p(t) = 0, non o podemos facer no sistema habitual de probabilidade. Por razóns semellantes, a expresión p(e, t) onde e é unha evidencia a favor da teoría t, pode ser indefinido, mais esta información é moi importante (en termos de Fischer é a «probabilidade» de t dada a evidencia e; véxase tamén o apéndice *ix). Fainos falta, logo, un cálculo de probabilidade no que poidamos operar con segundos argumentos de probabilidade absoluta cero. É indispensable, por exemplo, para calquera consideración seria da teoría da corroboración ou confirmación. Este é o motivo polo que intentei ao longo de varios anos elaborar un cálculo de probabilidade relativa en que, sempre que p(a, b) = r sexa unha fórmula correcta, isto é, verdadeira ou falsifica, p(b, a) = r é tamén unha fórmula correcta, mesmo se p(a) = 0. A un sistema deste tipo pódeselle chamar «simétrico». O primeiro sistema deste tipo que publiquei é do ano 19554. Este sistema simétrico resultou ser moito máis simple do que eu agardaba, mais daquela eu estaba aínda preocupado polas peculiaridades que tería que mostrar todo sistema deste tipo. refírome a feitos coma estes: para que un sistema simétrico sexa satisfactorio, teñen que ser válidas regras coma as seguintes: p(a, b ) = 1 Se p( , b) ≠ 0 entón p(a, b) = 1 Se p(a, b) ≠ 0 entón p(a, b) = 1 Estas fórmulas ou ben non son válidas nos sistemas habituais, ou ben o seu cumprimento resulta vacuo (a segunda e a 4 No British Journal for the Philosophy of Science, 6, 1955, p 56 ss. 467 a lóxida da descuberta científica terceira), debido a que teñen segundos argumentos con cero probabilidades absolutas. Así que eu daquela eu pensaba que algunhas delas terían que aparecer nos meus axiomas. Pero máis adiante descubrín que o meu sistema de axiomas se podía simplificar e, ao simplificalo, descubrín que todas estas fórmulas inusuais se poderían deducir de fórmulas que teñen aparencia totalmente «normal». O sistema simplificado resultante publiqueino no artigo «Philosophy of Science: A Personal report»5. É o mesmo sistema de seis axiomas que se presenta de maneira máis completa no presente apéndice. O sistema sorprende pola súa simplicidade e carácter intuitivo, tamén pola súa potencia, que sobrepasa amplamente a de calquera dos sistemas habituais e que se debe simplemente ao feito de que omito de todas as fórmulas, excepto unha (axioma C), toda condición do tipo «Se p(b) ≠ 0 entón...» (nos sistemas habituais esas condicións ou ben están xa presentes ou terían que estar, para evitar incoherencias). No presente apéndice o que pretendo é, primeiro, explicar o sistema axiomático, con demostracións de coherencia e independencia, e despois explicar unhas poucas definicións baseadas no sistema, entre elas a do campo de probabilidades no sentido de Borel. Primeiro, o sistema axiomático. Nos postulados aparecen catro conceptos non definidos: (1) S, o universo de discurso ou sistema de elementos admisibles; os elementos de S desígnanse con letras minúsculas en cursiva, «a», «b», «c», ... etc.; (ii) unha función numérica binaria destes elementos, designada por «p(a,b)», etc.; isto é, a probabilidade a dado b; (iii) unha operación binaria dos elementos, simbolizada por «ab», denominada produto (intersección ou conxunción) de a e b; (iv) o complemento do elemento a, representado por « ». 5 En British Philosophy in the Mid-Century, editado por C. A. Mace, 1956, p. 191; agora é o capítulo 1 de Conjectures and Refutations. Os seis axiomas dados alí son B1, C, B2, A3, A2 e A1 do presente apéndice; alí levan a notación B1, B2, B3, C1, D1 e E1, respectivamente. 468 Karl Popper A estes catro conceptos non definidos podemos engadir un quinto (que pode ser considerado, segundo a nosa escolla, como non definido ou como definido): é o concepto de «probabilidade absoluta de a», representado por «p(a)». Cada un dos conceptos non definidos é introducido por un Postulado. Para comprender intuitivamente estes postulados, é recomendable ter en mente que p(a, a) = 1 = p(b, b) para todos os elementos a e b de S, como se pode probar formalmente coa axuda dos postulados. Postulado 1. O número de elementos de S é, como máximo, infinito pero numerable. Postulado 2. Se a e b están en S, entón p(a, b) é un número real, e os seguintes axiomas son válidos: A1 hai elementos c e d en S tales que p(a, b) ≠ p(c, d) (Existencia) A2 Se p(a, c) = p(b, c) para todo c en S, entón p(d, a) = p(d, b) para todo d en S. (Substituibilidade) A3 p(a, a) = p(b, b) (reflexividade) Postulado 3. Se a e b están en S, entón ab está en S; e se, ademais, c está en S (por tanto, tamén bc), entón valen os seguintes axiomas: B1 p(ab, c) ≤ p(a, c) (Monotonía) B2 p(ab, c) = p(a, bc) p(b, c) (Multiplicación) Postulado 4. Se a está en S, entón está en S; e se, ademais, b está en S, entón vale o seguinte axioma: C p(abc) + p( , b) = p(b, b) a menos que p(b, b) = p(c, b) para todo c en S. (Complementación). Isto conclúe o sistema «elemental» (elemental en oposición á súa extensión aos campos de Borel). Podemos engadir aquí, como se indicou, a definición de probabilidade absoluta como un quinto postulado, chamado «Postulado PA» ou, se non, tamén se pode considerar como unha definición explícita, en vez de un postulado. 469 a lóxida da descuberta científica Postulado PA. Se a e b están en S, e se p(b, c) ≥ p(c, b) para todo c en S, entón p(a) = p(a, b). (Definición de Probabilidade Absoluta6) Máis abaixo mostrarase que o sistema de postulados e axiomas presentado aquí é coherente e independente7. Pódense facer as seguintes puntualizacións sobre este sistema de postulados: Os seis axiomas (A1, A2, A3, B1, B2 e B3) úsanse explicitamente nas operacións reais de dedución dos teoremas. As partes restantes (existenciais) dos postulados pódense dar por sentadas, como se fixo no artigo en que publiquei este sistema de axiomas por primeira vez (cf. nota 1, supra.). Ao prezo de introducir unha cuarta variable, «d», nos postulados 3 e 4, estes seis axiomas pódense substituír por un sistema de só catro axiomas, que contén A1, A2 e os dous seguintes: 6 PA baséase no teorema: Se p(b, c) = 1, entón p(a, bc) = p(a, c). 7 Un sistema alternativo sería o seguinte: os postulados son os mesmos que no texto, coma os axiomas A1 e A2, pero os axiomas A3 e B1 son substituídos por A3' p(a, a) = 1 A4' p(a, b) ≥ 0 B1' Se p(ab, c) > p(a, c), entón p(ab, c) > p(b, c) O axioma B2 permanece coma no texto e o axioma C é substituído por C' Se p(a, b) ≠ 1, entón p(c, b) + p( , b) = 1 Este sistema seméllase a algúns dos sistemas habituais (excepto na omisión de antecedentes nos axiomas diferentes de C' e a forma do antecedente de C'); é destacable que para os elementos a, b, ..., dá (igual que o sistema do texto principal) os teoremas da álxebra de Bool que normalmente se asumen por separado. Con todo, é máis forte do necesario, non só porque introduce os números 1 e 0 (ocultando así o feito de que estes non necesitan ser mencionados nos axiomas), senón tamén porque A3, B1 e C dedúcense inmediatamente de A3', a4' e C', mentres que para as deducións opostas todos os axiomas do sistema dados no texto (excepto A2) son imprescindibles (sobre estas deducións, véxase o apéndice *v). No sistema de axiomas descrito aquí, e tamén no sistema dado no texto principal, a conxunción de axiomas A4' e B1' é substituíble por B1 e viceversa. As miñas probas de independencia (que se dan máis abaixo) son aplicables ao sistema descrito aquí. A dedución de B1 a partir de A4' e B1', en presenza dos axiomas A3 ou A3', C ou C', e B2, é como segue: (1) 0 ≤ p(a, b) ≤ p(a,a) A4'; C ou C'; A3 ou A3' (2) p(a, a) ≥ p(aa)a, a) = p(aa,aa)p(a, a) = p(a, a)2 1, A3'; B2; A3 ou A3' (s) 0 ≤ p(a, b) ≤ p(a, a) ≤ 1 1, 2 (4) p(ab, c) ≤ p(a, c) B2, 3 Agora aplicamos B1' (5) p(ab, c) ≤ p(a, c) 4.B1' Para a dedución de A4' e B1' a partir de B1, véxase o apéndice *v. 470 Karl Popper B+ Se p(a, bc)p(b, c) ≠ p(d, c) sempre que p(a, c) ≥ p(d, c), entón p(ab, c) ≠ p(d, c) C+ Se p(a, b) + p( , b) ≠ p(c, c) entón p(c, c) = p(d, b) Neste sistema, B+ é equivalente á conxunción de B1 e B2 e, de igual xeito, C+ á de A3 e C.8 O sistema resultante de catro axiomas é moi breve e comparte moitas das vantaxes do sistema que é algo máis longo: o produto e o complemento ocorren por separado, de xeito que todos os axiomas, excepto os que levan a letra «B», están libres do produto, e o complemento ocorre só unha vez. Mais, persoalmente, eu prefiro o sistema de seis axiomas, aínda sendo máis longo9. A continuación fago algunhas puntualizacións sobre os varios postulados e axiomas do sistema. Do Postulado 1 (que só pertence á teoría elemental) pódese prescindir. Isto demóstrase polo feito de que, para probar a súa independencia, podemos construír un sistema S que non sexa numerable. (Todos os outros postulados cúmprense se interpretamos S como conxunto de todas as sumas finitas de 8 C+ dedúcese inmediatamente de A3 e C. O inverso pódese mostrar deducindo A3 de C+ da seguinte maneira: (1) p(c, b) + p( , b) ≠ p(b,b)  p(b, b) = p(d, b) = p(c, b) = p( , b) C+ (2) p(a, a) ≠ p(b, b)  p(a, a) = p(c, b) + p( , b) ≠ p(b, b) = p(c, b) = p( , b) C+, 1 (3) p(a, a) ≠ p(b, b)  p(a, a) = 2p(b, b) 2 (4) p(b, b) ≠ p(a, a)  p(b, b) = 2p(a, a) = 4p(b, b) = 0 = p(a, a) 3 (5) p(a, a) = p(b, b) 4 C+ tamén se pode substituír, por exemplo, pola fórmula lixeiramente máis robusta Cs p(a, a) ≠ p(b, c)  p(a, c) + p( , c) = p(d, d) B+ só é unha maneira «orgánica» de escribir a fórmula máis simple pero «inorgánica» Bs p(ab, c) = p(a, bc)p(b, c) ≤ p(a, c) 9 Tres razóns polas que prefiro o sistema de seis axiomas ao de catro son estas: (i) os axiomas do sistema máis longo son un pouco menos inusuais e, por tanto, algo máis intuitivos, especialmente na forma mencionada na nota 7 deste apéndice; (ii) introducir unha variable adicional é pagar un prezo demasiado alto para unha redución no número de axiomas; (iii) A «organicidade» de B+ conséguese por medio dunha trampa mecánica e, por tanto, non é de moito valor. 471 a lóxida da descuberta científica subintervalos semiabertos [x, y) do intervalo de unidade [0, 1), onde x e y son números reais, non números racionais; podemos, entón, interpretar p(a) como a lonxitude destes intervalos, e que p(ab) é igual a p(ab)/p(b) sempre que p(b) ≠ 0, e que é igual a 1 sempre que b = 0; ou, se non, como lím. p(ab)/p(b), sempre que exista este límite). A función do Postulado 1 é simplemente a de caracterizar os sistemas elementais: un postulado deste tipo é decote presuposto no tratamento axiomático da álxebra de Bool ou na lóxica de enunciados ou proposicións; e a nós gustaríanos ser capaces de mostrar que, na teoría elemental, S é unha álxebra de Bool (numerable). (Outro exemplo ofrécese no apéndice *vi, punto 15). No Postulado 2, fai falta A1 para determinar que non todas as probabilidades son iguais (poñamos, igual a 0 ou igual a 1). A función de A2 é permitirnos probar «p(x, a) = p(x, b)» para todos os elementos a e b cuxas probabilidades, dada unha condición c calquera, sexan iguais. Isto pódese facer sen A2, pero só baixo a asunción p(a) ≠ 0 ≠ p(b). Así, A2 vainos permitir ampliar a equivalencia probabilística de a e b ao segundo argumento mesmo nos casos en que a e b teñan probabilidade absoluta cero. A2 pódese substituír pola seguinte fórmula, que é máis forte, A2+ Se p(a, a) = p(b, c) = p(c, b), entón p(a, b) = p(a, c); ou por unha das dúas seguintes (das cales B3é a máis feble): B3 Se p(ab, c) = p(ba, c) entón p(c, ab) = p(c, ba). B3 – Se p(ab, ac) = p(ab, c), entón p(ba, ca) = p(ba, c). Obviamente, tamén se pode substituír pola fórmula (que é máis simple, pero moito máis forte): B3+ p(a, bc) = p(a, cb) Mais, como B3+ é máis forte do necesario (de feito, p(a, (bc) (cb)) = p(a, (cb)(bc)), aínda que é máis feble, podería chegar), 472 Karl Popper resulta un pouco enganoso: a súa adopción ocultaría o feito de que só coa axuda dos outros axiomas, pódese probar a lei da conmutación para o primeiro argumento. A2+ é preferible ás outras fórmulas mencionadas aquí na medida en que evita (igual que a moito máis feble A2) usar o produto de a e b. Así e todo, podemos facer uso dos feitos mencionados aquí para reducir o número de axiomas a tres, a saber: A1, C+ e o seguinte axioma B, que combina B3+ con B+: B Se p(ab, c) ≠ p(a, d)p(b, c) sempre que p(a, c) ≥ p(a, d)p(b, c) e p(a, d) = p(a, bc), entón p(a, cb) ≠ p(a, d). A parte de que é máis forte do que talvez a un lle gustaría que fose, este sistema de só tres axiomas ten todas as vantaxes do sistema de catro axiomas A1, A2, B+ e C+. A3 fai falta para probar p(a, a) = 1, para todo elemento a de S, como xa se indicou. Mais pódese omitir se facemos C máis forte: como se pode ver polo axioma C+, A3 vólvese redundante se substituímos en C as dúas ocorrencias de «p(b, b)» por «p(d, d)» (ou só a segunda ocorrencia). O postulado 3 pide a existencia dun produto (ou intersección) de calquera elemento a e b en S. Caracteriza exhaustivamente todas as propiedades do produto (coma a idempotencia, a conmutación e a asociación) mediante dous axiomas simples, dos cales o primeiro é intuitivamente obvio e o segundo xa se comentou no apéndice *iii. O axioma B1 é, na miña opinión, o que é intuitivamente máis obvio dos catro. É preferible a A4' e B1' (cf. nota 7, supra.), malia que o poidan substituír xuntos. A4' pódese confundir cunha convención, pero non B1; e B1' non caracteriza, como si o fai B1, un aspecto métrico intuitivo da probabilidade, senón un produto ou conxunción ab. Como se mostra pola fórmula B exposta máis arriba, o axioma B2 pódese combinar con B1 e A2+; hai outras combinacións posibles, entre elas algunhas en que o produto só aparece 473 a lóxida da descuberta científica unha vez. Son moi complicadas, mais teñen a vantaxe de que se lles pode dar unha forma análoga á dunha definición. unha tal forma definicional pódese obter do seguinte axioma BD (que, coma B, pode substituír a A2, B1 e B2) inserindo o símbolo «(a)» dúas veces, unha ao comezo e unha segunda vez antes de «(Eb)» e mais substituíndo a primeira frecha (condicional) por unha segunda frecha (bicondicional). uso aquí as abreviacións que se explican ao comezo do apéndice *v.*1 BD p(xy, a) = p(z, a)  (Eb) (c) (d) (Ee) (Eƒ) (Eg) (p(x, a) ≥ p(z, a) = p(x, b) p(y,a) & p(a, c) ≥ p(b, c) ≥ p(y, c) & (p(a, e) ≥ p(c, e) ≤ p(y, e)  p(c, d) ≤ p(b, d) & (p(a, ƒ) = p(y, ƒ)  p(x, a) = p(x, b) = p(x, y)) & p(x, g) ≥ p(c, g) ≤ p(y, g)  p(c, a) ≤ p(z, a))). O postulado 4 pide a existencia dun complemento, , para todo a de S e caracteriza este complemento mediante o que semella (unha forma condicional feble de) unha fórmula obvia, «p(a, c) + p( , c) = 1, tendo en conta que 1= p(a, a). Cómpre a condición que precede esta fórmula porque, en caso de que c sexa, digamos a (o «elemento baleiro»: a= 0), obtemos p(a, c) = 1 = p( , c) de tal maneira que, neste caso límite, falla a fórmula aparentemente «obvia». Este postulado, ou o axioma C, ten o carácter dunha definición de p(, b), en termos de p(a, b) e p(a, a), como se pode observar doadamente se escribimos C como segue (nótese que (ii) se deduce de (i)): (i) p( , b) = p(a, a) – p(a, b), sempre que haxa un c tal que p(c, b) ≠ p(a, a) (ii) p( , b) = p(a, a), sempre que non haxa tal c. A fórmula CD análoga á versión corrixida de BD atoparase nunha addenda na p. 367. *1 Unha versión mellorada e abreviada de BD atópase na p. 367. 474 Karl Popper O sistema formado por A1, BD e CD é, creo, lixeiramente preferible a A1, B e C+, a pesar da complexidade de BD. O postulado PA, en última instancia, pódese substituír pola simple definición (.) p (a) = p(a, ) que, con todo, usa a complementación e o produto e, por tanto, presupón os Postulados 3 e 4. A fórmula (.) será deducida no apéndice *v como fórmula 75. Pódese probar que o noso sistema axiomático é coherente: podemos construír sistemas de elementos S (cun número infinito de elementos diferentes: para un S finito, a proba é trivial) e unha función p(a, b) tal que se demostra que se cumpren manifestamente todos os axiomas. Tamén se pode probar que o noso sistema de axiomas é independente. Debido á febleza dos axiomas, estas probas son bastante doadas. Unha primeira proba trivial de coherencia para un S finito obtense supoñendo que S = {1, 0}, isto é, que S está formado por dous elementos, 1 e 0; o produto, ou encontro, e o complemento considéranse iguais ao produto e ao complemento aritméticos (con respecto a 1). Definimos p(0, 1) = 0, e en todos os outros casos poñemos p(a, b) = 1. Cúmprense, logo, todos os axiomas. Antes de pasar á interpretación infinita numerable, daranse máis dúas interpretacións finitas de S. Ambas as dúas cumpren o noso sistema axiomático, e tamén a seguinte aseveración existencial (E): (E) hai elementos a, b e c de S tales que p(a, b) = 1 e p(a, bc) = 0 unha aseveración semellante sería (E') hai un elemento a en S tal que p(a) = p(a, ) = p( , a) = 0 ≠ p(a, a) =1. Esta aseveración non se cumpre polo noso primeiro principio, nin pode ser satisfeita en ningún sistema de probabilidade que eu coñeza (excepto, obviamente, nalgúns dos meus propios sistemas). 475 a lóxida da descuberta científica O primeiro exemplo que cumpre o noso sistema e (E) está formado por catro elementos: S = {0, 1, 2, 3}. Aquí ab defínese polo máis baixo dos dous números a e b, excepto que 1.2 = 2.1 = 0. Definimos = 3 a, e p(a) = p(a, 3) = 0 sempre que a = 0 ou 1, e p(a) = p(a, 3) = 1 sempre que a = 2 ou 3; p(a, 0) = 1; p(a, 1) a menos que a = 1 ou a = 3, en cuxo caso p(a, 1) = 1. No resto dos casos p(a, b) = p(ab)/p(b). Intuitivamente, o elemento 1 pódese identificar cunha lei universal de cero probabilidade absoluta, e 2 coa súa negación existencial. Para satisfacer (E), tomamos a = 2, b = 3 e c = 1. O exemplo que acabamos de describir pódese representar por medio das seguintes dúas «matrices» (este método foi introducido por primeira vez, paréceme, por huntington en 1904): ab 0 1 2 3 p(a, b) 0 1 2 3 0 0 0 0 0 3 0 1 0 0 0 1 0 1 0 1 2 1 1 1 0 0 2 0 0 2 2 1 2 1 0 1 1 3 0 1 2 3 0 3 1 1 1 1 O segundo exemplo é unha xeneralización do primeiro, mostrando que a idea que subxace ao primeiro exemplo se pode ampliar a todos os elementos que excedan un número calquera escollido, sempre que estes elementos formen unha álxebra de Bool, o cal significa que o número de elementos ten que ser igual a 2n. Aquí n pódese considerar o número das zonas ou clases excluíntes máis pequenas en que está dividido un universo de discurso. Podemos facer correlacións entre cada unha destas clases e algunha fracción positiva, 0 ≤ r ≤ 1, como a súa probabilidade absoluta, asegurándose de que a súa suma sexa igual a 1. Facemos correlacións entre calquera das sumas booleanas coas sumas aritméticas das súas probabilidades, e tamén con calquera complemento booleano, que é o complemento arit476 Karl Popper mético con respecto a 1. Podemos asignar unha ou varias das áreas ou clases de probabilidade 0 máis pequenas (non cero) e excluíntes. Se b é unha tal área ou clase, poñemos p(a, b) = 0 en caso de que ab = 0; se non, p(a, b) = 1. Tamén poñemos p(a, 0) = 1; en todos os outros casos, poñemos p(a, b) = p(ab)/p(b). Para mostrar que o noso sistema é coherente mesmo baixo a asunción de que S é infinito, pero numerable, pódese escoller a seguinte interpretación. (Ten interese pola súa conexión coa interpretación frecuencial). Supoñamos que S é a clase das fraccións racionais en representación diádica, tal que, se a é un elemento de S, podemos escribir a como unha sucesión, a = a1, a2..., onde a1 é ou 0 ou 1. Interpretamos ab como a sucesión ab = a1b1, a2b2, ... de xeito que (ab)1 = a1b1 e como a sucesión a = 1 a1, 1 a2, ..., de maneira que = 1 a1. Para definir p(a, b), introducimos unha expresión auxiliar, An, definida como segue: An ai n de maneira que temos (AB)n = ai n Ademais, definimos unha función auxiliar, q: q(an, bn) = 1 sempre que Bn = 0 q(an, bn) = (AB)n/Bn, sempre que Bn ≠ 0 Agora podemos definir, p(a, b) = lim q(an, bn). Este límite existe para todos os elementos a e b de S e pódese mostrar doadamente que cumpre todos os nosos axiomas (véxase tamén o apéndice *vi, puntos 8 a 14). Con isto rematamos as probas de coherencia dos nosos sistemas de axiomas. 477 a lóxida da descuberta científica Para mostrar a independencia de A1 podemos coller p(a, b) = 0 para todo a e b de S. Entón cúmprense todos os axiomas excepto A1. Para mostrar a independencia de A2 supoñemos10 que S está formado por tres elementos, S = {0, 1, 2}. Podemos mostrar doadamente que o produto ab ten que ser non conmutativo; pódese definir como segue: 1.2 = 2; e en todos os outros casos, incluíndo 2.1, ab é igual a min(a, b), isto é, ao máis pequeno dos seus compoñentes a e b. Tamén definimos = 1 se e só se a = 0; se non, = 0; e definimos p(0, 2); en todos os outros casos, p(a, b) = 1. Agora xa é doado mostrar que para todo b, p(1, b) = p(2, b) mentres p(0, 1) = 1 e p(0, 2) = 0. logo A2 non se cumpre, pero todos os demais axiomas si. Podemos ilustrar esta interpretación representando a matriz non conmutativa como segue: ab 0 1 2 3 p(0, 2) = 0; en todos os outros casos p(a, b) = 1 0 0 0 0 0 1 1 0 1 2 1 0 2 0 1 2 3 0 Para mostrar que A3 é independente, coma na primeira proba trivial da coherencia, tomamos S = {0, 1}, e os produtos e complementos iguais aos aritméticos. Definimos p(1, 1) = 1, e en todos os outros casos p(a, b) = 0. Despois p(1, 1) ≠ p (0, 0), de maneira que A3 non se cumpre. Os outros axiomas cúmprense. 10 En vista do que se dixo con anterioridade sobre A2 está claro que o problema de probar a súa independencia equivale ao de construír un exemplo (unha matriz) que sexa non conmutativo, combinado cunha regra non numérica sobre os valores p que asegura que a lei de conmutación só se infrinxe no segundo argumento. A proba de independencia de A2 descrita aquí, deseñada para cumprir estas condicións, foi descuberta ao mesmo tempo polo Dr. J. Agassi e por min propio. (O exemplo cumpre o Postulado PA só se en PA se coloca unha liña por riba da letra «b»; mais cumpre (.) na p. 343). *Cf. Addenda en p. 367 ss. 478 Karl Popper Para mostrar que B1 é independente, collemos S = {– 1, 0, + 1}; facemos que ab sexa o produto aritmético de a e b; que = – a; e p(a, b) = a. (1 - |b|). Despois todos os axiomas cúmprense excepto B1, que falla porque a = – 1, b ≠ + 1, e c = 0. As matrices pódense representar: ab –1 1 0 +1 p(a, b) –1 0 +1 –1 +1 0 0 –1 +1 –1 0 –1 0 0 0 1 0 0 0 0 0 0 0 +1 –1 1 0 +1 –1 +1 0 +1 1 Este exemplo tamén proba a independencia de A4' (cf. nota 7, supra.). un segundo exemplo que proba a independencia de B1, e tamén de B1', baséase na seguinte matriz non conmutativa: ab 0 1 2 p(0, 2) = 0; en todos os outros casos p(a, b) = 1 0 0 1 0 2t 1 0 1 1 0 2 0 1 2 0 B1 non se cumpre porque a = 0, b = 1 e c = 2. Para mostrar que B2 é independente, collemos o mesmo S que en A3 e definimos p(0, 1) = 0; en todos os outros casos, p(a, b) = 2. B2 non se cumpre porque 2 = p(1.1, 1) ≠ p(1, 1.1)p(1, 1) = 4, pero todos os outros axiomas cúmprense. (Outro exemplo que mostra a independencia de B2 pódese obter se consideramos que B2 fai falta para probar «p(ba, c)  p(a, c)», isto é, o dual de B1. Isto indica que podemos usar o segundo exemplo para B1, cambiando só o valor de 1.0 de 0 a 1, e o de 0.1 de 1 a 0. Todo o demais pódese deixar como está. B2 non se cumpre porque a = 1, b = 0 e c = 2.) 479 a lóxida da descuberta científica Por último, para mostrar que C é independente, collemos de novo o mesmo S, pero asumimos que = a. Se agora collemos p(0, 1) = 0 e en todos os outros casos p(a, b) = 1, entón C non se cumpre, porque p( , 1) ≠ p(1, 1). Os outros axiomas cúmprense. Isto conclúe as probas da independencia dos axiomas operativos. En canto ás partes non operativas dos postulados, unha proba da independencia do postulado 1 xa se deu antes (cando expliquei este postulado). O postulado 2 require (na súa parte non operativa) que sempre que a e b estean en S, p(a, b) sexa un número real. Para demostrar a independencia deste requirimento (que podemos abreviar como «postulado 2») consideramos primeiro unha interpretación booleana non numérica de S. Para isto, interpretamos S como unha álxebra booleana non numérica e numerable, como máximo (como un conxunto de enunciados en que «a», «b», etc. sexan nomes de enunciados variables). Estipulamos que « » designe, se x é un número, o mesmo que «–x»; e se x é un elemento booleano (digamos, un enunciado) entón « » vai designar o complemento booleano (negación) de x. De maneira semellante, estipulamos que «xy»; «x + y»; «x = y»; «x ≠ y» e «x ≤ y» teñan o seu significado aritmético habitual se x e y son números, e que teñan o seu coñecido sentido booleano sempre que x e y sexan elementos booleanos (se x e y son enunciados, «x ≤ y» habería que o interpretar no sentido de «x implica y»). Para demostrar a independencia do postulado 2, agora simplemente engadimos unha estipulación máis: interpretamos «p(a, b)» como sinónimo de «a+b» no sentido booleano. O postulado 2 non se cumpre, mentres que A1, A2, A3 e todos os outros axiomas e postulados se converten nos coñecidos teoremas da álxebra booleana11. 11 Unha lixeira variación desta interpretación transforma todos os axiomas en tautoloxías do cálculo proposicional, satisfacendo todos os postulados excepto o postulado 2. 480 Karl Popper As demostracións da independencia das partes existenciais dos postulados 3 e 4 son case triviais. Primeiro introducimos un sistema auxiliar, S'= {0, 1, 2, 3}, e definimos produto, complemento e probabilidade absoluta pola matriz: ab 0 1 2 3 p(a) 0 0 0 0 0 3 0 1 0 1 0 1 2 0 2 0 0 2 2 1 1 3 0 1 2 3 0 1 A probabilidade relativa defínese por p(a, b) = 0 sempre que p(a) ≠ 1 = p(b); p(a, b) = 1 en todos os outros casos. Este sistema S' cumpre todos os nosos axiomas e postulados. Para mostrar a independencia da parte existencial do postulado 3, agora consideramos que S se limita aos elementos 1 e 2 de S', deixando o demais como estaba. Obviamente, o postulado 3 non se cumpre, porque o produto dos elementos 1 e 2 non está en S; todo o demais segue sendo válido. Igualmente, podemos mostrar a independencia do postulado 4 limitando S aos elementos 0 e 1 de S' (agora podemos escoller 2 e 3, ou calquera combinación formada por tres ou catro elementos de S' excepto a combinación formada por 1, 2 e 3). A proba da independencia do postulado PA é aínda máis trivial: só temos que interpretar S e p(a, b) no sentido da nosa primeira proba de coherencia e coller p(a) = constante (unha constante coma 0, 1/2, 1 ou 2) para obter unha interpretación na que PA non se cumpra. Queda así demostrado que todas e cada unha das aseveracións do noso sistema axiomático son independentes (no que a min se me alcanza, nunca antes se publicaran probas da inde481 a lóxida da descuberta científica pendencia de sistemas axiomáticos de probabilidade. A razón, supoño, é que os sistemas coñecidos, sempre que sexan satisfactorios en todo o demais, non son independentes). A redundancia dos sistemas habituais débese ao feito de que todos eles postulan, implícita ou explicitamente, a validez dalgunha das súas regras da álxebra de Bool para os elementos de S; pero, como demostraremos contra o final do apéndice *v, estas regras son deducibles do noso sistema se definimos a equivalencia booleana, «a = b», pola fórmula (*) a = b se, e só se, p(a, c) = p(b, c) para todo c en S. un pódese preguntar se algún axioma do noso sistema se volve redundante se postulamos que ab é un produto booleano e un complemento booleano, que os dous obedecen as leis da álxebra booleana e que (*) é válido. A resposta é que ningún dos axiomas (excepto B1') se volve redundante. (Só se fósemos postular, ademais, que dous elementos calquera para os que se poida demostrar equivalencia booleana poden ser substituídos mutuamente no segundo argumento da función p, entón si que se volvería redundante un dos nosos axiomas, a saber: o axioma de substituibilidade, A2, que serve para o mesmo, precisamente, que este postulado adicional). Que os nosos axiomas non se volven redundantes pódese observar polo feito de que se pode demostrar a súa independencia (excepto a de A2 e a de B1', claro está) coa axuda de exemplos que cumpren a álxebra Booleana. xa proporcionei tales exemplos para todos excepto B1 e C1, para os cales que se deron exemplos máis simples. un exemplo dunha álxebra Booleana que demostra a independencia de B1 (e A4') e de C é o seguinte (0 e 1 son o cero Booleano e elementos universais, e = 1 – a; o exemplo é, en esencia, igual ao anterior, pero coas probabilidades – 1 e 2 asociadas aos elementos distintos de 0 ou 1): 482 Karl Popper ab –1 0 1 2 B1 (e A4'): p(a) = a; p(a, 0) = 1; en todos os outros casos, p(a, b) = p(ab)/p(b) = ab/b C: p(a, b) = 0 se ab = 0 ≠ b; en todos os outros casos, p(a, b) = 1. –1 –1 0 –1 0 2 0 0 0 0 0 1 1 –1 0 1 2 0 2 0 0 2 2 -1 B1 é infrinxido porque 2 = p(1.2, 1) > p(1, 1) = 1 C é infrinxido porque p( , 1) + p(2, 1) = 2, malia que p(0, 1) ≠ p(1, 1). O feito de que o noso sistema continúe a ser independente aínda que postulemos álxebra booleana e mais (*) pódese expresar dicindo que o noso sistema é «autonomamente independente». Se substituímos o noso axioma B1 por A4' e B1' (véxase a nota 7 deste apéndice), entón o noso sistema deixa de ser, obviamente, autonomamente independente. A independencia autónoma seméllame unha interesante (e desexable) propiedade dos sistemas axiomáticos para o cálculo de probabilidade. Para concluír, gustaríame dar unha definición, no sentido «autónomo», isto é, no sentido probabilístico da nosa teoría, dun «sistema admisible» S e dun campo de Borel de probabilidades S. Este último termo é de Kolmogorov, pero eu vouno usar nun senso lixeiramente máis amplo ca el. Vou aprofundar un pouco sobre a diferenza entre a perspectiva de Kolmogorov sobre o tema e a miña porque me semella que o contraste pode ser iluminador. Primeiro defino, en termos probabilísticos, o que quero dicir ao afirmar que a é un superelemento de b (e máis amplo que, ou igual a, b) ou que b é un subelemento de a (e en termos lóxicos máis forte que, ou igual a, a). A definición é como segue (véxase tamén o final do apéndice *v): a é un superelemento de b, ou b un subelemento de a (en símbolos, a ≥ b), se e só se p(a, x) ≥ p(b, x) para todo x en S. 483 a lóxida da descuberta científica A continuación defino o que quero dicir co elemento produto a dunha sucesión infinita, A = a1, a2, ..., da cal todos os membros an sexan elementos de S. Supoñamos que se ordenan algúns ou talvez todos os elementos de S nunha sucesión infinita A = a1, a2, ..., de maneira que a calquera elemento de S se lle permita repetirse na sucesión. Por exemplo, que S estea formado só por dous elementos, 0 e 1; entón tanto A = 0, 1, 0, 1, .., como B = 0, 0, 0, ..., serán as dúas sucesións infinitas de elementos de S, no sentido que nós lle damos. Pero o caso máis importante é, xaora, o dunha sucesión infinita A tal que todos, ou case todos, os seus membros son elementos diferentes de S que, polo tanto, conterá infinitos elementos. un caso de especial interese é o da sucesión infinita decrecente (mellor dito, non crecente), isto é, unha sucesión A = a1, a2, ..., tal que an ≥ an+1 para todo par constitutivo de membros de A. Agora podemos definir o elemento produto a (booleano, en oposición ao da teoría de conxuntos) dunha sucesión infinita A = a1, a2, ..., como o máis amplo entre os elementos de S que son subelementos de todo elemento an pertencente á sucesión A, dito en símbolos: a = πan se e só se a cumpre as seguintes condicións (i) p(an, x) ≥ p (a, x) para todos os elemento an de A e para todo elemento x de S. (ii) p(a, x) ≥ p(b, x) para todos os elementos x de S e para todo elemento b de S que cumpra a condición p(an, y) para todos os elementos an e para todo elemento y de S. Para mostrar a diferenza entre o noso elemento produto a de A (booleano) e o produto ou encontro de A da teoría de conxuntos, limitaremos a nosa discusión a exemplos S, que cumpran os nosos postulados 2 a 5, cuxos elementos x, y, z, ... sexan conxuntos, tales que xy sexa o seu produto da teoría de conxuntos. 484 Karl Popper O noso principal exemplo, S1, ao que me referirei como «o exemplo do semiintervalo ausente», é o seguinte: S1 é un sistema de determinados subintervalos semiabertos do intervalo universal u = (0, 1]. S1 contén, precisamente, (a) a sucesión decrecente A tal que an = (0, 1 2 + 2 –n], e ademais (b) os produtos, no senso da teoría de conxuntos, de dous elementos calquera e os complementos, da teoría de conxuntos, de calquera dos seus elementos. Así que S1 non contén o «medio intervalo» h = (0, 1 2 ], nin ningún subintervalo non baleiro de h. Como o medio intervalo que falta h = (0, 1 2 ] é o produto de teoría de conxuntos da sucesión A, está claro que S1 non contén o produto de A da teoría de conxuntos. Mais S1 si que contén o «elemento produto» (booleano) de A, tal como se definiu aquí. Isto é porque o intervalo baleiro cumpre trivialmente a condición (i) e, como é o intervalo máis amplo que cumpre (i), tamén cumpre (ii). Está claro, ademais, que se lle engadimos a S1, poñamos, calquera dos intervalos b1 = (0, 1 8 ] ou b2 = (0, 3 16 ], etc., entón o máis grande destes será o elemento produto de A no senso (booleano) da nosa definición, aínda que ningún deles será o produto de A no senso da teoría de conxuntos. Talvez nos poida pasar pola cabeza que, debido á presenza dun elemento baleiro en todo S, todo S contén, igual que S1, un elemento produto (no senso da nosa definición) dun A calquera en S, pois se non contén ningún elemento máis amplo que cumpra (i), sempre valerá o elemento baleiro. Mais que isto non é así demóstrao outro exemplo, S2, que contén, ademais dos elementos de S1, os elementos (xunto cos produtos en termos de teoría de conxuntos de dous elementos calquera, e mais o complemento de teoría de conxuntos dun elemento calquera) da sucesión B = b1, b2, onde bn = (0, (2n – 1)/2n+2]. Observarase doadamente que, aínda que cada bn cumpra a condición (i) para o elemento produto de A, ningún deles cumpre a condi485 a lóxida da descuberta científica ción (ii), de tal maneira que, de feito, non hai ningún elemento máis amplo en S2 que cumpra a condición (i) para o elemento produto de A. Así que S2 non contén nin o produto de A en termos da teoría de conxuntos nin tampouco no noso senso (booleano). Pero S1, e todos os sistemas obtidos engadíndolle a S1 un número finito de novos intervalos (con produtos e complementos), conterá un elemento produto de A no noso senso, pero non no senso da teoría de conxuntos, a menos que lle engadamos a S1 o semiintervalo que falta h = (0, 1 2 ]. lembrando que o baleiro dun elemento a se pode caracterizar no noso sistema por p( , a) ≠ 0, podemos agora definir un «sistema admisible S» e un «campo de Borel de probabilidades S», como segue: (i) un sistema S que cumpre os nosos postulados 2 e 4 denomínase un sistema admisible se e só se S satisfai o noso conxunto de postulados e ademais a seguinte condición definitoria. Sexa bA = a1b, a2b, ... unha sucesión decrecente calquera de elementos de S (dicimos neste caso que A = a1, a2, ... é «decrecente con relación a b»). logo, se o elemento produto ab desta sucesión está en S,12 entón lim p(an, b) = p(a, b) 12 Podería ter engadido «e se p( , ab) ≠ 0, tal que ab estea baleiro»: isto tería aproximado máis aínda a miña formulación á de Kolmogorov. Mais esta condición non é necesaria. Quero deixar constancia aquí de que me animou moito ler o interesantísimo artigo de A. Rényi titulado «On a New Axiomatic Theory of Probability», Acta Mathematica Acad. Scient. Hungaricae 6, 1955, pp. 286-335. Aínda que eu me decatara había anos de que o sistema de Kolmogorov se debía relativizar e aínda que eu xa sinalara en numerosas ocasións as vantaxes matemáticas dun sistema relativizado, foi a lectura do artigo de Rény a que me mostrou o fértil que resultaría esta relativización. Os sistemas relativos que publiquei despois de 1955 son aínda máis xerais que o de Rényi, o cal, coma o de Kolmogorov, está formulado en termos da teoría de conxuntos e é non simétrico. É doado observar que estas xeneralizacións poden dar lugar a simplificacións considerables no seu tratamento matemático. 486 Karl Popper (ii) un sistema admisible S denomínase un campo de probabilidades de Borel se e só se hai en S un elemento produto dunha sucesión decrecente (absoluta ou relativamente) de elementos S. Destas dúas definicións, (i) corresponde ao chamado «axioma de continuidade» de Kolmogorov, mentres que (ii) desempeña no noso sistema un papel análogo á definición de Kolmogorov de campos de Borel de probabilidade. Agora pódese mostrar que sempre que S sexa un campo de Borel de probabilidades no senso de Kolmogorov, tamén o será no senso definido aquí, onde a probabilidade é unha función de medida aditiva computable dos conxuntos que son os elementos de S. As definicións de sistemas admisibles e campos de Borel de probabilidades formúlanse de tal maneira que todos os sistemas S que cumpran os nosos postulados e que teñan só un número finito de elementos diferentes son sistemas admisibles e campos de Borel. Por tanto, as nosas definicións son relevantes só en relación con sistemas S que conteñan un número infinito de elementos diferentes. Tales sistemas infinitos poden cumprir, ou non cumprir, unha ou a outra das nosas condicións definitorias. Noutras palabras, para sistemas infinitos as nosas condicións definitorias son non redundantes e independentes. Esta non redundancia pódese demostrar para (i) do xeito máis sinxelo na forma que se menciona na nota 12, con axuda do exemplo do semiintervalo ausente, S1, dado anteriormente. Só temos que definir que a probabilidade p(x) é igual a l(x), isto é, a lonxitude do intervalo x. A nosa primeira definición, (i), infrínxese porque o lim ) =, mentres que o elemento produto (en S) de A, p(a) = 0. A definición (ii) infrínxese no noso exemplo S2 (que cumpre en van a nosa primeira definición). Mentres que o primeiro destes exemplos determina a independencia ou, máis precisamente, a non redundancia da nosa primeira definición (por infrinxir esta), non determina, na súa presente formulación, a independencia do «axioma de continuidade» de Kolmogorov, que se cumpre claramente co noso exemplo. O semiintervalo ausente, h = 1 2 ], estea ou non en S, é 487 a lóxida da descuberta científica o único produto de A en termos da teoría de conxuntos, tal que a = h é verdadeiro para o teórico dos conxuntos, estea a en S ou non. E con a = h, temos lim p(an) = p (a). Así cúmprese o axioma de Kolmogorov (malia que omitamos a condición p( , a) ≠ 0; cf. nota 12). Débese mencionar, en relación con isto, que Kolmogorov non ofrece no seu libro unha demostración de independencia para o seu «axioma de continuidade», aínda que el afirme que este é independente. Mais é posible recontextualizar a nosa demostración de independencia de maneira que resulte aplicable para o axioma de Kolmogorov e a súa perspectiva da teoría de conxuntos. Isto pódese facer escollendo un sistema de intervalos S3, en lugar do noso S1, que sexa exactamente igual a S1 pero baseado nunha sucesión C = c1, c2, ..., definida por cn = (0, 2–n], en lugar de basearse na sucesión A = a1, a2, ..., onde an = (0, 1⁄2 + 2–n]. Agora podemos mostrar a independencia do axioma de Kolmogorov definindo as probabilidades dos elementos da sucesión A como segue: p(cn) = l(cn) + 1 2 = p(an) Aquí l(cn) é a lonxitude do intervalo cn. Esta definición é altamente contraintuitiva pois, por exemplo, asígnalles a ambos intervalos (0, 1 2 ] e (0, 1] a probabilidade un e, por tanto, ao intervalo ( 1 2 , 1] a probabilidade 0; e o feito de que infrinxa o axioma de Kolmogorov (establecendo así a súa independencia) está intimamente vinculado co seu carácter contraintuitivo. Infrinxe o axioma porque lim p(cn) = 12 , malia que p(c) = 0. Debido ao seu carácter contraintuitivo, a coherencia deste exemplo dista moito de ser evidente, polo que xorde a necesidade de demostrar a súa coherencia para establecer a validez da proba da independencia do axioma de Kolmogorov. Mais esta proba de coherencia é doada, á vista da nosa anterior proba de independencia: a proba da independencia da nosa primeira definición servíndonos do exemplo S1. Isto é debido a que as probabilidades p(an) e p(cn) dos dous exemplos 488 Karl Popper S1 e S3 coinciden. E como se poden facer correlacións entre as dúas sucesións, podemos establecer correspondencias entre os elementos de S1 e os de S3, a coherencia de S1 proba a de S3. Está claro que calquera exemplo que demostre a independencia do axioma de Kolmogorov ha de ser igualmente contraintuitivo, polo que para demostrar a súa coherencia haberá que usar algún método semellante ao noso. Noutras palabras, a demostración da independencia do axioma de Kolmogorov terá que usar un exemplo que estea baseado, en esencia, nunha definición (booleana) de produto coma a nosa, en lugar doutra definición baseada na teoría de conxuntos. Aínda que o campo de Borel de probabilidades no senso de Kolmogorov tamén o é no sentido que nós lle damos, o oposto non é certo. Pois podemos construír un sistema S4 que sexa exactamente igual a S1, onde h = (a 1 2 ] continúa a faltar e contén no seu lugar o intervalo aberto g = (a, 1 2 ) onde p(g) = 1 2 . Definimos, dalgún xeito arbitrariamente, = u – g =( 1 2 , 1], e u – (g + ) = u e (máis que o punto 1⁄2). É doado ver que S4 é un campo de Borel no senso que nós lle damos, onde g é o elemento produto de A. Mais S4 non é un campo de Borel no senso de Kolmogorov porque non contén o produto de A en termos da teoría de conxuntos: a nosa definición permite unha interpretación por un sistema de conxuntos que non sexa o sistema de conxuntos de Borel, na cal o produto e o complemento non son exactamente o produto e o complemento no senso da teoría de conxuntos. A nosa definición é, logo, máis ampla que a de Kolmogorov. As demostracións que acabamos de ofrecer da independencia de (i) e (ii) botan luz, paréceme, sobre as funcións realizadas por (i) e (ii). A función de (i) é excluír sistemas coma S1, para asegurarse de que haxa adecuación en termos de teoría da medida do produto (ou límite) dunha sucesión decrecente: o límite das medidas ten que ser igual á medida do límite. A función de (ii) é excluír sistemas como S2, con sucesións crecentes sen límites. É para asegurarse de que toda sucesión decrecente teña un produto en S e que toda sucesión crecente teña unha suma. 489 a lóxida da descuberta científica APÉNDICE *V As deducións na teoría formal da probabilidade Neste apéndice propoño ofrecer as deducións máis importantes do sistema de postulados que se explicou no apéndice *iv. Vou mostrar como se obteñen as leis dos limites superior e inferior, de idempotencia, conmutación, asociación e distribución, xunto cunha definición máis simple de probabilidade absoluta. un tratamento máis completo ofrecerase por separado noutra publicación. usarei as seguintes abreviacións: para «se..., entón...», usarei unha frecha «»; unha frecha dobre «» para «se e só se»; «&» para «e»; «(Ea) » para «hai un a en S tal que...»; e «(a)» para «para todo a en S...». Primeiro volverei a enunciar o postulado 2 e os seis axiomas operativos que serán citados nas demostracións (os outros postulados serán usados implicitamente; mesmo o postulado 2 só se usará unha vez, na demostración de 5). Para os axiomas A3 e C, débese ter en mente que axiña vou demostrar (véxase a fórmula 25) que p(a, a) = 1. Postulado 2. Se a e b están en S, entón p(a, b) é un número real. A1 (Ec)(Ed) p(a, b) ≠ p(c, d), A2 ((c)(p(a, c) = p(b, c))  (d, a) = p(d, b), A3 p(a, a) = p(b, b) B1 p(ab, c) ≤ p(a, c), B2 p(ab, c) = p(a, bc)p(bc). C p(a, a) ≠ p(b, a)  p(a, a) = p(c, a) + (p( , a) Paso agora ás deducións: (1) p(a, a) = p(b, b) = k Abreviación baseada en A3 (2) p((aa)a, a) ≤ p (aa, a) ≤ p(a, a) = k B1, 1 (3) p((aa)a, a) = p (aa,aa)p(a, a)k2 B2, 1 (4) k2 ≤ k 2, 3 490 Karl Popper (5) 0 ≤ k ≤ 1 4 (e Postulado 2) (6) k ≠ p(a, b)  k = k + p( , b) C, 1 (7) k ≠ p(a, b)  p( , b) = 0 6 (8) p(a , b) = p(a, b)p( , b) B2 (9) k ≠ p(a,b)  0 = p(a ,b) ≤ p(a, b) 7, 8, B1 (10) k ≠ p(a, b)  0 ≤ p(a, b) 9 (11) 0 > p(a, b)  k = p(a, b) 10 (12) k = p(a, b)  0 ≤ p(a, b) 5 (13) 0 > p(a, b)  0 ≤ p(a, b) 11, 12 (14) 0 ≤ p(a, b) 13 (ou 10, 12) (15) 0 ≤ p( , b) 14 (16) k ≠ p(a, b)  k ≥ p(a, b) C, 1, 15 (17) p(a, b) ≤ k ≤ 1 16, 5 (18) 0 ≤ p(a, b) ≤ k ≤ 1 14, 17 (19) k = p(aa, aa) ≤ p(a, aa) ≤ k 1, B1, 17 (20) k = p(a(aa), a(aa)) ≤ p(a, a(aa)) ≤ k 1, B1, 17 (21) k = p(aa, aa) = p(a, a(aa))p(a, aa)=k2 1, B2, 19, 20 (22) k = k2 21 (23) (Ea) (Eb) p(a, b) ≠ 0  k = 1 18, 22 (24) (Ea) (Eb) p(a, b) ≠ 0 A1 (25) p(a, a) = k = 1 1, 23, 24 (26) (Eb) (Ea) p(b, a) ≠ k A1, 1 (27) (Ea) p( ,a) = 0 7, 26 Así xa establecemos todas as leis dos límites superior e inferior: (14) e (17), resumidas en (18), mostran que as probabilidades están limitadas por 0 e 1. (25) e (27) demostran que estes límites se atinxen realmente. Agora pasamos á dedución das numerosas leis tomadas normalmente da álxebra Booleana ou do cálculo proposicional. Primeiro deducimos a lei da idempotencia. (28) 1 = p(ab, ab) ≤ p(a, ab) = 1 25, B1, 17 (29) p(aa, b) = p(a, ab) p(a, b) B2 (30) p(aa, b) = p(a, b) 28, 29 491 a lóxida da descuberta científica Esta é a lei de idempotencia, ás veces tamén chamada «lei da tautoloxía». Agora pasamos á dedución da lei da conmutación. (31) p(a, bc) ≤ 1 17 (32) p(ab, c) ≤ p(b, c) B2, 31, 14 Esta é a segunda lei da monotonía, análoga a B1. (33) p(a(bc), a(bc)) = 1 25 (34) p(bc, a(bc)) = 1 33, 32, 17 (35) p(b, a(bc)) = 1 34, B1, 17 (36) p(ba, bc) = p(a, bc) 35, B2 (37) p((ba)b, c) = p(ab, c) 36, B2 (38) p(ba, c) ≥ p(ab, c) 37, B1 (39) p(ab, c) ≥ p(ba, c) 38 (subst.) (40) p(ab, c) = p(ba, c) 38, 39 Esta é a lei de conmutación para o primeiro argumento (para ampliala ao segundo argumento, teriamos que usar A2). Deduciuse de (25) simplemente usando as dúas leis de monotonía (B1 e 32) e B2. Agora pasamos á dedución da lei de asociación. (41) p(ab, d((ab)c)) = 1 35 (subst.) (42) p(a, d((ab)c)) = 1 = p(b, d((ab)c)) 41, B1, 17, 32 (43) p(a, (bc)((ab)c)) = 1 42 (subst.) (44) p(a(bc), (ab)c) = p(bc, (ab)c) 43, B2 (45) p(bc, (ab)c) = p(b, c((ab)c))p(c, (ab)c) B2 (46) p(b, c((ab)c)) = 1 42 (subst.) (47) p(c, (ab)c) = 1 25, 32, 17 (48) p(a(bc), (ab)c) = 1 44 a 47 Esta é unha forma preliminar da lei de asociación. (62) dedúcese dela por A2+ (e B2), mais evito no posible usar A2 e A2+. (49) p(a(b(cd)), d) = p(cd, b(ad))p(b, ad)p(a, d) 40, B2 (50) p(a(bc), d) = p(c, b(ad))p(b, ad)p(a, d) 40, B2 (51) p(a(bc), d) ≥ p(a(b(cd)), d) 49, 50, B1 Esta é unha especie de xeneralización feble da primeira lei de monotonía, B1. 492 Karl Popper (52) p(a(b(cd)), (ab)(cd)) = 1 48 (subst.) (53) p((a(b(cd))(ab), cd) = p(ab, cd) 52, B2 (54) p(a(b(cd)), cd) ≥ p(ab, cd) 53, B1 (55) p((a(b(cd)))c, d) ≥ p((ab)c, d) 54, B2 (56) p(a(b(cd)), d) ≥ p((ab)c, d) 55, B1 (57) p(a(bc), d) ≥ p((ab)c, d) 51, 56 Esta é a metade da lei de asociación. (58) p((bc)a, d) ≥ p((ab)c, d) 57, 40 (59) p((ab)c, d) ≥ p(b(ca), d) 58 (subst.), 40 (60) p((bc)a, d) ≥ p(b(ca), d) 58, 59 (61) p((ab)c, d) ≥ p(a(bc), d) 60 (subst.) Esta é a segunda parte da lei de asociación. (62) p((ab)c, d) = p(a(bc), d) 57, 61 Esta é a forma completa da lei de asociación para o primeiro argumento (véxase tamén a fórmula (g) ao comezo do apéndice *iv). A lei do segundo argumento pódese obter aplicando A2. (Aplicando B2 dúas veces a cada lado de (62) non conduce máis que a unha forma condicional con «p(bc, d) ≠ 0 » como antecedente.) Agora pasamos á xeneralización do axioma de complementación , C. De agora en diante serei algo máis conciso nas deducións. (63) p( , b) ≠ 0  (c)p(c, b) = 1 7, 25 (64) p(a, b) + p( , b) = 1 + p( , b) C, 25, 63 Esa é a forma non condicional do principio de complementación, C, que agora vou xeneralizar. En vista de que (64) é non condicional e de que «a» non ocorre no membro dereito da ecuación, podemos substituír «a» por «c» e afirmar (65) p(a, b) + p(a, b) = p(c, b) + p( , b) 64 (66) p(a, bd) + p( , bd) = p(c, bd) + p( , bd) 65 Multiplicando con p(b, d) obtemos: (67) p(ab, d) + p ( b, d) = p(cb, d) + p( b, d) B2, 66 Isto é unha xeneralización de (65). Por substitución, obtemos: (68) p(ab, c) + p( b,c) = p(cb, c) + p( b, c) 67 493 a lóxida da descuberta científica En vista de que (69) p( b, c) = p( , c), 7, B1, 25, 63 podemos tamén escribir (68) de xeito máis breve e, en analoxía con (64), (70) p(ab, c) + p( b, c) = p(bc) + p( , c). 68, 691 Esta é a xeneralización da forma non condicional de C e da fórmula (64). (71) p(aa, b) + p( a,b) = p(a, b) + p( , b) 70 (72) p( a, b) = p(a , b) = p( , b) 40, 71, 30 (73) p( a, b) + p( , b) = p(a , b) + p(( , b) = 1 + p( , b) 64 (74) p( , b) = 1 = p( , b) 72, 73 Isto establece o feito de que os elementos aa cumpren a condición do Postulado PA. Obtemos, segundo isto, (75) p(a) = p(a, ) = p(a, ) = p(a, )=p(a, ); 25, 74, PA ou sexa, unha definición de probabilidade absoluta nunha forma máis manexable. A continuación deducimos a lei xeral da adición. (76) p(a , c) = p(a, c) – p(ab, c) + p( , c) 70, 40 (77) p( , c) = p( , c) – p( b, c) + p( , c) 76 1 Na dedución de (70) tamén necesitamos a seguinte fórmula p(cb, c) = p(b, c), que se pode denominar «(29')». A súa dedución, tendo en conta (40) e (32), é análoga aos pasos (28) e (29): (28') p(ab, ab) = 1 = p(b, ab) 25, 32, 17 (29') p(ba, b) = p(b,a b)p(a, b) = p(a, b). B2, 28' A isto podemos engadir a lei de idempotencia para o segundo argumento (30') p(ab, b) = p(a, bb) = p(a, b). B2, 25, 29', 40 Ademais, de (28) obtemos por substitución (31') p(a, a ) = 1 28 e, do mesmo xeito, de (28') (32') p( , a ) = 1 28' Isto dá, por C, (33') p(a, b) = 1 31', 32', C Temos, logo, (34') (Eb)(a) p(a, b) = 1 33' (35') (Ea) p( , a) = 1 34' Véxase tamén (27). As fórmulas (31') á (35') non pertencen aos teoremas dos sistemas habituais. 494 Karl Popper (78) p( , c) = 1 – p(a, c) – p(b, c) + p(ab, c) + p( , c) 77, 76, 64, 40 (79) p( , c) = p(a, c) + p(b, c) – p(ab, c) 78, 64 Esta é a forma da lei xeral da adición, como se observará doadamente se se lembra que significa o mesmo no noso sistema que «a+ b» no sentido booleano. Paga a pena mencionar que (79) ten a forma habitual: é incondicional e está libre do pouco habitual . (79) pódese xeneralizar máis aínda: (80) p( , ad) = p(b, ad) + p(c, ad) – p(bc, ad) 79 (81) p(a ( , d) = p(ab, d) + p(ac, d) – p(a(bc), d) 80, B2, 40 Isto é unha xeneralización de (79). Pasamos agora á dedución da lei de distribución. Pódese obter de (79), (81) e o simple lema (84) que eu propoño denominar «lema de distribución», que é unha xeneralización de (30): (82) p(a(bc),d) = p(a,(bc)d)p(bc, d) = p((aa)(bc), d) B2, 30 (83) p(((aa)b)c, d) = p(a(ab), cd)p(c, d) = p(((ab)a)c, d) B2, 62, 40 (84) p(a(bc),d) = p((ab)(ac), d) 82, 83, 62 Este é o «lema de distribución». (85) p( , d) = p(ab, d) + p(ac, d) – p((ab)(ac), d) 79 (subst.) A esta fórmula e (81) podémoslles aplicar agora o «lema de distribución» e obtemos: (86) p(a , d) = p( , d) 81, 85, 84 Esta é unha forma da primeira lei de distribución. Pódese aplicar ao primeiro membro da seguinte fórmula (87) p( a, c) = p( , ac) p (a, c) = p(a, c) B2, 74 logo obtemos, (88) p( , c) = p(a, c). 86, 87, 40 Nótese que (89) p( b, c) = p(ab, c), 68 (subst.) (90) p(a, c) = p(b, c)  p( , c) = p( , c) 64 En consecuencia, temos (91) p( , d) = p( , d) 62, 89, 40 (92) p( , d) = p( , d) 90, 91 495 a lóxida da descuberta científica Esta é a lei de asociación para a suma booleana. Substituíndo en (40) os complementos de a e b, atopamos (93) p( , c) = p( , c) 40, 90 Esta é a lei de conmutación para a suma booleana. Do mesmo xeito, obtemos (94) p( , b) = p(a, b) 30, 89, 90 Esta é a lei de idempotencia para a suma booleana. De (87) obtemos (95) p(a, b) = p(a, b ), 87, 40, A2 (96) p(a, b)p(b) = p(ab) 95, B2, 75 Isto tamén se pode escribir (97) p(b) ≠ 0  p(a, b) = p(ab)/p(b) 96 Esta fórmula demostra que o noso concepto xeneralizado de probabilidade relativa coincide, para , co concepto habitual, e tamén que o noso cálculo é unha xeneralización do cálculo habitual. Que a xeneralización é auténtica pódese observar polos exemplos dados no apéndice *iv, que mostran a coherencia do noso sistema coa seguinte fórmula (E): (E) (Ea)(Eb)(Ec) p(a, b) = 1 & p(a,b c) = 0, unha fórmula que non é válida en moitas interpretacións finitas do noso S, mais que é válida nas súas interpretacións infinitas normais. Para demostrar agora que S, na nosa interpretación coherente, ten que ser unha álxebra booleana, sinalamos que (98) ((x)p(a, x) = p(b, x))  p(ay, z) = p(by, z) B2 (99) ((x)p(a, x) = p(b, x))  p(y, az) = p(y, bz) 98, A2 É interesante que (99) necesite A2: non deriva de 98, 40 e B2, porque é posible que (isto ocorrerá se, por exemplo, ). (100) ((x)(p(a, x) = p(b, x) & p (c, x) = p(d, x)))  p(ac, y) = p(bd, y) 99, B2 Coa axuda de (90), de (100) e de A2, pódese mostrar doada e inmediatamente que, sempre que se cumpra a condición (*) p(a, x) = p(b, x) para todo x en S, 496 Karl Popper calquera nome do elemento a pódese substituír por algunha ou todas as ocorrencias de nomes do elemento b en calquera fórmula correctamente formada do cálculo sen alterar o seu valor de verdade. Noutras palabras, a condición (*) garante a equivalencia substitutiva de a e b. En vista deste resultado, agora definimos a equivalencia booleana de dous elementos, a e b, como segue: (D1) a = b  (x)p(a, x) = p(b, x) Desta definición obtemos inmediatamente as fórmulas: (A) a = a (B) a = b  b = a (C) (a = b & b = c)  a = c (D) a = b  a pode substituír a b nalgún ou todos os sitios de calquera fórmula sen afectar o seu valor de verdade. A2, 90, 100 Podemos tamén introducir unha segunda definición (D2) a = b + c  a = Despois obtemos (i) Se a e b están en S, entón a + b está en S (Postulado 3, D2, D1, 90, 100) (ii) Se a está en S, entón está en S (Postulado 4) (iii) a + b = b + a 93, D2 (iv) (a + b) + c = a + (b + c) 92, D2 (v) a + a = a 94, D2 (vi) b + a = a 88, D2 (vii) (Ea) (Eb) a ≠ b 27, 74, 90, D1 Mais o sistema (A) a (D2) e (i) a (vi) é un coñecido sistema axiomático para a álxebra booleana, debido a huntington2, e sábese que todas as fórmulas válidas da álxebra booleana son deducibles del. 2 Cf. E. V. Huntington, Transactions Am. Math. Soc. 35, 1933, pp. 274-304. O sistema (i) a (vi) é o «conxunto cuarto» de Huntington e descríbese na p. 280. Na mesma páxina pódese atopar (A) a (D) e (D2). A fórmula (v) é redundante, como mostrou Huntington na p. 557 ss. do mesmo volume. (vii) tamén é asumida por el. 497 a lóxida da descuberta científica Así que S é unha álxebra de Bool. E debido a que a álxebra booleana se pode interpretar como unha lóxica dedutiva, podemos afirmar que na súa interpretación lóxica, o cálculo de probabilidade é unha xeneralización xenuína da lóxica dedutiva. Máis en concreto, podemos interpretar a  b que é definible por «ab = b», para significar, na interpretación lóxica, «a dedúcese de b» (ou «b implica a»). Pódese probar doadamente que (+) b  p (a, b) = 1 Esta é unha fórmula importante que foi afirmada por moitos autores3, pero que, con todo, non é válida nos sistemas habituais, sempre que estes sexan coherentes. Pois para tornala válida, deberíase permitir4 p(a, a ) + p( , a ) = 2, malia que temos p(a + , a ) = 1. Isto é, fórmulas como p(a + , b) = p(a, b) + p( , b) non se deben afirmar incondicionalmente no sistema (cf. o noso axioma C; véxase tamén a nota 1, supra.) O inverso de (+), isto é, p(a, b) = 1  a  b non debe ser demostrable, claro está, como mostran os nosos exemplos segundo e terceiro da demostración de coherencia 3 Afírmaa, por exemplo, H. Jeffreys, Theory of Probabiliy, parágrafo 1.2, «Convention 3». Pero se se acepta, o seu teorema 4 vólvese contraditorio inmediatamente, pois afírmase sen unha condición coma a nosa «p(b) ≠ 0». Jeffreys corrixiu, neste sentido, a formulación do teorema 2 na segunda edición do seu libro, de 1948. Pero, como se pode ver polo seu Teorema 4 (e moitos outros), o seu sistema continúa a ser incoherente (malia que recoñeceu, na segunda edición, p. 35, que dúas proposicións contraditorias implican calquera proposición; cf. nota *2 do apartado 23 e a miña resposta a Jeffreys en Mind 52, 1943, p. 47 ss.). 4 Véxanse as fórmulas 31' ss. na nota 1, supra. 498 Karl Popper (cf. tamén a fórmula (E) neste apéndice e no anterior). Pero hai outras equivalencias válidas no noso sistema como (‡) a  b  p(a, b) ≠ 0 a  b  p(a, b) = 1 Ningunha destas se sostén nos sistemas habituais en que p(a, b) é non definido a menos que p(b) ≠ 0. Parece bastante claro, por tanto, que os sistemas habituais da teoría da probabilidade se caracterizan, erroneamente, como xeneralizacións da lóxica, mais vemos que non son formalmente apropiados para este fin, pois nin sequera implican a álxebra de Bool. O carácter formal do noso sistema fai posible interpretalo, por exemplo, como unha lóxica proposicional de numerosos valores (con tantos como queiramos: discretos, densos ou continuos) ou como un sistema de lóxica modal. En realidade, hai moitas maneiras de facer isto: por exemplo, podemos definir «a necesariamente implica b» por «p(b, a ) ≠ 0», como se acaba de indicar, ou «a é loxicamente necesario» por «p(a, ) = 1». Mesmo o problema de se un enunciado necesario é 'necesariamente necesario' atopa o seu sitio na teoría da probabilidade: está intimamente relacionado coa relación entre enunciados de probabilidade primarios e secundarios (como se mostra no apéndice *ix, punto *13 da Terceira Nota). En termos aproximados, escribir « x»por «x é necesario (ou demostrable)» e «h» por «p(a, ) = 1», podemos mostrar que  a   h e, por tanto, atopamos que  a   «p(h, ) = 1», que se pode entender no sentido de que implica que a é necesariamente necesario; e como isto significa algo do estilo de  a   «p('p(a, ) = 1', 'p(a, ) = 1') = 1', 499 a lóxida da descuberta científica obtemos enunciados de probabilidade (secundarios) sobre enunciados de probabilidade (primarios). Mais está claro que hai outras posibles maneiras de interpretar a relación entre un enunciado de probabilidade primario e un secundario (algunhas delas impediríannos que as considerásemos do mesmo nivel lingüístico, nin sequera da mesma lingua). Addenda, 1964 Desde aquela descubrín que o seguinte sistema de tres axiomas (A, BD e CD) é equivalente ao de seis axiomas das pp. 337 e 356-7: A (Ea) (Eb)p(a, a) ≠ p(a, b) BD ((d)p(ab, d)=p(c, d))  (e)(f)(p(a, b)  p(c, b) & p(a, e)  p(c, e)  p(b, c) & ((p(b, e)  p(f, e) & p(b ,f)  p(f, f)  p(e, f)  p(a, f) p(b, e) = p(c, e))) CD p(a, b) = p(b, b) – p(a, b)  (Ec)p(b, b) ≠ p(c, b) Tamén descubrín desde aquela un exemplo que non cumpre A2 pero si cumpre todos os outros axiomas e o Postulado PA (véxase a nota 10 na p. 345). O exemplo da p. 348 pódese modificar (poñendo p(2) = 1 2 , p(a, b) = 1 sempre que p(b) = 0, p(a, b) = p(ab)/p(b) sempre que p(b) ≠ 0) para obter unha álxebra de Bool que demostre a independencia de C. Véxase tamén o meu libro Conjectures and Refutations, 1963, p. 388 ss.; a terceira e posteriores edicións alemás do meu Logik der Forschung; e tamén Synthese 15, 1963, pp. 107186, e Synthese 21, 1970, p. 107. 500 Karl Popper APÉNDICE *VI Sobre a desorde obxectiva ou aleatoriedade Para unha teoría da probabilidade e a súa aplicación a tales conceptos como entropía (ou desorde molecular) é esencial ofrecer unha caracterización obxectiva da desorde ou aleatoriedade, como un tipo de orde. Neste apéndice o que pretendo facer é indicar brevemente algúns dos problemas xerais que esta caracterización pode axudar a resolver e a maneira en que se poderían abordar estes problemas. (1) Suponse que a distribución de velocidades das moléculas dun gas en equilibrio é (case) aleatoria. Igualmente, a distribución de nebulosas no universo semella ser aleatoria, cunha densidade de ocorrencia globalmente constante. A ocorrencia de choiva os domingos é un feito aleatorio: a longo prazo, chove a mesma cantidade de auga todos os día da semana, e o feito de que chovese un mércores, por exemplo, talvez non nos axude a predicir se vai chover o domingo ou non. (2) Temos certas comprobacións estatísticas da aleatoriedade. (3) Podemos describir a aleatoriedade como «ausencia de regularidade», mais esta descrición, como veremos, non resulta útil, pois non existen comprobacións sobre a presenza ou ausencia de regularidade en xeral, tan só hai probas sobre presenza ou ausencia dunha regularidade concreta dada ou proposta. Así que as nosas comprobacións da aleatoriedade non exclúen nunca a presenza de toda regularidade: podemos comprobar se existe unha correlación significativa entre a choiva e os domingos ou se funciona unha certa fórmula dada para predicir a choiva en domingo, do tipo de «(chove) polo menos unha vez cada tres semanas». Malia que poidamos rexeitar esta fórmula en vista das nosas comprobacións, non podemos determinar, polas mesmas probas, se existe ou non unha fórmula mellor. (4) Nestas circunstancias, podémonos sentir tentados de dicir que a aleatoriedade ou a desorde é un tipo de orde que se 501 a lóxida da descuberta científica pode describir obxectivamente e que se debe interpretar como carencia de coñecemento pola nosa parte sobre a orde existente, se é que tal orde existe. A min paréceme que se debe resistir esta tentación e que se pode elaborar unha teoría que nos permita realmente construír tipos ideais de desorde (e tamén, claro está, tipos ideais de orde e mais de todos os graos intermedios entre estes dous extremos). (5) O problema máis simple neste campo, que me parece que resolvín eu, é a elaboración dun tipo ideal unidimensional de desorde, ou sexa, unha sucesión desordenada idealmente. O problema de construír unha sucesión deste tipo xorde inmediatamente ao partir dunha teoría frecuencial da probabilidade que opera con sucesións infinitas. Isto pódese demostrar como se fai aquí a continuación. (6) Segundo von Mises, unha sucesión de ceros e uns con equidistribución é aleatoria se non admite ningún sistema de xogos de azar, isto é, se non admite un sistema que nos permita escoller de antemán unha subsucesión en que a distribución sexa desigual. Von Mises admite, xaora, que calquera sistema de xogos de azar pode funcionar «accidentalmente» durante un tempo determinado, mais el postula que fracasará a longo prazo, isto é, se é sometido a un número infinito de intentos. Segundo isto, un colectivo de von Mises pode ser extremadamente regular no seu segmento inicial: sempre que se volvan irregulares ao final, a regra de von Mises é incapaz de excluír colectivos que comezan de xeito moi regular, por exemplo, 00 11 00 11 00 11 ... e así por diante, durante os primeiros cinco centos millóns de lugares. (7) Está claro que este tipo de aleatoriedade diferida non se pode comprobar empiricamente, e tamén que cando que se fan comprobacións de aleatoriedade nunha sucesión, o que temos en mente é un tipo diferente de aleatoriedade: unha sucesión que desde o comezo se comporta de xeito «razoablemente aleatorio». 502 Karl Popper Mais a expresión «desde o comezo» dá lugar a un problema de seu. Ten carácter aleatorio unha sucesión como 010110? Está claro que é demasiado curta para podermos responder si ou non. Mais se dicimos que nos cómpre unha sucesión máis longa para respondermos unha pregunta deste tipo, entón parece que estamos a contradicir o que afirmamos antes: parece que nos desdicimos da expresión «desde o comezo». (8) A solución para esta dificultade é construír unha sucesión idealmente aleatoria, unha sucesión que sexa para cada segmento inicial, curto ou longo, tan aleatoria como permita o segmento. Noutras palabras, unha sucesión cuxo grao n de aleatoriedade (isto é, a súa liberdade n de repercusións posteriores) aumente coa lonxitude da sucesión tan rapidamente como sexa posible matematicamente. No apéndice iv deste libro xa se mostrou como se pode construír unha sucesión deste tipo (véxase en especial a nota *1 do apéndice iv, que contén unha referencia a un artigo ata daquela non publicado escrito conxuntamente polo Dr. l. r. B. Elton e por min propio). (9) O conxunto infinito de todas as sucesións que responden a esta descrición pódese denominar tipo ideal de alternativas aleatorias con distribución equitativa. (10) Aínda que delas só se postule que son «fortemente aleatorias» (no senso de que os segmentos iniciais finitos pasarían todas as probas de aleatoriedade), pódese demostrar doadamente que posúen límites de frecuencia, no senso normalmente esixido polas teorías de frecuencia. Isto resolve de maneira sinxela un dos problemas centrais do meu capítulo sobre probabilidade: a eliminación do axioma do límite, mediante a redución do comportamento tendente ao límite das sucesións ao seu comportamento aleatorio en segmentos finitos. (11) A construción pódese estender doadamente a ambos lados do caso unidimensional, facendo correlacións entre o primeiro, segundo, ..., elemento dos números impares co primeiro, segundo, ..., lugar da dirección positiva, e entre o primeiro, 503 a lóxida da descuberta científica segundo, ..., elemento par e o primeiro, segundo, ..., lugar da dirección negativa. Mediante métodos semellantes, que son ben coñecidos, podemos estender a nosa construción ás células dun espazo n-dimensional. (12) Mentres que outros teóricos da frecuencia, en especial von Mises, Copeland, Wald e Church, se centraron en definir sucesións aleatorias no senso máis rigoroso, excluíndo «todos» os sistemas de xogos de azar, no senso máis amplo posible da palabra «todos» (isto é, no senso máis amplo que sexa compatible cunha proba de que existen sucesións aleatorias definidas dese xeito), o meu obxectivo era bastante diferente. Desde o comezo, o que eu pretendía era ofrecer unha resposta á obxección de que a aleatoriedade é compatible con calquera segmento inicial finito. O que eu pretendía era describir sucesións que resultan de sucesións finitas aleatorias, mediante unha transición ao infinito. Con este método eu agardaba conseguir dúas cousas: manterse preto do tipo de sucesión que pasaría probas estatísticas de aleatoriedade e demostrar o teorema do límite. xa se conseguiron as dúas, como se indicou no punto (8), coa axuda da construción dada no vello apéndice iv. Pero desde aquela decateime de que unha «achega desdea teoría da medición» sobre a probabilidade é preferible á interpretación frecuencial (véxase o meu Postscript, capítulo *iii), por razóns tanto matemáticas coma filosóficas (a cuestión decisiva está relacionada coa interpretación da probabilidade como propensión, tratada a fondo no Postscript). Por tanto, agora xa non creo que sexa moi importante a eliminación do axioma do límite da teoría da frecuencia. Mais pódese construír igual: podemos construír a teoría da frecuencia coa axuda do tipo ideal de sucesións aleatorias elaborado no apéndice iv, e tamén podemos dicir que unha sucesión empírica é aleatoria na medida en que as comprobacións demostren que se aproxima estatisticamente a unha sucesión ideal. As sucesións admitidas por von Mises, Copeland, Wald e Church non son necesariamente deste tipo, como se dixo antes, 504 Karl Popper pero non hai dúbida de que unha sucesión que algunha vez fose rexeitada baseándose en probas estatísticas por non ser aleatoria, pode máis tarde converterse nunha sucesión admisible no senso en que o entenden estes autores. Addenda, 1967 (13) hoxe, anos despois de conseguir unha solución para este vello problema que me parecería satisfactoria en 1934, xa non creo na importancia do feito de que se poida construír unha teoría da frecuencia que estea libre de todas as vellas dificultades. Mais sigo pensando que é importante que sexa posible caracterizar a aleatoriedade como un tipo de orde e mais que poidamos construír sucesións aleatorias. (14) Paga a pena sinalar que as sucesións idealmente aleatorias, tal como se describen aquí nos apartados (8) a (10), cumpren o sistema formal dos apéndices *iv e *v, e tamén o do apéndice *ii anterior. Supoñamos que S é un conxunto de sucesións aleatorias de ceros e uns, tal que a = a1, a2, ...; b = b1, b2, ..., e que, para a ≠ b, a e b sexan independentes (e ab aleatorio, logo). Supoñamos que S contén dúas sucesións formadas só por ceros e uns. Poñemos p(a, b) = lim ((∑an bn) / ∑bn), p(ab, c) = lim ((∑an bn nn) / ∑cn), p( , b) = lim ((∑1 – an) bn) / ∑bn), p(a) = lim ((∑an) /n); entón cúmprense todos os Axiomas e Postulados dos apéndices *iv e *v (excepto o Postulado 1; cf. p. 353). 505 a lóxida da descuberta científica APÉNDICE *VII Probabilidade cero e a estrutura fina de probabilidade e de contido No libro trázase unha distinción drástica entre a idea de probabilidade dunha hipótese e o seu grao de corroboración. Afírmase que dicir que unha hipótese está ben corroborada é o mesmo que dicir que foi sometida a comprobacións rigorosas (ten que ser, logo, unha hipótese cun alto grao de comprobabilidade) e que superou con éxito as probas máis severas que ata o momento fomos quen de deseñar para este fin. Tamén se afirma que o grao de corroboración non pode ser unha probabilidade, debido a que non cumpre as leis do cálculo de probabilidade. As leis do cálculo de probabilidade esixen que, entre dúas hipóteses, a que sexa loxicamente máis forte, máis informativa ou mellor comprobable, a que pode, logo, ser mellor corroborada, sempre é menos probable (baseándose nunha evidencia dada) que a outra (véxase, en especial, os apartados 82 e 83). un maior grao de corroboración, polo xeral, combinarase cun menor grao de probabilidade, o cal demostra non só que temos que facer unha distinción clara entre a probabilidade (no senso de cálculo de probabilidade) e grao de corroboración ou confirmación, senón tamén que a teoría probabilística da indución, ou a idea dunha probabilidade indutiva, é insostible. A imposibilidade da probabilidade indutiva ilústrase no libro (apartados 80, 81 e 83) mediante a discusión de certas ideas de reichenbach, Keynes e Kaila. un dos resultados que se tiran desta discusión é que nun universo infinito (pode ser infinito con respecto ao número de cousas discernibles ou ás rexións espacio-temporais), a probabilidade dunha lei universal (non tautolóxica) será cero. (Outro dos resultados é que non debemos asumir acriticamente que os científicos sempre pretendan conseguir que as 506 Karl Popper teorías teñan un grao cada vez maior de probabilidade. Teñen que escoller entre alta probabilidade e alto contido informativo, debido a que, por razóns lóxicas, non poden ter ambas. Polo de agora, cando se viron ante este dilema, os científicos déronlle prferencia ao alto contido informativo sobre a alta probabilidade, sempre que a teoría superase con éxito as comprobacións). Por «probabilidade» quero dicir ou ben a probabilidade lóxica absoluta dunha lei universal, ou ben a probabilidade relativa a algunha evidencia, isto é, relativa a algún enunciado singular ou a unha conxunción finita de enunciados singulares. Así, se a é unha lei e b unha evidencia empírica calquera, eu afirmo que (1) p(a) = o e tamén que (2) p(a, b) = 0 Neste apéndice comentaranse estas fórmulas. As dúas fórmulas, (1) e (2), son equivalentes pois, como sinalaron Jeffreys e Keyness, se a probabilidade «previa» (a probabilidade lóxica absoluta) dun enunciado a é cero, entón tamén o será a súa probabilidade relativa a unha evidencia finita b, pois debemos asumir que para calquera evidencia finita b, temos p(b) ≠ 0. Como p(a) = 0 implica p(ab) = 0 e, como p(a, b) = p(ab)/p(b), obtemos (2) de (1). Por outro lado, podemos tamén obter (1) de (2), pois se (2) vale para calquera evidencia (b), por moi feble ou «case tautolóxica» que sexa, podemos asumir que tamén vale para a evidencia cero, isto é, para a tautoloxía t = ; e p(a) pódese definir como igual a p(a, t). hai moitos argumentos a favor de (1) e (2). Primeiro, podemos considerar a definición clásica da probabilidade como o número de posibilidades favorables dividido polo número de todas as posibilidades (iguais). Entón podemos deducir (2), por 507 a lóxida da descuberta científica exemplo, se identificamos as posibilidades favorables coa evidencia favorable. Está claro que, neste caso, p(a, b) = 0, pois a evidencia favorable só pode ser finita, mentres que as posibilidades nun universo infinito teñen que ser obviamente infinitas. (Nada depende aquí da «infinidade», pois calquera universo suficientemente grande dará, co grao de aproximación que se queira, o mesmo resultado; e sabemos que o noso universo é extremadamente grande, comparado coa cantidade de evidencia dispoñible para nós). Esta simple consideración resultará, se cadra, algo vaga, mais pódese fortalecer considerablemente se intentamos deducir (1), en vez de (2), da definición clásica. Para isto, podemos interpretar que o enunciado universal a implica un produto infinito de enunciados singulares, cada un cunha atribución de probabilidade que ten que ser, obviamente, inferior a un. No caso máis simple, pódese interpretar que o propio a é un produto infinito, isto é, podemos poñer a = «todo ten a propiedade A» ou, en símbolos, «(x)Ax», que se pode ler «para calquera valor de x que escollamos, x ten a propiedade A»1. Neste caso, a pódese interpretar como o produto infinito a = a1a2a3... onde ai = Aki, e onde ki é o nome do i-ésimo elemento do noso universo infinito de discurso. 1 «x» aquí é unha variable individual que alcanza o universo (infinito) de discurso. Podemos escoller, por exemplo, a = «Todos os cisnes son brancos» = «para calquera valor de x que escollamos, x ten a propiedade A», onde «A» se define como «ser branco ou non ser un cisne». Tamén podemos expresar isto de xeito lixeiramente diferente, asumindo que x abarca as rexións espacio-temporais do universo, e que «A» se define por «non habitado por un cisne non branco». Mesmo as leis que teñen forma máis complexa (poñamos, dunha forma como «(x) (y) (xSy)  xSY)» pódense escribir «(x)Ax», pois podemos definir «A» por Ax  (y) (xRy  xSy). Se cadra podemos chegar á conclusión de que as leis naturais teñen outra forma que a descrita aquí (cf. apéndice *x): que son loxicamente máis fortes aínda do que se presupón aquí e que, se se forzan ata chegar a unha forma como «(x)Ax», o predicado A vólvese esencialmente non observable (cf. notas *1 e *2 da «Terceira Nota», incluídas no apéndice *ix), malia que sexa comprobable dedutivamente. Mais neste caso, as nosas consideracións continúan a ser válidas a fortiori. 508 Karl Popper Agora podemos introducir o nome «an» para o produto dos primeiros enunciados singulares n, a1a2... an, tal que a se poida escribir a = lim (a)n n∞ e (véxase p. 346) (3) p(a) = lim p(a)n n∞ Está claro que podemos interpretar an como a afirmación de que, dentro da sucesión finita de elementos k1, k2, ... kn, todos os elementos posúen a propiedade A. Isto facilita a aplicación da definición clásica da avaliación de p(an). Só hai unha posibilidade que sexa favorable á afirmación an: é a posibilidade de que todos os n elementos, ki sen excepción, posúan a propiedade A en vez da propiedade non A. Pero en conxunto hai 2n posibilidades, pois temos que asumir que é posible que calquera elemento ki posúa ou ben a propiedade A ou ben a propiedade non A. Segundo isto, a teoría clásica dá (4c) p(an) = 1/2n Mais, a partir de (3) e (4c), obtemos inmediatamente (1). O argumento «clásico» que dá lugar a (4c) non é enteiramente adecuado, aínda que creo que é esencialmente correcto. A razón pola que non é adecuado reside simplemente na asunción de que A e non A sexan igualmente probables. Pois pódese aducir, na miña opinión acertadamente, que como se supón que a describe unha lei da natureza, os varios a1 son enunciados exemplificadores e, por tanto, máis probables que as súas negacións, que son falsificadores potenciais (cf. nota *1 do apartado 28). Esta obxección, con todo, afecta a unha parte non esencial do argumento, debido a que, sexa cal sexa a probabilidade (non sendo un) que lle atribuamos a A, o produto infinito A terá cero probabilidade (supoñendo independencia, que será tratada máis adiante). De feito, atopámonos aquí cun caso particularmente trivial de lei de probabilidade «cero ou un» (que 509 a lóxida da descuberta científica tamén podemos chamar, nunha alusión á neurofisioloxía, «o principio de todo ou nada»). Neste caso pódese formular como segue: se a é o produto infinito de a1, a2, ..., onde p(ai)=p(aj), e onde todo ai é independente de todos os demais, entón vale o seguinte: (4) p(a)=lim p(an) = 0, a menos que p(a) = p(an) = 1 n∞ Mais está claro que p(a) = 1 é inaceptable (non só desde o meu punto de vista, senón tamén desde o dos meus opoñentes indutivistas, que de ningunha maneira aceptarán que a probabilidade dunha lei universal nunca poida ser aumentada pola experiencia). un enunciado como «todos os cisnes son negros» tería a probabilidade 1, igual que «todos os cisnes son brancos», e co resto das cores ocorre algo parecido, de xeito que «existe un cisne negro» e «existe un cisne branco», etc., terían os dous probabilidade cero, malia que intuitivamente isto pareza moi débil desde un punto de vista lóxico. Noutras palabras, p(a) = 1 sería equivalente a afirmar con probabilidade 1, baseándose en razóns puramente lóxicas, que o universo está baleiro. Deste xeito (4) establece (1). Aínda que creo que este argumento é incontestable (incluíndo a suposición de independencia que se comenta máis adiante), hai unha serie de argumentos moito máis febles que non supoñen independencia mais que continúan levando a (1). Por exemplo, poderíase argumentar o seguinte. Na nosa dedución supoñiamos que para todo ki é loxicamente posible que teña a propiedade A ou, se non, que teña a propiedade non A: isto leva esencialmente a (4). Mais un tamén pode supoñer, talvez, que o que temos que considerar como posibilidades fundamentais non son as propiedades posibles de todo elemento no universo de n elementos, senón as proporcións posibles coas que as propiedades A e non A poden ocorrer dentro dunha mostra de elementos. Nunha mostra de n elementos as posibles proporcións coas que A pode ocorrer son: 0, 1/n, ..., 510 Karl Popper n/n. Se consideramos as ocorrencias de calquera destas proporcións como posibilidades fundamentais, tratándoas, logo, como equiprobables («distribución de laplace»2), entón (4) tería que ser substituída por (5) p(an) = 1 (n+1) ; tal que lim p(an) = 0 Aínda que desde o punto de vista da dedución de (1), a fórmula (5) é moito máis feble que (4c), continúa permitíndonos deducir (1), e isto sen identificar os casos observados como favorables nin asumir que o número de casos observables é finito. un argumento moi semellante que dá lugar a (1) sería o seguinte: podemos considerar o feito de que toda lei universal a implica (e é, por tanto, como moito, tan probable como) unha hipótese estatística h coa forma «p(x, y) = 1», e que a probabilidade absoluta de h se pode calcular coa axuda da distribución de laplace, dando como resultado p(h) = 0 (cf. o apéndice *ix, a Terceira Nota, especialmente *13). Mais como a implica h, isto leva a p(a) = 0, isto é, a (1). A min esta proba seméllame a máis simple e a máis convincente: fai posible soster (4) e (5), asumindo que (4) é aplicable a a e (5) a h. Ata o de agora, as nosas consideracións baseábanse na definición clásica de probabilidade, mais chegamos aos mesmos resultados se adoptamos como base a interpretación lóxica do cálculo formal de probabilidade. Neste caso, o problema é sobre a dependencia ou independencia dos enunciados. Se consideramos, de novo, a como produto lóxico dos enunciados singulares a1, a2, ..., entón a única asunción razoable semella ser que, a falta de información (que non sexa tautoló2 É a asunción que subxace á dedución de Laplace da súa famosa «regra de sucesión»; por iso a denomino «distribución de Laplace». É unha asunción apropiada se o noso problema é o dunha simple mostraxe; semella inadecuada se se trata (coma no caso de Laplace) dunha sucesión de acontecementos individuais. Véxase tamén o apéndice *ix, puntos 7 e seguintes da miña «Terceira Nota» e mais a nota 10 do apéndice *viii. 511 a lóxida da descuberta científica xica), temos que considerar todos estes enunciados singulares como mutuamente independentes, de xeito que ai estar seguido por aj ou pola súa negación j, coas probabilidades p(aj, ai) = p(aj) p( j, ai) = p( j) = 1– p(aj). Calquera outra asunción equivalería a postular ad hoc unha especie de repercusión posterior ou, noutras palabras, a postular que existe algo do tipo dunha conexión causal entre ai e aj. Mais isto sería, obviamente, unha asunción sintética e ilóxica, que habería que formular como hipótese. Non pode formar parte, logo, dunha teoría da probabilidade puramente lóxica. Isto mesmo tamén se pode dicir de xeito lixeiramente distinto: en presenza dunha hipótese h, por exemplo, está claro que podemos ter (6) p(aj, aih) > p(ajh) Isto é debido a que h nos pode informar da existencia dunha especie de repercusión posterior. En consecuencia, despois deberiamos ter (7) p(ai aj, h) > p(ai, h) p(aj, h) debido a que (7) é equivalente a (6). Mais, en ausencia de h, ou se h é tautolóxico ou, noutras palabras, se se trata de probabilidades lóxicas absolutas, (7) débese substituír por (8) p(ai a) = p(ai)p(aj) que significa que ai e aj son independentes, e que é equivalente a (9) p(aj, ai) = p(aj) Mais a asunción de independencia mutua leva, xunto con p(ai) < 1, coma antes, a p(a) = 0, isto é, a (1). Así que (8), ou sexa, a asunción da independencia mutua dos enunciados singulares ai leva a (1) e, maiormente por esta 512 Karl Popper razón, algúns autores rexeitaron (8) directa ou indirectamente. O argumento esgrimido sempre era, invariablemente, que (8) tiña que ser falso porque, se fose verdade, nunca aprenderiamos nada da experiencia: o coñecemento empírico sería imposible. Mais isto é incorrecto: podemos aprender da experiencia aínda que p(a) = p(a, b) = 0; por exemplo, C(a, b) –ou sexa, o grao de corroboración de a polas comprobacións b– pode, con todo, aumentar con novas probas (cf. apéndice *ix). Así que este argumento «transcendental» non alcanza o seu obxectivo e, en calquera caso, non alcanza a miña teoría3. Mais consideremos a idea de que (8) é falso ou, noutras palabras, que p(aiaj) > p(ai)p(aj) é válido e, en consecuencia, p(aj, ai) > p(aj), e tamén o seguinte: (+) p(an,a1 a2... an–1) > p(an) Esta perspectiva afirma que unha vez que descubrimos que ki posúe a propiedade A, aumenta a probabilidade de que outro kj posúa a mesma propiedade, e máis aínda se atopamos a propiedade en varios casos. En terminoloxía de hume, (+) afirma 3 Pódese cualificar de «transcendental» un argumento que invoca o feito de que temos coñecemento ou que aprendemos da experiencia, e que conclúe deste feito que o coñecemento ou aprendizaxe pola experiencia ten que ser posible e, ademais, que toda teoría que implique a imposibilidade do coñecemento ou de aprendizaxe pola experiencia teña que ser falsa (hai aquí unha alusión a Kant). Eu creo que un argumento transcendental pode ser válido se se usa criticamente, por exemplo contra unha teoría que implique a imposibilidade do coñecemento ou de aprender pola experiencia. Pero un debe ser moi cauto no seu uso. O coñecemento empírico existe nalgún senso da palabra «coñecemento». Mais noutros sensos non existe, por exemplo, no senso de coñecemento certo ou coñecemento demostrable. E non podemos asumir de xeito acrítico que teñamos coñecemento probable no senso do cálculo de probabilidade, debido a que eu creo que o que podemos chamar «coñecemento empírico», incluíndo o «coñecemento científico», consiste en intentos de previsión, moitos dos cales non son probables (ou teñen probabilidade cero) aínda que estean moi ben corroborados. Véxase tamén o Postscript, apartados *28 e *32. 513 a lóxida da descuberta científica de exemplos como kn que «é probable que aqueles casos dos que non tivemos experiencia se semellen a aqueles dos que si tivemos experiencia». A cita, excepto as palabras «é probable que», procede da crítica de hume á indución4. E a crítica de hume é aplicable na súa totalidade a (+) ou a súa formulación verbal en cursiva. hume argumenta: «mesmo despois da observación dunha conxunción de obxectos frecuente e constante, non temos razón para tirar ningunha inferencia sobre ningún obxecto máis alá daqueles que experimentamos directamente»5. Se alguén dixese que a experiencia, partindo de obxectos observados, nos permite tirar inferencias sobre obxectos non observados, hume retrucaría: «Eu volvería a preguntar por que se tira conclusión ningunha máis alá dos casos pasados dos que efectivamente se tivo experiencia». Noutras palabras, hume sinala que nos metemos nunha regresión infinita se invocamos a experiencia para xustificar calquera conclusión sobre casos non observados, mesmo que só sexan simples conclusións probables, como di el no seu Abstract. Alí pódese ler o seguinte: «É evidente que Adán, con toda a súa ciencia, nunca sería capaz de demostrar que o curso da natureza tería que continuar sendo uniformemente idéntico... Eu mesmo iría máis alá e diría que nin sequera podería probar mediante argumentos probables que o futuro se terá que adaptar aos moldes do pasado. Todos os argumentos probables constrúense sobre a suposición de que hai conformidade entre o futuro e o pasado e, por tanto, nunca se poden probar»6. Así que (+) non se pode xustificar pola experiencia; así e todo, para ser loxicamente válido, tería que ter o carácter 4 Treatise of Human Nature, 1739-40, libro 1, parte iii, apartado vi (a cursiva é de Hume). Véxase tamén o meu Postscript, nota 1 do apartado *2 e nota 2 do apartado *50. 5 L. cit., apartado xii (as cursivas son de Hume). A próxima cita procede de l. cit., apartado vi. 6 Cf. An Abstract of a Book lately published entitled A Treatise of Human Nature, 1740, editado por J. J. Keynes e P. Sraffa, 1938, p. 15. Cf. nota 2 do apartado 81. (A cursiva é de Hume). 514 Karl Popper dunha tautoloxía, que é válida en calquera universo loxicamente posible. Mais non cabe dúbida de que este non é o caso. Por tanto, se (+) fose verdade, tería o carácter lóxico dun principio de indución sintético e a priori, máis que carácter de afirmación lóxica ou analítica. Mais isto non é suficiente nin sequera como principio de indución, pois aínda que (+) sexa verdade, p(a) = 0 pode seguir sendo válido. (A teoría de Carnap7 é un exemplo de teoría que acepta (+) como válido a priori -aínda que, como vimos, (+) teña que ser sintético- e que ao mesmo tempo acepta p(a) = 0). un principio probabilístico de indución efectivo tería que ser aínda máis forte que (+). Tería que nos permitir, polo menos, concluír que para unha evidencia b singular e adecuada, poderiamos obter p(a, b) > 1/2 ou, dito en palabras, que a se pode facer, mediante acumulación de probas ao seu favor, máis probable que a súa negación. Mais isto só é posible se (1) é falso, isto é, se temos p(a) > 0. unha maneira máis directa de demostrar que (+) non é válido e que (2) si o é pódese tirar do argumento que dá Jeffreys na súa Theory of Probability8, apartado 1.6. Jeffreys comenta unha fórmula a que el lle dá o número (3) e que no noso sistema de simbolización equivale á afirmación de que, sempre que p(bi, a) = 1 para todo i ≤ n, tal que p(abn) = p(a), ten que ser válida a seguinte fórmula: 7 O requisito de Carnap de que o seu «lambda» (que eu demostrei que era o recíproco dunha medida de dependencia) teña que ser finito implica o noso (+); cf. o seu Continuum of Inductive Methods, 1952. Con todo, Carnap acepta p(a) = 0, o cal, segundo Jeffreys, implicaría a imposibilidade de aprender da experiencia. Mais Carnap basea a súa esixencia de que «lambda» sexa finito, e por tanto que (+) sexa válido, precisamente no mesmo argumento transcendental a que alude Jeffreys: que sen el, non poderiamos aprender da experiencia. Véxase o seu Logical Foundations of Probability, 1950, p. 565, e o meu artigo no volume sobre Carnap de Library of Living Philosophers, editado por P. A. Schilpp, especialmente a nota 87. Este último artigo está tamén recollido no meu Conjectures and Refutations, 1963. 8 Traduzo os símbolos de Jeffreys aos meus, omitindo o seu H, pois nada no argumento nos impide consideralo tautolóxico ou polo menos irrelevante; en calquera caso, o meu argumento pódese volver a afirmar sen omitir o H de Jeffreys. 515 a lóxida da descuberta científica (10) p(a, bn) = p(a) p(bn) = p(a) p(b1)p(b2, b1) ...p(bn, bn–1) Comentando esta fórmula, Jeffreys afirma (continúo usando os meus símbolos en lugar dos seus): «Así, cun número suficiente de verificacións, pode ocorrer unha de tres cousas: (1) A probabilidade de a coa información dispoñible é maior de 1. (2) é sempre 0. (3) p(bn, bn–1) tenderá a 1». A isto engádelle que o caso (1) é imposible (trivialmente), de tal maneira que só quedan (2) e (3). Eu digo que asumir que o caso (3) é válido universalmente, por escuras razóns lóxicas (e tería que ser válido universalmente, e realmente válido a priori, para poder usalo na indución), é algo que se pode refutar doadamente. Isto é debido a que a única condición necesaria para deducir (10), a parte de 0 < p(bi) < 1, é que existe algún enunciado a tal que p(bn, a) = 1. Mais esta condición pódese cumprir sempre para unha sucesión de enunciados bi. Supoñendo que bi son lanzamentos dunha moeda, sempre é posible construír unha lei universal a que implica os resultados de todos os lanzamentos observados n 1, e que nos permite predicir todos os lanzamentos futuros da moeda (aínda que probablemente de xeito incorrecto)99. Así, o a requirido sempre existe, e sempre hai tamén outra lei, a', que dá os mesmos primeiros resultados n 1, mais predicindo, para o enésimo lanzamento, o resultado contrario. Sería paradoxal, por tanto, aceptar o caso (3) de Jeffreys, pois para un n o suficientemente grande sempre obteriamos p(bn, bn-1) próximo a 9 Nótese que non hai nada nas condicións baixo as que se deduce (10) que esixa que bi sexa da forma «B(ki)», cun predicado común «B» e, por tanto, nada nos impide considerarmos que bi = «ki é cara» e bj = «kj é cruz». Porén, podemos construír un predicado «B» tal que todo bi teña a forma «B(ki)»: podemos definir B como «ter a propiedade cara, ou cruz, respectivamente, se e só se o elemento correspondente da sucesión determinada pola lei matemática a é 0, ou é 1, respectivamente». (Nótese que un predicado coma este só se pode definir con respecto a un universo de elementos que están ordenados, ou que poden ser ordenados, mais este é o único caso de interese, obviamente, se temos en mente aplicacións a problemas da ciencia. Cf. o meu Prólogo, 1958, e a nota 2 do apartado *49 do meu Postscript). 516 Karl Popper 1, e tamén (doutra lei, a') próximo a 1. Por tanto, o argumento de Jeffreys, que é matematicamente ineludible, pódese usar para probar o seu caso (2), que resulta que coincide coa miña propia fórmula (2), como se dixo ao comezo deste apéndice10. Podemos resumir a nosa crítica de (+) como segue. hai quen cre que, por razóns puramente lóxicas, a probabilidade de que a próxima cousa que atopemos sexa vermella aumenta en xeral segundo o número de cousas vermellas vistas no pasado. Mais crer isto é crer na maxia: na maxia da linguaxe humana. Pois «vermella» é un simple predicado, e sempre haberá predicados A e B aplicables ambos ás cousas observadas ata o de agora, mais que levan a predicións probabilísticas incompatibles con respecto á próxima cousa que se vaia atopar. Estes predicados poden non ocorrer nas linguas naturais, mais sempre se poden construír (a crenza máxica aquí criticada atópase, estrañamente, entre aqueles que constrúen modelos de linguaxes artificiais, máis que entre os analistas da linguaxe ordinaria). Ao criticar (+) o que estou facendo é, obviamente, defender o principio da independencia (absolutamente lóxica) dos varios an de calquera combinación aiaj..., isto é, a miña crítica equivale á defensa de (4) e (1). hai máis demostracións de (1). unha delas, debida fundamentalmente a unha idea de Jeffreys e Wrinch11, comentarase máis polo miúdo no apéndice *viii. A idea principal pódese resumir como segue: Supoñamos que e é o explicandum ou, máis precisamente, un conxunto de feitos singulares ou datos que pretendemos explicar coa axuda dunha lei universal. haberá, en xeral, un número infinito de posibles explicacións (algunhas das cales poden ser mesmo mutuamente excluíntes, dados datos e), de tal maneira que a suma das súas probabilidades (dado e) non poden 10 O propio Jeffreys tira a conclusión contraria: el dá por válida a posibilidade do caso (3). 11 Philos. Magazine 42, 1921, p. 369 ss. 517 a lóxida da descuberta científica ser superiores a un. Mais isto significa que a probabilidade de case todos eles ten que ser cero, a non ser, xaora, que poidamos ordenar as posibles leis nunha sucesión infinita, para podermos atribuírlle a cada un unha probabilidade positiva de tal maneira que a súa suma converxa e non supere a unidade. Significa, ademais, que ás leis que aparecen antes na sucesión débeselles atribuír unha probabilidade meirande (en xeral) que ás leis que aparecen máis tarde na sucesión. Teriamos, logo, que asegurarnos de que se cumpre a seguinte condición de coherencia: O noso método de ordenación de leis nunca debe situar unha lei antes doutra se é posible demostrar que a probabilidade da segunda é meirande que a da primeira. Jeffreys e Wrinch tiñan algunhas razóns intuitivas para crer que se podía atopar un método de ordenación de leis que cumpra esta condición de coherencia e por iso propuxeron ordenar as teorías explicativas segundo a súa simplicidade en orde decrecente («postulado de simplicidade»), ou segundo a súa crecente complexidade, medindo a complexidade polo número de parámetros axustables á lei. Mais pódese demostrar (e demostrarase no apéndice *viii) que este método de ordenación, ou calquera outro método posible, infrinxe a condición da coherencia. Así que obtemos p(a, e) = 0 para todas as hipóteses explicativas, sexan cales sexan os datos e, isto é, obtemos (2) e, polo tanto, indirectamente, obtemos (1). (un aspecto interesante desta última demostración é que é válida mesmo nun universo finito, sempre que as hipóteses explicativas estean formuladas nunha linguaxe matemática que permita unha infinidade de hipóteses (mutuamente excluíntes). Por exemplo, podemos construír o seguinte universo1212. Nun taboleiro de xadrez moi ampliado, alguén coloca pequenos discos ou fichas do xogo das damas segundo a seguinte regra: 12 Un exemplo semellante úsase no apéndice *viii, texto a que refire a nota 2. 518 Karl Popper hai unha función definida matematicamente, ou curva, que esa persoa coñece pero que nós descoñecemos, e as fichas pódense colocar só nas cuadrículas que cadran na curva; dentro dos límites determinados por esta regra, pódense situar aleatoriamente. O noso cometido é observar a colocación das fichas e atopar unha «teoría explicativa», ou sexa, descubrir a curva matemática descoñecida, se é posible, e, se non, unha que se lle aproxime. Vai haber, claramente, unha infinidade de posibles solucións matematicamente incompatibles, aínda que algunhas delas serán indistinguibles con respecto ás fichas situadas no taboleiro. Calquera destas teorías pode ser refutada, obviamente, se se colocan as fichas no taboleiro despois de que a teoría fose anunciada. Aínda que se poida decidir que o «universo» (de posibles posicións) sexa finito, haberá, con todo, unha infinidade de teorías explicativas matematicamente incompatibles. Ben sei que os instrumentalistas e os operacionalistas poden dicir que as diferenzas entre dúas teorías que determinasen as mesmas cuadrículas «non significan nada». Mais, a parte de que este exemplo non forma parte do meu argumento (polo que realmente nin tería que responder a esta obxección), deberíase sinalar o seguinte: en moitos casos será posible atribuírlle «sentido» a estas diferenzas que «non significan nada» facendo que a malla sexa o suficientemente mesta, isto é, subdividindo as cuadrículas.) No apéndice *viii atoparase unha explicación detallada do feito de que non se cumpre a miña condición de coherencia. Con isto remato co problema da validez das fórmulas (1) e (2) e paso a discutir un problema formal que xorde do feito de que estas fórmulas sexan válidas, para que todas as teorías universais, independentemente do seu contido, teñan probabilidade cero. Non hai dúbida de que o contido ou a fortaleza lóxica de dúas teorías universais pode diferir enormemente. Tómense, por exemplo, dúas leis: a1 = «Todos os planetas desprázanse en círculo» e a2 = «Todos os planetas desprázanse en elipse». 519 a lóxida da descuberta científica Debido a que todos os círculos son elipses (con excentricidade cero), a1 implica a2, pero non viceversa. O contido de a1 é moito máis grande que o de a2. (hai, claro está, outras teorías, loxicamente máis fortes, que a1; por exemplo: «Todos os planetas desprázanse en círculos concéntricos arredor do sol»). O feito de que o contido de a1 exceda o de a2 ten suma importancia para todos os nosos problemas. Por exemplo, hai comprobacións de a1 (isto é, intentos de refutar a1 descubrindo algunha desviación da circularidade) que non son comprobación de a2, mais non podería haber proba xenuína de a2 que non fose, ao mesmo tempo, un intento de refutar a1. Así que a1 pode ser comprobado máis rigorosamente que a2, ten maior grao de comprobabilidade e, se supera as probas máis severas a que o sometan, atinxirá un grao máis alto de corroboración que a2. relacións semellantes poden existir entre dúas teorías, a1 e a2, mesmo se a1 non implica loxicamente a2, senón unha teoría da que a2 é unha boa aproximación. (Así, a1 pode ser a dinámica de Newton e a2 poden ser as leis de Kepler, que non derivan da teoría de Newton, senón que simplemente «derivan con boa aproximación»; véxase tamén o apartado *15 do meu Postscript). A teoría de Newton ten tamén máis comprobabilidade porque o seu contido é maior13. 13 Independentemente do que C. G. Hempel queira dicir por «proba confirmadora» dunha teoría, claramente non pode ser o resultado das probas que corroboran a teoría. Nos seus artigos sobre o tema (Journal of Symbolic Logic 8, 1943, p. 122 ss., e especialmente Mind 54, 1945, p. 1 ss. e 97 ss.; Mind 55, 1946, p. 79 ss.) Hempel afirma (Mind 54, p. 102 ss.) entre as súas condicións para a adecuación a seguinte (8.3): se e é unha proba confirmadora de varias hipóteses, poñamos h1 e h2, entón h1, h2 e e teñen que formar un conxunto coherente de enunciados. Mais os casos máis típicos e interesantes van no sentido contrario a isto. Sexan h1 e h2 as teorías de Newton da gravitación. Levan a resultados incompatibles no caso dos campos gravitatorios e no dos corpos en movemento rápido e, por tanto, contradinse. Mais, aínda así, todas as probas coñecidas que serven de apoio á teoría de Newton, serven tamén de apoio para a de Einstein e, por tanto, serven para corroborar ambas. A situación é moi parecida no caso das teorías de Newton e Kepler, ou as de Newton e Galileo. (Tamén o meu intento fracasado de atopar un cisne vermello ou amarelo corrobora ambas as dúas teorías que son contraditorias entre si en presenza do enunciado «hai polo menos un cisne»: (i) «Todos os cisnes son brancos» e (ii) «Todos os cisnes son negros»). 520 Karl Popper A nosa demostración de (1) deixa ver que estas diferenzas de contido e comprobabilidade non se poden expresar inmediatamente en termos dunha probabilidade lóxica absoluta das teorías a1 e a2, pois p(a1) = p(a2) = 0. E se definimos unha medida de contido, C(a), por C(a) = 1 p(a), como se afirma no libro, entón obtemos, de novo, C(a1) = C(a2), de maneira que as diferenzas de contido que nos interesan non se manifestan nestas medidas. (De xeito semellante, a diferenza entre un enunciado contraditorio consigo mesmo a e unha teoría universal a tampouco se manifesta pois e p(a ) = p(a) = 0 e C(a ) = C(a) = 1)14. Todo isto non significa que non poidamos expresar a diferenza de contido entre a1 e a2 en termos de probabilidade, polo De maneira bastante xeral, supoñamos que existe unha hipótese h, corroborada polo resultado e de probas rigorosas, e que h1 e h2 son dúas teorías incompatibles e que ambas implican h. (h1 pode ser ah e h2 pode ser h). Entón calquera proba de h éo tamén de h1 e h2, pois unha refutación de h refutaría tamén h1 e h2; e se e é o informe dos intentos fracasados de refutar h, entón e corroborará á vez h1 e h2. (Mais buscaremos, claro está, probas cruciais entre h1 e h2). Coas «verificacións» e «exemplificacións» ocorre, claro está, algo distinto. Mais estas non teñen por que ter nada que ver coas comprobacións. A parte desta crítica, débese indicar que na linguaxe modelo de Hempel non se pode expresar a identidade; véxase o seu artigo en The Journal of Symbolic Logic 8, 1943, o último parágrafo da p. 143, especialmente a liña 5 comezando a contar polo final do artigo, e a p. 21 do meu Prólogo, 1951. Para unha definición («semántica») de exemplar, véxase a última nota a rodapé da miña nota de Mind 64, 1955, p. 391. 14 1Que un enunciado contraditorio consigo mesmo poida ter a mesma probabilidade que un enunciado sintético coherente é inevitable en calquera teoría da probabilidade se se aplica a un universo de discurso infinito: esta é simplemente unha consecuencia da lei de multiplicación que esixe que p(a1a2... an) tenda a cero sempre que todos os ai sexan mutuamente independentes. Así, a probabilidade de lanzar n caras sucesivas dunha moeda é, segundo todas as teorías de probabilidade, 1/2n, que se transforma en cero se o número de lanzamentos é infinito. Un problema semellante de teoría da probabilidade é o seguinte: se poñemos nunha urna n bolas marcadas cos números 1 a n e as mesturamos, cal é a probabilidade de sacar unha bola marcada cun número primo? A solución ben coñecida deste problema, coma no caso anterior, tende a cero cando n tende ao infinito, o cal significa que a probabilidade de sacar unha bola marcada cun número divisible é 1, pois n  ∞, aínda que hai un número infinito de bolas con números non divisibles na urna. Este resultado ten que ser o mesmo en calquera teoría adecuada da probabilidade. Non se debe, xa que logo, sinalar unha teoría particular da probabilidade, coma a teoría da frecuencia, para criticala alegando que é «polo menos lixeiramente paradoxal» por dar este resultado perfecto (unha crítica deste estilo atópase en W. Kneale, Probability and Induction, 1949, p. 156). En vista do noso último «problema da teoría da probabilidade» (o de sacar bolas numeradas), seméllame igualmente ilexítima a crítica de Jeffreys aos que falan de «distribución de probabilidade de números primos» (cf. Theory of Probability, 2a edición, p. 38, nota ao pé). 521 a lóxida da descuberta científica menos nalgúns casos. Por exemplo, o feito de que a1 implique a2 pero non viceversa daría lugar a p(a1, a2) = 0; p(a2, a1) = 1 aínda que deberiamos ter, ao mesmo tempo, p(a1) = p(a2) = 0. Deberiamos ter, logo, p(a1, a2) < p(a2, a1) que sería unha indicación do maior contido de a1. O feito de que haxa estas diferenzas de contido e de probabilidade lóxica absoluta que non se manifestan inmediatamente polas correspondentes medidas pódese expresar dicindo que hai unha «estrutura fina» de contido, e de probabilidade lóxica, que nos pode permitir diferenciar entre contidos e probabilidades absolutas menores ou maiores mesmo en casos en que as medidas C(a) e p(a) sexan demasiado imprecisas e insensibles ás diferenzas, isto é, en casos en que dan igualdade. Para expresar esta estrutura fina, podemos usar os símbolos « » («é maior») e « » («é menor»), en lugar dos símbolos ordinarios «>» e «<». (Tamén podemos usar « » para «é maior ou igual» e « » para «é menor ou igual»). O uso destes símbolos pódese explicar por medio das seguintes regras: (1) «C(a) C(b)» e, logo, o seu equivalente «p(b) p(a)» pódese usar para afirmar que o contido de a é maior que o de b (polo menos no senso da estrutura fina de contido). xa que logo, asumiremos que C(a) C(b) implica C(a) C(b), e que isto á vez implica (C(a)  C(b), isto é, a falsidade de C(a) < C(b). Ningunha das implicacións opostas é válida. (2) C(a) C(b) e C(a) C(b) xuntos implican C(a) = C(b), mais C(a) = C(b) é compatible con C(a) C(b), ou con C(a) C(b) e, obviamente, tamén con C(a) C(b) e con C(a) C(b). (3) C(a) > C(b) sempre implica C(a) C(b). (4) Serán válidas as regras correspondentes para p(a) p(b), etc. 522 Karl Popper Agora xorde o problema de determinar os casos en que podemos dicir que C(a) C(b) é válida aínda que teñamos C(a) = C(b). Moitos casos son bastante claros, por exemplo, a implicación unilateral de b por a. Máis xeralmente, eu propoño a seguinte regra: Se para todos os universos finitos suficientemente grandes (isto é, para todos os universos con máis de N números, para un N suficientemente grande), temos C(a) > C(b) e, por tanto, de acordo coa regra (3), C(a) C(b), obtemos C(a) C(b) para un universo infinito mesmo se, para un universo infinito, obtemos C(a) = C(b). Este regra semella cubrir todos os casos de interese, aínda que quizais non todos15. O problema de a1 = «Todos os planetas desprázanse en círculo» e a2 = «Todos os planetas desprázanse en elipse» claramente queda cuberto pola nosa regra, e tamén o problema de comparar a1 e a3 = «Todos os planetas desprázanse en elipses cunha excentricidade distinta de cero», pois p(a3) > p(a1) será válida en universos finitos suficientemente grandes (de posibles observacións, digamos) no senso simple de que hai máis posibilidades compatibles con a3 que con a1. * A estrutura fina de contido e de probabilidade tratada aquí afecta non só os límites, 0 e 1, do intervalo de probabilidade, senón que, en principio, afecta todas as probabilidades entre 0 e 1. Sexan a1 e a2 leis universais onde p(a2) = 0 e p(a1) p(a2), coma antes; supoñamos que b non é implicado nin por a1 nin por a2, nin polas súas negacións; e sexa 0 < p(b) = r < 1. Entón temos p(a1 v b) = p(a2 v b) = r 15 Trátanse problemas relacionados en considerable detalle nun artigo moi suxestivo de John Kemeny titulado «A Logical Measure Function», Journal of Symbolic Logic 18, 1953, p. 289 ss. A linguaxe modelo de Kemeny é a segunda das tres a que aludo na p. xxiv do meu Prólogo, 1958. Na miña opinión é, de lonxe, a máis interesante das tres. Como el mostra na p. 294, a súa linguaxe é tal que os teoremas infinitistas (coma o principio de que todo número ten un sucesor) non poden ser demostrables dentro dela. Por tanto, non pode conter o sistema habitual da aritmética. 523 a lóxida da descuberta científica e ao mesmo tempo p(a1 v b) p(a2 v b). Do mesmo xeito, temos p( 1 b) = p( 2 b) = r e ao mesmo tempo p( 1 b) = p( 2 b), porque p( 1) p( 2) aínda que p( 1) = p( 2) = 1. Así que podemos ter para todo b tal que p(b) = r, un c1 tal que p(c1) = p(b) e p(c1) p(b), e tamén un c2 tal que p(c2) = p(b) e p(c2) p(b). Todo isto é importante para o tratamento da simplicidade ou a dimensión dunha teoría. Este problema comentarase máis a fondo no próximo apéndice. Addenda, 1972 No último parágrafo do Apéndice anterior, eu insinuara que a idea da estrutura fina de probabilidade podería ser de relevancia para a comparación da simplicidade e a dimensión de teorías. Pero o oposto tamén é certo. A simplicidade e, en especial, a dimensión dunha teoría son relevantes para a teoría da súa estrutura fina, como se verá nas primeiras páxinas do seguinte Apéndice. A dimensión dunha teoría é relativa ao campo de aplicación e, xa que logo, a un conxunto de problemas para os que a teoría ofrece algunha solución (a mesma relativización será relevante para a estrutura fina das teorías e, por tanto, para a súa «idoneidade»). 524 Karl Popper APÉNDICE *VIII Contido, simplicidade e dimensión Como se indicou anteriormente11, non creo que se deba dificultar a linguaxe científica impedíndolles ás persoas científicas usaren libremente, sempre que o xulguen conveniente, novas ideas, predicados, conceptos «ocultos» ou calquera outra cousa. Por esta razón, non podo estar a favor dos varios intentos de introducir na filosofía da ciencia o método dos cálculos artificiais ou «sistemas lingüísticos», uns sistemas que supostamente son un modelo simplificado da «linguaxe da ciencia». Eu creo que estes intentos, ademais de non serviren de nada polo de agora, contribuíron a crear a confusión e o escurantismo que imperan na filosofía da ciencia. No apartado 38 e no apéndice i comentouse brevemente que, se tivésemos enunciados (absolutamente) atómicos ao noso dispor (ou, o que é o mesmo, predicados (absolutamente) atómicos), entón poderiamos introducir, como medida do contido dunha teoría, o recíproco do número mínimo de enunciados atómicos que se necesitan para refutar unha teoría. Como o grao de contido dunha teoría é o mesmo que o grao de comprobabilidade ou de refutabilidade e, xa que logo, o que ten maior contido (dito de xeito breve, canto máis pequeno sexa o número de enunciados atómicos que se necesitan para compoñer un falsificador potencial, maior será o contido da teoría). Mais eu non quero operar nin coa ficción dos enunciados atómicos nin cun sistema lingüístico artificial que dispoña de enunciados atómicos, pois seméllame bastante claro que na ciencia non hai dispoñibles predicados atómicos «naturais». Para os antigos lóxicos, os predicados «home» e «mortal» parece que se presentaban como exemplos de algo do estilo 1 Véxase o apartado 38, especialmente o texto posterior á nota 2 e o apéndice i; tamén o meu segundo Prólogo, 1958. 525 a lóxida da descuberta científica dos predicados atómicos. Carnap usa «azul» ou «morno» como exemplos, talvez porque «home» e «mortal» son ideas altamente complexas que (segundo algúns) se poden definir en termos de ideas máis simples como «azul» ou «quente». Así e todo, nas discusións científicas estes predicados, ou outros calquera, non se adoitan considerar como enunciados (absolutamente) atómicos. Dependendo do problema que se estea a tratar, «home» e «mortal» non son as únicas ideas altamente complexas, senón que ideas como «azul» ou «quente» tammén poden ser consideradas altamente complexas: poñamos, o «azul» como cor do ceo, que é explicable en termos de teoría atómica. Mesmo o termo fenoménico «azul» se pode considerar, en certos contextos, como algo definible, ou sexa, como un tipo de imaxes visuais que se corresponden con certos estímulos fisiolóxicos. A discusión científica caracterízase porque se leva a cabo en condicións de liberdade, polo que os intentos de limitar a súa liberdade, atándoa ao leito de Procusto dun sistema lingüístico preestablecido, implicaría a fin da ciencia. Por todas estas razóns eu negueime de antemán á idea de usar enunciados atómicos para medir o grao de contido ou simplicidade dunha teoría e propuxen usar, en lugar deles, a idea de enunciados atómicos relativos e, indo un pouco máis alá, a idea dun campo de enunciados que son atómico-relativos con respecto a unha teoría ou conxunto de teorías para cuxa comprobación contribúen de xeito relevante, e un campo F que se podería entender como campo de aplicación da teoría ou do conxunto de teorías. Collendo de exemplo, de novo, o xa usado no apéndice anterior, as dúas teorías a1 = «Todos os planetas desprázanse en círculo» e a2 = «Todos os planetas desprázanse en elipse», entón podemos tomar como campo todos os enunciados da forma «No momento temporal x o planeta y estaba na posición z», que serán os nosos enunciados atómicos relativos. E se asumimos que xa sabemos que a traxectoria do planeta é unha 526 Karl Popper curva plana, entón podemos coller un papel cuadriculado que representa o campo e sinalar as varias posicións, marcando en cada caso o tempo e o nome do planeta de que se trate, co fin de que cada anotación represente un dos enunciados atómicos relativos. (Podemos facer que a representación sexa tridimensional, xaora, marcando a posición cun alfinete cuxa lonxitude represente o tempo, medido desde un suposto instante cero; as variacións na cor da cabeza do alfinete pódense usar para indicar os nomes dos varios planetas). xa se explicou, sobre todo nos apartados 40 a 46, e no vello apéndice i, como se podería usar o número mínimo de enunciados atómicos relativos que se necesitan para refutar unha teoría dada para medir a complexidade dunha teoría. E quedou demostrado alí que a simplicidade formal dunha teoría se pode medir pola escaseza dos seus parámetros, na medida en que esta escaseza non fose resultado dunha redución «formal», e non «material», no número de parámetros (cf. especialmente apartados 40, 44 ss. E o apéndice 1). Pois resulta que todas estas comparacións da simplicidade das teorías e dos seus contidos equivales, claramente, ás comparacións da «estrutura fina» dos seus contidos, no senso explicado no apéndice anterior, porque as súas probabilidades absolutas serán todas iguais (isto é, iguais a cero). O que pretendo facer eu aquí é, en primeiro lugar, demostrar que o número de parámetros dunha teoría (con respecto a un campo de aplicación) se pode interpretar como medición da estrutura fina do seu contido. Para isto, o que teño que demostrar é que para un universo suficientemente grande, a teoría que teña maior número de parámetros sempre será máis probable (no senso clásico) que a que teña menos número de parámetros. Isto pódese mostrar da seguinte maneira: no caso dun campo xeográfico de aplicacións, está claro que o noso universo de posibles acontecementos, cada un descrito por un posible enun527 a lóxida da descuberta científica ciado atómico relativo, é infinito. Como se mostra no apartado 38 e seguintes, neste caso podemos comparar dúas teorías con respecto á dimensión, máis que o número, de posibilidades que deixan abertas, isto é, as posibilidades que son favorables a elas. A dimensión destas posibilidades resulta ser igual ao número de parámetros. Agora substituímos o universo infinito de enunciados atómicos relativos por un universo finito (aínda que grande) de enunciados atómicos relativos, que corresponden ao exemplo do taboleiro de xadrez do apéndice anterior2. Isto é, temos que supoñer que todo enunciado atómico relativo se refire a unha cuadrícula de lado ε como posición dun planeta antes que a un punto do plano, e que as posibles posicións non se sobrepoñen3. De xeito lixeiramente diferente ao exemplo do apéndice anterior, agora substituímos as varias curvas, que son a representación xeométrica habitual das nosas teorías, por «cuasicurvas» (dunha anchura aproximadamene igual a ε), isto é, por conxuntos, ou cadeas de cuadrículas. Como resultado de todo isto, o número de posibles teorías vólvese finito. Consideremos agora a representación dunha teoría con d parámetros que no caso continuo se representaba por un continuo d-dimensional cuxos puntos (d-uplas) representaban unha curva cada un. Observamos que podemos continuar a usar unha representación semellante, coa excepción de que o continuo d-dimensional será substituído por un arranxo d-dimensional de «cubos» d-dimensionais (co lado ε). Cada cadea destas curvas agora representará unha «cuasicurva» e, en consecuencia, unha das posibilidades favorables á teoría, e o arranxo d-dimensional 2 Cf. apéndice *vii, texto a que refire a nota 12. 3 A suposición de que as posibles posicións non se sobrepoñan faise para simplificar a exposición. Poderiamos supoñer igualmente que dúas cuadrículas adxacentes calquera se sobrepoñen parcialmente, poñamos, nun cuarto da súa área; ou poderiamos substituír as cuadrículas por círculos sobrepostos (sobrepostos ata permitirnos cubrir toda a área con eles). Esta última suposición estaría un pouco máis próxima dunha interpretación das «posicións» en termos de resultados nunca absolutamente precisos de todas as posibles medicións de posicións. 528 Karl Popper representará o conxunto de todas as «cuasicurvas» compatibles coa teoría ou favorables a ela. Agora podemos dicir que a teoría que teña menos parámetros, isto é, o conxunto de cuasicurvas que se representa por un arranxo de menores dimensións, non só terá menos dimensións, senón que tamén conterá un número menor de «cubos», isto é, de posibilidades favorables. Así que existe boa xustificación para aplicarmos os resultados do apartado anterior: se a1 ten menos parámetros que a2, podemos afirmar que, nun universo suficientemente grande pero non infinito, teremos p(a1) < p(a2) e, por tanto, (*) p(a1) p(a2). Mais a fórmula (*) segue a ser válida cando supoñemos que ε tende a cero, que no límite equivale a substituír un universo finito por outro infinito. Chegamos, por tanto, ao seguinte teorema. (1) Se o número de parámetros de a1 é menor que o de a2, entón a asunción p(a1) < p(a2) contradí as leis do cálculo de probabilidade. Escribindo «dF(a)» ou, de xeito máis simple, «d(a)», para a dimensión da teoría a (con respecto ao campo de aplicación F) podemos formular o teorema como segue: (1) Se d(a1) < d(a2) entón p(a1) p(a2); en consecuencia, «p(a1) > p(a2)» é incompatible con «d(a1) < d(a2)». Este teorema (que está implícito no que se dixo no corpo principal do libro) está en liña coas seguintes consideracións. unha teoría a require un mínimo de d(a) + 1 enunciados atómicos relativos para ser refutada. Os seus falsificadores máis febles, como os poderiamos denominar, están formados por unha conxunción de d(a) + 1 enunciados atómicos relativos. 529 a lóxida da descuberta científica Isto significa que se n  d(a), entón ningunha conxunción de n enunciados atómicos relativos é loxicamente o suficientemente forte para deducir deles , isto é, a negación de a. A forza ou contido de , segundo isto, pódese medir por d(a) + 1, pois a será máis forte que calquera conxunción de d(a) enunciados atómico relativos, mais con certeza que non será máis forte que algunhas conxuncións de d(a) + 1 de tales enunciados. Pero a partir da regra de probabilidade p( ) = 1 – p(a) sabemos que a probabilidade dunha teoría a diminúe segundo aumenta a probabilidade da súa negación , e viceversa, e tamén que se establecen as mesmas relacións entre os contidos de a e de . Disto observamos, de novo, que d(a1) < d(a2) quere dicir que o contido de a1 é maior que o de a2, de maneira que d(a1) < d(a2) implica p(a1) p(a2), e é, por tanto, incompatible con p(a1) > p(a2). Mais este resultado non é máis que o teorema (1) deducido antes. O noso teorema deducíuse considerando universos finitos e, en realidade, é independente da transición a universais infinitos. É independente, por tanto, das fórmulas (1) e (2) do apéndice precedente, isto é, do feito de que nun universo infinito, para unha lei universal a e unha sucesión finita e calquera, temos (2) p(a) = p(a, e) = 0. Podemos, logo, usar (1) con toda lexitimidade para outra dedución de (2), e isto pódese facer, en efecto, se utilizamos unha idea debida a Dorothy Wrinch e harold Jeffreys. Como se indicou de pasada no apéndice anterior4, Wrinch e Jeffreys observaron que se temos unha infinidade de teorías explicativas mutuamente incompatibles ou excluíntes, a suma das probabilidades destas teorías non pode ser superior a 1, de maneira que case todas estas probabilidades teñen que ser cero, a menos que poidamos ordenar as teorías nunha sucesión, 4 Cf. apéndice *vii, texto a que refire a nota 11. 530 Karl Popper asignándolle a cada unha, como probabilidade, un valor procedente dunha sucesión converxente de fraccións cuxa suma non exceda 1. Por exemplo, podemos facer as seguintes asignacións: podemos asignar o valor 1/2 á primeira teoría, 1/22 á segunda e, en xeral, 1/2n á enésima. Mais tamén podemos asignar a cada unha das primeiras 25 teorías o valor 1/50, isto é, 1/(2.25); a cada unha das seguintes 100, poñamos, o valor 1/400, isto é, 1/ (22.100), etc. Porén, independentemente de como construamos a orde das teorías e de como lles atribuamos as nosas probabilidades, sempre haberá algún valor de probabilidade máximo, digamos P (como 1/2) no noso primeiro exemplo, ou 1/50) e este valor P atribuiráselles como máximo a n teorías (onde n é un número finito e n.P < 1). Cada unha destas n teorías ás que se lles asignou a probabilidade máxima P, ten unha dimensión. Sexa D a dimensión máxima presente nestas n teorías e sexa a1 unha delas, sendo d(a1) = D. Neste caso, claramente, ningunha das teorías con dimensións superiores a D estará entre as nosas n teorías coa probabilidade máxima. Sexa a2 unha teoría cunha dimensión superior a D, tal que d(a2) > D = d(a1). Entón esta atribución conduce a: (-) d(a1) < d(a2) e p(a1) > p(a2). Este resultado mostra que se infrinxe o noso teorema (1). Mais é inevitable que unha atribución do tipo da descrita leve a este resultado se queremos evitar atribuírlle a mesma probabilidade (ou sexa, cero) a todas as teorías. En consecuencia, o noso teorema (1) implica a atribución de cero probabilidades a todas as teorías. Wrich e Jeffreys, pola súa banda, chegaron a un resultado moi diferente. Eles crían que a posibilidade do coñecemento empírico precisaba a posibilidade de aumentar a probabilidade dunha lei mediante a acumulación de información favorable a ela. Disto eles concluían que (2) tiña que ser falso, ademais de pensar que tiña que existir un método lexítimo de atribución de probabilidades distintas de cero a unha sucesión infinita de 531 a lóxida da descuberta científica teorías explicativas. Wrinch e Jeffreys, por tanto, tiraron conclusións positivas moi fortes a partir do argumento «transcendental», como lle chamei eu no apéndice anterior5. Crendo, como crían eles, que un aumento na probabilidade significaba un aumento do coñecemento (de maneira que obter unha alta probabilidade se convertía nun obxectivo da ciencia), non tiveron en conta que é posible aprender cada vez máis da experiencia sobre leis universais sen incrementar para nada a súa probabilidade; ou sexa, que é posible someter a probas e corroborar cada vez mellor algunhas delas, aumentando así o seu grao de corroboración, mais sen alterar en absoluto a súa probabilidade, que continúa tendo un valor cero. Jeffreys e Wrinch nunca describiron dunha maneira suficientemente clara a sucesión de teorías, e a atribución de valores de probabilidade. A súa idea principal, que eles denominan «postulado de simplicidade»6, é que as teorías se deberían ordenar de tal maneira que aumentase a súa complexidade, ou o número de parámetros, ao tempo que decrecían as probabilidades que eles lles atribuían. Isto significaría, incidentalmente, que dúas teorías calquera da sucesión infrinxirían o noso teorema (1). Mais esta ordenación non se pode realizar, como o propio Jeffreys sinalou, pois pode haber teorías que teñan o mesmo número de parámetros. Jeffreys dá os exemplos y = ax e y = ax2, dos cales afirma: «pódese considerar que teñen a mesma probabilidade previa as leis que teñan o mesmo número de parámetros»7. Mais o número de leis que teñen a mesma probabilidade previa é infinita: y = ax3, y = ax4, ... y = axn, etc., sendo n  ∞. Así que o noso problema volveríase presentar para cada número de parámetros da mesma maneira que para toda a sucesión. 5 Cf. nota 3 do apéndice *vii. 6 Na súa Theory of Probability, apartado 3.0, Jeffreys afirma sobre o «postulado de simplicidade» que «non é... un postulado separado, senón unha aplicación inmediata da regra 5». Mais todo o que a regra 5 contén como referencia á regra 4 (as dúas formuladas no apartado 1.1) é unha forma moi vaga do principio «transcendental». Así que non afecta o noso argumento. 7 Theory of Probability, parágrafo 3.0 (1a edición, p. 95; 2a edición, p. 100). 532 Karl Popper Ademais, o propio Jeffreys recoñece, no mesmo parágrafo 3.08, que unha lei, coma tal a1, pode ser obtida dunha lei a2 con un parámetro adicional, supoñendo simplemente que este parámetro é igual a cero; e que, neste caso, p(a1) < p(a2), pois a1 é un caso especial de a2, de maneira que a a1 corresponden menos posibilidades9. Así, neste caso especial, recoñece que unha teoría que teña menos parámetros será menos probable que unha teoría que teña máis parámetros, concordando, por tanto, co noso teorema (1). Mais el recoñece isto só neste caso especial e non di nada sobre o feito de que poida xurdir unha contradición entre o seu postulado de simplicidade e este caso. En conxunto, Jeffreys non intenta mostrar que o postulado de simplicidade é coherente co seu sistema axiomático. Mais, en vista do caso especial mencionado (que, obviamente, deriva do seu sistema axiomático), debería quedar claro que se necesitaba urxentemente unha demostración de coherencia. As nosas propias consideracións mostran que non se pode proporcionar unha demostración de coherencia e que o «postulado de simplicidade» ten que contradicir necesariamente todo sistema axiomático adecuado de probabilidade, pois ten que infrinxir o noso teorema (1). Para rematar este apéndice, gustaríame intentar ofrecer unha explicación de por que Wrinch e Jeffreys considerarían que o seu «postulado de simplicidade» non tería consecuencias ou que non xeraría problemas. Débese lembrar que eles foron os primeiros en identificaren a simplicidade e a escaseza de parámetros (non fago unha simple identificación entre as dúas: distingo entre a redución formal e a material no número de parámetros –cf. apartados 40, 44, 45– e a simplicidade intuitiva tórnase en algo parecido á simplicidade formal; polo demais, a miña teoría da simplicidade concorda coa de Wrinch e Jeffreys neste punto). Tamén 8 Ob. cit., 1a edición, p. 96; 2a edición, p. 101. 9 Jeffreys, l. cit., sinala que «a metade da probabilidade previa [de a2] se concentra en αm+1=0», que semella significar que p(a1) = p(a2)/2, mais esta regra pode dar lugar a contradicións se o número de parámetros de a2 é maior de 2. 533 a lóxida da descuberta científica viron claramente eles que a simplicidade é un dos obxectivos das persoas científicas, que prefiren unha teoría máis simple a unha máis complicada, polo cal proban primeiro coas teorías máis simples. No relativo a isto, Wrinch e Jeffreys tiñan razón, igual que na súa crenza de que existen comparativamente poucas teorías simples e moitas complexas que van en aumento segundo aumenta o número dos seus parámetros. Isto último puido levalos a crer que as teorías complexas eran as menos probables (dado que a probabilidade dispoñible había que dividila dalgún xeito entre as varias teorías). E debido a que eles tamén asumían que un alto grao de probabilidade era sinal de alto grao de coñecemento e, por tanto, que era un dos obxectivos da ciencia, deberon pensar que era intuitivamente evidente que a teoría máis simple se debía identificar coa máis probable (por tanto, tamén coa máis desexable), pois, se non, os obxectivos da ciencia volvíanse incoherentes. Así que o postulado de simplicidade parecía necesario por razóns intuitivas e, por tanto, coherente a fortiori. Mais, unha vez que nos decatamos de que a ciencia non ten, nin pode ter, como obxectivo o acadar un alto grao de probabilidade, e de que a impresión oposta se debe a unha confusión da idea intuitiva de probabilidade con outra idea intuitiva (aquí etiquetada como «grao de corroboración»10), tamén queda claro para nós que a simplicidade, ou escaseza de parámetros, está relacionada, e tende a aumentar, coa improbabilidade, máis que coa probabilidade. E, por tanto, tamén nos quedará claro que un 10 Móstrase no punto 8 da miña «Terceira Nota», incluída no apéndice *ix, que se h é unha hipótese estatística que afirma «p(a, b) = 1», entón despois de n probas rigorosas pasadas pola hipótese h, o seu grao de corroboración será n/(n+2) = 1 - (2/(n + 2)). Hai unha sorprendente semellanza entre esta fórmula e a «regra de sucesión» de Laclace, segundo a cal a probabilidade de h superar a súa próxima comprobación é (n + 1) / (n – 2) = 1 – (1/(n + 2)). A semellanza numérica destes resultados, xunto coa non diferenciación entre probabilidade e corroboración, pode explicar por que os resultados de Laclace e outros parecidos semellaban ser intuitivamene satisfactorios. Eu creo que o resultado de Laplace é erróneo porque me parece que os seus presupostos (teño en mente o que eu chamo «distribución laplaciana») non son aplicables aos casos que el ten en mente; mais estes presupostos si que son aplicables a outros casos, permitíndonos facer estimacións sobre a probabilidade absoluta dun informe sobre unha mostra estatística. Cf. a mina «Terceira Nota» (apéndice *ix). 534 Karl Popper alto grao de simplicidade está, con todo, relacionado cun alto grao de corroboración, pois un alto grao de comprobabilidade ou corroborabilidade é o mesmo que a alta probabilidade previa ou simplicidade. O problema da corroboración tratarase no seguinte apéndice. Addenda, 1967 Se lembramos o que se dixo no vello apéndice i (p. 283) sobre a dimensión dunha teoría a, relativa ao campo F, isto é, dF(a), e o que se dixo no presente apéndice sobre os falsificadores máis febles dunha teoría, podemos introducir unha medida da simplicidade ou o contido de a con relación a F, CtF (a), como segue: CtF (a) = 1/(dF (a)+1) Esta é unha medida da estrutura fina do contido dunha teoría (con relación a F), pois pode ser aplicable onde as probabilidades son imposibles de distinguir, porque p(a) = 0. Por certo, sempre se debería considerar que a simplicidade é relativa a un problema dado de explicación (véxase a nota 24 do capítulo 10, p. 241, do meu libro Conjectures and Refutations, na segunda edición [revisada], 1965 [e posteriores]). Addenda, 1972 ás veces descubrimos unha nova conexión entre problemas científicos. Así, se a simplicidade dunha teoría é relativa aos problemas que a teoría intenta resolver, entón tamén é, nalgunha medida, relativa á situación e o problema históricos de que se trate. Queda claro con isto que os problemas de contido e simplicidade dunha teoría poden cambiar no curso do desenvolvemento histórico dunha ciencia. 535 a lóxida da descuberta científica APÉNDICE *Ix Corroboración, peso das probas e comprobacións estatísticas As tres notas reimpresas no presente apéndice foron publicadas orixinalmente en The British Journal for the Philosophy of Science1. Mesmo antes de ser publicado o meu libro, tiven a sensación de que o problema do grao de corroboración era un deses que había que continuar investigando. Por «problema do grao de corroboración» quero dicir o problema de (i) mostrar que existe unha medida (que se denominará grao de corroboración) da rigorosidade das comprobacións a que foi sometida unha teoría e mais da maneira en que superou, ou non, estas probas, e (ii) mostrar que esta medida non pode ser unha probabilidade ou, máis concretamente, que non cumpre as leis formais do cálculo de probabilidade. No meu libro hai un esbozo de solución para ambos os dous cometidos, en especial o segundo, mais eu tiña a sensación de que cumpría algo máis. Non chegaba con demostrar o fracaso das teorías existentes da probabilidade, a de Keynes e a de Jeffreys, por exemplo, a de Kaila ou a de reichenbach, ningunha das cales foi capaz de establecer nin sequera a súa doutrina central: que unha lei universal, ou unha teoría, podería algunha vez atinxir unha probabilidade > 1⁄2 (nin sequera foron capaces de establecer que unha lei ou teoría universal podía ter unha probabilidade que non fose cero). O que facía falta era un tratamento xeral da probabilidade. Así que eu propúxenme construír un cálculo formal da probabilidade que puidese ser interpretado en varios sentidos. O que eu tiña en mente era (i) o sentido lóxico, esbozado no meu libro como probabilidade 1 B. J. P. S. 5, 1954, p. 143 ss. (véxanse tamén as correccións nas pp. 334 e 359); B. J. P. S. 7, 1957, p. 350 ss. e B. J. P. S. 8, 1958, p. 294 ss. 536 Karl Popper lóxica (absoluta) de enunciados, (ii) o sentido dunha probabilidade lóxica relativa de enunciados ou proposicións, como pretendera Keynes, (iii) o sentido do cálculo de frecuencias relativas en sucesións, (iv) o sentido do cálculo dunha medida de ámbitos, predicados, clases ou conxuntos. O obxectivo último era, xaora, demostrar que o grao de corroboración non é unha probabilidade, isto é, que non é unha das posibles interpretacións do cálculo de probabilidade. Así e todo, eu decateime de que non só era necesario construír un cálculo formal para este fin, senón que era un cometido interesante en si mesmo. Por iso escribín o artigo publicado en Mind, reimpreso aquí como apéndice *ii, e por iso continuei traballando durante moitos anos cos obxectivos de simplificar os meus sistemas axiomáticos e mais de construír un cálculo de probabilidade en que p(a, b) (a probabilidade de a dado b) puidese ter valores definidos, en lugar de 0/0, aínda que p(b) sexa igual a cero. O problema xorde, obviamente, porque a definición p(a, b) = p(ab)/p(b) falla se p(b) = 0. Facía falta unha solución para este último problema porque eu axiña descubrín que, para definir C(x, y) (o grao de corroboración da teoría x polas probas y), tiña que operar con algún inverso, p(y, x), que Fisher denomina a verosimilitude de x (vista as probas y, ou dado y; nótese que tanto a miña «corroboración» como a verosimilitude de Fisher pretenden medir a aceptabilidade da hipótese x; é x, por tanto, o que é importante, mentres que y representa só probas empíricas cambiantes ou, como eu prefiro dicir, os informes dos resultados das comprobacións). Ora ben, eu estaba convencido de que se x é unha teoría, entón p(x) = 0. Decateime de que tiña que construír un novo cálculo de probabilidade en que a verosimilitude p(y, x) puidese ser un 537 a lóxida da descuberta científica número definido, distinto de 0/0, aínda que x fose unha teoría universal onde p(x) = 0. Agora explicarei brevemente como xorde o problema de p(y, x), da verosimilitude de x. Se se nos pide que deamos un criterio do feito de que as probas y apoien, corroboren ou confirmen un enunciado x, a resposta máis obvia é que «y aumenta a probabilidade de x». Isto pódese poñer en símbolos escribindo «Co(x, y)» para «x é apoiado, corroborado ou confirmado por y». logo poderemos confirmar o noso criterio como segue: (1) Co(x, y) se e só se p(x, y) > p(x) Esta formulación, con todo, ten un defecto, pois se x é unha teoría universal e y probas empíricas, entón, como vimos nos dous apéndices anteriores2, (2) p(x) = 0 = p(x, y). Mais disto deduciríase que, para unha teoría x e as probas y, Co(x, y) sempre é falso ou, noutras palabras, que unha lei universal nunca pode ser apoiada, corroborada ou confirmada polas probas empíricas. (Isto é válido non só para un universo infinito, senón tamén para calquera universo extremadamente grande, coma o noso, pois neste caso p(x, y) e p(x) serán inconmensurablemente pequenos e, por tanto, practicamente iguais.) Esta dificultade, con todo, pódese superar da seguinte maneira: sempre que p(x) ≠ 0 ≠ p(y), temos (3) p(x, y) > p(x) se e só se p(y, x) > p(y), así que podemos transformar (1) en (4) Co (x, y) se, e só se, p(x, y) > p(x) ou p(y, x) > p(y). 2 Véxase, especialmente, o apéndice *vii, fórmulas (1) e (2), e mais o apéndice *viii, fórmula (2). 538 Karl Popper Agora, sexa x de novo unha lei universal e sexa b proba empírica que, poñamos, se deduce de x. Neste caso, isto é, sempre que y se deduza de x, diremos, intuitivamente, que p(y, x) = 1. E, como y é empírico, para que p(y) sexa con certeza menor de 1, entón encontramos que (4) se pode aplicar e que a afirmación Co(x, y) será verdadeira. Isto é, x pode ser corroborado por y se y se deduce de x, sempre que p(y) < 1. Así que (4) é perfectamente satisfactorio desde un punto de vista intuitivo mais, para operar libremente con (4), cómprenos un cálculo de probabilidade en que p(y, x) sexa un número definido (no noso caso, 1), en vez de 0/0, mesmo se p(x) = 0. Para conseguir isto, hai que ofrecer unha xeneralización do cálculo habitual, como se explicou antes. Aínda que eu xa me decatara disto á altura en que a miña nota apareceu en Mind (cf. apéndice ii), outros traballos que eu daquela consideraba máis urxentes impedíronme completar as miñas investigacións neste campo. Por iso os meus resultados sobre o grao de corroboración non foron publicados ata 1954, na primeira das notas reimpresas aquí, e tiveron que pasar outros seis meses antes de eu publicar o sistema axiomático de probabilidade relativa3 (que, aínda que menos simple, é equivalente ao que se atopará no apéndice *iv) que cumpría a esixencia de que p(x, y) tiña que ser un número definido aínda que p(y) fose igual a cero. Este artigo proporciona os prerrequisitos técnicos necesarios para unha definición satisfactoria da probabilidade e o grao de corroboración ou confirmación. A miña primeira nota, «Degree of Confirmation», publicada en 1954 en B. J. P. S., contén unha refutación matemática de todas aquelas teorías da indución que identifican o grao en que un enunciado é apoiado, confirmado ou corroborado por proba empírica co seu grao de probabilidade no senso do cálculo de probabilidade. A refutación consiste en mostrar que, se identi3 Véxase B. J. P. S. 6, 1955, pp. 56-57. 539 a lóxida da descuberta científica ficamos grao de corroboración ou confirmación con probabilidade, entón veriamonos abocados a adoptar varias ideas altamente paradoxais, entre elas a seguinte afirmación claramente contraditoria: (*) hai casos en que x é apoiado con forza por z e y é fortemente cuestionado por z, mentres que, ao mesmo tempo, x é confirmado por z en menor medida que y. No punto 6 da miña primeira nota4 atoparase un exemplo sinxelo que demostra que, se identificamos corroboración ou confirmación con probabilidade, esa é a consecuencia devastadora a que daría lugar. En vista da brevidade desa pasaxe, vou explicar de novo aquí este punto. Considérese o próximo lanzamento dun dado regular. Sexa x o enunciado «sairá 6»; sexa y a súa negación, isto é, sexa y = ; e sexa z a información «sairá un número par». Temos as seguintes probabilidades absolutas: p(x) = 1/6; p(y) = 5/6; p(z) = 1/2 Ademais, temos as seguintes probabilidades relativas: p(x, z) = 1/3; p(y, z) = 2/3. Vemos que x é apoiado pola información z, pois z aumenta a probabilidade de x de 1/6 a 2/6 = 1/3. Tamén vemos que y é cuestionado por z, pois z diminúe a probabilidade de y na mesma cantidade, de 5/6 a 4/6 = 2/3. Aínda así, temos p(x, z) < p(y, z). Este exemplo proba o seguinte teorema: (5) Existen enunciados x, y e z que cumpren a fórmula p(x, z) > p(x) & p(y, z) < p(y) & p(x, z )< p(y, z). 4 En contraste co exemplo dado aquí no texto, os exemplos que se dan nos puntos 5 e 6 da miña primeira nota son os exemplos posibles máis sinxelos, ou sexa, operan co número máis pequeno posible de propiedades equiprobables. Isto tamén vale para o exemplo dado na nota ao pé do punto 5. (En conto ao punto 5, semella que hai un exemplo equivalente, aínda que máis complicado, no libro de Carnap Logical Foundations of Probability, 1950, apartado 71; eu non fun quen de entendelo, debido á súa complexidade. En canto ao meu punto 6, non atopei aquí nin en ningún outro lugar un exemplo correspondente a el). 540 Karl Popper Obviamente, aquí podemos substituír «p(y, z) < p(y)» polo máis feble «p(y, z)  p(y)». Este teorema dista moito, claramente, de ser paradoxal. E o mesmo se pode dicir do seu corolario (6), que se obtén substituíndo, respectivamente, as expresións «p(x, z) > p(x)» e «p(y, z)  p(x)» polas expresións «Co(x, z) e «~Co(y, z)», isto é, «nonCo(y, z)», segundo a anterior fórmula (1): (6) Existen enunciados x, y e z que cumpren a fórmula Co(x, z) & ~ Co(y, z) & p(x, z) < p(y, z). Coma (5), o teorema 6 expresa un feito que establecemos por medio do noso exemplo: que x pode ser apoiado por z e y ser cuestionado por z, mais que x, dado z, pode ser menos probable que y, dado z. Aquí xorde inmediatamente, así e todo, unha clara contradición se agora identificamos en (6) grao de confirmación C(a, b) e probabilidade p(a, b). Noutras palabras, a fórmula (**) Co(x, z) & ~ Co(y, z) & C(x, z) < C(y, z) (Isto é, «z confirma x mais non y, aínda que z tamén confirme x en menor grao que y» é claramente contraditorio consigo mesmo.) Así queda demostrado que a identificación de grao de corroboración ou confirmación con probabilidade (e mesmo con verosimilitude) é absurda por razóns tanto formais coma intuitivas porque sempre leva a unha contradición. A expresión «grao de corroboración» aquí débese entender nun senso máis amplo do que eu normalmente teño en mente: mentres que para min normalmente a expresión é equivalente a «grao de rigorosidade das probas que superou unha teoría», aquí úsase simplemente como «grao en que un enunciado x é apoiado por un enunciado y». Se reparamos nesta demostración, observamos que depende só de dúas suposicións: 541 a lóxida da descuberta científica (a) Fórmula (1); (b) A suposición de que calquera afirmación que teña a seguinte forma é contraditoria consigo mesma: (***) x ten a propiedade P (por exemplo, a propiedade «quente») e y non ten a propiedade P, e y ten a propiedade P nun grao máis alto que x (por exemplo, y está máis quente que x). Quen lese con coidado a miña primeira nota, en especial o exemplo dado no punto 6, decatarase de que todo isto está claramente alí de xeito implícito, agás, se cadra, a formulación xeral (***) das contradicións (*) e (**). Débese recoñecer que aquí está expresado de xeito máis explícito, mais o obxectivo da miña nota non era tanto facer unha crítica como ofrecer unha definición de grao de corroboración. A crítica da miña nota ía dirixida contra todas aquelas persoas que identifican, explícita ou implicitamente, grao de corroboración, de confirmación ou de aceptabilidade con probabilidade. Os filósofos que eu tiña en mente eran, especialmente, Keynes, Jeffreys, reichenbach, Kaila, hosiasson e, en tempos máis recentes, Carnap. En canto a Carnap, xa escribín unha nota ao pé que é, paréceme, suficientemente explícita. A motivación para escribila procede de que Carnap, ao establecer os criterios de adecuación para o grao de confirmación, fala do consenso de «practicamente todas as teorías modernas de grao de confirmación», sen mencionar o meu desacordo, e isto a pesar de que el foi quen introduciu o termo «grao de confirmación» (degree of confirmation en inglés) como tradución do meu termo alemán Grad der Bewährung (cf. a nota anterior ao apartado 79, supra.). Ademais, eu quería sinalar que a súa división da probabilidade en probabilidade1 (= o seu grao de confirmación) e probabilildade2 (= frecuencia estatística) é insuficiente, que hai polo menos dúas interpretacións do cálculo de probabilidade (lóxica e estatística) e que, ademais, está o meu grao de corroboración, que non é unha probabilidade (como se demostrou aquí e como xa se demostraba na miña nota). 542 Karl Popper Parece que as dez liñas desta nota ao pé chamaron máis a atención que o resto do texto. Deu lugar a unha discusión no B. J. P. S.5 na que Bar-hillel afirmou que a miña crítica do que el denominou «a teoría actual da confirmación» (a saber, a teoría de Carnap) era de carácter puramente verbal, e que todo o que eu dixera xa fora anticipado por Carnap. Tamén deu lugar a unha recensión do meu artigo en Journal of Symbolic Logic6 no que Kemeny resumiu a miña nota con estas palabras: «A tese principal deste artigo é que os medidores de confirmación propostos por Carnap, ou calquera outra atribución de probabilidade lóxica, non son apropiados para medir graos de confirmación». Non cabe dúbida de que esta non era a miña principal tese. A miña nota era a continuación dun traballo publicado quince anos antes de que se escribise o libro de Carnap e, no referido á crítica, o que se discutía alí (a identificación de corroboración, confirmación ou aceptabilidade con probabilidade), aínda que era, xaora, a tese principal do libro de Carnap, estaba moi lonxe de ser unha tese orixinal de Carnap, pois el limítase a seguir a tradición de Keynes, Jeffreys, reichenbach, Kaila, hosiasson e outros. Tanto Bar-hillel como Kemeny cualifican a miña crítica de puramente verbal e reafírmanse en que non hai razón para abandonar a teoría de Carnap, polo que eu me vexo obrigado a dicir agora que a teoría de Carnap incorre en contradición consigo mesma e que esta contradición non é un asunto menor que se poida solucionar doadamente, senón que é debida a erros que parten da súa fundamentación lóxica. Primeiro, as presuposicións (a) e (b), que, como vimos, abondan para probar que o grao de confirmación non se debe identificar con probabilidade, son ambas afirmadas explicitamente na teoría de Carnap: (a), que é a nosa fórmula (1), pódese atopar no 5 Véxase B. J. P. S. 6, 1955, pp. 155 a 163; e B. J. P. S. 7, 1956, pp. 243 a 256. 6 Véxase J. S. L. 20, 1955, p. 304. Na recensión de Kemeny hai un erro evidente, na liña 16 comezando polo fondo da páxina: onde pon «medida de apoio dada por y a x» debería poñer «medida da potencia explicativa de x con respecto a y». 543 a lóxida da descuberta científica libro de Carnap como fórmula (4) na p. 4647; (b), ou sexa, (***) ou a presuposición de que o noso (**) é contraditorio consigo mesmo pódese atopar na p. 73 do libro de Carnap, onde este afirma: «Se a propiedade Quente e a relación Máis Quente se designasen por medio de..., poñamos, 'P' e 'R', entón 'Pa.~Pb. Rba' sería contraditorio consigo mesmo». Mais isto é o noso (***). Obviamente, dalgunha maneira isto é irrelevante para o meu argumento que demostra que é absurdo identificar C con p, sexan (a) e (b) admitidos explicitamente nun libro ou non, aínda que ocorre que si o son no libro de Carnap. Ademais, a contradición que estamos comentando é crucial para Carnap: ao aceptar (1) ou, máis concretamente, ao definir nas p. 463 e ss. «x é confirmado por y» coa axuda de «p(x, y) > p(x)» (nos nosos símbolos), Carnap mostra que o que el quere dicir con «grao de confirmación» (o seu explicandum) é, aproximadamente, o mesmo que quero dicir eu: é a idea intuitiva de grao de apoio polas probas empíricas. (Kemeny, l. cit., trabúcase cando di o contrario. En realidade, «unha lectura atenta» do meu artigo (e do libro de Carnap, engadiría eu) non «mostrará que Popper e Carnap teñen dous explicanda diferentes en mente», senón que mostrará que Carnap tiña en mente, sen se decatar, dous explicanda diferentes e incompatibles coa súa probabilidade1, un deles o meu C, o outro o meu p; e tamén mostrará que eu sinalei repetidas veces os perigos desta confusión, por exemplo, no artigo obxecto da recensión de Kemeny). Por tanto, calquera cambio de suposición (a) sería ad hoc. Así que non é a miña crítica a que é «puramente verbal», senón que o son máis ben os intentos de rescatar a «teoría actual da confirmación». Para máis detalles, remítome ao debate nas páxinas de B. J. P. S. Debo dicir que me defraudou un pouco a discusión, o mesmo que a recensión de Kemeny no Journal of Symbolic Logic. Desde 7 Véxase tamén a fórmula (6) na p. 464. A fórmula (4) de Carnap da páxina 464 aparece como unha equivalencia, mais isto non cambia nada. Nótese que Carnap usa «t» para a tautoloxía, un uso que nos levaría a nós a escribir p(x, t) en lugar de p(x). 544 Karl Popper un punto de vista racional, esta situación paréceme bastante grave. Nesta nosa era posrarionalista, cada vez escríbense máis libros en linguaxes simbólicas e cada vez faise máis difícil adiviñar para que serven: que significará todo iso do simbolismo, se será necesario e se se tirará algún proveito de aborrecerse tanto con volumes cheos de trivialidades simbólicas. É coma se o simbolismo se convertese nun valor en si mesmo, polo que habería que adoralo pola súa sublime «exactitude»: unha nova manifestación da vella busca da certeza, un novo ritual simbólico, un novo substituto da relixión. Mais o único valor posible de algo deste estilo (a única escusa posible para a súa dubidosa reivindicación da precisión) semella ser que unha vez que se identifica un erro ou unha contradición, non pode haber evasión verbal ningunha: pódese demostrar e nada máis (Frege non intentou facer manobras de evasión cando recibiu a crítica de russel). Así que, xa que hai que soportar todas esas tediosas cuestións técnicas, con ese formalismo dunha complexidade innecesaria, un agardaría polo menos ser compensado coa aceptación dunha demostración bastante sinxela dunha contradición, unha demostración feita co máis simple dos contraexemplos. Defraudoume ver que a resposta a esta demostraación eran simples evasións verbais, combinadas coa acusación de que a crítica ofrecida por min era unha «simple cuestión verbal». Malia isto, non se debe perder a paciencia. Desde Aristóteles, o enigma da indución levou a moitos filósofos ao irracionalismo, o escepticismo ou o misticismo. E aínda que semella que a filosofía da identidade entre C e p xa sobreviviu a moitas enxurradas desde laplace, eu sigo crendo que un día será abandonada. Eu non podo aceptar que os defensores da fe se contenten para sempre co misticismo e o hegelianismo, mantendo «C = p» como un axioma evidente ou como un obxecto cegador dunha intuición indutiva (digo «cegador» porque semella ser un obxecto que causa a cegueira dos que o sosteñen cando tropezan con contradicións lóxicas). Talvez deba dicir aquí que eu considero que a doutrina que sostén que o grao de corroboración ou aceptabilidade non pode 545 a lóxida da descuberta científica ser unha probabilidade é unha das descubertas máis interesantes da filosofía do coñecemento. Pódese expresar en termos moi simples como segue. un informe sobre o resultado das comprobacións dunha teoría pódese resumir mediante unha avaliación. Isto pódese facer atribuíndolle un grao de corroboración á teoría, mais nunca se pode facer mediante a atribución dun grao de probabilidade, pois a probabilidade dun enunciado (dados os enunciados das comprobacións) simplemente non expresa unha avaliación da rigorosidade das comprobacións que superou unha teoría, ou da maneira en que superou estas probas. A principal razón para isto é que o contido dunha teoría (que é o mesmo que a súa improbabilidade) determina a súa comprobabilidade e a súa corroborabilidade. Eu creo que estas dúas ideas (contido e grao de corroboración) son as dúas ferramentas lóxicas máis importantes elaboradas no meu libro8. Isto abonda como introdución. Nas tres notas que veñen a seguir deixei a palabra «confirmación» mesmo nos casos en que agora escribiría «corroboración». Tamén deixei «P(x)» onde agora normalmente escribiría «p(x)». Corrixín algunhas grallas9 8 Polo que eu sei, o recoñecemento da relevancia do contido empírico ou potencia afirmativa dunha teoría, a proposta de que o seu contido aumenta coa clase de potenciais falsificadores da teoría (ou sexa, os estados de cousas que prohibe ou exclúe, véxanse os apartados 23 e 31) e a idea de que o contido pode ser medido pola improbabilidade da teoría, todas estas ideas non as tomei de ningures, senón que son todas «da miña propia colleita». Por iso me sorprendeu ler en Introduction to Semantics, de Carnap (1942, p. 151), en relación coa súa definición de «contido», o seguinte: «... a potencia afirmativa dunha oración consiste na súa exclusión de certos estados de cousas (Wittgenstein); canto máis exclúe, máis afirma». Eu escribinlle a Carnap para preguntarlle por algúns detalles e para lembrarlle certas pasaxes do meu libro. Na súa carta de resposta dixo que a súa referencia a Wittgenstein fora debida a un erro de memoria e que o que el tiña en mente realmente era unha pasaxe do meu libro, por iso incluíu esta corrección en Logical Foundations of Probability, 1950, p. 406. Menciono isto aquí porque en varios artigos publicados despois de 1942, a idea de contido (no senso de contido empírico ou informativo) foi atribuída, sen ningunha referencia concreta, a Wittgenstein, a Carnap e, ás veces, a Wittgenstein e a min mesmo. Pero a min non me gustaría que ninguén pensase que lle collín a idea, sen recoñecelo, nin a Wittgenstein nin a ningún outro: como estudoso da historia das ideas, considero importante remitir ás referencias sobre as fontes que un usa (véxase tamén a miña discusión no apartado 35 da distinción entre contido lóxico e contido empírico, con referencias a Carnap nas notas 1 e 2). 9 Tamén incorporei, claro está, as correccións mencionadas en B. J. P. S. 5, pp. 334 e 359. 546 Karl Popper e engadín unhas cantas notas ao pé, precedidas de asterisco, e tamén engadín dous puntos novos, *13 e *14, ao final da Terceira Nota. Grao de confirmación 1. O obxectivo desta nota é propoñer e discutir a definición, en termos de probabilidades, do grao en que un enunciado x é confirmado por un enunciado y (obviamente, isto pódese considerar idéntico ao grao en que un enunciado y confirma un enunciado x). Designarei este grao mediante o símbolo «C(x, y)», que se debe ler «o grao de confirmación de x por y». En casos concretos, x pode ser unha hipótese h, e y pode ser algunha proba empírica e, a favor de h, en contra de h ou neutral con respecto a h. Mais C(x, y) tamén será aplicable a casos menos típicos. A definición farase en termos de probabilidades. Farei uso tanto de P(x, y), a saber, a probabilidade (relativa) de x dado y, como de P(x), a saber, a probabilidade (absoluta) de x1. Mais un calquera destes dous sería suficiente. 2. Presuponse decote que o grao de confirmación de x por y debe ser o mesmo que a probabilidade (relativa) de x dado y, isto é, que C(c, y) = P(x, y). O meu primeiro cometido é demostrar que esta idea é incorrecta. 3. Considérense dous enunciados continxentes x e y. Desde o punto de vista da confirmación de x por y, haberá dous casos extremos: que y apoie completamente x ou que se estableza x por y, cando x se deduce de y; ou que y cuestione ou refute o 1 «P(x)» pódese definir, en termos de probabilidade relativa, pola definiens «P(x, )» ou, de xeito máis simple, «P(x, )». (Uso seguido «sy» para indicar a conxunción de x e y, e «» para indicar a negación de x). Como, en xeral, temos P(x, y ) = P(x, y), e P(x, yz) = P(xy, z) / P(y, z), obtemos P(x, y) = P(xy)/P(y), unha fórmula que serve para definir a probabilidade relativa en termos de probabilidade absoluta. (Véxase a miña nota de Mind, 1938, 47, p. 275 ss., onde identifico probabilidade absoluta co que eu chamo «probabilidade lóxica» en Logik der Forschung, Viena, 1935, especialmente apartados 34 ss. e 83, pois o termo «probabilidade lóxica» é mellor usalo para a «interpretación lóxica» tanto de P(x) como de P(x, y), en oposición á súa «interpretación estatística», que pode ser ignorada aquí). 547 a lóxida da descuberta científica establecemento de x por y, cando se deduce de y. un terceiro caso de especial importancia é o de mutua independencia ou irrelevancia, caracterizado por P(xy) = P(x)P(y). O seu valor de C(x, y) estará por baixo do apoio claro ou por riba do cuestionamento claro. Entre estes tres casos especiais (apoio claro, indepenencia, cuestionamento claro) haberá casos intermedios: apoio parcial (cando y implica parte do contido de x), por exemplo se o noso enunciado continxente y se deduce de x pero non viceversa, entón el mesmo forma parte do contido de x e, logo, implica parte do contido de x, apoiando x; e cuestionamento parcial de x por y (cando y apoia parcialmente ), por exemplo se y se deduce de . Diremos, logo, que y apoia x, ou que cuestiona x, sempre que P(xy), ou P(y), respectivamente excedan os seus valores para a independencia. (Vese doadamente que estes tres casos –apoio, cuestionamento, independencia– son exhaustivos e excluíntes, vista esa definición). 4. Considérese agora a conxectura de que hai tres enunciados, x1, x2 e y, tales que (i) x1 e x2 sexan ambos independentes de y (ou que sexan cuestionados por y), mentres que (ii) y apoia a súa conxunción x1x2. Obviamente, neste caso teriamos que dicir que y confirma x1x2 nun maior grao do que confirma x1 ou x2; en símbolos, (4.1) C(x1, y) < C(x1 x2, y) > C(x2, y) Mais isto sería incompatible coa idea de que C(x, y) é unha probabilidade, isto é, con (4.2) C(x, y) = P(x, y) pois para probabilidades temos a fórmula, xeralmente válida, (4.3) P(x1, y)  P(x1 x2, y)  P(x2, y) que, en presenza de (4.1), contradí (4.2). Así que teriamos que descartar (4.2). Mais en vista de 0  P(x, y)  1, (4.3) é unha 548 Karl Popper consecuencia inmediata do principio xeral da multiplicación para probabilidades. Así que teriamos que descartar tal principio para o grao de confirmación. Ademais, semella que teriamos que descartar tamén o principio especial da adición, pois unha consecuencia deste principio é, dado que P(x, y)  0, (4.4) P(x1 x2 ou x1 2, y)  P(x1x2y) Mais isto non podía seguir a ser válido para C(x, y), considerando que a alternativa, x1x2 ou x12, é equivalente a x1, de maneira que obtemos por substitución na parte esquerda de (4.1): (4.5) C(x1x2 ou x1 2, y) < C(x1x2, y) En presenza de (4.4), (4.5) contradí (4.2).2 5. Estes resultados dependen da conxectura de que existen os enunciados x1, x2 e y, de maneira que (i) x1 e x2 sexan ambos dependentes de y (ou cuestionados por y) mentres que (ii) y apoie x1x2. Demostrarei esta conxectura por medio dun exemplo3 Tómense fichas redondas de cores, denominadas «a», «b», ..., con catro propiedades excluíntes e igualmente probables: azul, verde, vermello e amarelo. Sexa x1 o enunciado «a é azul ou verde», x2 = «a é azul ou amarela». Entón cúmprense todas as condicións (que y apoia x1x2 é obvio: y dedúcese de x1x2 e a súa presenza aumenta a probabilidade de x1x2 ao dobre do valor que ten en ausencia de y). 2 En Logical Foundations of Probability, Chicago, 1950, p. 285, Carnap usa os principios de multiplicación e da adición como «convencións sobre adecuación» para o grao de confirmación. O único argumento que el ofrece a favor da adecuación destes principios é que «son xeralmente aceptados en practicamente todas as teorías modernas da probabilidade1», isto é, o noso P(x, y) que Carnap identifica con «grao de confirmación». Mais o propio termo «grao de confirmación» (Grad der Bewährung en alemán) introducino eu no apartado 82 e seguintes de Logik der Forschung (libro a que Carnap se refire ás veces), para demostrar que nin a probabilidade lóxica nin a estatística son adecuadas para un grao de confirmación, pois a confirmabilidade ten que aumentar coa comprobabilidade e, en consecuencia, coa improbabilidade lóxica (absoluta) e o contido (véxase máis abaixo). 3 O exemplo cumpre (1) por independencia, máis que por cuestionamento (para obter un exemplo de cuestionamento, engádase ámbar como quinta cor, e póñase y = «a é ámbar, azul ou amarela»). 549 a lóxida da descuberta científica 6. Mais podemos construír un exemplo aínda máis rechamante para demostrar que non é adecuado identificar C(x, y) e P(x, y). Collemos x1 de maneira que sexa fortemente apoiado por y, e x2 de maneira que sexa fortemente cuestionado por y. logo, teremos que esixir que C(x1, y) > C(x2, y). Mais x1 e x2 pódense escoller de maneira que P(x1, y) < P(x2, y). O exemplo é este: tómese x1 = «a é azul», x2 = «a non é vermella» e y = «a non é amarela». Entón P(x1) = 1/4, P(x2) = 3/4 e 1/3 = P(x1, y) < P(x2, y) = 2/3. Que y apoia x1 e cuestiona x2 queda claro con estas cifras e tamén co feito de que y se deduce de x1 e tamén de 2.*1 7. Por que se confundiron C(x, y) e P(x, y) tan insistentemente? Por que ninguén viu que é absurdo dicir que unha proba y da que x é completamente independente pode, malia isto, «confirmar» x tan fortemente? Ou que y pode confirmar x tan fortemente, aínda que y cuestione x? E isto aínda que y sexa a única proba dispoñible? Eu non sei a resposta a estas preguntas, pero podo propoñer unhas cantas suxestións. Primeiro, existe unha forte tendencia a pensar que calquera cousa que se poida chamar «verosimilitude» ou «probabilidade» dunha hipótese ten que ser unha probabilidade no senso do cálculo de probabilidades. Para tentar desencerellar os varios fíos aquí enleados, hai vinte anos que distinguín o que chamei «grao de confirmación» das probabilidades lóxica e mais estatística. Desgraciadamente, así e todo, o termo axiña comezou a ser usado por outros como sinónimo de probabilidade (lóxica), se cadra por influencia da idea errónea de que a ciencia, incapaz de acadar a certeza, debe pretender acadar unha especie de Ersatz («substituto»): a máis alta probabilidade que se poida atinxir. Outra suxestión é esta: parece que a frase «o grao de confirmación de x por y» se acabou convertendo en «grao en que *1 Este feito (isto é, p(y, x1) = p(y, 2) = 1) significa que a «verosimilitude» de x1 de Fisher, e por tanto de 2, en vista de y, é máxima. Véxase a introdución ao presente apéndice, onde se elabora o argumento esbozado aquí no texto. 550 Karl Popper y confirma x» ou «o poder de y de apoiar x». Pero nesa forma estaría bastante claro, no caso en que y apoia x1 e cuestiona x2, que C(x1, y) < C(x1, y) é absurdo, aínda que P(x1, y) < P(x2, y) sexa necesario, indicando, en tal caso, que tiñamos P(x1) < P(x2) desde o comezo. Ademais, parece que hai unha tendencia a confundir medidas de aumento e diminución coas medidas que aumentan ou diminúen (como se demostra coa historia dos conceptos de velocidade, aceleración e forza). Mais o poder de y de apoiar x, como se verá, é esencialmente unha medida do aumento ou diminución debidos a y, na probabilidade de x (véxase tamén 9 (vii), infra.). 8. Dirase, se cadra, en resposta a todo isto, que é lexítimo, en todo caso, usar calquera nome para denominar P(x, y) e, por tanto, tamén valería «grao de confirmación». Pero a cuestión a que nos enfrontamos non é só verbal. Suponse que se usa o grao de confirmación dunha hipótese x mediante proba empírica y para facer estimacións sobre o grao en que x é apoiado pola experiencia. Mais P(x, y) non pode servir para este fin, porque P(x1, y) pode ser maior que P(x2, y) aínda que x1 sexa cuestionado por y e x2 sexa apoiado por y, e isto é debido ao feito de que P(x, y) depende fortemente de P(x), ou sexa, a probabilidade absoluta de x, que non ten nada que ver en absoluto coas probas empíricas. Ademais, suponse que o grao de confirmación inflúe na cuestión de se se debe aceptar ou escoller unha certa hipótese x, polo menos provisionalmente: un alto grao de confirmación suponse que caracteriza unha hipótese como «boa» (ou «aceptable»), mentres que unha hipótese que foi confirmada negativamente suponse que é «mala». Mais P(x, y) non serve de moito aquí. O obxectivo prioritario da ciencia non é conseguir altas probabilidades. O obxectivo da ciencia é acadar un alto contido informativo, que estea suficientemente apoiado na experiencia. Mais unha hipótese pode ser moi probable simplemente porque non nos di nada, ou di moi pouco. un alto grao de probabilidade 551 a lóxida da descuberta científica non indica que unha hipótese sexa «boa», é simplemente un síntoma de que o contido informativo é baixo. Por outra banda, C(x, y) debe, e pode, estar definido de tal maneira que só as hipóteses que teñan un alto valor informativo poidan acadar altos graos de confirmación. A confirmabilidade de x (isto é, o grao máximo de confirmación que pode acadar un enunciado x) ten que aumentar con C(x), isto é, a medida do contido de x, que é igual a P( ) e, por tanto, ao grao de comprobabilidade de x. Así, mentres P( , y) = 1, C( , y) debería ser cero. 9. unha definición de C(x, y) que cumpra todos estes e outros desiderata, algúns máis esixentes aínda, indicados no meu libro Logik der Forschung, pódese basear en E(x, y), isto é, unha medida non aditiva da capacidade explicativa de x con respecto a y, deseñada para ter 1 e + 1 como límites inferior e superior. Defínese como segue: (9.1) Sexa x coherente4 e P(y) ≠ 0; entón definimos, E(x, y) = P(y, x) – P(y) P(y, x) + P(y) E(x, y) tamén se pode interpretar como unha medida non aditiva da dependencia de y de x, ou o apoio que x dá a y (e viceversa). Cumpre o máis importante dos nosos desiderata, pero non todos: por exemplo, infrinxe (viii, c) e cumpre (iii) só aproximadamente en casos especiais. Para arranxar estes defectos, propoño definir C(x, y) como segue*2. 4 Esta condición pódese descartar se aceptamos a convención xeral de que P(x, y) = 1, sempre que y sexa incoherente. *2 O que segue é unha definición alternativa, máis simple dalgún xeito, que tamén cumpre todas as miñas condicións de adecuación ou desiderata (a primeira vez que a enunciei foi en B. J. P. S. 5, p. 359). (9.2*) C(x, y) = P(y, x) – P(y) P(y, x) – P(xy) + P(y) Igualmente, agora poño (10.1*) C(x, y, z) = P(y, xz) – P(y, z) P(y, xz) – P(xy, z) + P(y, z) 552 Karl Popper (9.2) Sexa x coherente e P(y) ≠ 0; entón definimos, C(x,y ) = E(x, y)(1 + P(x)P(x, y)) Isto é menos simple que, por exemplo, E(x, y)(1 + P(xy)), que cumpre a maioría dos nosos desiderata pero infrinxe (iv), mentres que para C(x, y) o teorema afirma que todos os desiderata seguintes: (i) C(x, y)  0 respectivamente se e só se y apoia x, é independente de x ou cuestiona x. (ii) –1 = C( , y)  C(x, y)  C(x, x)  1 (iii) 0  C(x, x) = C(x) = P( )  1 Nótese que C(x) e, por tanto C(x, x) é unha medida aditiva do contido de x, definible por P( ), isto é, a probabilidade absoluta de x de ser falsa, ou a verosimilitude a priori de x de ser refutada. Así que a confirmabilidade é igual á refutabilidade ou comprobabilidade5. (iv) Se y implica x, entón C(x, y) = C(x, x) = C(x) (v) Se y implica , entón C(x, y) = C( , y) = –1 (vi) Supoñamos que x ten un alto contido –de maneira que C(x, y) se aproxime a E(x, y)– e supoñamos que y apoia x. (Podemos, por exemplo, considerar y a proba empírica total dispoñible). Entón, para calquera y, C(x, y) aumenta coa capacidade de x de explicar y (isto é, de explicar cada vez máis contido de y) e, por tanto, co interese científico de x. (vii) Se C(x) = C(y) ≠ 1, entón C(x, u)  C(y, w) sempre que P(x, u)  P(y,w).*3 (viii) Se x implica y, entón (a) ; (b) para calquera x, e C(y) aumentan xuntos; e (c) para calquera y, C(x, y) e P(x) aumentan xuntos6. 5 Véxase o apartado 83 do meu Logik der Forschung, titulado «confirmabilidade, comprobabilidade, probabilidade lóxica» (de acordo coa terminoloxía da miña nota de Mind, l. cit., debíase inserir «absoluta» antes de «lóxica»). *3 A condición «≠ 1» non aparecía nin no orixinal alemán nin nas versións corrixidas publicadas. 6 (vii) e (viii) conteñen os únicos desiderata importantes cumpridos por P(x, y). 553 a lóxida da descuberta científica (ix) Se é coherente e implica y, entón: (a) C(x, y) ≤ 0; (b) para calquera x dado, C(x, y) e P(y) aumentan xuntos; e (c) para calquera y dado, C(x, y) e P(x) aumentan xuntos. 10. Todas as nosas consideracións, sen excepción, pódense relativizar con respecto a algunha información inicial z, engadindo nos lugares apropiados frases como «en presenza de z, asumindo «P(z, ) ≠ 0». A definición relativizada do grao de confirmación devén: (10.1) C(x, y, z) = E(x, y, z) (1 + P (x, z) P(x, yz)) Onde (10.2) E(x, y, z) = P(y, xz) – P(y, z) P(y, xz) + P(y, z) E(x, y, z) é a capacidade explicativa de x con respecto a y, en presenza de z.7 11. hai, paréceme, algúns desiderata intuitivos que non poden ser cumpridos por ningunha definición formal. Por exemplo, unha teoría está mellor confirmada canto máis enxeñosos fosen os nosos intentos fracasados de refutala. A miña definición incorpora algo desa idea, polo menos na medida en que esta poida ser formalizada. Mais nunca se pode formalizar completamente a idea dun intento sincero e enxeñoso de refutación8. 7 Sexa x1 a teoría da gravitación de Einstein, x2 a de Newton, y a proba empírica (interpretada) dispoñible hoxe, incluíndo as leis «aceptadas» (non importa se están incluídas unha, as dúas ou ningunha das teorías en cuestión, sempre que se cumpran as condicións para y), e z unha parte de y, por exemplo, unha selección das probas empíricas dispoñibles un ano antes. Como podemos asumir que x1 explica máis de y que x2, obtemos C(x1, y, z) ≥ C(x2, y, z) para todo z, e C(x1, y, z) para todo z adecuado que conteña algunha das condicións iniciais relevantes. Isto dedúcese de (vi), mesmo se temos que asumir que P(x1, yz) = P(x2, yz) = P(x1) = P(x2) = 0. 8 Hai moitas maneiras de aproximarse a esta idea. Por exemplo, podemos poñer unha prima para experimentos cruciais definindo n Ca,b(h) = (C(h,eb) ∏ C(h, ci,ea))1/(n+1) i=1 onde c1, c2, ..., é a sucesión de experimentos feitos entre os momentos de tempo ta e tb. Temos ta < tl ≤ ti ≤ tn = tb. ea e eb son a as probas totais (que poden incluír leis) aceptadas en ta e tb. Postulamos P(ci, eb) = 1 e (para asegurarnos de que só se conten experimentos novos) P(ci, ea) ≠ 1 e P(ci, Ucj) ≠ 1, sempre que j < 1. («Ucj» é a universalización espaciotemporal de cj). 554 Karl Popper A maneira concreta en que se define aquí C(x, y) non a considero importante. O que si pode ser importante son os desiderata e mais o feito de que se poidan cumprir conxuntamente. Unha segunda nota sobre o grao de confirmación 1 O profesor J. G. Kemeny1 (que fixo unha referencia á miña definición de contido), por un lado, e o Dr. C. l. hamblin2, por outro, fixeron a proposta de que o contido de x, simbolizado por «C(x)» se debía medir mediante –log2P(x) en lugar de 1 – p(x), como eu propuxera inicialmente (uso aquí os meus propios símbolos). Se se adopta esta proposta, entón os meus desiderata3 para o grao de confirmación de x por y, designado por C(x, y) teñen que ser lixeiramente modificados: en (ii) e en (v), temos que substituír por ±1; e ± ∞ (iii) transfórmase en: (iii) 0 ≤ C(x, xy) = C(x, x) = C(x) = –log2P(x)≤ + ∞. Os outros desiderata mantéñense igual. O Dr. hamblin4 propón definirmos o grao de confirmación por (1) C(x, y) = log2(P(xy)/P(x)P(y) ), *Hoxe en día inclinaríame por tratar esta cuestión doutro xeito. Podemos, de xeito simple, distinguir entre a fórmula «C(x, y)» (ou «C(x, y, z)») e as aplicacións desta fórmula ao que queremos dicir, intuitivamente, por corroboración ou aceptabilidade. Entón basta con dicir que C(x, y) non se debe interpretar como grao de corroboración nin se debe aplicar a problemas de aceptabilidade, a menos que y represente os resultados (totais) dos intentos sinceros de refutar x. Véxase tamén o punto *14 da miña «Terceira Nota», infra. Puxen «total» entre parénteses porque hai que considerar outra posibilidade: podemos limitar as nosas comprobacións a un certo campo de aplicación F (cf. o vello apéndice i e mais o apéndice *viii), podemos logo relativizar C e escribir «CF (x, y)». Pódese dicir que a corroboración total dunha teoría se corresponde coa suma das súas corroboracións nos seus varios campos de aplicación (independentes). 1 John G. Kemeny, Journal of Symbolic Logic 18, 1953, p. 297. (A referencia de Kemeny é ao meu Logik der Forschung). 2 C. L. Hamblin, «Language and the Theory of Information», tese lida na Universidade de Londres en maio de 1955 (non publicada); véxase p. 62. O Dr. Hamblin creou a súa definición de maneira independente do artigo do Profesor Kemeny (ao que el se refire na súa tese). 3 «Degree of Confirmation», neste B. J. P. S 5, 1954, p. 143 ss.; véxase tamén p. 334. 4 C. L. Hamblin, ob. cit., p. 83. Unha proposta semellante (sen especificar, porén, 2 como base do logaritmo) faise na recensión do Dr. I. J. Good do meu artigo «Degree of Confirmation»; cf. Mathematical Review, 16, 1955, 376. 555 a lóxida da descuberta científica o cal, para sistemas finitos, pero non necesariamente para os infinitos, é o mesmo que (2) C(x, y) = log2(P(y, x)/P(y)), unha fórmula que ten a vantaxe de continuar a ser determinada mesmo se P(x) = 0, como pode ocorrer se x é unha teoría universal. A fórmula relativizada correspondente sería (3) C(x, y, z) = log2(P(y, xz)/P(y, z)). A definición (1), con todo, non cumpre o meu desideratum viii (c), como observa o Dr. hamblin, e o mesmo ocorre con (2) e (3). Os desiderata (b) e (c) tampouco se cumpren. Ora ben, o meu desideratum viii (c) marca, na miña opinión, a diferenza entre unha medida con capacidade explicativa e outra con capacidade de confirmación. A primeira pode ser simétrica en x e y, a segunda non. Supoñamos que y se deduce de x (e que apoia x) e que x non sexa confirmado por y. Neste caso non parece satisfactorio dicir que ax é confirmado igual de ben por y que por x (mais non semella que haxa ningunha razón para que ax e x non teñan a mesma capacidade explicativa con respecto a y, pois y é explicado completamente por ambos). Este é o motivo polo que creo que viii (c) non se debía descartar. Así, prefiro considerar que (2) e (3) son definicións altamente adecuadas que teñen capacidade explicativa (de E(x, y) e E(x, y, z)), máis que grao de confirmación. Esta última pódese definir, sobre a base da capacidade de explicación, de moitas maneiras diferentes para cumprir viii (c). unha destas maneiras é esta (paréceme que se poden atopar outras mellores): (4) C(x, y) = E(x, y)/((1 + nP(x))P( , y)) (5) C(x ,y, z) = E(x, y, z)/((1 + nP(x, z)) P( , yz)) Aquí podemos escoller n ≥ 1. E se queremos que viii(c) teña un efecto marcado, podemos facer que n sexa un número grande. 556 Karl Popper En caso de que x sexa unha teoría universal onde P(x) = 0 e y sexa proba empírica, desaparece a diferenza entre E e C, igual que nas miñas definicións orixinais e tal como esixe o meu desideratum (vi). Tamén desaparece se x se deduce de y. Así aínda se conservan algunhas das vantaxes de operar cunha medida logarítmica: como explica hamblin, o concepto definido por (1) relaciónase así intimamente cunha idea fundamental da teoría da información. Good tamén comenta este punto (véxase a nota 4). A transición das definicións vellas para as novas faise conservando a orde (isto tamén é válido para a capacidade explicativa, como indican as observacións de hamblin). Así que a diferenza é só métrica. 2. As definicións de capacidade explicativa, e máis aínda as de grao de confirmación (ou corroboración, aceptabilidade, testemuña ou calquera outro nome que se lle dea), danlle todo o peso ao peso das probas (ou o «peso dun argumento», como o denomina Keynes no capítulo vi do seu libro)*1. Isto resulta moi claro coas novas definicións, baseadas nas propostas de hamblin, que parecen ter considerables vantaxes para quen se interese por cuestións métricas. 3. Así e todo, hai que decatarse de que o noso C dependerá totalmente da métrica de P. Mais non pode haber unha métrica satisfactoria de P, isto é, non pode haber unha métrica da probabilidade lóxica baseada en consideracións puramente lóxicas. Para demostrar isto consideramos a probabilidade lóxica de calquera propiedade física medible (variable aleatoria non discreta) como a lonxitude, para collermos o exemplo máis simple. Supoñamos que (o cal é favorable aos nosos opoñentes), para os seus valores, se nos facilitan os límites, finitos e loxicamente necesarios, superior e inferior, l e u. Supoñamos que se nos dá unha función de distribución para a probabilidade lóxica desta propiedade, por exemplo, unha función de equidistribución xeneralizada entre l e u. Podemos descubrir que un cambio empiricamente desexable das nosas teorías leva a unha *1 Véxase a «Terceira Nota», infra. 557 a lóxida da descuberta científica corrección non lineal da medida das nosas propiedades físicas (baseadas, poñamos, no metro de París). Entón, a «probabilidade lóxica» tamén ten que ser corrixida, o cal demostra que a súa métrica depende do noso coñecemento empírico, e que non pode ser definida a priori, en termos puramente lóxicos. Noutras palabras, a métrica da «probabilidade lóxica» dunha propiedade medible dependería da métrica da propiedade medible mesma, e como esta última é susceptible de correccións sobre a base de teorías empíricas, non pode haber unha medida «lóxica» da probabilidade. Estas dificultades pódense superar en grande medida, mais non enteiramente, facendo uso dos nosos «coñecementos previos» z, mais elas poñen de manifesto a relevancia da achega topolóxica para os problemas do grao de confirmación e mais da probabilidade lóxica*2. Con todo, mesmo se descartamos todas as consideracións métricas, teriamos que conservar, paréceme, o concepto de probabilidade, tal como se define implicitamente nos habituais sistemas axiomáticos de probabilidade. Estes conservan toda a súa relevancia, exactamente do mesmo xeito que a xeometría métrica pura conserva toda a súa relevancia aínda que nós non sexamos capaces de definir unha vara de medir en termos de xeometría (métrica) pura. Isto é especialmente importante se temos en conta a necesidade de identificar independencia lóxica con independencia probabilística (o teorema especial da multiplicación). Se asumimos unha linguaxe como a de Kemeny (que, así e todo, non funciona, con propiedades continuas), ou unha linguaxe que teña enunciados atómicos relativos (como *2 Paréceme que agora superei estas dificultades, no relativo ao sistema S (no senso do apéndice *iv) que contén elementos que son enunciados de probabilidade, isto é, no relativo á métrica lóxica da probabilidade dos enunciados de probabilidade ou, noutras palabras, á métrica lóxica de probabilidades secundarias. O método de solución descríbese na miña «Terceira Nota», puntos 4 e seguintes; véxase, en especial, o punto *13. En canto ás propiedades primarias, eu creo que as dificultades descritas aquí no texto non son esaxeradas en absoluto (está claro que z pode ser útil, ao sinalar, ou asumir, que estamos, nun caso determinado, ante un conxunto finito de posibilidades simétricas ou iguais). 558 Karl Popper se indica en apéndice n'A Lóxica da investigación científica), entón teremos que postular a independencia para as oracións atómicas ou as atómicas relativas (evidentemente, sempre que non sexan «loxicamente dependentes» no senso de Kemeny). Baseándose na teoría probabilística da indución, resulta logo que non podemos aprender se identificamos a independencia lóxica e a probabilística da maneira descrita aquí, mais si que podemos aprender no sentido das miñas funcións C, isto é, podemos corroborar as nosas teorías. En relación con isto hai que facer dúas consideracións máis. 4. A primeira consideración é esta: baseándose no meu sistema axiomático para a probabilidade relativa5, pódese considerar que P(x, y) se define para calquera valor de x e y, incluíndo aqueles valores para os que p(y) = 0. Máis concretamente, na interpretación lóxica do sistema, sempre que x se deduza de y, P(x, y) = 1, mesmo se P(y) = 0. Non hai razón, logo, para dubidar de que a nosa definición funcione en linguaxes que conteñan tanto enunciados singulares como leis universais, aínda que todas estas teñan probabilidade cero, como ocorre, por exemplo, coa función de medida m de Kameny, que postula P(x) = m(x). (No caso das nosas definicións de E e C, non fai falta desviarse da atribución de igual peso aos «modelos»; cf. Kemeny, ob. cit. p. 307. Ao contrario, calquera desviación dese estilo débese considerar unha desviación con respecto á interpretación lóxica, pois infrinxiría a igualdade entre a independencia lóxica e a probabilística esixida en 3, supra.). 5. A segunda consideración é esta: entre os desiderata deducidos, o seguinte non o cumpren todas as definicións de «x é confirmado por y» propostas por outros autores. Poderíase indicar por separado como o décimo desideratum6: 5 B. J. P. S. 6, p. 56 ss., (véxase tamén pp. 176 e 351). Versións simplificadas apareceron en British Philosophy in the Mid-Century (editado por C. A. Mace), p. 191, e no meu libro A lóxica da investigación científica, apéndice *iv). 6 Compárese co comentario neste mesmo B. J. P. S. 5, 1954, final do primeiro parágrafo da p. 144. 559 a lóxida da descuberta científica (x) Se x é confirmado, corroborado ou apoiado por y de tal maneira que C(x, y) > 0, entón (a) sempre é cuestionado por y, isto é, C( , y) < 0, e (b) x sempre é cuestionado por , isto é, C(x, ) < 0. Paréceme claro que este desideratum é unha condición de adecuación indispensable e que calquera definición proposta que non o cumpra resultará intuitivamente paradoxal. Unha terceira nota sobre o grao de corroboración ou confirmación Nesta nota gustaríame facer varios comentarios sobre o problema do peso das probas e sobre as probas estatísticas. 1. A teoría da corroboración ou «confirmación» proposta nas dúas notas anteriores sobre «Grao de Confirmación»1 é capaz de resolver doadamente o denominado problema do peso das probas. O primeiro que presentou este problema foi Peirce e máis adiante Keynes, que falara do «peso dun argumento» ou da «cantidade de probas», tratouno en bastante detalle. O termo «peso das probas» foi tomado de J. M. Keynes e de I. J. Good2. As consideracións sobre o «peso das probas» levan, na teoría subxectiva da probabilidade, a paradoxos que, na miña opinión, son irresolubles no marco da súa teoría. 2. Por teoría subxectiva da probabilidade, ou a interpretación subxectiva do cálculo da probabilidade, quero dicir unha teoría que interpreta a probabilidade como unha medida da 1 Neste mesmo B. J. P. S. 5, 1954, 143, 323 e 359; e B. J. P. S. 7, 1957, 350. Véxase tamén B. J. P. S. 6, 1955 e B. J. P. S. 7, 1956, 244. Ao primeiro parágrafo da miña «Segunda Nota», debíaselle engadir unha referencia a un artigo de R. Carnap e Y. Bar-Hillel, «Semantic Information», neste mesmo Journal 4, 1953, 147 ss. Ademais, a primeira frase da nota 1 na p. 351 debería dicir «Ob. cit., p. 83» en lugar do que pon agora, porque a referencia é á tese do Dr. Hamblin. *(Esta última corrección xa foi feita na versión impresa neste libro). 2 Cf. C. S. Peirce, Collected Papers, 1932, Vol. 2, p. 421 (primeira edición de 1878); J. M. Keynes, A Treatise on Probability, 1921, pp. 71 a 78 (véxase tamén 312 ss., «a cantidade de probas» e o Índice; I. J. Good, Probability and the Weight of Evidence, 1950, p. 62 ss. Véxase tamén C. I. Lewis, An Analysis of Knowledge and Valuation, 1946, p. 292 ss; e R. Carnap, Logical Foundations of Probability, 1950, p. 554 ss. 560 Karl Popper nosa ignorancia, da parcialidade do noso coñecemento ou, digamos, do grao de racionalidade das nosas crenzas, á luz das probas que temos dispoñibles. (Debo mencionar, entre parénteses, que o termo máis habitual, «grao de crenza racional», pode ser un síntoma dunha lixeira confusión, pois o que se quere dicir é «grao de racionalidade dunha crenza». A confusión xorde do seguinte: probabilidade explícase, en primeira instancia, como unha medida da forza ou intensidade dunha crenza ou convicción, medible, poñamos, pola nosa disposición a aceptar probabilidades nas apostas. Despois a xente decatouse de que a nosa crenza depende decote, en realidade, dos nosos desexos e temores, máis que de argumentos racionais. Así, por un lixeiro cambio, a probabilidade pasa a ser interpretada como a intensidade, ou o grao, dunha crenza na medida en que está racionalmente xustificada. A estas alturas, a referencia á intensidade dunha crenza, ou ao grao dunha crenza, resulta claramente redundante, polo que o «grao de crenza» debería ser substituído por «grao de racionalidade da crenza». Con estes comentarios non quero dicir que eu estea disposto a aceptar toda forma de interpretación subxectiva; véxase o punto 12, infra., e o capítulo *ii do meu Postscript: After Twenty Years.) 3. Para aforrar espazo, vou explicar o problema do peso das probas simplemente ofrecendo un exemplo dos paradoxos que mencionei antes: o exemplo que podemos denominar paradoxo das probas ideais. Supoñamos que z é unha moeda e que a é o enunciado «o enésimo lanzamento (aínda non observado) de z sairá cara». Na teoría subxectiva, pódese asumir que a probabilidade absoluta (ou previa) do enunciado a é igual a 1/2, isto é, (1) P(a) = 1/2 Agora supoñamos que e é unha proba estatística, isto é, un informe estatístico, baseado na observación de miles ou quizais 561 a lóxida da descuberta científica millóns de lanzamentos de z; e supoñamos que esta proba e é idealmente favorable á hipótese de que z é estritamente simétrica: que é unha «boa» moeda, con equidistribución. (Nótese que aquí e non é o informe completo e detallado sobre os resultados de cada un destes lanzamentos –podemos dar por suposto que este informe se perdeu– senón só un resumo estatístico do informe completo; por exemplo, e pode ser o enunciado «entre un millón de lanzamentos observados de z, saíu cara en 500.000 20 casos». Observarase, polo punto 8 infra., que unha proba e' con 500.000 ± 1.350 casos seguiría sendo ideal, adoptando as miñas funcións C e E; de feito, do punto de vista destas funcións, e é ideal precisamente porque implica e'). Entón non temos outra opción, con relación a P(a, e), máis que asumir (2) P(a, e) = 1/2 Isto significa que a probabilidade de que saia cara permanece inalterada, vista a proba e, pois agora temos (3) P(a) = P(a, e). Mais, segundo a teoría subxectiva, (3) significa que e é, en conxunto, información (absolutamente) irrelevante con respecto a a. Isto é bastante sorprendente, pois significa, máis explicitamente, que o denominado «grao de crenza racional» na hipótese a non debería verse afectado en absoluto pola acumulación de información que serve de proba, e; e que a ausencia de proba estatística sobre z xustifica precisamente o mesmo «grao de crenza racional» que o abultado peso das probas de millóns de observacións que, prima facie, apoian, confirman ou reforzan a nosa crenza. 4. Eu non creo que este paradoxo se poida resolver no marco da teoría subxectiva, pola seguinte razón: O postulado fundamental da teoría subxectiva é que os graos de racionalidade das crenzas, vistos á luz das probas, mostran 562 Karl Popper unha orde lineal: pódense medir, coma os graos de temperatura, nunha escala unidimensional. Mais, todos os intentos, desde Peirce ata Good, de resolver o problema do peso das probas dentro do marco da teoría subxectiva, introduciron, ademais da probabilidade, outra medida da racionalidade da crenza á luz das probas. Que lle chamen «outra dimensión da probabilidade», «grao de fiabilidade á luz das probas» ou «peso das probas» é bastante irrelevante. O que é relevante é a admisión (implícita) de que non é posible atribuír orde lineal aos graos de racionalidade das crenzas á luz das probas: que pode haber máis de unha maneira en que as probas afecten a racionalidade dunha crenza. Esta concesión é suficiente para tirar por terra o postulado fundamental en que se basea a teoría subxectiva. Así que a crenza inxenua en que existen realmente tipos de entidades inherentemente diferentes, denominadas, por exemplo, «grao de racionalidade da crenza», «grao de fiabilidade» ou «apoio nas probas», non serve para salvar a teoría subxectiva, como tampouco serve a crenza igualmente inxenua en que estas medidas varias «explican» diferentes explicanda. Afirmar que existe aquí un explicandum (coma o «grao de crenza racional») capaz de «explicar» en termos de probabilidade é algo que se sosterá ou caerá por terra segundo o que eu denominei «postulado fundamental». 5. Todas estas dificultades desaparecen se interpretamos as probabilidades obxectivamente (non importa, no contexto do presente texto, se a interpretación obxectiva é unha interpretación puramente estatística ou unha interpretación como propensión3). Segundo a interpretación obxectiva, temos que introducir b, o enunciado das condicións do experimento (as condicións que definen a sucesión dos experimentos da que tiramos o noso 3 Sobre a «interpretación da probabilidade como propensión», véxanse os cinco artigos (especialmente «Three Views Concerning Human Knowledge», «Philosphy of Science: A Personal Report», ambos recollidos en Conjectures and Refutations) referidos nas notas das pp. 313 e 314, supra. 563 a lóxida da descuberta científica exemplo); por exemplo, b pode ser a información «o lanzamento será un lanzamento de z, facendo xirar a moeda para que sexa aleatorio». Ademais, temos que introducir a hipótese probabilística obxectiva h, isto é, a hipótese «P(a, b) =1/2».*4 Do punto de vista da teoría obxectiva, o que nos interesa fundamentalmente é a hipótese h, isto é, o enunciado «P(a, b) = 1/2» 6. Se consideramos agora a proba estatística e idealmente favorable que deu lugar ao «paradoxo da proba ideal», está bastante claro que, desde o punto de vista da teoría obxectiva, hai que considerar e como proba que ten influencia en h, máis que proba que ten influencia en a: idealmente é favorable a h e bastante neutral con respecto a a. Asumindo que os varios lanzamentos son independentes, ou aleatorios, a teoría obxectiva dá para calquera proba estatística e de maneira bastante natural P(a, be) = P(a, b). Por tanto, e é realmente irrelevante para a, en presenza de b. Como e é proba a favor de h, o noso problema diríxese, naturalmente, á cuestión de como a proba e corrobora h (ou confirma h). A resposta é que se e é proba idealmente favorable, entón tanto E(h, e) coma C(h, e), o grao de corroboración de h, dado e, aproximarase a 1, se o tamaño da mostra en que se basea e vai ata o infinito4. Así que a proba ideal produce un comportamento de E e C igualmente ideal. En consecuencia, non xorde para- *4 Nótese que «b» se pode interpretar, de xeito alternativo, non como o nome dun enunciado senón como o nome dunha sucesión de lanzamentos; neste último caso teriamos que interpretar que «a» é o nome dunha clase de acontecementos, máis que o dun enunciado, mais «h» segue a ser o nome dun enunciado. 4 Tanto E coma C se definen na miña primeira nota. Baste aquí con lembrar que E(h, e) = (P(e, h) – (P(e))/(P(e, h) + P(e)), e que C se aproxima a E na maioría dos casos de importancia. Neste mesmo Journal 5, 1954, 324, eu propuxen definirmos C(x, y, z) = P(y, xz) – P(y, z) P(y, xz) – P(xy, z) + P(y, z) Disto obtemos C(x, y) asumindo que z (os «coñecementos previos») é tautolóxico ou non existente, se se prefire esta expresión. 564 Karl Popper doxo ningún e podemos medir de xeito bastante natural o peso da proba con respecto á hipótese h ou ben por E(h, e) ou C(h, e) ou, se non (manténdose máis próximos á idea de Keynes), polos valores absolutos dunha destas funcións. 7. Se, como ocorre no noso caso, h é unha hipótese estatística e e o informe dos resultados de probas estatísticas de h, entón C(h, e) é a medida do grao en que estas probas corroboran h, exactamente igual que no caso dunha hipótese non estatística. Débese mencionar que, en contraste co que ocorre no caso das hipóteses non estatísticas, ás veces pode ser bastante doado facer estimacións sobre os valores numéricos de E(h, e) e mesmo de C(h, e), se h é unha hipótese estatística5. (En 8 indicarei brevemente como se poden facer tales cálculos numéricos en casos simples, incluíndo, evidentemente, o caso h = «p(a, b) = 1»). A expresión (4) P(e, h) – p(e) é crucial para as funcións E(h, e) e C(h, e); en realidade, estas funcións non son máis ca dúas maneiras diferentes de «normalizar» a expresión (4); así que elas aumentan e diminúen con (4). Isto quere dicir que para atoparmos un bo enunciado de comprobación e (que, de ser verdadeiro, é altamente favorable a h), temos que construír un informe estatístico e tal (i) que e faga grande P(e, h) (que é a 'verosimilitude' de Fisher de h dado e), ou sexa, case igual a 1, e (ii) tal que e faga P(e) pequeno, isto é, case igual a 0. unha vez construído un enunciado de proba e deste tipo, temos que someter o propio e a probas empíricas (isto é, temos que intentar atopar probas que refuten e). 5 É bastante probable que en casos numericamente calculables, as funcións logarítmicas propostas por Hamblin e Good (véxase a miña «Segunda Nota») melloren as funcións propostas inicialmente por min. Ademais, débese sinalar que do punto de vista numérico (mais non do punto de vista teórico que subxace aos nosos desiderata) as miñas funcións e o «grao de apoio nos feitos» de Kemeny e Oppenheim darán resultados semellantes na meirande parte dos casos. 565 a lóxida da descuberta científica Agora sexa h o enunciado (5) P(a, b) = r e sexa e o enunciado «Nunha mostra que ten o tamaño n e que cumpre a condición b (ou escolleita ao chou da poboación b), a cúmprese en n(r ± δ) dos casos»*1. Entón podemos poñer, especialmente para valores pequenos de δ, (6) P(e) ≈ 2δ *2 Agora podemos poñer P(e) = 2, pois isto significaría que atribuímos iguais probabilidades (por tanto, as probabilidades 1/(n + 1)) a cada unha das n + 1 proporcións, 0/n, 1/n, ... n/n, con que unha propiedade a pode ocorrer nunha mostra do tamaño n. Por tanto, teriamos que atribuír a probabilidade P(e) = (2d + 1) / (n + 1) a un informe estatístico e que nos di que m ± d membros dunha poboación do tamaño n teñen a propiedade a, de maneira que poñendo δ = (d + (1/2))/(n + 1), obtemos P(e) = 2δ. (A equidistribución descrita aquí é a que asume laplace na dedución da súa regra de sucesión. É adecuada para avaliar a probabilidade absoluta, P(e), se e é un informe estatístico sobre unha mostra. Pero é inadecuada para avaliar a probabilidade relativa P(e, h) do mesmo informe, dada unha hipótese h segundo a cal a mostra é o produto dun experimento repetido n veces, cuxos posibles resultados ocorren cunha certa probabilidade cada un. Neste caso, sería adecuado asumir unha distribución combinatoria, isto é, a distribución de Bernoulli en lugar da de laplace). En (6) vemos que, se quixermos facer P(e) pequeno, temos que facer pequeno. *1 Asúmese aquí que se o tamaño da mostra é n, a frecuencia dentro desta mostra pódese determinar como moito cunha imprecisión de ±1/2n, de maneira que para un n finito, δ ≥1/2n temos (en mostras máis grandes, isto dá simplemente δ > 0). *2 A fórmula (6) é unha consecuencia directa do feito de que o contido informativo dun enunciado aumenta coa súa precisión; véxanse os apartados 34 a 38 (a isto temos que engadir o feito de que no caso dunha mostra estatística, o grao de imprecisión e de probabilidade teñen os mesmo mínimos e máximos: 0 e 1). 566 Karl Popper Por outra banda, P(e, h) –a verosimilitude de h– aproximarase a 1 ou ben se é comparativamente pequeno (aproximadamente, se δ ≈ 1/2), ou ben (se δ é pequeno) se n, o tamaño da mostra, é un número grande. Atopamos, logo, que P(e, h) – P(e) e, xa que logo, as nosas funcións E e C, só poden ser grandes se δ é pequeno e n grande; noutras palabras, se e é un informe estatístico que afirma un bo axuste nunha mostra grande. Así que o enunciado de comprobación e será tanto mellor canto maior sexa a súa precisión (que será inversa a 2δ e, en consecuencia, a súa refutabilidade ou contido, e canto máis grande sexa o tamaño da mostra n, isto é, o material estatístico requirido para comprobar e. Construído deste xeito, o enunciado de comprobación e pode ser logo confrontado cos resultados de observacións reais. Vemos que a acumulación de proba estatística, se é favorable, aumentará E e C. Así, E e C pódense considerar medidas do peso da proba a favor de h; ou, se non, os seus valores absolutos pódense considerar medidas do peso das probas con respecto a h. 8. Como o valor numérico de P(e, h) se pode determinar coa axuda do teorema binomial (ou da integral de laplace) e dado que, especialmente para un pequeno, podemos, pola fórmula (6), poñer P(e) igual a 2δ, é posible calcular P(e, h) P(e) numericamente, e tamén E. Ademais, podemos calcular para calquera dado n un valor δ = P(e)/2 para o que P(e, h) P(e) sería o máximo. (Para n = 1.000.000, obtemos δ = 0,0018). Igualmente, podemos calcular outro valor, de δ = P(e)/2 para o que E sería o máximo. (Para o mesmo n, obtemos δ = 0,00135, e E(h, e) = 0,9946). Para unha lei universal h tal que h = «P(a, b) = 1» que superase n probas rigorosas, todas elas co resultado a, obtemos, primeiro, C(h, e) = E(h, e), en vista de P(h) = 0; e ademais, avaliando P(e) coa axuda dunha distribución de laplace e d = 0, obtemos C(h, e) = n/(n + 2) = 1 – (2/ (n + 2)). Deberíase 567 a lóxida da descuberta científica lembrar, porén, que as teorías científicas non estatísticas teñen, polo regular, unha forma totalmente diferente da que describimos aquí para h; ademais, de seren forzadas a adoptaren esta forma, entón calquera caso a, e por tanto a «proba» e, volveríase esencialmente non observable*3. 9. De todo isto pódese observar que a comprobación dunha hipótese estatística é dedutiva, igual que a de todas as outras hipóteses: primeiro constrúese un enunciado de cmprobación de tal maneira que se deduza (ou case) da hipótese, aínda que o seu contido ou comprobabilidade sexa alto, e despois confróntase coa experiencia. É interesante sinalar que se se decidise que e fose un informe completo das nosas observacións (poñamos, un informe completo sobre unha sucesión longa de lanzamentos, cara, cara, cruz, ..., etc., unha sucesión de mil elementos), entón e non valería para nada como proba nunha hipótese estatística, pois calquera sucesión real de lonxitude n ten a mesma probabilidade que calquera outra sucesión (dado h). Así, deberiamos chegar ao mesmo valor para P(e, h) e, por tanto, para E e C (a saber: E = C = 0) xa e conteña, poñamos, só caras, ou xa conteña exactamente a metade de caras e a metade de cruces. Isto *3 Poderíase, con todo, falar do grao de corroboración dunha teoría con respecto a un campo de aplicación, no sentido dos apéndices i e *viii e poderíase usar logo o método do cálculo descrito aquí. Mais como este método ignora a estrutura fina de contido e probabilidade, resulta moi rudimentario no tocante ás teorías non estatísticas. Nestes casos, podemos usar o método comparativo explicado na nota 7 da «Primeira Nota», infra. Débese subliñar que formulando unha teoría coa forma «(x)Ax», en xeral vémonos obrigados a converter «A» nun predicado altamente complexo e non observable. (Véxase tamén o apéndice *vii, especialmente a nota 1). Paréceme que ten certo interese mencionar aquí que o método elaborado no texto permítenos obter resultados numéricos (isto é, graos numéricos de corroboración) en todos os casos previstos por Laplace ou polos lóxicos modernos que introducen sistemas lingüísticos artificiais, agardando en van obter así unha métrica a priori para a probabilidade dos seus predicados, crendo como eles cren que isto é necesario para obter resultados numéricos. Mais eu obteño graos numéricos de corroboración en moitos casos en moita maior medida que estes sistemas lingüísticos, pois os predicados medibles non crean ningún novo problema para o noso método. (E é unha grande vantaxe que non teñamos que introducir unha métrica para a probabilidade lóxica de calquera dos predicados de que se trate; véxase a miña crítica no punto 3 da «Segunda Nota», supra. Véxase tamén o meu segundo Prólogo, 1958). 568 Karl Popper demostra que non podemos usar, como proba a favor ou en contra de h, o noso coñecemento da observación total, senón que debemos extraer, do noso coñecemento da observación, aqueles enunciados estatísticos que poidan ser comparados con enunciados que ou ben se deducen de h, ou que polo menos teñan unha alta probabilidade, dado h. Así que se e está formado polos resultados completos dunha sucesión longa de lanzamentos, entón e é, nesta forma, completamente inservible como enunciado de proba dunha hipótese estatística. Mais un enunciado loxicamente máis feble da frecuencia media de caras, extraída do mesmo e, si que podería ser usado para este fin. Isto é debido a que unha hipótese probabilística pode explicar só resultados interpretados estatisticamente e, por tanto, só pode ser corroborada e comprobada mediante resumos estatísticos, e non, por exemplo, mediante as «probas totais dispoñibles», se isto consiste nun informe completo da observación, nin sequera se as súas varias interpretacións estatísticas se puidesen usar como enunciados de comprobación de grande peso e calidade*4. Así que a nosa análise mostra que os métodos estatísticos son esencialmente hipotético-dedutivos e que proceden mediante a *4 Este punto é de considerable interese no relativo ao problema do valor numérico das probabilildades absolutas que se necesitan para a determinación de C(x, y), ou sexa, o problema tratado no punto 3 da «Segunda Nota» e tamén na presente nota (véxase sobre todo a nota ao pé *1). Se tivésemos que determinar a probabilidade absoluta das «probas totais dispoñibles» consistentes nun elevado número de informes observacionais, entón teriamos que coñecer a probabilidade absoluta (ou «amplitude») de cada un destes informes, para formar o seu produto, baixo a suposición (comentada no apéndice *vii, supra.) da independencia absoluta destes informes. Pero para determinar a probabilidade absoluta dun resumo estatístico, non hai que facer ningunha suposición sobre a probabilidade absoluta dos informes da observación ou a súa independencia. Pois está claro, mesmo sen asumir unha distribución de Laplace, que (6) ten que ser válido para valores pequenos de , simplemente porque o contido de e sempre ten que ser unha medida da súa precisión (cf. apartado 36) e, por tanto, a probabilidade absoluta débese medir pola amplitude de e, que é 2. Unha distribución laplaciana, entón, pódese aceptar simplemente como a suposición equiprobabilística máis simple que dá lugar a (6). Débese mencionar, neste contexto, que se pode dicir que a disbribución laplaciana está baseada nun universo de mostras, antes que nun universo de cousas ou acontecementos. O universo de mostras escolleito depende, evidentemente, da hipótese que haxa que comprobar. É dentro de cada universo de mostras onde unha asunción de equiprobabilidade dá lugar a unha distribución laplaciana (ou «rectangular»). 569 a lóxida da descuberta científica eliminación de hipóteses inadecuadas, igual que todos os outros métodos científicos. 10. Se é moi pequeno e, por tanto, tamén P(e), que é posible só para mostras amplas, entón temos, en vista de (6), (7) P(e, h) ≈ P(e, h) – P(e) Neste caso, e só neste caso, será posible aceptar a función de verosimilitude de Fisher como medida adecuada de grao de corroboración. Podemos interpretar, á inversa, a nosa medida de grao de corroboración como unha xeneralización da función de verosimilitude de Fisher, unha xeneralización que cubre casos, como un δ comparativamente amplo, en que a función de verosimilitude de Fisher sería claramente inadecuada. Isto é porque a probabilidade de h á luz das probas estatísticas e non debería acadar un valor próximo ao seu máximo simplemente porque (ou parcialmente porque) as probas estatísticas dispoñibles e carezan de precisión. Non resulta satisfactorio, por non dicir que resulta paradoxal, que a proba estatísticas e, baseadas nun millón de lanzamentos e δ = 0,00135, poidan dar como resultado numérico a mesma verosimilitude (a saber: P(e, h) = 0,9930) que a proba estatística e', baseada só en cen lanzamentos e δ = 0,135.*5 (Mais resulta bastante satisfactorio atopar que E(h, e) = 0,9946, mentres que E(h, e') = 0,7606). 11. Nótese que a probabilidade lóxica absoluta dunha lei universal h (isto é, P(h)) será en xeral cero, nun universo infinito. Por esta razón, P(e, h) (isto é, a verosimilitude de h) volverase indefinida, na maioría dos sistemas de probabilidade, pois na maioría deles P(e, h) defínese como P(eh)/P(h) = 0/0. Así que *5 A «verosimilitude» de Fisher resulta ser en moitos casos intuitivamente insatisfactoria. Sexa x «o próximo lanzamento con este dado será un seis». Entón a probabilidade de x á luz da das probas y será 1, ou sexa, o seu valor máximo, se consideramos que y significa, por exemplo, «o próximo lanzamento é par», «o próximo lanzamento é un número > 4» ou mesmo «o próximo lanzamento é un número distinto de 2». (Semella que os valores de C(x, y) resultan satisfactorios: son, respectivamente, 3/8, 4/7 e 1/10. 570 Karl Popper precisamos un cálculo formal de probabilidade que dea valores definidos para P(e, h) mesmo se P(h) = 0, e que dea sempre e de xeito non ambiguo P(e, h) = 1 sempre que e se deduza (ou «case se deduza») de h. un sistema que cumpría estas esixencias foi publicado por min hai xa tempo6. 12. O noso E(h, e) pódese interpretar correctamente como unha medida do poder explicativo de h con respecto a e, aínda que e non sexa un informe de intentos xenuínos e sinceros de refutar h. Mais o noso C(h, e) pódese interpretar correctamente como grao de corroboración de h –ou da racionalidade da nosa crenza en h, á luz das probas –só se e consiste en informes dos resultados de intentos sinceros de refutar h, máis que de intentos de verificar h. Como se insinuou na oración anterior, a miña proposta é que, malia que é erróneo pensar que a probabilidade se pode interpretar como medida da racionalidade das nosas crenzas (esta interpretación é excluída polo paradoxo da proba perfecta), o grao de corroboración si que se pode interpretar neste sentido7. En canto ao cálculo de probabilidade, ten un altísimo número de interpretacións diferentes8. Aínda que o «grao de crenza racional» non estea entre elas, hai unha interpretación lóxica que considera a probabilidade como unha xeneralización da deducibilidade. Mais esta lóxica probabilística ten pouco que ver coas estimacións hipotéticas de oportunidades ou de posibilidades, pois os enunciados de probabilidade en que expresamos estas estimacións sempre son valoracións hipotéticas das posibilidades obxectivas existentes nunha situación concreta, ou sexa, nas condicións obxectivas da situación, por exemplo, na elaboración de experimentos. Estas estimacións hipotéticas 6 Neste Journal 6, 1955; véxase en especial p. 56 ss. Unha forma simplificada deste sistema axiomático pódese atopar nos meus artigos «Philosophy of Science: A Personal Report» (p. 191) e «The Propensity Interpretation», etc. Referido na nota 3 supra. 7 Cf. este Journal 6, 1955 (o título do apartado). 8 Cf. a miña nota en Mind 47, 1938, 275. 571 a lóxida da descuberta científica (que non son deducibles de nada, senón que son conxecturas libres, aínda que poidan ser suxeridas por consideracións de simetría ou por material estatístico) poden en moitos casos importantes ser sometidas a comprobacións estatísticas. Nunca son estimacións da nosa propia falta de coñecemento: a perspectiva oposta, como viu tan claramente Poincaré, é consecuencia dunha perspectiva determinista (posiblemente inconsciente) do mundo9. Desde este punto de vista, un «xogador racional» sempre intenta facer estimacións sobre as posibilidades obxectivas. As posibilidades que el/ela están dispostos a aceptar non representan unha medida do seu «grao de crenza» (como se pensa normalmente), senón que son máis ben o obxecto da súa crenza. El/ela cren que hai, obxectivamente, tales posibilidades, ou sexa, cren nunha hipótese probabilística h. Se queremos medir, de xeito behaviorista, o grao da súa crenza (neste exemplo ou en calquera outra cousa) entón teriamos que descubrir, por exemplo, que proporción da súa fortuna están dispostos a arriscar nunha aposta de un a un a que a súa crenza (a súa estimación das posibilidades) era correcta, sempre que isto se poida determinar dalgunha maneira. En canto ao grao de corroboración, non é outra cousa que unha medida do grao en que unha hipótese h foi sometida a comprobacións e da medida en que superou tales probas. Non se debe interpretar, logo, como grao de racionalidade da nosa crenza na verdade de h; en realidade, sabemos que C(h, e) = 0 sempre que h sexa loxicamente verdade. É, máis ben, unha medida da racionalidade de dar por boa, provisionalmente, unha conxectura, sabendo que é unha hipótese, iso si, unha hipótese sometida a exames exhaustivos. 9 Cf. H. Poincaré, Science and Method, 1914, IV, 1. (Este capítulo foi publicado orixinariamente en La Revue du mois, 3, 1907, 257-276 e en The Monist, 22, 1912, pp. 31-52. 572 Karl Popper 13. Os doce puntos anteriores constitúen a «Terceira Nota», tal como foi publicada no B.J.P.S. Engadirei dúas puntualizacións para facer máis explícitas algunhas das consideracións de tipo formal que están implícitas nesta nota. O primeiro problema que teño en mente é, de novo, o da métrica da probabilidade lóxica (cf. a segunda nota, punto 3) e a súa relación coa distinción entre o que vou chamar estimacións de probabilidade primarias e secundarias. A miña tese é que no nivel secundario a distribución de Bernoulli e laplace proporciónanos unha métrica. Podemos operar cun sistema S1 = {a, b, c, a1, b1, c1,...} de elementos (no senso do noso sistema de postulados do apéndice *iv). Estes elementos darán lugar a enunciados de probabilidade coa forma «p(a, b) = r». Podémolos denominar «enunciados de probabilidade primarios». Estes enunciados de probabilidade pódense considerar despois como elementos dun sistema secundario de elementos S2 = {e, f, g, h,...}, de maneira que «e», «f», etc. sexan agora nomes de enunciados da forma «p(a, b) = r». O que nos di o teorema de Bernoulli, aproximadamente, é o seguinte: sexa h «p(a, b) = r»; entón, se h é verdade, é extremadamente probable que nunha sucesión longa de repeticións das condicións b, a frecuencia da ocorrencia de a será igual a r, ou moi próxima. Supoñamos que «δr(a)n» representa o enunciado que di que a ocorrerá nunha sucesión longa de n repeticións cunha frecuencia r ± δ. Entón, o teorema de Bernoulli di que a probabilidade de δr(a)n se aproximará a 1, segundo aumenta n, dado h, isto é, dado p(a, b) = r. (Tamén di que esta probabilidade se aproximará a 0, dado que p(a, b) = s, sempre que s caia fóra de r ± δ, o cal é imporante para a refutación de hipóteses probabilísticas). Isto quere dicir que podemos escribir o teorema de Bernoulli na forma dun enunciado (secundario) de probabilidade relativa sobre os elementos g e h de S2, isto é, podemos escribilo na forma lim p(g, h) = 1 n∞ 573 a lóxida da descuberta científica onde g = δr(a)n e onde h é a información de que p(a, b) = r; isto é, h é un enunciado de probabilidade primario e g é un enunciado primario de frecuencia relativa. Estas consideracións demostran que temos que admitir en S2 enunciados de frecuencia como g, isto é, δr(a)n e tamén suposicións probabilísticas ou estimacións de probabilidade hipotética, como h. Por esa razón, en beneficio dun S2 homoxéneo, semella apropiado identificar todos os enunciados de probabilidade que forman os elementos de S2 con enunciados de frecuencia ou, noutras palabras, asumir, para os enunciados de probabilidade primarios e, f, g, h, ... que forman os elementos de S2, algún tipo de interpretación frecuencial da probabilidade. Ao mesmo tempo, podemos asumir a interpretación lóxica da probabilidade para os enunciados de probabilidade que teñan a forma P(g, h) = r isto é, para os enunciados de probabilidade secundarios que fan afirmacións sobre o grao de probabilidade dos enunciados de probabilidade primarios g e h. Aínda que non teñamos unha métrica lóxica (ou absoluta) dos enunciados de probabilidade primarios, isto é, aínda que non teñamos idea do valor de p(a) ou de p(b), podemos conseguir unha métrica lóxica ou absoluta dos enunciados de probabilidade secundarios: isto ofréceo a distribución laplaciana, segundo a cal P(g), a probabilidade absoluta de g, ou sexa, δr(a)n, é igual a 2δ, xa sexa g unha observación empírica ou unha hipótese; de maneira que unha hipótese probabilística típica h obtén P(h) = 0, porque h ten a forma «p(a, b) = r», sendo δ = 0. Como os métodos de Bernoulli nos permiten calcular o valor da probabilidade relativa P(g, h) , por pura análise matemática, podemos considerar que as probabilidades relativas P(g, h) son tamén determinadas por razóns puramente lóxicas. Semella enteiramente apropiado, xa que logo, adoptar, nun nivel secundario, a interpretación lóxica do cálculo formal da probabilidade. 574 Karl Popper resumindo, podemos considerar que os métodos de Bernoulli e laplace están dirixidos ao establecemento dunha métrica de probabilidades puramente lóxica no nivel secundario, independentemente de se existe ou non unha métrica lóxica de probabilidades no nivel primario. Con isto os métodos de Bernoulli determinan a métrica lóxica de probabilidades (probabilidade secundaria de hipóteses primarias, maiormente) e os de laplace a métrica lóxica das probabilidades absolutas (de informes estatísticos de mostras, maiormente). Non hai dúbida de que os seus esforzos estaban dirixidos á elaboración dunha teoría probabilística da indución; certamente identificaron C con p. Ninn que dicir ten que me parece que nisto estaban enganados, pois as teorías estatísticas son, coma todas as outras teorías, hipotético-dedutivas. E as hipóteses estatísticas contrástanse, igual que todas as outras hipóteses, mediante intentos de falsificalas, isto é, mediante intentos de reducir a súa probabilidade secundaria a cero, ou case a cero. O seu grao de corroboración, C, só ten interese se é o resultado de tales comprobacións, pois non hai nada máis doado que seleccionar probas estatísticas para que sexan favorables a unha hipótese estatística, se desexásemos facelo. *14. Ao final de todo isto, alguén podería moi ben preguntarse se eu non terei cambiado imperceptiblemente de doutrina. Pode semellar que nada nos impide dicir que C(h, e) quere dicir «a probabilidade indutiva de h, dado e» ou (se se cre que isto pode levar a engano, en vista de que C non obedece as leis do cálculo de probabilidade) «o grao de racionalidade da nosa crenza en h, dado e». un crítico indutivista benevolente mesmo podería darme os parabéns por resolver, mediante a miña función C, o antigo problema da indución nun senso positivo, ou sexa, por conseguir establecer por fin a validez do razoamento indutivo mediante a miña función C. A miña resposta a isto sería a seguinte. Eu non fago obxeccións a que se use un nome ou outro para denominar C(h, e), 575 a lóxida da descuberta científica sexa ou non sexa apropiado, pois a terminoloxía éme bastante indiferente, sempre que non nos leve a engano. E tampouco poño obxeccións (sempre que non nos leve a engano) ao significado de «indución». Pero debo insistir en que C(h, e) só se pode interpretar como grao de corroboración se e é un informe sobre as comprobacións máis rigorosas que fomos quen de deseñar. Este punto é o que marca a diferenza entre a actitude do indutivista ou verificacionista e a miña propia actitude. A/o intuitivista ou verificacionista quere que a súa hipótese se faga firme, que sexa afirmada. Agarda poder facer máis firme a súa hipótese mediante a proba e e anda á busca de firmeza e de confirmación. Como moito, pódese decatar de que non nos podemos basear na nosa selección de e: que non podemos ignorar os casos que non sexan favorables e que e debe comprender informes sobre o coñecemento total procedente da observación, favorable e desfavorable. (Nótese que o requisito do indutivista de comprender todo o noso coñecemento procedente da observación non pode ser representado en ningún formalismo. É un requirimento non formal, unha condición de adecuación que debe ser cumprida se queremos interpretar p(h, e) como grao do noso coñecemento imperfecto de h). En contraste con esta actitude indutivista, eu afirmo que C(h, e) non se debe interpretar como o grao de corroboración de h por e, a menos que e nos informe dos resultados dos nosos intentos sinceros de tirar abaixo h. O requisito de sinceridade non se pode formalizar, como tampouco se pode formalizar o requisito indutivista de que e teña que representar todo o noso coñecemento procedente da observación. Mais se e non é un informe sobre os resultados dos nosos intentos sinceros de botar h abaixo, entón simplemente nos estaremos enganando a nós mesmos se pensamos que podemos interpretar C(h, e) como grao de corroboración ou, para o caso, como calquera outra cousa. O meu crítico benévolo pode retrucar que continúa sen ver a razón pola que a miña función C non se pode considerar 576 Karl Popper unha solución positiva ao problema clásico da indución. Dirá este crítico que a miña resposta podería resultar perfectamente aceptable para o indutivista clásico, en vista de que simplemente consiste na exposición do denominado «método da indución eliminatoria», un método indutivo ben coñecido para Bacon, Whewell e Mill, que non foi totalmente esquecido polos teóricos da probabilidade indutiva (aínda que este crítico tería que admitir que estes últimos foron incapaces de o incorporar eficazmente nas súas teorías). A miña reacción a este retruque sería lamentarme pola miña reiterada incapacidade para explicar cal era o meu principal obxectivo coa suficiente claridade. Pois o único obxectivo da eliminación defendida por todos estes indutivistas era establecer con toda a firmeza posible a teoría sobrevivente, que, pensaban eles, tiña que ser a verdadeira (ou talvez só que era altamente probable, na medida en que se cadra non fomos quen de eliminar totalmente todas as outras teorías que fosen distintas da verdadeira). En oposición a isto, eu non creo que sexamos capaces de reducir seriamente, por eliminación, o número de teorías alternativas, pois este número sempre seguirá sendo infinito. O que si facemos, ou deberiamos facer, é aceptar, polo momento, a teoría máis improbable entre as teorías sobreviventes ou, máis concretamente, a que pode ser comprobada máis rigorosamente. Aceptamos provisionalmente esta teoría, mais só no senso de que a escollemos por ser merecedora de ser sometida a críticas ulteriores e ás comprobacións máis rigorosas que sexamos quen de deseñar. Visto polo lado positivo, podemos estar autorizados a engadir que a teoría sobrevivente é a mellor teoría –e a mellor comprobada– das que coñecemos. 577 a lóxida da descuberta científica Addenda, 1972 (1) Engadiría un comentario ás últimas liñas do texto. Con a «mellor» teoría quero dicir aquela, entre as alternativas que sobreviven, que teña maior poder explicativo, maior contido e maior simplicidade, e que sexa menos ad hoc. Tamén será a que sexa máis comprobable; pero a mellor teoría neste sentido non ten por que ser sempre a que xa foi máis e mellor comprobada de feito. (2) Acaba de publicarse unha contribución importantísima ao problema da falsificabilidade de teorías probabilísticas ou estatísticas e de probas estatísticas falsificadoras: Donald A. Gillies, «A Falsifying rule for Probability Statements», B.J.P.S. 22, 1971, p. 231-261. 578 Karl Popper APÉNDICE *x universais, disposicións e necesidade natural ou física (1) A doutrina fundamental que subxace a todas as teorías da indución é a doutrina da primacía das repeticións. Tendo en mente a actitude de hume, podemos distinguir dúas variantes desta doutrina. A primeira (que hume criticara) pódese denominar doutrina da primacía lóxica das repeticións. Segundo esta doutrina, a repetición de casos fornece unha especie de xustificación para a aceptación dunha lei universal (a idea de repetición relaciónase, polo regular, coa de probabilidade). A segunda (defendida por hume) pódese chamar doutrina da primacía temporal (e psicolóxica) das repeticións. Segundo esta segunda doutrina, malia non nos proporcionaren xustificación ningunha para ningunha lei universal nin para as expectativas e as crenzas que carreta, en realidade as repeticións indúcennos e incítannos a abrigarmos estas expectativas e crenzas, por moi pouco xustificadas que estean. Ambas as variantes desta doutrina da primacía das repeticións, tanto a máis forte, que afirma a primacía lóxica das repeticións, como a máis feble, que afirma a súa primacía temporal (causal ou psicolóxica), son insostibles. Isto pódese demostrar coa axuda de dous argumentos enteiramente diferentes. O meu primeiro argumento contra a primacía das repeticións é o seguinte. Todas as repeticións que nós experimentamos son repeticións aproximadas. Cando digo que unha repetición é aproximada quero dicir que unha repetición B dun acontecemento A non é idéntico a A, ou indistinguible de A, senón que é máis ou menos semellante a A. Mais se a repetición se basea así na simple semellanza, será que comparte unha das principais características da semellanza, que é a súa relatividade. Dúas cousas que son semellantes son sempre semellantes en certos aspectos. Isto pódese ilustrar por medio dun simple diagrama. 579 a lóxida da descuberta científica Se observamos este diagrama, decatámonos de que algunhas das súas figuras son semellantes con respecto á presenza ou ausencia de sombreado, outras son semellantes con respecto á forma e outras son semellantes con respecto ao tamaño. O cadro pódese ampliar do seguinte xeito: É doado decatarse de que non hai un punto final para os posibles tipos de semellanza. 580 Karl Popper Estes diagramas mostran que as cousas poden ser semellantes segundo diferentes aspectos e que dúas cousas que son semellantes desde un punto de vista poden ser desemellantes desde algún outro punto de vista. En xeral, a semellanza, e con ela a repetición, sempre presupón a adopción dun punto de vista: algunhas semellanzas ou repeticións sorprenderannos se estamos interesados nun problema. Mais se a semellanza e a repetición presupoñen a adopción dun punto de vista, un interese ou unha expectativa, é loxicamente necesario que os puntos de vista, os intereses ou as expectativas sexan loxicamente anteriores, e tamén temporalmente (e casual ou psicoloxicamente) anteriores á repetición. Pero este resultado destrúe as dúas doutrinas da primacía das repeticións, a da primacía lóxica e a da temporal1. Débese engadir que para un grupo finito calquera de cousas, por moi variada que sexa a escolla, sempre podemos, cun pouco de enxeño, atopar algún punto de vista desde o cal todas as cousas pertencentes ao conxunto sexan semellantes (ou parcialmente iguais) consideradas desde este punto de vista, o cal significa que se pode dicir que todas as cousas son unha «repetición» doutras cousas, sempre que se adopte o punto de vista adecuado. Isto mostra que é unha inxenuidade concibir a repetición como algo definitivo ou que está xa dado. Isto está en íntima relación co feito (mencionado no apéndice *vii, nota 7; cf. a propiedade B) de que se pode atopar, para unha sucesión finita calquera de ceros e uns, unha regra matemática ou «lei» para construír unha sucesión infinita de tal maneira que comece pola sucesión finita dada. Agora paso ao meu segundo argumento en contra da primacía das repeticións. É o seguinte. hai leis e teorías que teñen un carácter totalmente diferente de «Todos os cisnes son brancos», aínda que se poidan formular de xeito semellante. 1 Algunhas ilustracións deste argumento, en canto que vai en contra da doutrina da primacía temporal das repeticións (isto é, contra Hume), pódense atopar nos apartados iv e v do meu artigo «Philosophy of Science: A Personal Report», agora incluído cun título diferente no capítulo 1 de Conjectures and Refutations, 1963, 1965. 581 a lóxida da descuberta científica Considérese a teoría atómica antiga. hai que recoñecer que se pode manifestar (nunha das súas formas máis simples) como «Todos os corpos materiais están compostos de corpúsculos». Pero está ben claro que a forma «todos» é comparativamente pouco importante no caso desta lei. O que quero dicir é que o problema de mostrar que un único corpo físico (poñamos, un pedazo de ferro) está composto por átomos ou «corpúsculos» é polo menos tan difícil coma mostrar que todos os cisnes son brancos. As nosas afirmacións transcenden, en ambos casos, a experiencia da observación. Ocorre o mesmo con case todas as teorías científicas. Non podemos mostrar directamente, nin sequera con respecto a un corpo físico, que, en ausencia de forzas, se despraza en liña recta, ou que atrae e é atraído por outro corpo físico de acordo coa lei do inverso do cadrado. Todas estas teorías describen o que podemos denominar propiedades estruturais do mundo e todas transcenden toda posible experiencia. A dificultade que se lles presenta a estas teorías estruturais non é tanto establecer a universalidade da lei a partir de casos repetidos coma establecer que é válida mesmo para un caso único. Esta dificultade foi percibida por moitos indutivistas. A maioría dos que a percibiron intentaron, como fixo Berkeley, facer unha distinción drástica entre xeneralizacións baseadas puramente na observación e teorías máis «abstractas» ou «ocultas», coma a teoría corpuscular ou a teoría de Newton; polo regular, intentaron resolver o problema dicindo, como fixo Berkeley, que as teorías abstractas non son afirmacións xenuínas sobre o mundo, senón que son só instrumentos para a predición de fenómenos observables. Eu chameille instrumentalismo a esta concepción e fíxenlle noutro lugar unha crítica en profundidade2. Baste aquí con dicir que eu rexeito o instrumentalismo e vou dar só unha razón para facelo: que 2 Cf. os meus artigos «A Note on Berkeley as a Precursor of Mach», B.J.P.S. 4, 1953 e «Three Views Concerning Human Knowledge» en Contemporary British Philosophy iii, editado por H. D. Lewis, 1956. Os dous están recollidos en Conjectures and Refutations, 1963, 1965. 582 Karl Popper non resolve o problema das propiedades «abstractas», «ocultas» ou «estruturais». Estas propiedades non ocorren só nas teorías «abstractas» que Berkeley e os seus seguidores tiñan en mente, senón que son mencionadas todo o tempo por todo o mundo na linguaxe ordinaria. Case todo enunciado que facemos transcende a experiencia. Non hai liña divisoria drástica entre un unha «linguaxe empírica» e unha «linguaxe teórica»: todos teorizamos continuamente, mesmo cando emitimos o enunciado singular máis trivial. Con isto chegamos ao problema principal que pretendo examinar neste apéndice. (2) É certo que se dicimos «Todos os cisnes son brancos», entón a «brancura» que predicamos é unha propiedade observable e, neste sentido, un enunciado singular como «Este cisne de aquí é branco» pódese dicir que está baseado na observación. Mais a razón pola que transcende á experiencia non se debe á palabra «branco», senón á palabra «cisne», pois ao chamarlle «cisne» atribuímoslle propiedades que van moito máis alá da simple observación (e que van case tan lonxe coma cando dicimos que está composto de «corpúsculos»). Así que non só transcenden a experiencia as teorías explicativas máis abstractas, senón tamén os enunciados ordinarios máis singulares. Porque incluso os enunciados ordinarios singulares sempre son interpretacións dos «feitos» á luz de teorías (e o mesmo se pode dicir dos «feitos» mesmos de que se trate: conteñen universais e os universais sempre implican un comportamento semellante ao dunha lei). Expliquei brevemente ao final do apartado 25 como é que o uso de universais como «vaso» ou «auga» nun enunciado como «aquí está un vaso de auga» transcende necesariamente a experiencia. É debido ao feito de que palabras como «vaso» ou «auga» úsanse para caracterizar o comportamento semellante ao dunha lei de certas cousas, o cal se pode expresar denominándoas «palabras disposicionais». Como toda lei transcende a experiencia (o cal non é máis que outra maneira de dicir que 583 a lóxida da descuberta científica non é verificable) todo predicado que exprese un comportamento semellante ao dunha lei tamén transcende a experiencia: esta é a razón pola que o enunciado «este contedor contén auga» é unha hipótese comprobable mais non verificable, porque transcende a experiencia3. Esta é a razón pola que é imposible «constituír» ningún verdadeiro termo universal (como intentou facer Carnap), isto é, definilo en termos procedentes da pura observación ou experimentais, ou «reducilo» a termos puramente experimentais ou da observación: como todos os universais son disposicionais, non se poden reducir á experiencia. Temos que os introducir como termos non indefinidos, excepto aqueles que podemos definir en termos doutros universais non experienciais (como «auga» se decidimos definila como «composto de dous átomos de hidróxeno e un de osíxeno»). (3) Decote pásase por alto que todos os universais indican disposicións, debido ao feito de que os universais poden ser disposicionais en varios graos. Así, «soluble» ou «rompible» son claramente disposicionais nun maior grao que «disolto» e «roto». Mais moitas veces non se percibe que mesmo «disolto» e «roto» son tamén disposicionais. un químico non diría que o azucre ou o sal se disolveron na auga se non agardase poder recuperar o azucre ou o sal, evaporando a auga. Así que «disolto» indica un estado disposicional. En canto a «roto», só temos que considerar como facemos cando temos a dúbida de se unha cousa rompeu ou non, por exemplo, como algo que nos caeu ao chan ou, talvez, un óso do noso corpo. O que facemos neste caso é comprobar o comportamento da cousa de que se trate, intentando saber se mostra, por exemplo, unha excesiva 3 Como é un enunciado singular, é menos incorrecto falar neste caso dunha simetría entre non verificabilidade e non falsificabilidade que no caso de enunciados universais, pois para falsificalo temos que aceptar que outro enunciado singular, igualmente non verificable, é verdadeiro. Mais mesmo aquí permanece unha certa simetría, pois en xeral, ao asumir a verdade, ou falsidade, dalgún enunciado de comprobación, só podemos establecer a falsidade do enunciado que se somete a comprobación, pero non a súa verdade. A razón é que esta última implica un número infinito de enunciados de comprobación. Véxase tamén o apartado 29 deste libro e o apartado *22 do Postscript. 584 Karl Popper mobilidade. Así que «roto», igual que «disolto», describe disposicións a comportarse dunha certa maneira regular ou semellante á dunha lei. Do mesmo xeito, dicimos que unha superficie é vermella ou branca, se ten a disposición a reflectir luz vermella ou branca e, en consecuencia, a disposición a ter aparencia vermella ou branca á luz do día. En xeral, a disposición de calquera propiedade universal verase claramente se consideramos as probas que fariamos cando non temos a certeza de que unha propiedade estea ou non presente nun caso concreto. Así que é un erro intentar distinguir entre predicados disposicionais e non disposicionais, o mesmo que intentar distinguir entre termos teóricos (ou linguaxes) e termos non teóricos, empíricos, observables, fácticos ou ordinarios. O que ocorre en realidade é algo do estilo do seguinte: aquilo que a xente aprende antes dunha certa idade crítica tende a consideralo como fáctico ou «ordinario» e aquilo que aprende máis tarde tende a consideralo como teórico ou, talvez, como «meramente instrumental» (semella que a idade crítica depende do tipo psicolóxico). (4) As leis universais transcenden a experiencia, se non máis, porque son universais e, por tanto, transcenden todo número finito dos seus casos observables; e os enunciados singulares transcenden a experiencia tamén porque os termos universais que normalmente ocorren neles implican disposicións a comportárensese de maneira semellante á dunha lei, de xeito que implican leis universais (dun nivel máis baixo de universalidade, polo regular). Segundo isto, as leis universais transcenden a experiencia polo menos de dúas maneiras: pola súa universalidade e pola ocorrencia neles de termos universais ou disposicionais. E transcenden a experiencia nun maior grao se os termos disposicionais que ocorren neles son disposicionais nun maior grao ou máis abstractos. hai capas sucesivas de universalidade cada vez maior e, por tanto, de transcendencia (no apartado *15 do Postscript faise un intento de explicar a maneira en que tamén son capas do que se pode chamar «profundidade»). 585 a lóxida da descuberta científica A transcendencia é, obviamente, a razón pola que as teorías ou leis científicas son non verificables e pola que a comprobabilidade ou refutabilidade é o único que as distingue, en xeral, das teorías metafísicas. Se se nos pregunta por que usamos estas leis universais transcendentais en lugar de mantérmonos máis pegados á «experiencia», pódense ofrecer dous tipos de resposta: (a) Porque as necesitamos: porque non existe nada parecido á «pura experiencia», senón que a experiencia é interpretada á luz das expectativas ou teorías que son «transcendentes». (b) Porque as persoas teóricas aspiran a explicaren experiencias e porque a explicación implica o uso de hipóteses explicativas que (para seren independentemente comprobables; véxase apartado *15 do Postscript) teñen que transcender o que aspiramos a explicar. A razón dada en (a) é de orde pragmática ou instrumentalista e, aínda que eu a considero certa, paréceme que non é comparable en importancia coa razón dada en (b) pois, por moito éxito que tivese un proxecto de eliminación de teorías explicativas para fins prácticos, o obxectivo da teoría non se vería afectado4. (5) Que as teorías transcenden a experiencia no senso indicado aquí foi afirmado en moitos lugares deste libro. Ao mesmo 4 Que é posible prescindir das teorías afírmao Carnap, Logical Foundations of Probability, p. 574 ss. Mais non hai razón ningunha para crer que a análise de Carnap, mesmo se fose defendible, puidese ser transferida da súa linguaxe modelo á «linguaxe da ciencia»; véxase o meu Prólogo, 1958. En dous artigos moi interesantes W. Craig estudou determinados proxectos de redución (véxase Journal of Symbolic Logic 18, 1953, p. 30 ss e Philosophical Review 65, p. 38 ss.). Aos seus excelentes comentarios críticos sobre o método de eliminar ideas «auxiliares» (ou «transcendentes»), pódese engadir o seguinte: (1) el consegue a eliminación de teorías explicativas, fundamentalmente, ascendendo unha cantidade infinita de teoremas ao rango de axiomas (ou substituíndo a definición de «teorema» por unha nova definición de «axioma» que é equivalente no tocante á sublingua «purificada»). (ii) Na construción práctica do sistema purificado, guíase polo noso coñecemento das teorías que hai que eliminar. (iii) O sistema purificado xa non é explicativo nin comprobable no senso en que son comprobables os sistemas explicativos, unha comprobabilidade que está relacionada esencialmente co seu contido informativo e profundidade (poderíase moi ben dicir que os axiomas do sistema purificado teñen cero profundidade no senso do apartado *15 do meu Postscript). 586 Karl Popper tempo, as teorías caracterizáronse como enunciados estritamente universais. unha crítica moi penetrante da idea de que as teorías, ou leis da natureza, se poden expresar adecuadamente mediante un enunciado universal, como «Todos os planetas desprázanse en elipse» foi proposta por William Kneale. A súa crítica pareceume moi difícil de comprender e nin sequera agora estou totalmente seguro de que comprendese a Kneale cabalmente, aínda que agardo que si5. Paréceme que a posición de Kneale se pode describir como segue. Aínda que os enunciados universais sexan implicados por enunciados de lei natural, estes últimos son loxicamente máis fortes que os primeiros. Non só afirman «Todos os planetas desprázanse en elipse», senón algo do estilo de «Todos os planetas desprázanse necesariamente en elipse». A un enunciado deste tipo Kneale chámalle «principio de necesariedade». A min non me parece satisfactoria a distinción que fai entre enunciado universal e o «principio de necesariedade». El fala da «necesidade dunha formulación máis precisa das nocións de continxencia e necesidade»6, pero un pouco máis adiante, sorprendentemente, lese: «De feito, a palabra 'necesidade' é a menos problemática das que temos que usar nesa parte da filosofía»7. É certo que, no texto que media entre estas dúas pasaxes Kneale intenta persuadirnos de que «o senso desta distinción [entre continxencia e necesidade] pódese comprender doadamente con exemplos»8. Mais os exemplos que dá 5 Cf. William Kneale, Probability and Induction, 1949. Un aspecto menor das miñas dificultades para comprender a crítica de Kneale ten que ver co feito de que nalgúns lugares ofrece paráfrases moi boas das miñas ideas, mais noutros semella que non me entende en absoluto (véxase, por exemplo, nota 17, infra.) 6 Ob. cit., p. 32. 7 Ob. cit., p. 80. 8 Ob. cit., p. 32. Unha das dificultades é que Kneale ás veces semella aceptar a idea de Leibniz («Unha verdade é necesaria cando a súa negación implica unha contradición; e cando non é necesaria, denomínase continxente». Die philosophischen Schriften, editado por Gerhardt, 3, p. 400; véxase tamén o no. 7, pp. 390 ss.), mentres que outras veces parece que usa «necesario» nun senso máis amplo. 587 a lóxida da descuberta científica deixáronme bastante perplexo. Supoñendo sempre que comprendese correctamente a Kneale, debo dicir que a súa teoría positiva das leis naturais me semella manifestamente insostible. Malia isto, a súa crítica ségueme parecendo moi valiosa. (6) Agora vou explicar por medio dun exemplo o que eu creo que é en esencia a crítica de Kneale á idea de que a caracterización das leis da natureza como enunciados universais é loxicamente suficiente e tamén intuitivamente adecuada. Considérese un animal extinto, poñamos o moa, un inmenso paxaro do que abundan ósos nalgunhas marismas de Nova Celandia (eu mesmo andei na súa procura). Decidimos usar o nome «moa» como nome universal (antes que un nome propio; cf. apartado 14) dunha certa estrutura biolóxica, mais deberiamos admitir que é bastante posible, obviamente (e mesmo bastante crible), que os moas nunca existisen no universo, nin que existirán nunca, a parte das que viviron en Nova Celandia; e supoñamos que esta idea verosímil sexa correcta. Supoñamos agora que a estrutura biolóxica do organismo do moa é dun tipo tal que en condicións moi favorables un moa poida vivir sesenta anos ou máis. Supoñamos ademais que as condicións en que viviu o moa en Nova Celandia distaban de ser ideais (debido, por exemplo, á presenza dalgún virus) e que ningún moa chegou nunca aos cincuenta anos de idade. Neste caso, o enunciado estritamente universal «Todos os moas morren antes de acadar os cincuenta anos» será verdadeiro pois, segundo a nosa suposición, nunha houbo, hai, nin haberá no universo moas de máis de cincuenta anos. Ao mesmo tempo, este enunciado universal non será unha lei da natureza pois, segundo as nosas suposicións, sería posible que un moa vivise máis tempo e se ocorre que ningún moa viviu nunca máis , isto será debido a condicións accidentais ou continxentes, coma a presenza dun determinado virus. O exemplo demostra que pode haber enunciados estritamente universais verdadeiros que teñen un carácter accidental, máis 588 Karl Popper que seren verdadeiras leis universais da natureza. Segundo isto, a caracterización das leis da natureza como enunciados estritamente universais é loxicamente insuficiente e intuitivamente inadecuada. (7) O exemplo tamén pode indicar en que sentido as leis naturais poden ser descritas como «principios de necesidade» ou «principios de imposibilidade», como propón Kneale. Segundo as nosas suposicións (que son perfectamente razoables) sería posible, baixo condicións favorables, que un moa acadase unha idade superior á acadada ata o de agora. Mais se houbese unha lei natural que limitase a idade dun organismo calquera, como o dun moa, a cincuenta anos, entón non sería posible que ningún moa vivise máis tempo. Así que as leis naturais establecen límites ao posible. Eu creo que todo isto é intuitivamente aceptable; de feito, ao dicir, en moitos lugares do libro, que as leis naturais impiden que ocorran certos acontecementos, ou que teñen o carácter de prohibicións, eu estaba expresando a mesma idea. Ademais, creo que é posible e mesmo útil falar de «necesidade natural» ou de «necesidade física» para describir esta característica das leis naturais e das consecuencias lóxicas que ten. (8) Mais paréceme un erro infravalorar as diferenzas entre esta necesidade natural ou física e outros tipos de necesidade, por exemplo, a necesidade lóxica. Describiriamos como loxicamente necesario, de maneira aproximada, aquilo que ocorrería en calquera mundo concibible. Mais aínda que a lei do inverso do cadrado poida ser concibida como unha verdadeira lei da natureza nalgún mundo e, nesa medida, como naturalmente necesaria neste mundo, tamén é perfectamente concibible un mundo onde non sexa válida. Kneale criticou este tipo de argumento sinalando que a conxectura de Goldbach (segundo a cal calquera número par superior a dous é a suma de dous primos) pódese concibir que é verdadeira, ou falsa, aínda que sexa demostrable (ou refuta589 a lóxida da descuberta científica ble) e, neste sentido, matemática ou loxicamente necesaria (ou imposible); e afirma que «a concibilidade do contraditorio non é unha refutación da necesidade en matemáticas»9. Mais se isto é así, pregúntase el por que «se debería considerar que proporciona... unha refutación na ciencia natural»10. Eu creo que o seu argumento concédelle demasiada énfase á palabra «concibir» (e «concibible»), ademais de operar cunha acepción da palabra «concibir» diferente do que el quere dicir: unha vez que temos a proba do teorema de Goldbach, podemos dicir que esta proba establece precisamente que un número par (maior de dous) que non sexa a suma de dous primos é inconcibible, no sentido de que dá lugar a resultados incoherentes: dá lugar á afirmación, entre outras, de que 0 = 1, o cal é «inconcibible». Noutro sentido, 0 = 1 pode ser bastante concibible: mesmo se pode usar, como calquera outro enunciado matemático falso, como unha suposición nunha proba indirecta. De feito, unha proba indirecta poderíase formular así: «Concíbase que a é verdade. Entón teriamos que admitir que b é verdade. Mais sabemos que b é absurdo. Así que é inconcibible que a sexa verdade». resulta claro que, aínda que este uso dos termos «concibible» e «inconcibible» é un pouco vago e ambiguo, sería un erro dicir que esta maneira de argumentar ten que ser inválida porque a verdade de a non pode ser inconcibible, tendo en conta que comezáramos, precisamente, por concibir a verdade de a. Así que «inconcibible» en lóxica e matemáticas é simplemente outra maneira de dicir «que dá lugar a unha contradición evidente». Todo aquilo que non leve a unha contradición evidente é loxicamente posible ou «concibible» e todo o que leve a tal contradición é loxicamente imposible ou «inconcibible». Cando Kneale di que o contraditorio dunha teoría pode ser «concibible», usa a palabra noutro sentido, un sentido perfectamente válido. 9 Ob. cit., p. 80. 10 Ibid. 590 Karl Popper (9) Así que unha suposición é loxicamente posible se non é contraditoria en si mesma; é fisicamente posible se non contradí as leis da natureza. Os dous sentidos de «posible» teñen o suficiente en común como para explicar por que se usa a mesma palabra, mais pasar por alto a diferenza só pode dar lugar a confusións. Comparadas coas tautoloxías lóxicas, as leis da natureza teñen un carácter continxente e accidental. Isto recoñéceo claramente leibniz, quen afirma (cf. Philosischen Schriften, Gerhardt, 7, p. 390) que o mundo é obra de Deus, nun senso semellante a como un soneto, un rondó, unha sonata ou unha fuga son obra dun artista. O artista pode escoller libremente unha certa forma, restrinxindo voluntariamente a súa liberdade ao facer esa escolla: impón certos principios de imposibilidade á súa creación, por exemplo, ao ritmo e, en menor medida, ás palabras que, comparadas co ritmo, poden parecer continxentes e accidentais. Mais isto non significa que a súa escolla do ritmo e as palabras non fose tamén continxente, pois podía ter escollido outro ritmo e outras palabras. Algo semellante ocorre coas leis naturais: elas restrinxen a escolla (loxicamente) posible de feitos singulares. Son, logo, principios de imposibilidade con respecto a estes feitos singulares. E os feitos singulares parecen altamente continxentes comparados coas leis naturais. Mais as leis naturais, aínda que necesarias comparadas cos feitos singulares, son continxentes comparadas coas tautoloxías lóxicas, debido a pode haber mundos estruturalmente diferentes, ou sexa, mundos con leis naturais diferentes. Así que a necesidade ou imposibilidade natural é como a necesidade ou imposibilidade musical. É coma a imposibilidade dun ritmo cuaternario no minueto clásico ou a imposibilidade de rematalo cunha sétima diminuída ou calquera outra disonancia. Imponlle principios estruturais ao mundo. Así e todo, segue permitindo unha boa marxe de liberdade aos feitos singulares continxentes (as condicións iniciais). 591 a lóxida da descuberta científica Se comparamos o que ocorre na música co que ocorre no noso exemplo do moa, podemos dicir: non hai lei musical que prohiba compoñer un minueto en sol menor, mais é bastante posible que nunca se compuxese ningún minueto nesta clave inusual. Así que podemos distinguir por un lado as leis musicalmente necesarias e por outro os enunciados universais verdadeiros sobre os feitos históricos da composición musical. (10) A idea contraria, a idea de afirma que as leis naturais non son continxentes en absoluto, semella ser, se eu o entendín ben, a que Kneale propón. A min isto paréceme un erro tan grande como a idea que el critica, con toda razón, de que as leis da natureza non son máis que enunciados universais verdadeiros. A idea de Kneale de que as leis da natureza son necesarias do mesmo xeito que as tautoloxías lóxicas pódese expresar, talvez, en termos relixiosos: é posible que Deus tivese que escoller entre crear un mundo físico ou non crealo, pero unha vez que decidiu crealo, xa non tivo a liberdade para escoller a forma ou estrutura do mundo, debido a que, como a estrutura do mundo (as regularidades da natureza, descritas polas leis da natureza) é necesariamente como é, todo o que puido escoller libremente Deus só foron as condicións iniciais. Paréceme Descartes tiña unha concepción moi semellante a esta. Segundo el, todas as leis da natureza derivan dun único principio analítico (a definición esencial de «corpo») segundo o cal «ser un corpo» é o mesmo que «ser extenso», o cal quere dicir que dous corpos diferentes non poden adoptar a mesma extensión, ou espazo (en realidade este principio é semellante ao exemplo típico de Keale de que «unha cousa que sexa vermella non é verde»11). Mais foi só indo alén destas «obviedades» (como lles chama Kneale, subliñando a súa proximidade coas tautoloxías lóxicas12), que a teoría física, comezando polo 11 Cf. Kneale, ob. cit., p. 32; véxase tamén, por exemplo, p. 80. 12 Ob. cit., p. 33. 592 Karl Popper propio Newton, acadou unha profundidade de comprensión que claramente queda fóra do alcance da perspectiva cartesiana. Paréceme que a doutrina que afirma que as leis da natureza non son continxentes en ningún sentido é unha forma particularmente extrema dunha perspectiva que eu describín e critiquei noutro lugar co nome de «esencialismo»13. Esta concepción implica a doutrina da existencia de explicacións últimas, isto é, da existencia de teorías explicativas que á vez non teñen necesidade de explicación ulterior ou posterior. Se fósemos capaces de reducir todas as leis da natureza aos «principios de necesariedade» verdadeiros (a obviedades, do tipo de que dúas cousas esencialmente extendidas non adoptan a mesma extensión, ou que algo que é vermello non pode ser ao mesmo tempo verde), sería innecesaria e imposible ningunha explicación ulterior. Non vexo razón para crer que sexa verdade a doutrina da existencia de explicacións últimas e, en cambio, si que vexo moitas razóns para crer que é falsa. Canto máis sabemos sobre as teorías ou leis da natureza, menos nos lembran as obviedades cartesianas que se explican a si mesmas ou as definicións de tipo esencialista. O que a ciencia revela non son obviedades. Ao contrario, parte da grandeza e a beleza da ciencia consiste en podermos descubrir, mediante as nosas propias investigacións críticas, que o mundo é radicalmente diferente do que imaxinabamos antes, isto é, ata o momento en que a nosa imaxinación se viu incitada a refutar as nosas teorías anteriores. Non parece que haxa ningunha razón para crer que este proceso vaia rematar14. O apoio máis forte para todo isto está constituído polas nosas consideracións sobre o contido e a probabilidade lóxica (absoluta). Se as leis da natureza non son só enunciados estritamente universais, teñen que ser loxicamente máis fortes que os corres13 Cf. Poverty of Historicism, apartado 10; The Open Society, capítulo 3, apartado vi, e capítulo 11; «Three Views Concerning Human Knowledge» (incluído en Conjectures and Refutations, 1965, capítulo 3) e o Postscript, por exemplo os apartados *15 e *31. 14 Cf. o Postcript, especialmente o apartado *15. 593 a lóxida da descuberta científica pondentes enunciados universais, pois estes últimos teñen que ser deducibles delas. Mais a necesidade lóxica de a, como vimos (ao final do apéndice *v) pódese definir por medio do definiens p(a) = p(a, ) = 1. Para enunciados universais a, por outra banda, obtemos (cf. apéndices *v, *vii e *viii): p(a) = p(a, ) = 0; e o mesmo ten que ser válido para calquera enunciado loxicamente máis forte. Por tanto, unha lei da natureza está, polo seu grande contido, tan distante dun enunciado loxicamente necesario como o poida estar un enunciado coherente; e está moito máis preto, no aspecto lóxico, dun enunciado universal «meramente accidental» que dunha obviedade lóxica. (11) O resultado desta discusión é que eu estou disposto a aceptar a crítica de Kneale na medida en que estou disposto a aceptar a perspectiva que afirma que existe unha categoría de enunciados, as leis da natureza, que son loxicamente máis fortes que os correspondentes enunciados universais. Esta doutrina é, na miña opinión, incompatible con calquera teoría da indución. Con todo, isto non ten repercusión ningunha no tocante á miña propia metodoloxía. Ao contrario, resulta bastante claro que un principio que se propón ou unha conxectura que afirma a imposibilidade de certos acontecementos tería que ser rigorosamente comprobada para demostrar que estes acontecementos son posibles, isto é, habería que intentar que estes acontecementos ocorran. Pero este é precisamente o método das comprobacións que eu defendo. Por tanto, do punto de vista adoptado aquí, non fai falta cambio ningún no tocante á metodoloxía. O cambio ocorre enteiramente no nivel ontolóxico ou metafísico. Poderíase describir este cambio dicindo que se facemos a conxectura de que a é unha lei natural, estamos conxecturando que a expresa 594 Karl Popper unha propiedade estrutural do noso mundo, unha propiedade que impide a ocorrencia de certos acontecementos singulares loxicamente posibles, ou estados de cousas dun certo tipo (do estilo do explicado nos apartados 21 a 23 do libro e tamén nos apartados 79, 83 e 85). (12) Como demostrou Tarski, é posible explicar a necesidade lóxica en termos de universalidade: pódese dicir que un enunciado é loxicamente necesario se e só se é deducible (por exemplo, por particularización) dunha función enunciativa «universalmente válida», isto é, dun enunciado que se cumpra en todos os modelos15 (isto quere dicir que é verdadeiro en todos os mundos posibles). Paréceme que podemos explicar polo mesmo método o que queremos dicir por necesidade natural, pois podemos adoptar a seguinte definición, (N0): (N0) Pódese dicir que un enunciado é fisicamente necesario se e só se é deducible dunha función enunciativa que se cumpra en todos os mundos que sexan diferentes do noso, se é que o son, só con respecto ás condicións iniciais (*véxase a Addenda do presente apéndice). Nunca podemos saber, evidentemente, se unha suposta lei é unha lei xenuína ou se é que semella unha lei pero, de feito, depende de certas condicións iniciais imperantes na nosa rexión do universo (cf. apartado 78). Non poderemos descubrir nunca, xa que logo, que un enunciado non lóxico dado sexa en realidade naturalmente necesario: a conxectura de que o é seguirá sempre sendo unha conxectura (non só porque non podemos investigar todo o noso mundo para asegurarnos de que non existe ningún contraexemplo, mais pola razón aínda máis forte de que non podemos investigar todos os mundos que sexan diferentes do noso con respecto ás condicións iniciais). Mais, 15 Cf. o meu artigo «Note on Tarski's Definition of Truth», Mind 64, 1955, especialmente p. 391. 595 a lóxida da descuberta científica aínda que a nosa proposta de definición exclúe a posibilidade de conseguir un criterio positivo da necesidade natural, na práctica podemos aplicar a nosa definición de necesidade natural de xeito negativo: atopando condicións iniciais baixo as cales a suposta lei resulte ser inválida, podemos mostrar que non era necesaria, isto é, que non era unha lei da natureza. Deste xeito comprobamos que a proposta de definición cadra perfectamente coa nosa metodoloxía. A definición proposta, evidentemente, faría que todas as leis da natureza, xunto coas súas consecuencias lóxicas, fosen natural ou fisicamente necesarias16. Observarase inmediatamente que a definición proposta cadra perfectamente cos resultados acadados na nosa discusión do exemplo do moa (cf. puntos 6 e 7, supra.): era precisamente porque pensabamos que os moas vivirían máis tempo en condicións diferentes (máis favorables) polo que tiñamos a impresión de que un enunciado universal verdadeiro sobre a súa idade máxima real era de carácter accidental. (13) Agora introducimos o símbolo «N» como nome da clase de enunciados que son necesariamente verdadeiros, no senso de necesidade natural ou física, isto é, aqueles que son verdadeiros independentemente de cales sexan as condicións iniciais. Coa axuda de «N», podemos definir « a  nn » (dito en palabras: «Se a, entón necesariamente b») mediante a seguinte definición, que dalgún xeito é obvia: (D) a  b n é verdade se e só se (a  b)ε N Dito en palabras: «Se a, entón necesariamente b» é válido se e só se «Se a, entón b» é necesariamente verdadeiro. Aquí «a  b» é, claro está, o nome dun condicional ordinario co antecedente a e o consecuente b. Se quixésemos definir implicación 16 Por certo, os enunciados loxicamente necesarios (simplemente porque derivan dun enunciado calquera) tamén se tornan fisicamente necesarios; mais está claro que isto pouco importa. 596 Karl Popper lóxica ou «implicación estrita», entón tamén usariamos (D), mais teriamos que interpretar «N» como «loxicamente necesario» (en vez de como «natural ou fisicamente necesario»). Debido á definición (D), podemos dicir de « a  bn » que é o nome dun enunciado coas seguintes propiedades: (A) a  bn non sempre é verdadeiro se a é falso, en contraposición con a  b. (B) a  bn non sempre é verdadeiro se b é verdadeiro, en contraposición con . (A') a  bn é sempre verdadeiro se a é imposible ou necesariamente falso, ou se a súa negación é necesariamente verdadeiro por necesidade lóxica ou física. (Cf. as tres últimas páxinas do presente apéndice e mais a nota 26, infra.) (B') a  bn é sempre verdadeiro se b é necesariamente verdadeiro (sexa por necesidade lóxica ou física). Aquí a e b poden ser enunciados ou funcións enunciativas. A a  bn pódeselle chamar «condicional necesario» ou «condicional gnómico». Expresa o que algúns autores denominaron «condicionais subxuntivos» ou «condicionais contrafácticos». (Con todo, parece que outros autores, coma Kneale, por «condicional contrafáctico» querían dicir algo distinto: para eles este nome implicaba, de feito, que a era falso17. Eu non creo que este uso sexa recomendable). reparando un pouco verase que a clase N de enunciados naturalmente necesarios comprende non só a clase de todos aqueles enunciados dos cales se pode dicir intuitivamente, igual que das verdadeiras leis universais da natureza, que non 17 En «Note on Natural Laws and so-called Contrary-to-Fact Conditionals» (Mind 58, N.S., 1949, pp. 62-66) usei o termo «condicional subxuntivo» para o que aquí chamo «condicional gnómico» ou «necesario»; e expliquei en repetidas ocasións que os condicionais subxuntivos estes teñen que ser deducibles de leis naturais. É difícil, xa que logo, entender como Kneale (Analysis 10, 1950, p. 122) me puido atribuír a min nin sequera provisionalmente a idea de que un «condicional subxuntivo» ou un «condicional contrario aos feitos» tivese a forma ~φ(a).(φ(a) ψ(a)). Pregúntome se Kneale se decatou de que esta expresión súa só era unha maneira complicada de dicir «~φ(a)», pois a quen se lle ía ocorrer dicir que «~φ(a)» fose deducible da lei «(x) (φ (x) ⊃ ψ (x))»? 597 a lóxida da descuberta científica lles afectan os cambios das condicións iniciais, senón tamén todos aqueles que derivan de leis universais da natureza ou das verdadeiras teorías estruturais sobre o mundo. Entre estes, haberá enunciados que describen un número definido de condicións iniciais, por exemplo, enunciados que teñan a forma «se neste recipiente, baixo temperatura ambiente e unha presión de 1000 g. por cm2, se mesturan hidróxeno e osíxeno... entón... «. Se os enunciados condicionais deste tipo son deducibles das leis verdadeiras da natureza, entón a súa veracidade será tamén invariable con respecto a todo cambio de condicións iniciais: ou ben se cumpren as condicións iniciais descritas no antecedente, e neste caso o consecuente será verdadeiro (e, por tanto, todo o condicional), ou ben non se cumprirán as condicións iniciais descritas no antecedente e, por tanto, non se corresponderán cos feitos verdadeiros («contrafácticas»). Neste caso o condicional será verdadeiro no sentido de que é vacuamente cumprido. Así que o tan discutido cumprimento vacuo desempeña o seu papel para asegurar que os enunciados deducibles de leis naturalmente necesarias sexan tamén «naturalmente necesarias» no senso da nosa definición. En realidade, poderiamos ter definido N simplemente como a clase das leis naturais e as súas consecuencias lóxicas. Mais se cadra gañamos unha lixeira vantaxe ao definirmos N servíndonos da idea de condicións iniciais (dunha clase simultánea de enunciados singulares). Se definimos N como, por exemplo, a clase de enunciados que son verdadeiros en todos os mundos diferentes do noso só con respecto ás condicións iniciais (se é que se diferenza en algo), entón evitamos o uso da formulación subxuntiva (ou contrafáctica), coma tal «que continuaría a ser verdadeiro aínda que houbese condicións iniciais (no noso mundo) diferentes das que realmente hai». Así e todo, non cabe dúbida de que a frase (No) «todos os mundos que sexan diferentes do noso, se é que o son, só con respecto ás condicións iniciais» contén implicitamente a idea 598 Karl Popper de leis da natureza. O que queremos dicir é «todos os mundos que teñan a mesma estrutura (ou as mesmas leis naturais) que o noso mundo». Na medida en que a nosa definiens contén implicitamente a idea de leis da natureza, pódese dicir que (N0) é circular. Mais todas as definicións teñen que ser circulares neste sentido: exactamente igual que todas as deducións (en oposición ás demostracións18), por exemplo, todos os siloxismos, son circulares. A nosa definición non é, con todo, circular nun senso máis técnico. A súa definiens opera cunha idea intuitiva perfectamente clara, a de variar as condicións iniciais do noso mundo, por exemplo, as distancias entre os planetas, a súa masa e a masa do sol. Interpreta os resultados de tales cambios como a construción dunha especie de «modelo» do noso mundo (un modelo ou «copia» que non ten que ser fiel con respecto ás condicións iniciais); e despois imita o coñecido recurso de chamarlle «necesarios» a aqueles enunciados que sexan verdadeiros (no universo) en todos estes modelos (ou sexa, en todas as condicións iniciais loxicamente posibles). (14) A miña perspectiva presente sobre este problema difire, intuitivamente, dunha versión publicada anteriormente1919. Paréceme que a de agora é unha versión considerablemente mellorada e compráceme recoñecer que en boa medida lle debo esta mellora á crítica de Kneale. Así e todo, desde o punto de vista máis técnico os cambios son pequenos, pois naquel artigo eu operaba (a) coa idea de leis naturais, (b) coa idea de condicionais derivados de leis naturais. Mais (a) e (b) xuntos teñen a mesma extensión que N, como vimos. (c) Propoñía que os «condicionais subxuntivos» fosen os que derivan de (a), isto é, só os da clase (b). E (d) propoñía (no último parágrafo) que habería 18 A distinción entre dedución e demostración trátase no meu artigo «New Foundations for Logic», Mind 56, 1947, p. 193 ss. 19 Cf. «A Note on natural Laws and So-Called Contrary-to-Fact Condicionais», Mind 58, N.S., 1949, pp. 62-66. Véxase tamén o meu libro Poverty of Historicism, 1957 (publicado orixinalmente en 1945), nota da p. 123. 599 a lóxida da descuberta científica que introducir a suposición de que todas as condicións iniciais loxicamente posibles (por tanto, todos os procesos e acontecementos que son compatibles coas leis) se realizasen no mundo nalgun lugar e nalgún momento, o cal é unha maneira algo torpe de dicir máis ou menos o que digo agora coa axuda da idea de todos os mundos que sexan diferentes do noso (se é que o son) só con respecto ás condicións iniciais20. A miña perspectiva de 1949 pódese formular coa axuda do seguinte enunciado. Aínda que o noso mundo pode non comprender todos os mundos loxicamente posibles, pois poden ser posibles mundos con outra estrutura (con leis diferentes), si comprende todos os mundos que son fisicamente posibles, no senso de que nel ser realizan todas as condicións iniciais que son fisicamente posibles, nalgún momento e nalgún lugar. hoxe en día paréceme que é obvio que esta suposición metafísica posiblemente sexa verdade (nos dous sensos de «posible»), mais a nós iranos mellor se prescindimos dela. Mais, unha vez que se adopta esta suposición metafísica, a concepción anterior e a actual vólvense equivalentes (a parte de diferenzas puramente terminolóxicas) no tocante ao estatus das leis. Así, a miña concepción anterior é, en todo caso, máis «metafísica» (ou menos «positivista») que a presente, aínda que non faga uso da palabra «necesario» ao describir o estatus das leis. (15) Para alguén que estude os métodos e que se opoña á doutrina da indución e subscriba a teoría da falsificación, non haberá moita diferenza entre a idea de que as leis universais 20 Digo que a formulación anterior era «torpe» porque equivalía a introducir a suposición de que os moas viviron algunha vez nalgún lugar, ou que vivirán un día, baixo condicións ideais, posibilidade que me semella bastante remota. Agora prefiro substituír esta suposición por outra: que entre os «modelos» do noso mundo (que supostamente non son reais, senón construcións lóxicas, por dicilo así) haberá un polo menos en que viven os moas baixo condicións ideais. Isto a min paréceme non só aceptable, senón obvio. A parte de cambios terminolóxicos, isto semella ser o único cambio na miña posición, en comparación coa miña nota de Mind de 1949. Mais paréceme que o cambio é importante. 600 Karl Popper non son máis que enunciados estritamente universais e a idea de que son «necesarias»: en ambos casos, só podemos comprobar a nosa conxectura mediante intentos de refutación. Para os indutivistas, existe aí unha diferenza crucial: eles deberían rexeitar a idea de leis «necesarias» pois estas, sendo loxicamente máis fortes, teñen por forza que ser aínda menos accesibles para a indución que simples enunciados universais. Mais os indutivistas non sempre razoan desta maneira. Ao contrario, parece que algúns pensan que un enunciado que afirma que as leis da natureza son necesarias se pode usar dalgunha maneira para xustificar a indución: talvez algo do estilo dun «principio de uniformidade da natureza». Mais é obvio que ningún principio desta natureza podería nunca xustificar a indución. Ningún destes principios podería tirar conclusións indutivas válidas, nin sequera probables. É certo, xaora, que se podería apelar a un enunciado como «existen leis da natureza» se quixésemos xustificar a nosa busca de leis da natureza21. Mais no contexto desta afirmación miña, «xustificar» ten un senso moi diferente do que ten no contexto da cuestión de se a indución pode ser xustificada. Neste último caso, preténdese establecer certos enunciados: as xeneralizacións inducidas. No primeiro caso, só se pretende xustificar unha actividade, a busca de leis. Ademais, aínda que esta actividade dalgunha maneira se poida xustificar polo coñecemento de que existen leis verdadeiras (de que hai regularidades estruturais no mundo) poderíase xustificar mesmo sen este coñecemento: a esperanza de que nalgún sitio poida haber comida «xustifica», xaora, a busca de comida (en especial se 21 Cf. Wittgenstein, Tractatus, 6.36: «Se houbese unha lei da causalidade, podería dicir así: «Hai leis naturais». Mais está claro que isto non se pode dicir; só se mostra». Na miña opinión, o que se mostra é, en todo caso, que isto claramente se pode dicir: díxoo Wittgenstein, por exemplo. O que claramente non se pode facer é verificar o enunciado de que hai leis naturais (nin sequera falsificalo). Mais o feito de que un enunciado non sexa verificable (ou que nin sequera sexa falsificable) non significa que careza de sentido, que non se poide entender ou que «obviamente non se pode dicir», como cría Wittgenstein. 601 a lóxida da descuberta científica estamos a morrer coa fame), aínda que esta esperanza se atope moi lonxe do coñecemento. Así, podemos dicir que, aínda que o coñecemento de que existen leis verdadeiras engadiría algo á xustificación da nosa busca das leis, esta busca está xustificada, mesmo se non dispoñemos de coñecemento, pola nosa curiosidade, e pola simple esperanza de que poidamos atopalas. Ademais, a distinción entre leis «necesarias» e enunciados «estritamente universais» non semella relevante para este problema: sexa ou non necesario, o coñecemento de que existen leis engadiría algo á «xustificación» da nosa busca, sen ser necesario para este tipo de «xustificación». (16) Creo, con todo, que a idea de que existen leis necesarias da natureza, no senso da necesidade natural ou física explicada no punto (12), é importante desde un punto de vista metafísico ou ontolóxico, revestindo ademais grande relevancia intuitiva para os nosos intentos de comprender o mundo. Aínda que sexa imposible asentar esta idea metafísica nin sobre bases empíricas (porque non é falsificable) nin sobre bases doutro tipo, eu creo que é verdade, como indiquei nos apartados 79, 83 e 85. Pero agora estou intentando ir alén do que dixen nestes apartados subliñando o estatus ontolóxico peculiar das leis universais (por exemplo, falando da súa «necesidade» ou do seu «carácter estrutural»), e tamén subliñando o feito de que o carácter metafísico ou a irrefutabilidade da afirmación de que existen as leis da natureza non ten por que nos impedir discutir racionalmene esta afirmación, ou sexa, analizala criticamente. (Véxase o meu Postscript, especialmente os apartados *6, *7, *15 e *120). Así e todo, a diferenza de Kneale, eu considero que «necesario» é simplemente unha palabra, unha etiqueta útil para distinguir a universalidade das leis da universalidade «accidental». Por iso calquera outra etiqueta podería valer exactamente igual, porque isto non garda moita relación coa necesidade lóxica. Concordo en grande medida co espírito da paráfrase que Wittgenstein fai de hume: «Non existe a necesidade de que ocorra unha cousa só porque ocorra outra. Só hai necesidade 602 Karl Popper lóxica»22. Só hai un sentido no que a  bn garda relación coa necesidade lóxica: o vínculo necesario entre a e b non se atopa en a nin en b, senón no feito de que o correspondente condicional ordinario (ou «implicación material», a  b sen «N») deriva con necesidade lóxica dunha lei da natureza: é necesario, con relación a unha lei da natureza23. E pódese dicir que á súa vez unha lei da natureza é necesaria porque é loxicamente deducible de, ou explicable por, unha lei dunha grao aínda maior de universalidade, ou de maior «profundidade» (Véxase o meu Postscript, apartado *15). Pódese supoñer que o que primeiro apuntou a idea dunha «conexión necesaria» entre causa e efecto fose esta dependencia loxicamente necesaria de anunciados verdadeiros de maior universalidade, cuxa existencia se conxectura24. (17) Polo que eu entendo das modernas discusións sobre «condicionais subxectivos», «condicionais contrarios aos feitos» ou «condicionais contrafácticos», semella que estes xurdiron do problema creado polas dificultades inherentes do individualismo, o positivismo, o operacionalismo ou o fenomenalismo. Os/as fenomenalistas, por exemplo, pretenden traducir enunciados sobre obxectos físicos a enunciados sobre observacións. Por exemplo, «hai unha maceta con flores no peitoril da ventá» deberíase poder traducir por algo do estilo de «Se alguén que está situado nun lugar adecuado mira na dirección adecuada, verá algo que lle aprenderon a chamar maceta con flores». A obxección máis simple, aínda que para nada a máis importante, para considerar que o segundo enunciado é unha tradución do primeiro é dicir que, mentres que o primeiro será verdade (vacuamente) cando ninguén mira para a ventá, sería absurdo dicir que continuaría habendo unha maceta de flores cando ninguén estea mirando para a ventá. un fenomenalista tería a ten22 Cf. Tractatus, 6.3637. 23 Sinalei isto en Aristotelian Society Suplementary Volume 22, 1948, pp. 141 a 154, apartado 3, especialmente p. 148. Neste artigo esbocei un proxecto que xa realicei en boa medida desde aquela. 24 Cf. o artigo meu citado na nota anterior. 603 a lóxida da descuberta científica tación de responder a isto dicindo que este argumento depende da definición segundo unha táboa de verdade do condicional (ou dunha «implicación material») e que hai que decatarse da necesidade de interpretar de xeito diferente o condicional: unha interpretación modal que recoñeza o feito de que o que queremos dicir é algo do estilo de «Se alguén mira, ou se alguén estivese mirando, entón verá ou vería, unha maceta con flores»25. Talvez se pense que a nosa fórmula a  bn podería proporcionar o desexado condicional modal e, en certo xeito, si que o fai. De feito, faino todo o ben que un podería agardar. Mais a nosa obxección orixinal segue en pé, porque sabemos que se é necesario (isto é, se a ε N) entón a  bn vale para todo b. Isto quere dicir que, se por algunha razón, o lugar en que está situada (ou non) a maceta é tal que é fisicamente imposible que ninguén mire para ela, entón «Se alguén mira, ou se alguén estivese mirando, para ese lugar, entón ve ou vería unha maceta con flores» será verdadeiro, simplemente porque ninguén pode mirar para ela26. Mais isto quere dicir que a tradución modal fenomenalista de «No lugar x hai unha maceta con flores» será verdade para todos eses lugares x para os que, por algunha razón física, ninguén pode mirar (así que hai unha maceta con flores, ou calquera outra cousa que se queira, no centro do sol). Mais isto é absurdo. Por esta razón, e por moitas outras máis, paréceme que non hai posibilidade ningunha de salvar o fenomenalismo por esta método. En canto á doutrina do operacionalismo (que esixe que os termos científicos, como lonxitude ou solubilidade, se deberían definir mediante procedementos experimentais adecuados), pódese demostrar doadamente que as denominadas definicións 25 Foi R. B. Braithwaite quen contestou algo semellante a isto á miña obxección de cumprimento vacuo despois dunha conferencia que deu sobre fenomenalismo no seminario de Susan Stebbing, na primavera de 1936. Foi a primeira vez que oín falar, nun contexto deste tipo, do que hoxe se chama «condicional subxuntivo». Para unha crítica dos «programas de redución» fenomenalistas, véxase a nota 4 e o texto a que remite, supra. 26 Unha formulación máis completa, dalgún xeito, desta perspectiva sobre os condicionais subxuntivos pódese atopar na miña nota «On Subjunctive Condicionals with Impossible Antecedents», Mind, N.S. 68, 1959, pp. 518-520. 604 Karl Popper operacionais son circulares. Vou demostrar isto brevemente con respecto a «soluble»27. Os experimentos cos que comprobamos se unha substancia como o azucre é soluble en auga inclúen probas como recuperar da disolución o azucre disolto (por exemplo, pola evaporación da auga; cf. punto 3 supra). Está claro que é necesario identificar a substancia recuperada, isto é, comprobar se ten as mesmas propiedades que o azucre. Entre estas propiedades está a solubilidade na auga. Así, para definir «x é soluble en auga» mediante a proba operativa estándar, teriamos que dicir polo menos algo do estilo disto: «x é soluble en auga se e só se (a) cando x se bota en auga, desaparece (necesariamente), e (b) cando, despois de evaporarse a auga, se recupera (necesariamente) unha substancia que, de novo, é soluble en auga». A razón fundamental para a circularidade deste tipo de definición é moi sinxela: os experimentos nunca son concluíntes e teñen que ser comprobables, á súa vez, por outros experimentos. Parece que os operacionalistas pensaban que unha vez que se solucionase o problema dos condicionais subxuntivos (para evitar o cumprimento vacuo do condicional definitorio) xa non habería máis obstáculos para as definicións operativas de termos disposicionais. Parece que o grande interese mostrado no denominado problema dos condicionais subxuntivos (ou contrafácticos) se debía maiormente a esta idea. Mais paréceme que demostrei que aínda que resolvamos o problema de analizar loxicamente condicionais subxuntivos (ou «gnómicos»), non podemos agardar definir os termos disposicionais, ou universais, operativamente: os temos universais ou disposicionais transcenden a experiencia, como se explicou nos puntos 1 e 2 e no apartado 25 do libro. 27 A argumentación atópase no meu artigo do volume de Carnap, de xaneiro de 1955, de Library of Living Philosphers, editado por P. A. Schilpp. Despois incluíuse no meu libro Conjectures and Refutations, 1965, capítulo II, p. 278. En canto á circularidade da definición operativa de lonxitude, pódese observar por estes dous feitos: (a) a definición operativa de lonxitude implica correccións de temperatura, e (2) a definición operativa (habitual) de temperatura implica medicións de lonxitude. 605 a lóxida da descuberta científica Addenda, 1968 Desde a primeira vez que se publicou este apéndice en 1959, houbo unha resposta moi interesante por parte de William Kneale, B.J.P.S. 12, 1961, p. 99 ss. e mais unha crítica de G. C. Nerlich e W. A. Suchting, B.J.P.S 18, 1967, p. 233 ss., con resposta miña en B.J.P.S. 18, 1967, p. 316 ss. Paréceme que esta miña resposta non é moi atinada. De feito, só despois de ler a crítica de Kneale me decatei do que hai no fondo do noso desacordo. Agora estou convencido que o motivo é que a maioría dos filósofos consideran que as definicións son importantes e que nunca tomaron en serio as miñas advertencias de que eu non considero que non o sexan. Eu non creo que as definicións poidan facer que o significado das nosas palabras sexa definido, nin creo que haxa que preocuparse por se somos capaces de definir un termo ou non (aínda que ás veces poida ser moderadamente interesante ser quen de definir un termo coa axuda doutros termos dun certo tipo); porque, en calquera caso, si necesitamos termos primitivos non definidos. A miña posición pódoa resumir se digo que, mentres que as teorías e os problemas relacionados coa verdade son importantísimos, as palabras e os problemas relacionados co seu significado non o son (cf. Conjectures and Refutations, 3a edición, 1968, punto (9), p. 28). Por este motivo non me interesa demasiado nin a definición nin a definibilidade da «necesidade natural», aínda que si que me interesa o feito (porque creo que é un feito) de que esa idea non carece de sentido. E moito menos me interesa aínda establecer o feito (se é un feito, que para min é dubidoso) de que un termo modal se poida definir usando termos non modais. Se algunha vez deu a impresión de que isto era o que eu quería demostrar, non cabe dúbida de que era unha impresión equivocada. 606 Karl Popper APÉNDICE *xI Sobre o uso e abuso de experimentos imaxinarios, especialmente na teoría cuántica As críticas que se ofrecen na última parte deste apéndice son de carácter lóxico. Non pretendo refutar determinados argumentos, algúns dos cales talvez xa fosen abandonados polas persoas que os propuxeron. O que pretendo, máis ben, é demostrar que certos métodos de argumentación son inaceptables, métodos que se usaron durante moitos anos sen que ninguén os cuestionase. O que critico aquí maiormente é o uso apoloxético dos experimentos imaxinarios, non ningunha teoría en particular que se pretendese defender con estes experimentos1. E moito menos pretendo crear a impresión de que dubido da utilidade dos experimentos imaxinarios. (1) un dos experimentos imaxinarios máis importantes na historia da filosofía natural, e un dos argumentos máis simples e enxeñosos na historia do pensamento racional sobre o noso universo atópase na crítica que Galileo realiza da teoría aristotélica do movemento2. Demóstrase alí que era falsa a suposición aristotélica de que a velocidade natural dun corpo máis pesado é maior que a dun corpo máis lixeiro. O voceiro de Galileo afirma: «Se collemos dous corpos en movemento que teñan velocidades naturais distintas, é manifesto que se unimos o máis lento co máis rápido, este diminuirá parcialmente a súa velocidade, e o máis lendo aumentará algo a súa». Así, «se unha pedra grande se move, por exemplo, a unha velocidade de oito grais e unha máis pequena se move a unha velocidade de catro, ao xuntarse, 1 En especial, non é o meu desexo criticar a teoría cuántica nin ningunha interpretación desta última. 2 O propio Galileo fachendea do seu argumento (poñendo as palabras na boca de Simplicio): «A dicir verdade, o seu argumento foi levado a cabo dun xeito extraordinario». Cf. Dialogues Concerning Two New Sciences, 1938, Primeiro Día, p. 109 (p. 66 do volume xiii, 1855, de Opere Complete; pp. 64 e 62 da edición inglesa de Crew e Salvio, 1914). 607 a lóxida da descuberta científica o sistema composto moverase a unha velocidade inferior a oito graos. E as dúas pedras xuntas fan, obviamente, unha pedra máis grande que a primeira que se movía a unha velocidade de oito graos. Así que o corpo composto (aínda que é máis grande que o primeiro) moverase, malia isto, máis lentamente que o primeiro el só, o cal é contrario á súa suposición»3. E como esta suposición aristotélica era unha das que iniciaran o argumento, agora queda refutada: demóstrase que é absurda. Vexo no experimento imaxinario de Galileo un modelo perfecto do mellor uso que se pode facer dos experimentos imaxinarios, que é o uso crítico. Non quero dicir que non haxa outros usos, por exemplo, o uso heurístico, que é moi útil, pero son usos que en xeral teñen menor utilidade. un exemplo antigo do que eu chamo uso heurístico de experimentos imaxinarios é o que forma a base heurística do atomismo. Imaxinemos que collemos unha peza de ouro, ou calquera outra substancia, e a cortamos en pedazos cada vez máis pequenos «ata chegarmos a partes tan pequenas que non se poidan subdividir máis»: trátase dun experimento mental usado para explicar a «indivisibilidade dos átomos». Os experimentos imaxinarios heurísticos xa constitúen unha parte importante da termodinámica (ciclo de Carot) e en tempos recentes puxéronse de moda debido ao seu uso na teoría da relatividade e na teoría cuántica. un dos mellores exemplos deste tipo é o experimento de Einstein do ascensor acelerado: ilustra a equivalencia local da aceleración e a gravidade e indica que os raios de luz nun campo gravitacional poden ter traxectorias curvas. Este é un uso importante e lexítimo. O principal obxectivo desta nota é advertir contra o que se pode chamar o uso apoloxético dos experimentos imaxinarios. Este uso remóntase, paréceme, á discusión do comportamento dos aparellos de medición e os reloxos desde o punto de vista 3 Ob. cit., p. 107 (1638); p. 65 (1855); p. 63 (1914). 608 Karl Popper da relatividade especial. Inicialmente usáronse estes experimentos a maneira de ilustración ou para fins expositivos, un uso perfectamente lexítimo. Mais posteriormente en discusións de teoría cuántica tamén se usaron ás veces como argumentos, de maneira á vez crítica e mais defensiva ou apoloxética (nisto xogou un importante papel o microscopio imaxinario de heisenberg para a observación de electróns; véxanse os puntos 9 e 10 máis abaixo). É indubidable que o uso de experimentos imaxinarios na argumentación crítica é lexítimo: vén sendo un intento de mostrar que o outor dunha teoría pasou por alto certas posibilidades. E tamén debe ser lexítimo, evidentemente, contrarrestar tales obxeccións críticas, por exemplo, mostrando que o experimento imaxinario proposto é en principio imposible e que, polo menos no caso de que se trate, non se pasou por alto ningunha posibilidade4. un experimento imaxinario deseñado cun espírito crítico (deseñado para criticar unha teoría demostrando que se pasaron por alto certas posibilidades) normalmente é aceptable, mais débese ter moito coidado coa resposta: na reconstrución dun experimento polémico, realizada en defensa da teoría, é importante, en particular, non introducir idealizacións ou outras presuposicións a menos que sexan favorables ao opoñente, ou a menos que necesariamente tivesen que ser aceptadas por calquera opoñente que use o experimento imaxinario en cuestión. (2) De xeito máis xeral, creo que o uso argumentativo de experimentos imaxinarios só é lexítimo se son claramente expostas as ideas do opoñente e se se respecta a regra de que as idealizacións que se fagan teñen que ser concesións ao opoñente, ou polo menos teñen que ser aceptables para o opoñente. Por exemplo, no caso do ciclo de Carnot, todas as idealizacións aumentan a eficiencia da máquina, de maneira que o opoñente 4 Por exemplo, Einstein demostrou que o meu propio experimento do apartado 77 era en principio imposible (desde o punto de vista da teoría cuántica) na carta incluída aquí como apéndice *xii; véxase a nota da p. 232 e as notas *3 e *4 do apartado 77. 609 a lóxida da descuberta científica da teoría (que afirma que unha máquina de calor pode producir traballo mecánico sen transferir calor dunha temperatura máis alta a unha temperatura máis baixa) ten que estar de acordo en que estas son concesións. As idealizacións, claramente, deixan de ser aceptables para os fins da argumentación crítica sempre que se infrinxa esta regra. (3) Esta regra pódese aplicar, por exemplo, á discusión iniciada polo experimento imaxinario de Einstein, Podolsky e rosen. (O argumento deles reitérao Einstein nunha carta reproducida neste volume no apéndice *xii; eu volvo sobre isto no meu Postscript, apartado *109). No desenvolvemento da súa argumentación crítica, Einstein, Podolsky e rosen intentan facer uso de idealizacións aceptables para Bohr e, na súa resposta, Bohr non cuestiona a lexitimidade das súas idealizacións. Eles introducen (cf. apartado *109 e apéndice *xii) dúas partículas, A e B, que interactúan de tal maneira que, medindo a posición (ou momento de B), a teoría permítenos calcular a posición (ou momento) de A, que mentres tanto se desprazou moi lonxe e xa non lle afecta a medición de B. Así que o momento de A (ou posición) non se pode volver borroso (ou «esvaerse», para usar o termo de Schrödinger), en contra do que diría heisenberg55. Bohr, na súa resposta, opera coa idea de que a medición da posición se pode conseguir só mediante «algún instrumento fixado rixidamente ao soporte que define o marco espacial de referencia», mentres que a medición do momento faríase mediante un «diafragma» movible cuxo «momento... 5 Heisenberg pensaba, claro está, que se esvaecía só unha partícula, a que se está a medir. Einstein, Podolsky e Rosen mostran que se debe ampliar a outra partícula (unha partícula coa que interactuase nalgún momento, quizais hai anos). Mais neste caso, como se vai evitar que se «esvaeza» todo (o mundo enteiro) cunha única observación? A resposta é, supostamente, que debido á redución do «paquete de ondas», a observación destrúe a vella imaxe do sistema, e á vez crea unha nova. Así que a interferencia non ocorre no mundo, senón só na nosa maneira de representalo. Esta situación é ilustrada, como se verá, pola resposta de Bohr que vén a seguir no texto. 610 Karl Popper se mide antes e despois de pasar a partícula»6. Bohr opera co argumento de que, ao escollermos un destes dous sistemas de referencia, «rompemos... con toda posibilidade» de usar o outro. Se o entendo ben, el afirma que aínda que non se interfira en A, as súas coordenadas pódense esvaer ao esvaerse o marco de referencia. (4) A resposta de Bohr seméllame inaceptable polo menos por tres razóns diferentes. Primeiro, antes do experimento imaxinario proposto por Einstein, Podolsky e rosen, a razón que se daba para explicar o esvaemento da posición ou o momento dun sistema era que a medición do sistema interfería no propio sistema. A min paréceme que Bohr abandonou subrepticiamente este argumento e substituíuno por outro ao dicir (máis ou menos claramente) que a razón é que as interferencias afectan ao noso marco de referencia e ao sistema de coordenadas, máis que ao sistema físico. Este cambio é demasiado importante como para deixalo pasar inadvertido. habería que recoñecer explicitamente que a posición anterior foi refutada polo experimento imaxinario e tamén habería que demostrar por que isto non destrúe o principio en que se baseou. Non debemos esquecer, neste sentido, o que pretendía demostrar o experimento imaxinario de Einstein, Podolski e rosen. Só pretendía refutar certas interpretacións das fórmulas de indeterminación, non refutar as fórmulas mesmas. Aínda que non explicitamente, a resposta de Bohr recoñece dalgún xeito que o experimento imaxinario conseguira o seu obxectivo, pois Bohr só intentara defender as relacións de indeterminación como tales: abandonou a idea de que a medición interferiría no sistema A que supostamente facía esvaer. Ademais, o argumento de Einstein, Podolski e rosen poderíase levar un pouco 6 Bohr, Physical Review 48, 1935, pp. 696-702. As citas son das pp. 700 e 699 (as cursivas son miñas). Véxase tamén a nota da p. 232, supra. 611 a lóxida da descuberta científica máis alá asumindo que medimos a posición A (accidentalmente) no mesmo punto temporal en que medimos o momento de B. Entón obtemos, nese punto temporal, as posicións e os momentos tanto de A coma de B. (hai que admitir que o momento de A e a posición de B se destruirán ou esvaerán con estas medicións). Mais isto é para dar por sentado o argumento principal de Einstein, Podolsky e rosen: que é incorrecto interpretar que as fórmulas de indeterminación afirman que o sistema non pode ter unha posición clara e un momento claro ao mesmo tempo, aínda que se debe admitir que non podemos predicir os dous ao mesmo tempo (para unha interpretación que ten todo isto en conta, véxase o meu Postscript). En segundo lugar, a afirmación de Bohr de que «rompemos» co outro marco de referencia semella ser ad hoc, pois está claro que é posible medir o momento espectroscopicamente (ou ben directamente ou ben usando o efecto Doppler), e o espectroscopio estará fixado rixidamente ao mesmo marco que o primeiro «instrumento» (que o espectroscopio absorba a partícula B é irrelevante para o argumento relativo ao destino de A). Así que un procedemento que use un marco de referencia movible non se pode aceptar como parte esencial do experimento. En terceiro lugar, Bohr non explica aquí como medir o momento de B coa axuda do seu diafragma movible. Noutro artigo posterior seu, descríbese unha maneira de facer isto, mais este método paréceme a min inaceptable7. Pois o método descrito por Bohr consiste en medir (dúas veces) a posición dun «diafragma cunha fenda... colgado con resortes febles nunha abrazadeira sólida»8; e como a medición do momento cun procedemento deste tipo depende das medicións de posición, non apoia o argumento de Bohr contra Einstein, Podolsky e rosen, nin tampouco é útil para outra cousa. Isto é debido a que desta 7 Véxase Bohr, en Albert Einstein: Philosopher-Scientist, editado por P. A. Schilpp, 1949; véxase especialmente o diagrama da p. 220. 8 Ob. cit., p. 219. 612 Karl Popper maneira non podemos obter o momento «con precisión antes e mais despois de pasar» B9: a primeira destas medicións de momento (xa que utiliza unha medición de posición) interferirá no momento do diafragma; por tanto, será só retrospectiva e non terá ningún uso para calcular o momento do diafragma no punto inmediatamente anterior á interacción con B. Non parece, por tanto, que Bohr respectase o principio de facer só aquelas idealizacións ou asuncións especiais que favorezan aos seus opoñentes (a parte de que dista moito de quedar claro que é o que el quería cuestionar exactamente). (5) Isto demostra que hai un serio perigo, en relación cos experimentos imaxinarios deste tipo, de levar a cabo análises só na medida en que sirvan os propios propósitos e nada máis, un perigo que se pode evitar simplemente respectando escrupulosamente os principios anteriormente mencionados. Vou referirme a outros tres casos semellantes porque me parecen instrutivos. (6) Para confrontar un experimento imaxinario crítico de Einstein baseado na súa famosa fórmula E = mc2, Bohr recorreu a argumentos da teoría da gravitación de Einstein (isto é, da relatividade xeral)10. Mais E = mc2 pódese deducir da relatividade especial e mesmo de argumentos non relativistas. En calquera caso, presupoñer E = mc2, con certeza que non é presupoñer a validez da teoría da gravitación de Einstein. Por tanto, se temos que presupoñer, como indica Bohr, certas fórmulas características da teoría da gravitación de Einstein para preservar a coherencia da teoría cuántica (en presenza de E = mc2), entón eu sosteño que isto equivale a afirmar, estrañamente, que a teoría cuántica contradí a teoría gravitacional de Newton e, o que é máis estraño aínda, que a validez da teoría da gravitación 9 Bohr, Physical Review 48, 1935, p. 699. 10 Bohr, en Albert Einstein: Philosopher-Scientist, editado por P. A. Schilpp; isto trátase nas pp. 225-228. Dr. J. Agassi chamou a miña atención sobre a invalidez deste argumento. *Débese lembrar que a equivalencia mi=mg é parte da teoría de Newton. 613 a lóxida da descuberta científica de Einstein (ou polo menos as fórmulas usadas caracteristicamente, que forman parte da teoría do campo gravitacional) se pode deducir da teoría cuántica. A min paréceme que isto non é suficiente nin sequera para os que estean dispostos a aceptar este resultado. Así que estamos outra vez ante un experimento imaxinario que fai presuposicións extravagantes con obxectivos apoloxéticos. (7) Tamén me parece altamente insatisfactoria a resposta de David Bohm ao experimento de Einstein, Podolsky e rosen11. El cre que o que ten que demostrar é que a partícula A de Einstein que se afastou de B e do aparato de medición si que se esvae na súa posición (ou momento) cando se mide o momento (ou posición) de B, polo que o que el intenta facer é demostrar que segue habendo interferencias impredicibles en A, a pesar de terse afastado xa. Desta maneira intenta demostrar que a súa teoría concorda coa interpretación de heisenberg das relacións de indeterminación. Mais non o conseguiu, como se pode observar se temos en conta que as teorías de Einstein, Podolsky e rosen nos permiten, mediante unha lixeira ampliación do seu experimento, determinar simultaneamente as posicións e mais os momentos de A e de B, aínda que o resultado desta determinación terá relevancia preditiva só para a posición dunha partícula e o momento da outra. Como xa se explicou no punto (4), nós podemos medir a posición de B, e alguén pode medir, lonxe de aquí, o momento de A accidentalmente no mesmo punto temporal ou, en calquera caso, antes de que o efecto de esvaemento da nosa medición de B poida acadar A. Así e todo, isto é todo o que fai falla para demostrar que non funciona o intento de Bohm de salvar a idea de heisenberg de que interferimos en A. 11 Véxase D. Bohm, Phys. Rev. 85, 1952, p. 166 ss., 150 ss.; véxase en especial p. 186 ss. (Sei que Bohm xa non sostén polo menos algunha das ideas expresadas nos artigos criticados aquí. Aínda así, paréceme que polo menos parte do meu argumento segue sendo aplicable ás súas teorías posteriores). 614 Karl Popper A resposta de Bohm a esta obxección está implícita cando afirma que o efecto de esvaemento ocorre a unha velocidade superior á da luz, ou mesmo instantaneamente (cf. o que di heisenberg sobre a velocidade superior á da luz, que se mencionou no apartado 76), unha suposición que hai que apoiar noutra suposición segundo a cal este efecto non se pode usar para transmitir sinais. Pero que ocorre realmente se as dúas medicións se realizan simultaneamente? A partícula esa que supostamente se observa no microscopio de heisenberg, non comeza a bailar diante dos teus propios ollos? E se o fai, non é isto un sinal? (este efecto de esvaemento particular de Bohm, coma a «redución do paquete de ondas», non forma parte do seu formalismo, senón da súa interpretación). (8) un exemplo semellante é unha resposta de Bohm a outro experimento imaxinario crítico proposto por Einstein (quen con isto recuperou a crítica de Pauli da teoría da onda piloto proposta por de Broglie)12. Einstein propón considerar unha «partícula» macroscópica (pode ser algo bastante grande, por exemplo unha bola de billar) que se move a unha determinada velocidade constante, indo e vindo en ambos sentidos, entre dúas paredes paralelas nas que se reflicte elasticamente. Einstein demostra que este sistema se pode representar na teoría de Schrödinger mediante unha onda estacionaria, ademais de demostrar que a teoría da onda piloto de de Broglie, ou a denominada «interpretación causal da teoría cuántica» de Bohm, dá lugar ao resultado paradoxal (sinalado primeiro por Pauli) de que a velocidade da partícula (ou bola de billar) desaparece. Noutras palabras, a nosa suposición orixinal de que a partícula se desprae cunha velocidade escollida arbitrariamente leva nesta teoría, e para calquera velocidade que escollamos, á conclusión de que a velocidade é cero e de que a partícula non se move. 12 Véxase A. Einstein en Scientific Papers Presented to Max Born, 1953, p. 33 ss., especialmente p. 39. 615 a lóxida da descuberta científica Bohm acepta esta conclusión e responde deste xeito: «O exemplo que dá Einstein é o dunha partícula que se move libremente entre dúas paredes perfectamente lisas e reflectoras»13 (non fai falla entrarmos nos detalles menores do experimento). Bohm continúa dicindo: «Na interpretación causal da teoría cuántica [isto é, a interpretación de Bohm], a partícula está en repouso», e a continuación afirma que, se queremos observar a partícula, temos que «provocar» un proceso que faga mover a partícula14. Mais este argumento sobre a observación, independentemente dos seus méritos, xa non ten interese. O que si ten interese é que a interpretación de Bohm paraliza a partícula que se move libremente: o seu argumento equivale a afirmar que a partícula non se pode mover entre esas dúas paredes se non é observada. Isto é debido a que a suposición de que si se move leva a Bohm a concluír que está en repouso ata que a observación provoca o seu movemento. Este efecto paralizante é sinalado por Bohm, mais non tratado en profundidade. En lugar disto, el pasa a afirmar que, aínda que a partícula non se move, as nosas observacións mostrarán que se move (mais isto non era o que se discutía); alén disto, procede a construír un experimento imaxinario enteiramente novo que describe como a nosa observación (o sinal de radar ou fotón usado para observar a velocidade da partícula) podería provocar o movemento desexado. Pero, en primeiro lugar, este non é o problema. E, en segundo lugar, Bohm non explica como o fotón que provoca o movemento nos pode revelar a partícula na súa velocidade característica, que é a máxima, e non nun estado de aceleración cara a súa velocidade máxima. Pois isto semella esixir que a partícula (que pode ser tan rápida e pesada como nós queiramos) adquira e revele a súa velocidade máxima durante o período extremadamente curto da súa interacción co fotón que 13 D. Bohm, no mesmo volume, p. 13; as cursivas son miñas. 14 Ob. cit., p. 14; véxase tamén a segunda nota ao pé nesta mesma páxina. 616 Karl Popper provocou o seu movemento. Todas estas son suposicións ad hoc que aceptarán moi poucos dos seus opoñentes. Mais podemos elaborar o experimento imaxinario de Einstein operando con dúas partículas (ou bolas de billar) das cales unha vai e vén entre a parede esquerda e o centro da mesa, mentres que a outra se move entre a parede dereita e o centro; no centro, as partículas colisionan elasticamente. Este exemplo lévanos outra vez ás ondas estacionarias e, en consecuencia, á desaparición da velocidade, co cal segue intacta a crítica de PauliEinstein á teoría. Mais o efecto desencadeador é agora aínda máis precario. Supoñamos que observamos a partícula esquerda lanzándolle un fotón desencadeador desde a esquerda. Isto, segundo Bohm, desfará o equilibrio de forzas que mantén a partícula en repouso e a partícula comezará a moverse (de esquerda a dereita, posiblemente). Mais, aínda que desencadeásemos só o movemento da partícula esquerda, a partícula dereita terá que comezar simultaneamente a moverse en dirección oposta. Pedirlle a un físico que acepte a posibilidade de todos estes procesos é demasiado, pois todos eles son supostos ad hoc, para evitar as consecuencias do argumento de Pauli e Einstein. Einstein poderíalle ter respondido a Bohm, paréceme, do xeito seguinte: No caso considerado, o noso sistema físico era unha bola macroscópica grande. Non se deu ningunha razón para que en tal caso non fose aplicable a concepción clásica habitual da medición. E esta é unha concepción que coincide coa experiencia todo o que un podería desexar. Deixando de lado a medición, estarase a afirmar en serio que non pode existir unha bola en movemento oscilante (ou dúas bolas oscilantes no experimento simétrico descrito aquí) se non é observada? Ou, o que é o mesmo, estase a afirmar en serio que o suposto de que si se move ou oscila mentres non é observada, ten que levar á conclusión de que non se move? E que ocorre se, unha vez que a nosa observación provocou o 617 a lóxida da descuberta científica movemento da bola, xa non se volve a interferir no sistema, de maneira que este se fai estacionario? Detense entón a partícula tan de repente como antes se botara a andar? E transfórmase a súa enerxía en enerxía de campo? Ou é o proceso irreversible? Mesmo supoñendo que todas estas preguntas se puidesen responder dalgunha maneira, elas ilustran, paréceme, a relevancia da crítica de Pauli e Einstein e do uso crítico dos experimentos imaxinarios, especialmente o experimento de Einstein, Podolsky e rosen. E creo que tamén ilustran o perigo do uso apoloxético dos experimentos imaxinarios. (9) Ata o de agora ocupeime do problema dos pares de partículas, que introduciron no debate Einstein, Podolsky e rosen. Agora paso a algún dos experimentos imaxinarios con partículas soltas, coma o famoso microscopio imaxinario de heisenberg que supostamente permitiría «observar» electróns e «medir» ou ben as posicións ou ben os momentos. Poucos experimentos imaxinarios exerceron maior influencia no pensamento da física que este. Coa axuda deste experimento imaxinario, heisenberg intentou deixar sentadas varias cousas, das que eu só mencionarei tres: (a) a interpretación das fórmulas de indeterminación de heisenberg en termos da existencia de barreiras insuperables na precisión das nosas medicións; (b) a alteración do obxecto medido polo proceso de medición, xa sexa a posición ou o momento; e (3) a imposibilidade de comprobar a «traxectoria» espacio-temporal da partícula. Eu creo que está moi claro que os argumentos de heisenberg que tenden a establecer estes puntos non teñen validez, independentemente dos méritos dos tres puntos por separado. A razón é que heisenberg na súa exposición non establece que as medicións de posición e de momento sexan simétricas. Enténdase, simétricas con respecto á alteración do obxecto medido polo proceso de medición. heisenberg si que demostra co seu experimento que para medir a posición do electrón hai que usar luz dunha frecuencia superior, isto é, 618 Karl Popper fotóns de alta enerxía, o cal significa que se lle transfire un momento descoñecido ao electrón, tal que este se ve alterado ao recibir un forte golpe, por dicilo así. Mais heisenberg non demostra que, analogamente, ocorra o mesmo se o que queremos é medir o momento do electrón en lugar da súa posición, pois neste caso, segundo heisenberg, hai que observalo cunha luz de baixa frecuencia, tan baixa que se poida supoñer que non alteramos o momento do electrón coa nosa observación. A observación resultante (aínda que revela o momento) non revelará a posición do electrón, que seguirá a ser indeterminada. Ora ben, repárese neste último argumento. Non se afirma aquí que alterásemos (ou «fixésemos esvaer») a posición do electrón, pois heisenberg o único que di é que nós non fomos quen de revelala. De feito, o seu argumento implica que o sistema non se alterou en absoluto (ou que a alteración foi tan leve que se pode desprezar): os fotóns usados tiñan unha enerxía tan baixa que non era suficiente para afectar o electrón. Así que as dúas operacións (a medición de posición e mais a de momento) están moi lonxe de seren análogas ou simétricas, segundo o argumento de heisenberg. Este feito permanece oculto, porén, polo discurso (positivista, operacionalista ou instrumentalista) sobre os «resultados da medición» cuxa incerteza é supostamente simétrica con respecto a posición e momento. Mais en moitísimas ocasións en que se trata o experimento, a comezar polo propio heisenberg, sempre se asume que o seu argumento establece a simetría das alteracións (no formalismo a simetría entre posición e momento é completa, claro está, mais isto non quere dicir que o experimento imaxinario de heisenberg dea conta disto). Así que se asume (erroneamente) que alteramos a posición do electrón se medimos o seu momento co microscopio de heisenberg e mais que este efecto de «esvaemento» foi establecido pola explicación que heisenberg dá do seu experimento imaxinario. O meu propio experimento imaxinario do apartado 77 baseábase en grande medida nesta asimetría no experimento 619 a lóxida da descuberta científica de heisenberg (cf. nota *1 do apéndice vi). Mais o meu experimento non é válido simplemente porque a asimetría invalida toda a discusión de heisenberg da medición: para ilustrar as fórmulas de heisenberg só se poden usar as medicións que resultan da selección física (como eu a denomino), e unha selección física, como xa sinalara eu correctamente no meu libro, debe cumprir as «relacións de dispersión» (a selección física si que altera o sistema). Se as «medicións» de heisenberg fosen posibles poderiamos mesmo comprobar o momento dun electrón entre dúas medicións de posición sen alteracións, o cal tamén nos permitiría (contra o que se afirmaba no punto (c) anteriormente) comprobar parte da súa «traxectoria» espacio-temporal, que é calculable a partir destas dúas medicións de posición. Que pasase tanto tempo sen se decatar da inadecuación do argumento de heisenberg débese, sen dúbida, ao feito de que as fórmulas de indeterminación se deducen claramente do formalismo da teoría cuántica (a ecuación de onda), e a que a simetría entre a posición (q) e momento (p) tamén está implícita neste formalismo. Isto pode explicar por que moitos físicos non examinaron co coidado debido o experimento imaxinario de heisenberg: non o tomaron en serio, supoño, pero só en canto que ilustración dunha fórmula deducible. O que eu quero dicir é que é unha mala ilustración, simplemente porque non dá conta da simetría entre posición e momento. Sendo unha mala ilustración, é inadecuado como base para interpretar estas fórmulas, e moito menos aínda como base de toda a teoría cuántica. (10) Estou convencido de que a inmensa influencia acadada polo experimento imaxinario de heisenberg se debe a que el conseguiu transmitir por medio del unha nova imaxe metafísica do mundo físico, ao tempo que rexeitaba a metafísica (cedendo así a unha obsesión curiosamente ambivalente da nosa era posracionalista: a súa preocupación por matar ao pai –ou sexa, a Metafísica– ao tempo que se resgardaba de toda crítica. Para 620 Karl Popper algúns teóricos da física cuántica ás veces parece que o pai é Einstein). A imaxe metafísica do mundo que, sen ser unha implicación real, heisenberg transmite dalgún xeito durante a discusión do seu experimento, é a seguinte: a cousa en si é incognoscible, pois nós só podemos coñecer as súas aparencias, que se debe entender que son (como sinalou Kant) o resultado da combinación da cousa en si e mais do noso marco de percepción. Así que as aparencias xorden dunha especie de interacción entre as cousas e nós. Esta é a razón de que unha mesma cousa se nos poida aparecer en formas diferentes, segundo as nosas diferentes maneiras de percibila, observala e interactuar con ela. Nós intentamos apreixar, por así dicir, a cousa en si, mais nunca o damos feito: mediante as nosas trampas só atopamos aparencias. Podemos montar ou ben unha trampa de partícula clásica ou ben unha clásica trampa de onda («clásicas» porque as podemos facer e montalas como unha trampa para cazar ratos) e no proceso de activar a trampa, interactuando así con ela, a cousa é inducida a adoptar aparencia de partícula ou de onda. hai unha simetría entre estas dúas aparencias ou entre as dúas maneiras de atrapar a cousa. Ademais, ao montar a trampa, non só temos que proporcionar un estímulo para que a cousa adopte unha das dúas aparencias físicas clásicas, senón que temos que poñerlle un bo cebo con enerxía: a enerxía necesaria para unha realización física clásica ou materialización da cousa incognoscible en si. Desta maneira mantemos as leis de conservación. Esta é a imaxe metafísica transmitida por heisenberg e quizais tamén por Bohr. Eu estou moi lonxe de poñerlle obxeccións á metafísica deste tipo (aínda que non me atrae demasiado esta mestura particular de positivismo e transcendentalismo). Nin tampouco fago obxeccións a que se transmita mediante metáforas. A miña obxección é contra a diseminación case inconsciente desta imaxe metafísica, decote combinada con rexeitamentos explíci621 a lóxida da descuberta científica tos da metafísica. Eu creo que ela non se debería permitir que callase sen decatármonos e, por tanto, de xeito acrítico. Paréceme interesante que boa parte do traballo de David Bohm semelle inspirarse na mesma metafísica. Mesmo se podería caracterizar o seu traballo como un valente intento de construír unha teoría física que explicita claramente esta metafísica. Isto é admirable. Pero eu pregúntome se esta idea metafísica concreta será suficiente, e se realmente pagará a pena o esforzo, tendo en conta que non se pode apoiar (como vimos) no experimento imaxinario de heisenberg, que é a fonte intuitiva de todo isto. A min paréceme que hai unha conexión bastante obvia entre o «principio de complementariedade» de Bohr e esta concepción metafísica dunha realidade incognoscible, unha concepción que indica a «renuncia» (para usar o termo preferido de Bohr) das nosas aspiracións ao coñecemento e a restrición dos nosos estudos físicos a aparencias e as súas interrelacións. Mais non me vou estender sobre esta conexión evidente e limitareime a comentar certos argumentos a favor da complementariedade que estaban baseados noutros experimentos imaxinarios. (11) En relación con «principio de complementariedade» (tratado máis amplamente no meu Postscript; cf. tamén o meu artigo «Three Views Concerning human Knowledge», agora incluído en Conjectures and Refutations, 1963, capítulo 3), Bohr analizou unha grande cantidade de experimentos imaxinarios que, sendo moi sutís, teñen igualmente carácter apoloxético. Como as formulacións de Bohr do principio de complementariedade son imprecisas e difíciles de explicar, farei uso dun coñecido libro, excelente en moitos aspectos, de P. Jordan titulado Anschauliche Quantentheorie15 (onde casualmente se alude ao meu libro Logik der Forschung). 15 Jordan, Anschauliche Quantentheorie, 1936, p. 282. 622 Karl Popper Jordan ofrece unha formulación de (parte) dos contidos do principio de complementariedade que a aproxima enormemente ao problema do dualismo entre partículas e ondas. El formúlao así: «Calquera experimento que manifeste, ao mesmo tempo, as propiedades de onda e as propiedades de partícula da luz non só contradiría as teorías clásicas (xa nos afixemos ás contradicións deste tipo), senón que, sobre todo, sería absurdo nun sentido lóxico e matemático»16. Jordan ilustra este principio co famoso experimento das dúas fendas (véxase o apéndice v): «Supoñamos que hai unha fonte de luz da que procede luz monocromática que bate nunha pantalla negra con dúas fendas [paralelas] próximas unha da outra. Supoñamos, por un lado, que as fendas e a distancia entre elas son o suficientemente pequenas (en comparación coa lonxitude de onda da luz) para obter franxas de interferencia nunha placa fotográfica que rexistra a luz que pasa polas dúas fendas; por outro lado, supoñamos que unha montaxe experimental faga posible saber, dun fotón illado, por cal das dúas fendas pasou»17. Jordan afirma que «estas dúas suposicións conteñen unha contradición»18. Eu non vou rebater isto, aínda que a contradición non sería un absurdo lóxico ou matemático, como indica el nunha das citas anteriores; o que ocorre é, máis ben, que as dúas suposicións xuntas contradirían simplemente o formalismo da teoría cuántica. O que eu pretendo rebater é algo diferente: Jordan usa este experimento para ilustrar a súa formulación dos contidos do principio de complementariedade, mais pódese demostrar que é refutada polo propio experimento co que el ilustra este principio. repárese na descrición que fai Jordan do experimento das dúas fendas, omitindo en primeira instancia a súa última suposición (a introducida por «por outra banda»). Aquí obtemos 16 Ob. cit., p. 115. 17 Ob. cit., p. 115 ss. (as cursivas son de Jordan). 18 Ob. cit., p. 116. 623 a lóxida da descuberta científica franxas de interferencia no placa fotográfica. Así que este é un experimento que «manifesta as propiedades de onda da luz». Supoñamos agora que a intensidade da luz é o suficientemente baixa para obter na placa colisións claras dos fotóns; noutras palabras, unha intensidade tan baixa que as franxas son analizables debido á distribución da densidade das colisións do fotón illado. Entón temos aquí «un experimento» que «manifesta, ao mesmo tempo, tanto as propiedades de onda como as propiedades de partícula da luz», polo menos algunhas delas. Isto é, fai precisamente aquilo que segundo Jordan tiña que ser «absurdo nun senso lóxico e matemático». É certo que se, amais, fósemos quen de descubrir por cal das dúas fendas pasou un determinado fotón, entón seriamos quen de determinar a súa traxectoria e poderiamos dicir que este experimento (supostamente imposible) manifestaría as propiedades de partícula do fotón aínda máis claramente. Eu concedo todo isto, mais é bastante irrelevante, pois o que afirmaba o principio de Jordan non era que algúns experimentos que a primeira vista semellaban posibles se volvan imposibles –o cal é trivial– senón que non hai experimentos de ningún tipo que «manifesten, ao mesmo tempo, as propiedades de onda e as propiedades corpusculares de luz». E nós demostramos que esta afirmación é simplemente falsa: é refutada por case todos os experimentos típicos da mecánica cuántica. Mais que era, logo, o que quería dicir Jordan? Quizais que non hai experimento ningún que manifeste ao mesmo tempo todas as propiedades de onda e todas as propiedades de partícula da luz? Esta non podía ser, evidentemente, a súa intención pois ata é imposible un experimento que manifeste, ao mesmo tempo, todas as propiedades de onda, nin sequera retirando a esixencia de que manifeste algunha das propiedades de partícula (e ao revés ocorre o mesmo). O que resulta inquietante na argumentación de Jordan é a súa arbitrariedade. É evidente, polo dito ata agora, que ten que 624 Karl Popper haber algunhas propiedades de onda e algunhas propiedades de partícula que ningún experimento pode combinar. Jordan xeneraliza este feito e despois formúlao como un principio (principio que na formulación de Jordan nós refutamos, en calquera caso). E despois é ilustrado por un experimento imaxinario que Jordan demostrou que era imposible. Mais, como vimos, a parte do experimento que todo o mundo admite que é posible en realidade refuta o principio, polo menos na formulación de Jordan. Observemos un pouco máis de preto a outra parte do experimento imaxinario, a parte introducida pola expresión «por outro lado». Se facemos arranxos para determinar por que fenda pasou a partícula, entón dise que destruímos as franxas. Vale. Pero, destruímos tamén as propiedades de onda? Considérese o experimento máis simple: fechamos unha das fendas. Se facemos isto, aínda quedan moitos indicios do carácter de onda da luz (aínda cunha soa fenda obtemos unha disbribución de densidade semellante á da onda). Mais agora ata os nosos opoñentes recoñecen que as propiedades de partícula se mostran en plenitude, pois agora podemos trazar a traxectoria da partícula. (12) Desde un punto de vista racional, todos estes argumentos son inadmisibles. Eu non dubido que haxa unha idea intuitiva detrás do principio de complementariedade de Bohr. Pero nin el nin ningún outro membro da súa escola foron quen de explicalo, nin sequera a aqueles críticos que, coma Einstein, se esforzaron por entendelo ao longo de moitos anos19. A miña impresión é que moi ben podería ser a idea metafísica descrita anteriormente no punto (10). Se cadra engánome mais, sexa o que sexa, paréceme que Bohr nos debe unha mellor explicación20. 19 Cf. Albert Einstein: Philosopher-Scientist, editado por P. A. Schilpp, 1949, p. 674. 20 (Engadido en 1967) Unha discusión posterior dalgúns destes problemas atoparase no meu artigo «Quantum Mechanics Without 'The Observer'», en Quantum Theory and Reality, editado por Mario Bunge, 1967, pp. 7-44. 625 a lóxida da descuberta científica APÉNDICE *xII O experimento de Einstein, Podolsky e rosen Unha carta de albert einstein, 1935 A carta de Einstein reimpresa aquí en tradución refuta de xeito breve e decidido o meu experimento imaxinario do apartado 77 do libro (tamén fai referencia a unha versión lixeiramente diferente dun artigo non publicado) e a continuación pasa a describir con admirable claridade o experimento imaxinario de Einstein, Podolsky e rosen (Physical Review 47, 1935, pp. 777-780; cf. a miña nota da p. 232 e a nota do apartado 3 do apéndice *xi). Ademais diso, atoparanse uns cantos comentarios sobre a relación entre teoría e experimentos en xeral e sobre a influencia das ideas positivistas na interpretación da teoría cuántica. Os dous últimos parágrafos da carta tamén tratan un problema tratado no meu libro (e no Postscript): o problema das probabilidades subxectivas e o de tirar conclusións estatísticas da nesciencia. Nisto continúo estando en desacordo con Einstein: paréceme que tiramos estas conclusións probabilísticas partindo de conxecturas sobre a equidistribución (que decote son conxecturas moi naturais e por este motivo quizais non sempre son feitas conscientemente) e, por tanto, de premisas probabilísticas. Os testamenteiros de Einstein solicitaron que a versión orixinal da carta acompañase a publicación da tradución. De aquí procede a idea de reproducir a carta de Einstein na súa versión manuscrita (véxanse pp. 489-492). 626 Karl Popper Old lyme, 11-Ix-1935 Prezado Sr. Popper: lin o seu artigo e concordo en xeralx. O único é que non creo na posibilidade de xerar un «caso super-puro» que nos permita predicir posición e mais momento (cor) dun fotón con precisión «inadmisible». Eu considero que o método proposto por vostede (unha pantalla cun diafragma rápido xunto cun conxunto selectivo de filtros de vidro) é ineficaz en principio, pola razón de que eu creo firmemente que un filtro deste tipo provocaría que se «esvaese» a posición, como ocorre coa retícula espectroscópica. O meu argumento é o seguinte: considérese un sinal breve de luz (posición precisa). Para ver máis doadamente os efectos dun filtro absorbente, asumo que o sinal se analiza nun número maior de trens de onda monocromáticos, Wn. Supoñamos que os filtros absorban todas as cores Wn excepto unha, W1. Agora, este grupo de ondas terá unha extensión espacial considerable («esvaemento» da súa posición) porque é cuasimonocromático, o cal significa que o filtro necesariamente fará que «se esvae» a posición. Non me agrada, en xeral, a tendencia 'positivista', que agora está tan de moda [modische], de limitarse ao que é observable. Considero trivial que un non poida, no ámbito das magnitudes atómicas, facer predicións co grao de precisión que un queira, e creo (coma vostede, por certo) que a teoría non se pode construír partindo dos resultados da observación, senón que só pode ser inventada. Non teño aquí copias do artigo que escribín conxuntamente co Sr. rosen e o Sr. Podolski, mais pódolle resumir brevemente os seus contidos. Cabe preguntarse, desde o punto de vista da teoría cuántica actual, se o carácter estatístico dos nosos achados experimenx Punto principal: A función Ψ caracteriza un agregado estatístico de sistemas máis que un único sistema. Isto é tamén o resultado das consideracións expostas máis abaixo. Esta concepción fai innecesario distinguir, máis concretamente, entre casos «puros» e «non puros». 627 a lóxida da descuberta científica tais é simplemente o resultado de interferir nun sistema desde fóra, incluíndo a medición deste, mentres que os sistemas en si (descritos por unha función Ψ) se comportan de xeito determinista. heisenberg coquetea [liebäugelt] con esta interpretación, sen chegar a adoptala sistematicamente. Mais a pregunta tamén se pode formular deste xeito: deberiamos considerar a función Ψ (cuxos cambios dependentes do tempo son, segundo a ecuación de Schrödinger, deterministas) como unha descrición completa da realidade física e deberiamos, por tanto, considerar a interferencia externa (insuficientemente coñecida) no sistema como a única causa de que as nosas predicións teñan un carácter meramente estatístico? A resposta a que chegamos é que a función Ψ non se debería considerar como unha descrición completa do estado físico do sistema. Consideremos un sistema composto, consistente nun sistema parcial A e B que só interactúan durante un curto período de tempo. Supoñamos que coñecemos a función Ψ do sistema composto antes de que tivese lugar a interacción (unha colisión entre dúas partículas libres, por exemplo). A ecuación de Schrödinger daranos a función Ψ do sistema composto despois da interacción. Supoñamos agora que despois da interacción se leva a cabo unha medición óptima [vollständige] no sistema parcial A, que se pode realizar de varias maneiras, dependendo das variables que un queira medir con precisión, por exemplo, a coordenada de momento ou a de precisión. A mecánica cuántica daranos logo a función Ψ para o sistema parcial B, e daranos varias funcións Ψ que difiren, segundo o tipo de medición que decidimos realizar sobre A. Non é razoable supoñer que o estado físico de B poida depender da medición realizada nun sistema A que agora xa está separado de B [de xeito que xa non interactúa con B]; e isto significa que dúas funcións Ψ diferentes pertencen ao mesmo estado físico de B. Como unha descrición completa dun estado físico ten que ser necesariamente unha descrición non ambigua 628 Karl Popper (a parte de superficialidades como as unidades, a escolla de coordenadas, etc.), non é posible, por tanto, considerar a función Ψ como a descrición completa do estado do sistema. un teórico cuántico ortodoxo dirá, evidentemente, que unha tal descrición completa non existe e que só pode existir unha descrición estatística dun agregado de sistemas, máis que unha descrición dun único sistema. Mais, primeiro, isto deberíao dicir claramente e, segundo, non creo que teñamos que contentarnos para sempre cunha descrición tan imprecisa e tan pouco consistente da natureza. Deberíase sinalar que algunhas das predicións precisas que podo obter para o sistema B (segundo o método de medición de A libremente escollido) se poden relacionar entre si da mesma maneira que as medicións de momento e de posición. Dificilmente se pode evitar a conclusión de que o sistema B ten en realidade unhas coordenadas definidas de momento e de posición, pois se son quen de predicir algo, ao decidir libremente facelo [isto é, sen interferir nel], entón este algo ten que existir na realidade. un [método de] descrición que, coma o que agora se usa, é estatístico en principio, só pode ser unha fase transitoria, na miña opinión. Gustaríame repetir* que non creo que estea acertada a súa tese de que é imposible deducir conclusións estatísticas partindo dunha teoría determinista. Pénsese só na mecánica estatística clásica (a teoría do gas ou a teoría do movemento browniano). Exemplo: un punto material móvese a velocidade constante nun círculo fechado; eu podo calcular a probabilidade de atopalo nun instante temporal dado nunha parte dada da periferia. O que é esencial é simplemente isto: que eu non coñeza o estado inicial ou que non o coñeza con precisión! un agarimoso saúdo, A. Einstein. * Hai aquí unha alusión a unha carta anterior [K. R. P.]. 629 a lóxida da descuberta científica Facsímile reducido 630 Karl Popper 631 a lóxida da descuberta científica 632 Karl Popper 633 a lóxida da descuberta científica ÍNDICE ONOmáSTICO A letra «c» indica «cita»; «n» indica «nota» Acton, lord Adams, J. C. Agassi, J. Ajdukiewicz, K. Ancillion, J. P. F. Aristotle Avenarius, r. Bacon, F. Bar-hillel, Y. Bayes, Th. Bergson, h. Berkeley, G. Bernoulli, J. Black, J. Bohm, D. Böhm-Bawerk, E. Bohr, N. Boltzmann, l. Bolyai, J. Bolzano, B. Boole, G. Borel, E. Born, M. Boscovic, r. G. Bose, S. N. Bothe, W. Braithwaite, r. B. Brown, r. Bunge, M. Carnap, r. Carnot, S. Church, A. Compton, A. h. Comte, A. Copeland, A. h. Cornelius, h. Czuber, E. Davisson, C. J. De Broglie, l. De Moivre, A. Descartes, r. Dingle, h. Dingler, h. Dirac, P. A. M. Döege, F. Doppler, C. Dörge, F. Dubislav, W. Duhem, P. Eddington, A. S. Ehrenfest, P. & T. Einstein, A. Elton, l. r. B. Euclides Faraday, M. Feigl, h. Fermat, P. Fermi, E. Fisher, r. A. Fitzgerald, G. F. 634 Karl Popper Fourier, J. B. Frank, Ph. Frege, G. Fries, J. F. Galileo Geiger, h. Germer, l. h. Gilbert, W. Gillies, D. A. Goldbach, C. Gomperz, h. Good, I. J. Grelling, K. Grünbaum, A. haas, A. hahn, h. haldane, J. B. S. hamblin, C. l. hausdorff, F. hegel, G. W. F. heisenberg, W. hempel, C. G. heymans, G. hilbert, D. hobbes, Th. hossiasson, J. hume, D. huntington, E. V. Jeans, J. h. Jeffreys, h. Jordan, P. Kaila, E. Kamke, E. Kant, I. Kaufmann, F. Kemeny, J. Kepler, J. Keynes, J. M. Kirchof, G. r. Klein, F. Klein, O. Kneale, W. C. Kolmogorov, A. Körner, S. Kraft, J. Kraft, V. Kramers, h. A. Kries, J. Külpe, O. landé, A. laplace, P. S. laue, M. leibniz, G. W. leverrier, u. K. J. levy, h. lewin, K. lewis, C. I. lewis, h. D. liebig, J. lobatschewski, N. I. locke, J. lorentz, A. h. lummer, O. Mace, C. A. Mache, E. March, A. Maxwell, J. Mazurkiewicz, S. Menger, K. Meyerson, E. Michelson, A. A. Mie, G. 635 a lóxida da descuberta científica Mill, J. S. Miller, D. C. Millikan, r. A. Mises, r., Morley, E. W. Natkin, M. Nerlich, G. C. Nernst, W. Neumann, J. Neurath, O. Newton, I. Neyman, J. Ogden, C. K. Oppenheim, P. Parton, h. Pasteur, l. Pauli, W. Peano, G. Peirce, C. S. Planck, M. Platón Podolsky, B. Poincaré, h. Poisson, S. D. Post, E. l. Pringsheim, E. rabinowitsch, E. rayleigh, J. W. Strutt reichenbach, h. reininger, r. rényi, A. rosen, N. russell, B. rutherford, E. Schiff, K. Schilpp, P. A. Schlick, M. Scholl, D. Schopenhauer, A. Schrödinger, E. Simon, A. W. Slater, J. C. Smoluchowski, M. Spann, O. Spinoza, B. Sraffa, P. Stebbing, S. Stumpf, C. Suchting, W. A. Tarski, A. Tales Tornier, E. Tschuprow, A. A. Venn, J. Waismann, F. Wald, A. Watkins, J. W. N. Weierstrasse, K. Weizsäcker, C. F. von Weyl, h. Whewell, W. Whitehead, A. N. Wien, W. Wiener, P. P. Wigner, E. Wisdom, O. Wittgenstein, l. Woodger, J. h. Wright, G. h. Wrinch, D. 636 Karl Popper ÍNDICE TEmáTICO Os números de páxina en cursiva indican que a referencia é de especial importancia. un número de páxina seguido por «t» indica a páxina do texto en que se trata; «n» significa nota. Absoluto, véxase tamén unicidade Abstracto, véxase tamén xeneralización Accidental (descuberta) Aceptabilidade, véxase tamén Avaliación; Crenza; Corroboración, Decisións, sobre aceptación de teoría Acontecemento, apartado 23; de tipo casual; homotípico ou típico; e probabilidade dunha hipótese véxase Probabilidade lóxica, perspectiva de reichenbach de; sucesións de véxase Sucesións Acordo sobre o resultado dunha proba, véxase tamén Decisións, sobre resultados de probas Actitude crítica, Crítica, véxase tamén Discusión; racionalismo Ad hoc (hipótese), véxase hipótese Adición (teorema), véxase tamén Avaliación Aleatoriedade ou desorde obxectiva, apéndice vi, véxase tamén Frecuencia relativa, axioma de aleatoriedade; Mostra; Seleccións, insensibilidade a; Sucesións, aleatorias Alteración subrepticia Alternativa; aleatoria, véxase tamén Sucesión. álxebra de Bool; dedución de ámbito, selección lóxica, apartado 72 Apoio véxase Corroboración, sen gradación Apriorismo, véxase tamén argumento transcendental Aproximación, véxase tamén Modificación Argumento transcendental Argumento véxase Crítica; Discusión, tratamento Asimetría entre verificación (ou confirmación e falsificación) Atomismo (metafísico) 637 a lóxida da descuberta científica Atrevemento da ciencia, véxase tamén Contido Autoridade de experiencia, non existencia de, véxase tamén Enunciados básicos, incerteza de Avaliación, da adecuación dunha teoría Axiomas, axiomatización, sistemas axiomatizados; independencia de véxase Independencia, lóxica; interpretación de, apartado xx; «orgánica», véxase tamén Formalización; Probabilidade, teoría formal da Axiomática Bloques ou iteracións Cálculo proposicional Campo de aplicación dunha teoría Campo de probabilidades, de Borel Campo de representación gráfica dunha teoría, véxase tamén Curvas Case seguro; case segue Caso puro Causalidade, explicación causal, apartado 12 Causalidade, principio de Certeza, busca de, véxase tamén Convicción; Demarcación; hipótese; Verificación. Ciencia, aplicada; como sentido común; como sentido común; empírica véxase carácter empírico; Empirismo; Teorías; e liberdade; como xogo con regras; o seu obxectivo, apartado 9; e lóxica Círculo de Viena Clase de referencia, Sucesión ou colectivo de referencia, véxase tamén Aleatoriedade; Sucesións, aleatorias Clases de enunciados; comparación de; complemento, véxase tamén Clase de referencia; Sucesión, de enunciados. Coherencia apartado 24; de axiomas de probabilidade véxase Probabilidade, cálculo formal de, véxase tamén Contradicións Colectivo, de Mises véxase Sucesión de referencia; Sucesións, aleatorias 638 Karl Popper Composición, absoluta, non existente; grao de Comprobabilidade, comprobación, proba, apartado 3; coa axuda dos conceptos de campo de aplicación e de dimensión; coa axuda do concepto de subclase, apartado 33; comparación de, apartado 32; grao de, capítulo VI; aumenta co contido, apartado 35; aumenta coa improbabilidade; aumenta coa simplicidade, apartado 43; aumenta coa universalidade e precisión, apartado 36; de enunciados de probabilidade véxase Decidibilidade; as dúas medidas comparadas, véxase tamén Falsificabilidade Conceptos, disposicionais véxase Disposicionais, definición empírica de, imposibles, véxase tamén Constituír, concepción indutiva de; lóxica; primitiva ou non definida, véxase tamén Nomes; universais Condicional véxase Implicación Condicións do marco, véxase tamén Condicións experimentais Condicións iniciais, véxase tamén Condicións experimentais Conduta de «tipo lei», véxase tamén Enunciados básicos, falsificabilidade de; Observabilidade; regularidade; Semellanza Coñecemento, psicoloxía do Confirmación no senso de Corroboración ou resistencia demostrada a probas rigorosas véxase Corroboración; no senso de verificación feble ou de afirmar pola experiencia véxase Verificación; para confusión terminolóxica Constituír, Constitución, véxase tamén redución Contido lóxico Contido, empírico ou informativo; aumenta co grao de falsificabilildade ou comprobabilidade e coa improbabilidade, apartado 35; medida de; de enunciados de probabilidade, véxase tamén Prohibicións Continuidade, axioma de Kolmogorov Contradición Convencionalismo apartado 19; excluído por unha decisión; e simplicidade apartado 46, véxase tamén Métodos, concepción convencionalista de 639 a lóxida da descuberta científica Convencións véxase Decisións Convicción, impresión de irrelevancia para a discusión científica, véxase tamén Crenza, grao «racional» de Coordenadas, espacio-temporais, sistemas de Coordenadas Corroborabilidade apartado 82; véxase tamén Comprobabilidade, grao de Corroboración, capítulo x, apartado 81, grao de; como grao de crenza racional; aumenta co grao de falsificabilidade ou comprobabilidade e non é a probabilidade; de enunciados de probabilidade; relativizada; e verdade apartado 84; sen gradación Cosmoloxía, os seus problemas son os da filosofía da ciencia xviii; os seus problemas son os da filosofía da ciencia xxiii Crenza metafísica en regularidades, véxase tamén Causalidade; leis; regularidades; Argumentos transcendentais; uniformidade da natureza Crenza, grao racional de, véxase tamén Convicción Crenza, racional Crucial, experimento véxase Experimento Cuasi-indución véxase Dirección indutiva Curvas, dimensións de, apartados Datos sensoriais, véxase tamén Observación Decidibilidade ou comprobabilidade de enunciados de probabilidade Decisións ou propostas para a adopción de regras de métodos; son indispensables, apartado 9; sobre aceptación de enunciados básicos; sobre aceptación dunha teoría; sobre o obxectivo da ciencia, apartado 9; sobre explicacións causais; sobre corroboración; sobre demarcación da ciencia; sobre exclusión de hipóteses ad hoc; sobre exclusión de estrataxemas convencionalistas; sobre exclusión da metafísica; sobre exclusión de cambios subrepticios; sobre resultado de comprobacións; sobre preferencia de precisión; sobre preferencia de simplicidade; sobre preferencia de comproba640 Karl Popper bilidade; sobre preferencia de universalidade; sobre termos primitivos; sobre explicacións de probabilidade; carácter convencional, apartado 11; para comprobar as nosas hipóteses rigorosamente; para intentar clarificar posición antes de criticala, véxase tamén Aceptabilidade; Metafísica, odio dos positivistas a Dedución, Deducibilidade, apartado 12; xeneralizada véxase Probabilidade, lóxica Dedutivismo véxase Método, perspectiva dedutivista de Definición; esencial; implícita; intencional e estensional; operacional; ostensiva; recursiva. Definicións ostensivas véxase Definicións Demarcación entre ciencia e pseudociencia, e entre ciencia e metafísica, apartado 4; certeza como, inadecuada; falsificabilidade como, apartado 6; significado como, inadecuada, véxase tamén Asimetría; Certeza; Carácter empírico; estabilidade; Falsificabilidade; Significado, dogma positivista de; Verificación Demarcación versus significado Demostrabilidade, véxase tamén Tautoloxía Descrición, teoría de russel da Descuberta; accidental, rara, véxase tamén Falsificación Desorde obxectiva véxase Aleatoriedade Desorde véxase Aleatoriedade Desviación, estatística, véxase tamén Flutuación Determinismo, metafísico Dimensión, apartado 38, apéndice i, apéndice viii; de enunciados de probabilidade; redución de, material e formal, véxase tamén Decidibilidade; Campo de aplicación. Dirección indutiva, movemento dedutivo en, cuasi-indución, véxase tamén universalidade, niveis de Discusión, comentario crítico; crítica Disposicións, Disposicionais; grao de, véxase tamén Conduta de «tipo lei» 641 a lóxida da descuberta científica Distancia característica Distribución de probabilidades, véxase tamén Equidistribución. Dogmatismo, véxase tamén Significado, dogma positivista de, carácter dogmático Dualidade de presentacións de onda e partícula, véxase tamén Complementariedade Duhm-Quine, tese, véxase Sistemas Economía Ecuación persoal Efecto posterior; absoluto; en sucesións finitas; en sucesións finitas, apartado 148-151t; liberdade de; en sucesións infinitas, apartado 153-4; invariable a certas transformacións 162, véxase tamén Aleatoriedade; seleccións, insensibilidade a; Sucesións, aleatorias Efecto, oculto; reproducible, véxase tamén Conduta de «tipo lei»; Observabilidade; regularidade Efectos ocultos, fenómenos ocultos Elemento metafísico de teoría cuántica véxase Programa de heisenberg Eliminación, método de Empírica, base, apartado 7, capítulo V; obxectividade de, apartado 27 Empírico, carácter dun enunciado ou sistema de enunciados, véxase tamén Demarcación; Falsificabilidade Empirismo Enerxía, lei de conservación Enunciados analíticos véxase Tautoloxías Enunciados atómicos; relativamente; véxase tamén Campo de aplicación Enunciados básicos ou enunciados de comprobación; grao de composición de; falsabilidade de; requisitos formais e materiais de; homotípicos; permitidos; na probabilidade véxase decidibilidade; prohibidos; relatividade de, apartado 86-7; regra de aceptación; apartados 82-5t; a súa negación 642 Karl Popper son enunciados exemplificadores; incerteza, véxase tamén Falsificador potencial. Enunciados de comprobación véxase Enunciados básicos; Falsificadores potenciais Enunciados de probabilidade; como ponte co subxectivismo; especialmente en teoría cuántica; normalmente singulares, apartado 71; forma lóxica de, apartado 66; numéricos; convertidos en comprobables; non comprobables, véxase tamén Decidibilidade Enunciados do tipo«absolutamente todos» Enunciados metafísicos, Metafísica; o grande papel que poden desempeñar na actividade científica; odio dos positivistas a; probabilidade, apartado 67; enunciados puramente existenciais; non falsificables, véxase tamén Contido Enunciados singulares; de «tipo lei» Enunciados sintéticos; non empíricos, véxase tamén Demarcación versus significado; Significado, dogma positivista de; Metafísica Enunciados universais; existenciais; como prohibicións; estritos ou de non existencia; estritos versus numéricos, apartado 13, véxase tamén leis; Nomes, universais; Probabilidade cero Enunciados; distinción entre singulares e universais; distinción entre sintéticos e empíricos; ecuacións e funcións, véxase tamén Enunciados do tipo «Absolutamente todos»; Enunciados atómicos; Enunciados básicos; Contradicións; Demarcación versus significado; Carácter empírico; Enunciados existenciais; Enunciados metafísicos; Metafísica; Oracións de protocolo; Enunciados singulares; Enunciados sintéticos; Tautoloxías Epistemoloxía véxase Coñecemento, teoría de Equidistribución, distribución equitativa; Equiprobabilidade, probabilidade equitativa Equivalencia, lóxica Erros nas medicións véxase Medicións, técnica de 643 a lóxida da descuberta científica Esencia, Esencialismo Espazo véxase Coordenadas Estabilidade estatística, véxase tamén Flutuacións; Traxectoria; Caso puro Estabilidade, estatística Estatística véxase Probabilidade; Frecuencia relativa Estética Estimación estatística véxase hipótese, estatística Estimacións estatísticas, hipóteses estatísticas véxase hipóteses Estrataxema convencionalista, véxase tamén Decisións, sobre a estrataxema e sobre o resultado das probas Estrataxema véxase Estrataxema convencional Estrutura fina de probabilidades Evidencia, proba(s) véxase tamén Convicción Evolución da ciencia, apartado 85, véxase tamén utilidade Exactitude; relixión de Exemplificación, exemplificador Existenciais, enunciados; puramente; singulares Expectativa, matemática, véxase tamén hipótese, estatística Experiencia, apartado 5; base de; e probabilidade véxase Probabilidade e experiencia; chamada perceptual ou inmediata, véxase tamén Experimento; Teoría, e experimento Experimentais, condicións; Explicación véxase Explicación causal Experimento das dúas fendas, apéndice v Experimento, crucial; imaxinario véxase Imaxinario, experimento; uso en discusión teórica, apartado 30; repetible, véxase tamén Teoría, e experimento Experimentos imaxinarios, apéndice xi, de autor, apartado 77, apéndice vii; de Bohm; de Bohr, apéndice v; de Carnot; de Einstein e Pauli; de Einstein, Podolski e rosen, apéndice xii; de Einstein; de Galileo; de heisenberg; non validez de; substituíble polo de Einstein, Podolski e rosen Explicación, véxase tamén Adecuación 644 Karl Popper Explicativa, capacidade Falsidade, véxase tamén Eliminación, método de; Falsificadores potenciais Falsificabilidade, grao de véxase Comprobabilidade, grao de; nunca final ou concluínte; non como criterio de significado véxase Demarcación versus significado; de enunciados de probabilidade véxase Decidibilidade; como característica científica dunha teoría, apartado 6, capítulo IV, véxase tamén Asimetría; refutación; Comprobabilidade Falsificación, evasión de; en probabilidade; dunha teoría, apartado 22, véxase tamén Asimetría; Convencionalista, estrataxema; Decisións, sobre estrataxema convencionalista e sobre resultado de comprobacións; refutación Falsificadores potenciais, véxase tamén Campo de aplicación Feitos Fenomenalismo Fenómenos de masa, véxase tamén leis, microe macro-; Termodinámica Filosofía, véxase tamén Cosmoloxía; Coñecemento, teoría do; Metafísica; Métodos; Problemas Física; probabilidade en véxase leis, microe macro-; Probabilidade e experiencia; Probabilidade en física, véxase tamén Teoría cuántica; relatividade; Termodinámica Fisicalismo Flutuacións probabilísticas, véxase tamén Desviacións; estabilidade estatística Formalización, véxase tamén Axiomas Fórmula binomial; primeira forma de (para segmentos sobrepostos finitos dunha sucesión finita polo menos libre n-1), apéndice iii; segunda forma de (para segmentos superpostos finitos dunha sucesión infinita polo menos libre n-1); terceira forma de (para segmentos adxacentes dunha sucesión aleatoria infinita) 645 a lóxida da descuberta científica Fórmulas de heisenberg; implica hipóteses auxiliares e ad hoc; interpretación ortodoxa de; carácter positivista de; interpretación propensiva de; interpretación provisional de Schrödinger; interpretación estatística de, véxase tamén Programa de heisenberg; Experimento imaxinario; Significado, dogma positivista de, carácter dogmático de; Positivismo; relacións estatísticas de dispersión. Frecuencia de Verdade Frecuencia media Frecuencia relativa; axiomas de Mises, apartado 50; coherencia de; axioma de converxencia ou límite; crítica de, apartado 58; de clases finitas (F'), apéndice ii; de sucesións finitas; independencia de; modificación de (en requisito de unicidade), apartado 64; modificación de, apartado 51; de sucesións aleatorias infinitas (F); axioma de exclusión de sistemas de xogos de azar ou aleatoriedade, apartado 58; redundancia de; de segmentos de sucesións finitas, véxase tamén Efectos posteriores; Aleatoriedade; Segmentos; Selección; Sucesións Frecuencia véxase Probabilidade; Frecuencia relativa Frecuencia, límite de Función de Verdade Gravitación, corroboración das teorías de Einstein e Newton da heurística hipótese, carácter hipotético de enunciados científicos; ad hoc; auxiliar; decidibilidade de véxase Decidibilidade; existencial; estatística, estimación estatística de frecuencia, ou extrapolación estatística, apartado 57; universal-existencial, véxase tamén Certeza; Corroboración; Distribución; Equidistribución; lóxica da probabilidade; Comprobabilidade; Verificación historia; da filosofía; da ciencia, véxase tamén Métodos, históricos Idealización, uso crítico de Idempotencia 646 Karl Popper Imaxinación, véxase tamén Audacia, claridade; Contido; Intuición Implicación ou condicional; contrafáctica, chamada; material; modal ou estrita; necesaria, subxuntiva ou nómica, véxase tamén Necesidade Implicación véxase Deducibilidade Incerteza véxase hipótese Independencia, lóxica dun axioma ou dunha parte dun sistema; lóxica e probabilística comparadas; probabilística; de axiomas de probabilidade véxase Probabilidade, formal, véxase tamén Irrelevancia Indeterminismo, metafísico, apartado 78; metafísico Indiferenza, principio de, véxase tamén Equidistribución, distribución equitativa Indución, apéndice I, eliminatoria; falsificación de; matemática; principio de; problema de, apartado 1; resolta; superfluidez de, véxase tamén Apriorismo; regresión infinita; Argumento transcendental Inferencia indutiva véxase Método, perspectiva indutivista de; lóxica da probabilidade Inferencia véxase Dedución; Dedución, indutiva e probable véxase Método, perspectiva indutivista de; lóxica da probabilidade Información, cantidade de véxase Contido; Prohibicións Información, teoría da Insensibilidade véxase Selección Instrumentalismo, véxase tamén Operación, Pragmatismo Interferencia por medición véxase Fórmula de heisenberg, interpretación ortodoxa de; Experimento imaxinario, de Bohr e heisenberg Interpretación de axiomas; de observacións en virtude de teorías; de enunciados de probabilidade véxase Probabilidade, formal, interpretacións de; da ciencia, véxase tamén Teoría, e experimento 647 a lóxida da descuberta científica Interpretación propensiva, de propensión véxase Probabilidade, interpretacións de Intersensorialiedade da experiencia científica Intersubxectividade da experiencia científica Intuición, creativa; creativa Invarianza véxase Transformación Irrefutabilidade véxase refutación; refutabilidade; Sistemas Irrelevancia, probabilística véxase tamén Independencia, probabilística Iteracións véxase Bloques Kantianismo leis naturais véxase leis leis, da arte, véxase tamén Estética leis, naturais ou universais; como simples regras de transformación; microe macro-, apartado 70; probabilidade, apartado 69; como prohibicións, véxase tamén Decidibilidade; Instrumentalismo; Necesidade, natural; Pragmatismo; Termodinámica leis, xurídicas linguas, sistemas lingüísticos, véxase tamén Significado; Modos e rexistros da linguaxe; uso lóxica da probabilidade, perspectiva de Carnap; perspectiva de reichenbach ou frecuencial, apéndice i; perspectiva de hempel; ou lóxica indutiva; perspectiva de Jeffreys e Wrinch; regra de sucesión de laplace; perspectiva de Keynes ou lóxica; refutación de, véxase tamén Probabilidade cero lóxica; e indución; modal; probabilidade véxase Probabilidade, lóxica; e ciencia; da descuberta científica véxase Coñecemento, teoría do; Métodos, perspectiva dedutivista de, véxase tamén Apriorismo; álxebra de Bool; Coherencia; Contradicións; Deducibilidade; Implicación; regresión infinita; Cálculo proposicional; Tautoloxías Matemáticas, véxase tamén Tautoloxías Materialismo, véxase tamén Mecanismo 648 Karl Popper Matriz Mecanismo Medición en teoría cuántica véxase Fórmula de heisenbereg, interpretación ortodoxa de; Teoría cuántica, interpretación ortodoxa de, técnica de; como comprobación, apartado 37, véxase tamén Precisión Medida véxase Probabilidade formal, teoría da medida Método dialéctico de resolución de contradicións, véxase tamén Métodos, históricos Métodos; escolla de; perspectiva convencionalista dos; empíricos; históricos; perspectiva naturalista sobre, apartado 10; filosóficos, non existentes; científicos, capítulo II, véxase tamén Discusión; utilidade; historia; linguas; lóxica da probabilidade Métrica véxase lóxica da probabilidade, métrica de Modelo(s); linguas, linguaxes véxase linguas, linguaxes; de sucesións aleatorias apéndice xiv Modificación ou revisión, véxase tamén Aproximación Modos, rexistros de lingua, formais e materiais; realistas Modus Ponens Modus Tollens, apartado 18 Monismo Mostra representativa, véxase tamén Segmentos, representativos Mostra, estatística, véxase tamén Segmentos, representativos Movemento browniano, véxase tamén Flutuacións; leis, microe macro-; Termodinámica Naturalismo, apartado 10 Necesidade, comparada; lóxica; natural ou física Nomes; universais, véxase tamén Conceptos; universais Números normais, de Borel Observabilidade, véxase tamén Efecto, reproducible; conduta ou comportamento de tipo casual; regularidade; Semellanza Observables Observación ou percepción; interpretación de, en virtude da teoría; e probabilidade; enunciados de véxase Enunciados básicos; Oracións de protocolo, véxase tamén Experiencia 649 a lóxida da descuberta científica Obxectividade de probabilidade véxase Teoría da probabilidade, perspectiva subxectiva versus obxectiva de; científica, apartado 8, apartado 27 Obxectivo da Ciencia véxase Decisións; Proveito; Ciencia Obxecto Ocorrencias, apartado 23; sucesións de véxase Sucesións Operacionalismo, véxase tamén Instrumentalismo; Pragmatismo Oportunidade apartado 48; problema fundamental de apartado 27; teoría de véxase Probabilidade; Aleatoriedade; Sucesión; versus lei, véxase tamén Comportamento aleatorio; regularidade Oracións protocolarias, apartado 26 Orixe das teorías Paquete de ondas; redución de Paradoxos, lóxicos Parámetros Período xerador Posibilidades, peso de Positivismo, Positivista, véxase tamén Fórmula de heisenberg, interpretación ortodoxa, carácter positivista de; Significado, dogma positivista de; Metafísica, odio dos positivistas a Pragmatismo, véxase tamén Instrumentalismo; Operacionalismo Precisión, busca de Precisión, grao de aumenta coa comprobabilidade, apartado 36; e probabilidade Predición, como medio de comprobación dunha teoría, apartado 12 Prexuízo Prexuízos, véxase tamén Prexuízo Principio da complementariedade de Bohr, véxase tamén Dualidade Principio de incerteza véxase Fórmula de heisenberg Principio de todo ou nada Proba, probas, paradoxo de e peso de 650 Karl Popper Probabilidade a priori e a posteriori; absoluta e relativa; estrutura fina; lóxica, apartado 83; métrica de; primaria e secundaria; como teoría do ámbito, apartado 37, apartado 72, véxase tamén Enunciados atómicos; Campo de aplicación Probabilidade cero do segundo argumento Probabilidade cero, dun enunciado universal; apéndice vii Probabilidade e experiencia, véxase tamén Decidibilidade; Proba(s), paradoxo de Probabilidade en física, apartado 68; casualidade obxectiva da, véxase tamén Teoría cuántica Probabilidade metafísica, apartado 67 Probabilidade, cálculo formal de; autónomo; sistema axiomático autónomo de, apéndice ii; clásica, apéndice iii; coherencia de; definicións en apéndice v; frecuencia; non completitude de; independencia de; neoclásica ou de teoría de medida, véxase tamén frecuencia relativa, axiomas de Probabilidade, interpretacións do cálculo de, apartado 47; xogos de azar ou clásica; indutiva véxase lóxica da Probabilidade; estatística ou frecuencia relativa Probabilidade, matemática Probabilidade, teoría de, perspectivas obxectiva versus subxectiva sobre Problema de Bernoulli, cuasiProblemas Profundidade Programa de heisenberg, apartado 73 Programa de Kolmogorov Progreso, científico véxase Evolución; utilidade; universalidade, niveis de Prohibicións, leis universais como Proposicións, véxase Enunciados Proximidade, lóxica Psicoloxía; do coñecemento Psicoloxismo, apartado 2 651 a lóxida da descuberta científica Puntos de acumulación Puntos de vista, esenciais para a ciencia racionalismo, filosofía racional, actitude racional racionalismo, filosofía racional, actitude racional, clásica, véxase tamén Crítica; Discusión racionalización realismo reconstrución racional redución a observacións, véxase tamén Constituír redución, de dimensión véxase Dimensión refutabilidade véxase refutación; Falsificabilidade refutación, imposibilidade de xerar refutación concluínte refutación; Falsificación regras de Método véxase Decisións regras matemáticas para xerar sucesións regresión infinita regularidade, véxase tamén Efecto, repetible; Flutuacións; Conduta ou comportamento de «tipo lei»; Observabilidade; Estabilidade estatística; uniformidade da natureza relación de subclase véxase Comprobabilidade, grao de relacións estatísticas de dispersión relatividade, de Einstein; e teoría cuántica relativismo relevancia véxase Irrelevancia repetibilidade véxase Efecto, repetible; Flutuacións; Observabilidade; regularidade repeticións véxase Semellanza representación gráfica véxase Curvas; Campo de representación gráfica; xeometría retícula rigorosidade, grao de Segmentos de sucesións; adxacentes; sobrepostos; probabilidade de; representativos, véxase tamén Efectos posteriores, liberdade de 652 Karl Popper Segunda cuantización Selección natural, véxase tamén Eliminación Selección, física, véxase tamén relacións de dispersión estatísticas Semellanza Sentido común Significado, Sentido, carácter dogmático de; de palabras ordinarias; de palabras ordinarias; dogma positivista de; dogma positivista de; de termos primitivos, véxase tamén Demarcación versus significado; Metafísica, odio positivista a Simbolismo, adoración de Simetría; en axiomas de probabilidade; en formalismo de teoría cuántica pero non no experimento imaxinario de heisenberg, véxase tamén Probabilidade cero Simplicidade, capítulo VII, apéndice vii; como contido; como improbabilidade; matemática; problema metodolóxico de, apartado 42; nin estética nin pragmática, apartado 41; como escaseza de parámetros; de enunciados de probabilidade; como comprobabilidade, véxase tamén Parámetros Sistemas de xogos de azar, exclusión de, véxase tamén Aleatoriedade; Selección Sistemas, a irrefutabilidade lóxica de sistemas parciais Situación (actual) do problema Socioloxía; coñecemento Subsistemas véxase Independencia Sucesións; alternativas; empíricas; finitas, apartado 54; infinitas, apartado 57; matemáticas; libres-n véxase Efectos posteriores; aleatorias ou de carácter casual, apartado 59; de frecuencias ou propiedades relativas; de segmentos, apartado 56; as máis breves; de enunciados, véxase tamén Sucesión de referencia; Segmentos; Selección Tautoloxías Tecnoloxía véxase Ciencia, aplicada 653 a lóxida da descuberta científica Teorema da Asociación Teorema da conmutación Teorema da multiplicación Teorema de Bayes Teorema de Bernoulli ou lei dos grandes números; como ponte; interpretacións de, apartado 62 Teoría cuántica; propensión do autor; estatística do autor, apartado 74; causal de Bohm; descontinuidade en; interpretacións de; medición e precisión en; a antiga; ortodoxa; predición en; e probabilidade; subxectiva versus obxectiva; comprobabilidade; comprobabilidade de, véxase tamén Fórmula de heisenberg; Experimentos imaxinarios; Traxectoria; Enunciados de probabilidade; relacións estatísticas de dispersión; paquete de ondas Teoría, Sistemas teóricos, capítulo III; e experimento, apartado 30; orixe de, véxase tamén Interpretación; leis; Enunciados universais Terminoloxía Termodinámica Termos ou conceptos primitivos ou non definidos Tolerancia, principio de Carnap de Tradución, do modo lingüístico realista ao formal Transcendencia Transformacións, matemáticas, invarianza Transformacións, probabilísticas véxase Probabilidade, teoría de Traxectoria dunha partícula elemental unicidade uniformidade da natureza, principio de, véxase tamén Crenza metafísica en regularidades universais, problemas de, véxase tamén Nomes, universais universalidade, accidental e necesaria; niveis de, apartado 18 uso das palabras utilidade 654 Karl Popper Validez, concepto de Bolzano de Valor de Verdade Valor de xuízos sobre ciencia, necesarios, véxase tamén Decisións Verdadeiro, Verdade Veredicto Verificación dun enunciado universal, posible; dun enunciado básico, imposible; ou confirmación no senso de verificación feble; de enunciados de probabilidade, imposible; de enunciados universais, imposible dun xeito e demasiado doada doutro, véxase tamén Exemplificación; Probabilidade cero Verosimilitude, de Bernouilli xeneralización, véxase tamén Indución; Nomes, universais; universais, enunciados; universais, problema de xeometría, apartado 45 xogos de azar, teoría clásica de véxase Probabilidade, cálculo formal de, clásico xuízo, sobre feitos xustificación xustificación versus obxectividade, véxase tamén utilidade A marca tipográfica desta colección procede da viñeta utilizada por Gonzalo Rodríguez de la Pasera no deseño do Missale Auriense, un dos primeiros libros impresos en Galicia, realizado en Monterrei en 1493.

clásicos do pensamento universal Títulos publicados Nicolás Maquiavelo. O príncipe Tradución de Isabel González Fernández Prólogo de Manuel M. de Artaza Montero Claude Bernard. Introducción ó estudio da medicina experimental Tradución de xesús Otero Costas Prólogo de Carlos Acuña Castroviejo Aristóteles. Política Tradución de Juan José Moralejo álvarez Prólogo de Pedro lópez-Barja de Quiroga Charles Darwin. A orixe das especies Tradución de Emilio Valadé del río Prólogo de Francisco Díaz-Fierros Viqueira Isaac Newton. O sistema do mundo Tradución de José Manuel Díaz de Bustamante Prólogo de Carlos Pajares Vales Erasmo de Rotterdam. Eloxio da loucura Tradución de Manuel Enrique Vázquez Buján Prólogo de Ofelia rey Castelao John von Neumann. O computador e o cerebro Tradución de Elisardo Antelo Suárez Prólogo de Senén Barro Ameneiro Jean-Jacques Rousseau. Emilio ou da educación Tradución de henrique harguindey Prólogo de herminio Barreiro Max Weber. A ética protestante e o «espírito» do capitalismo Tradución de xosé Manuel García Prólogo de ramón Máiz Platón. Teeteto Tradución de Teresa Amado rodríguez Prólogo de Carlos A. Baliñas Sigmund Freud. Introdución á Psicanálise Tradución de Ma José Noya Ansede Prólogo de Fernando Márquez Gallego Antoine Laurent Lavoisier. Tratado Elemental de Química Tradución de Sergio Casas Fernández e Ma Victoria Castaño Palazón Prólogo de Manuel r. Bermejo Séneca. A vida feliz. A brevidade da vida Tradución de Manuel E. Vázquez Buján Prólogo de xosé l. Barreiro rivas Edward Sapir. A linguaxe Tradución de Benigno Fernández Salgado Prólogo de Milagros Fernández Pérez Marshall McLuhan. A Galaxia Gutenberg. A creación do home tipográfico Tradución de Manuel Outeiriño Prólogo de Darío Villanueva Cesare Beccaria. Dos delitos e das penas Tradución de Benedict Buono Prólogo de luis González Guitián Tomás Moro. Utopía Tradución de helena de Carlos Prólogo de Andrés Torres Queiruga Karl Popper. A lóxica da descuberta científica Tradución de Manuel Puga Moruxa Prólogo de Juan Vázquez Sánchez De próxima aparición Euclides. Os elementos (Escolma) Tradución de Ana Gloria Alonso, Celso rodríguez Prólogo de José luis Gómez Pardo