Universidade Estadual de Campinas Instituto de Filosofia e Ciências Humanas Alfredo Roque de Oliveira Freire Filho Estudo Comparado do Comprometimento Ontológico das Teorias de Classes e Conjuntos Campinas 2019 Alfredo Roque de Oliveira Freire Filho Estudo Comparado do Comprometimento Ontológico das Teorias de Classes e Conjuntos Tese apresentada ao Instituto de Filosofia e Ciências Humanas da Universidade Estadual de Campinas como parte dos requisitos exigidos para obtenção do título de Doutor em Filosofia. Orientador: Prof. Dr. Walter Alexandre Carnielli Este exemplar corresponde à versão final da tese a ser defendida pelo aluno Alfredo Roque de Oliveira Freire Filho, e orientada pelo Prof. Dr. Walter Alexandre Carnielli Campinas 2019 Ficha catalográfica Universidade Estadual de Campinas Biblioteca do Instituto de Filosofia e Ciências Humanas Cecília Maria Jorge Nicolau CRB 8/3387 Freire, Alfredo Roque, 1990- F883e FreEstudo comparado do comprometimento ontológico das teorias de classes e conjuntos / Alfredo Roque de Oliveira Freire Filho. – Campinas, SP : [s.n.], 2019. FreOrientador: Walter Alexandre Carnielli. FreTese (doutorado) – Universidade Estadual de Campinas, Instituto de Filosofia e Ciências Humanas. Fre1. Ontologia. 2. Teoria dos conjuntos. 3. Traduções. I. Carnielli, Walter Alexandre, 1952-. II. Universidade Estadual de Campinas. Instituto de Filosofia e Ciências Humanas. III. Título. Informações para Biblioteca Digital Título em outro idioma: Compared study of ontological commitment of class and set theories Palavras-chave em inglês: Ontology Set theory Translation Área de concentração: Filosofia Titulação: Doutor em Filosofia Banca examinadora: Walter Alexandre Carnielli [Orientador] Marcelo Esteban Coniglio Hugo Luiz Mariano Edgar Luis Bezerra de Almeida Vinicius Cifú Lopes Data de defesa: 28-03-2019 Programa de Pós-Graduação: Filosofia Identificação e informações acadêmicas do(a) aluno(a) ORCID do autor: https://orcid.org/0000-0003-0132-355X Currículo Lattes do autor: http://lattes.cnpq.br/9597772498442436 Powered by TCPDF (www.tcpdf.org) Universidade Estadual de Campinas Instituto de Filosofia e Ciências Humanas A Comissão Julgadora dos trabalhos de Defesa de Dissertação/Tese de Doutorado, composta pelos Professores Doutores a seguir descritos, em sessão pública realizada em 28/03/2019, considerou o candidato Alfredo Roque de Oliveira Freire Filho aprovado. Prof Dr Walter Alexandre Carnielli Prof Dr Marcelo Esteban Coniglio Prof Dr Hugo Luiz Mariano Prof Dr Edgar Luis Bezerra de Almeida Prof Dr Vinicius Cifú Lopes A Ata de Defesa com as respectivas assinaturas dos membros encontra-se no SIGA/Sistema de Fluxo de Dissertações/Teses e na Secretaria do Programa de Pós-Graduação em Filosofia do Instituto de Filosofia e Ciências Humanas. Dedico aos meus pais e minha esposa, Alfredo, Sylvia e Juliana. Agradecimentos Agradeço ao meu orientador, professor Walter Carnielli, que me acompanhou por todo esse período de doutoramento, oferecendo liberdade, entusiasmo e apoio. Walter sempre depositou em mim enorme confiança para perseguir os temas que mais me motivam. Agradeço ao meu coorientador, Rodrigo Freire. Desde os primeiros momentos como professor, ele ganhou minha admiração por sua seriedade e compromisso com a verdade. Sou profundamente grato por ter aceitado coorientar este trabalho. Tateava minhas angústias sobre filosofia de modo desordenado quando Rodrigo canalizou essas angústias em uma direção que me orgulho estar caminhando junto com ele. I thank professor Joel Hamkins, my supervisor in my time in New York. My experience with him was productive and inspiring. His keen comprehension of the field we love and his eagerness to reach technically challenging and philosophically profound results is a guiding light to what I want to become. Agradeço a minha família. Meus pais, endereço gratuito de amor, foram uma fundamental base de apoio ao longo de todos os meus anos. Primeiros professores, meu pai me ensinou a pensar com autonomia e minha mãe me ensinou perseverar. Agradeço pelo suporte, confiança e companheirismo de meus irmãos Pedro, João, Duda, Julianna e Luciana. Eles são amigos que não precisei encontrar, não precisei conquistar e não precisei aprender a amar. Agradeço também ao meus tios Guilherme, Janine, Maria Perpétua, Maria Helena e meu afilhado Bernardo pelo profundo suporte e confiança. Agradeço aos amigos Gustavo, Barbalat e Hansés. Eles acompanharam de perto as ansiedades, dores e conquistas desses intensos anos de pesquisa. Eu tive a sorte de ter o suporte desses amigos incríveis. Agradeço aos meus professores Messias, César, Israel, Umberto, Valdir, Claudete, Jony e Botelho. Esses professores foram responsáveis por construir o conhecimento basilar que hoje desfruto. Messias me ensinou a amar matemática; César me fez acreditar que tinha algo a dizer; Israel me ensinou a amar filosofia; Umberto me ensinou a aprender matemática; Valdir me ensinou que, para ser profundo, não precisamos ser complicados; Claudete me ensinou a olhar para mim mesmo; Jony me ensinou a amar lógica; Botelho me encantou com o entusiasmo pelo conhecimento. Agradeço aos professores Mary Jane Spink e Peter Spink por todo suporte oferecido a mim e a minha esposa nesses anos de muito estudo. Esses incríveis professores me ensinaram o lado Humano da profissão de pesquisador. Agradeço a tudo que aprendi com os queridos amigos Cadu, Rodrigo, Thiago, Franklin, Bernardo, Felipe Melo, Anísio, Maurício, Chico, Lucas, Gabriel, Schiller, Osman, Homero, Juliano, Bernardo Amorim, Thaís, Patrícia, Fred, Mario, Luciane, Rafael, George, Pedro, Priscila, Felipe de Oliveira, Manu, Giovanni. I thank the amazing friends I made at the Graduate Center and New York: Yale, Vincent, Liry, Dongwoo, Martin, Jessie, Susana, Thomas, Claudia, Letícia, Flávia, Ciro, Bernardo and Felipe. Those people contrubute not only with many interesting philosophical discussions, but also with their friendship and support. Agradeço aos amigos e colegas Bruno, Henrique, Vincenzo, Júlio e Felipe. Aprendi lógica e teoria de conjuntos a partir deles e junto com eles. Sou imensamente grato a todos pelos longos seminários, grupos de estudo e pela amizade. Agradeço aos professores e amigos Leandro, Emiliano, Dave e Peter, com os quais aprendi imensamente. Agradeço aos colegas e amigos do Centro de Lógica, Francesco, Edson, Gilson, Tami, Laura e Sanfelice. Agradeço ao professor Peter e sua esposa Veerle por tantas vezes me receberem com carinho e entusiasmo. Agradeço ao professor Edgar. Muito do que aprendi sobre lógica e teoria de conjuntos é devido a esse professor incrível. Compartilhamos minuciosas discussões sobre filosofia da matemática, lógica e sobre a vida acadêmica. Edgar é um grande amigo que tive a sorte de conhecer nesses anos de pesquisa. Agradeço a minha esposa Juliana e a minha enteada Rebecca. Juliana foi a faísca que despertou em mim a coragem de seguir a vida acadêmica. Eu a amo por isso e por tudo mais. Agradeço Juliana e Rebecca pelo carinho por todo esse duro percurso, agradeço pela paciência com a minha ausência, agradeço por todo suporte que me proporcionaram todos esses anos. As duas têm o meu amor e gratidão. Por fim, agradeço à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pela bolsa de doutorado direto, cujo número do processo é 2016/10497-8. Agradeço também à FAPESP pela bolsa de estágio de pesquisa no exterior, cujo número do processo é 2017/21020-0. O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Brasil (CAPES) Código de Financiamento 001. Penrhyndeudraeth, 23 November 1962 Dear Professor Heijenoort, I should be most pleased if you would publish the correspondence between Frege and myself, and I am greatful to you for suggesting this. As I think about acts of integrity and grace, I realise that there is nothing to my knowledge to compare with Frege's dedication to truth. His entire life's work was on the verge of completion, much of his work had been ignored to the benefit of men infinitely less capable, his second volume was about to be published, and upon finding that his fundamental assumption was in error, he responded with intellectual pleasure clearly submerging any feelings of personal disappointment. It was almost superhuman and a telling indication of that of which men are capable if their dedication is to creative work and knowledge instead of cruder efforts to dominate and be known. Yours sincerely, Bertrand Russell Resumo Frequentemente, a prática de ZF inclui o uso metateórico da noção de classes como forma de abreviar expressões ou simplificar o entendimento de recursos conceituais. A teoria NBG expressa formalmente a internalização desse recurso na teoria dos conjuntos; nesse caso, as classes, antes usadas metateoricamente, passam a ser capturadas também pelas quantificações da teoria de primeira ordem. Apesar disso, existe uma opinião bastante difundida de que essa internalização do uso de classes é inofensiva. Nesse contexto, é comum referir-se à conservatividade de NBG em relação ZF como condição suficiente para entender as teorias como "equivalentes", atribuindo-se um sentido de virtualidade ao uso de classes quantificadas em NBG. Acreditamos, porém, que uma técnica usada para estabelecer relações entre teorias não é necessariamente neutra em relação aos seus resultados – por isso, uma conservatividade estabelecida através de modelos tem significado e profundidade diferente da mesma relação estabelecida finitariamente por interpretações. Entendemos, portanto, que o modo pelo qual estabelecemos relações entre teorias influencia no resultado da análise. Para o caso da relação entre NBG e ZF, uma vez que NBG é finitamente axiomatizável e ZF não, entendemos ter motivos suficientes para acreditar que o uso de diferentes ferramentas de análise pode revelar diferenças, tais como expressividade, comprometimento ontológico e conservatividade lógica. Por isso, esse projeto tem como objetivo esclarecer as relações entre essas duas teorias por meio de triangulações entre elas e as diferentes ferramentas de análise. O uso de técnicas finitárias, nesse caso, pode revelar uma maior expressividade e comprometimento ontológico de NBG em relação a ZF – relação obscurecida por uma abordagem infinitária. Entendemos que, através desta pesquisa, poderemos contribuir para o debate sobre a fundamentação da matemática, desnaturalizando o uso supostamente "equivalente" de NBG e ZF para essa finalidade. Palavras-chaves: Ontologia, Teoria dos conjuntos, Traduções. Abstract Often ZF practice includes the use of the meta-theoretical notion of classes as shorthand expressions or in order to simplify the understanding of conceptual resources. NBG theory expresses formally the internalization of this feature in set theory; in this case, classes, before used metatheoretically, will also be captured by quantifiers of the first order theory. Nevertheless there is a widespread opinion that this internalization of classes is harmless. In this context, it is common to refer to the conservativeness of NBG in relation to ZF as a sufficient condition to understand those theories as "equivalent", attributing a sense of virtuality to the use of classes quantified in NBG. We believe, however, that a technique used to establish relationships between theories is not necessarily neutral in relation to its results so a conservativeness established through models have different meaning and depth of that relationship established by finitary interpretations. We believe, therefore, that the way in which relationships between theories are established influences the analysis result. In the case of the relationship between NBG and ZF, since NBG is finitely axiomatizible and ZF not, we believe that we have sufficient reasons to assert that the use of different analysis tools may reveal differences such as expressiveness, ontological commitment and logical conservativeness. Therefore, this project aims to clarify the relationship between these two theories through triangulations between them and the different analysis tools. The use of finitary techniques, in this case, may prove greater expressiveness and ontological commitment of NBG in relation to ZF relation obscured by an infinitary approach. We believe that, through this research, we can contribute to the debate on the basis of mathematics, denaturalizing the supposedly "equivalent" use of NBG and ZF for this purpose. Keywords: Ontology; Set theory; Translation. Sumário 1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.1 Um breve histórico sobre a fundamentação da matemática no fim do século XIX 13 1.2 Programa de Hilbert e os métodos finitários . . . . . . . . . . . . . . . . . . 15 1.3 Métodos infinitários: teoria de modelos . . . . . . . . . . . . . . . . . . . . . 21 1.4 Um Caso de Estudo: equiconsistência entre NBG e ZF . . . . . . . . . . . . 25 1.4.1 Linguagem e axiomas: lógica de primeira ordem clássica . . . . . . . . 26 1.4.1.1 Axiomatização de NBG . . . . . . . . . . . . . . . . . . . . 27 1.4.2 Equiconsistência entre NBG e ZFC . . . . . . . . . . . . . . . . . . . 29 2 Comprometimento ontológico em provas de consistência relativa . . . . . . . 31 2.1 Considerações preliminares sobre o problema . . . . . . . . . . . . . . . . . . 31 2.2 Modelo como interpretação . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.3 Presunção da existência de interpretações . . . . . . . . . . . . . . . . . . . . 35 2.3.1 Abordagem modelo-teorética pode ser enganadora na análise ontológica de teorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.4 Análise ontológica relativa entre NBG e ZF . . . . . . . . . . . . . . . . . . . 38 2.4.1 Prova semântica de equiconsistência de Novak (1950) . . . . . . . . . 38 2.4.2 Framework simplificado para análise ontológica . . . . . . . . . . . . 39 3 Relações de redução entre NBG e ZF . . . . . . . . . . . . . . . . . . . . . . 42 3.1 Prova da equiconsistência por modelos . . . . . . . . . . . . . . . . . . . . . 42 3.2 Prova da satisfação dos axiomas de NBG' . . . . . . . . . . . . . . . . . . . 49 3.3 Prova finitária de equiconsistência . . . . . . . . . . . . . . . . . . . . . . . . 56 3.3.1 Prova Finitária de Equiconsistência . . . . . . . . . . . . . . . . . . . 62 3.4 Não existe interpretação de NBG em ZF . . . . . . . . . . . . . . . . . . . . 71 4 Sobre o que conta como tradução . . . . . . . . . . . . . . . . . . . . . . . . 74 4.1 Análise preliminar dos métodos de consistência como tradução . . . . . . . . 74 4.2 Tradução Ideal e a relatividade na tradução . . . . . . . . . . . . . . . . . . 75 4.2.1 Relatividade da tradução . . . . . . . . . . . . . . . . . . . . . . . . . 75 4.3 Tradução idealizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4.3.1 Condições de idealização . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.4 O sentido de tradução em uma prova de consistência relativa . . . . . . . . . 87 4.4.1 O esquema geral para o sentido de tradução . . . . . . . . . . . . . . 88 5 Explorando o esquema geral de redução . . . . . . . . . . . . . . . . . . . . . 91 5.1 O problema das traduções modelo-teoréticas . . . . . . . . . . . . . . . . . . 92 5.2 Tradução tipo-modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.2.1 Condição Prenexa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.2.2 Condição de Coerência . . . . . . . . . . . . . . . . . . . . . . . . . . 100 5.2.3 Preservando derivações em lógica de primeira ordem . . . . . . . . . . 101 5.3 Definindo a tradução de NBG em ZF . . . . . . . . . . . . . . . . . . . . . . 105 5.4 Combinando interpretações . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6 Nenhum método de tradução é ontologicamente neutro . . . . . . . . . . . . 110 6.1 Puro sentido de tradução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 6.2 Enxergar parcialmente a consistência de uma teoria . . . . . . . . . . . . . . 112 6.3 Dependência da suposição Con(T ) . . . . . . . . . . . . . . . . . . . . . . . 114 6.4 A prova de consistência em uma tradução . . . . . . . . . . . . . . . . . . . 117 6.5 Cenário integrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 6.5.1 Comentário sobre o caso da redução de uma teoria nela mesma . . . . 123 7 Bi-interpretações em teoria de conjuntos . . . . . . . . . . . . . . . . . . . . 125 7.1 Quaisquer duas extensões diferentes de ZF não são bi-interpretáveis . . . . . 129 7.2 Construção de Mathias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 7.3 A teoria de conjuntos de Zermelo não é tight . . . . . . . . . . . . . . . . . . 139 7.4 Bi-interpretação modelo a modelo . . . . . . . . . . . . . . . . . . . . . . . . 146 7.5 Relação entre ZF e PA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 8 Hierarquia de traduções: análise ontológica . . . . . . . . . . . . . . . . . . . 152 8.1 Universo ontológico de teorias de primeira ordem . . . . . . . . . . . . . . . 152 8.2 Hierarquia de traduções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 8.3 Casos de comparação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 8.4 Comentário sobre hierarquias alternativas . . . . . . . . . . . . . . . . . . . . 164 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 13 1 Introdução 1.1 Um breve histórico sobre a fundamentação da matemática no fim do século XIX Na segunda metade do século XIX, a linguagem da lógica de predicados desenvolvida por Frege e a algebrização da lógica proposicional por Boole possibilitaram a reformulação de teorias já estabelecidas em um patamar de precisão sem precedentes. É nesse período que vemos o desenvolvimento das primeiras formalizações da aritmética, da álgebra e das geometrias não euclidianas. Entretanto, segundo Viero (2011), ainda era predominante a noção tradicional de axiomática, na qual a verdade portada por um axioma deveria ser avaliada segundo critérios locais como simplicidade, intuitividade e obviedade. O modo de pensar os axiomas nesse período seguia considerações feitas pelo idealismo transcendental de Kant (SILVA, 2007). O pensamento matemático, para esse filósofo, teria como fundamento as intuições puras do tempo e do espaço. Todo julgamento matemático deveria, em última análise, estar fundado em verificações realizadas nesse lugar abstrato do pensamento. Foi por essa razão que houve grande rejeição do número complexo/imaginário (i) na matemática do final do século XVIII. Embora sua utilidade fosse evidente, o número imaginário não parecia corresponder a nenhuma relação intuitiva de tempo e espaço. O seu uso volta a ser reconhecido apenas quando Gauss estabelece uma interpretação geométrica para as operações com números complexos (SILVA, 2007). Ainda assim, a descrição do contínuo matemático e questões a respeito do infinito não pareciam ser possivelmente capturadas por esse tipo de intuição. No fim do século XIX, o programa logicista de Frege desafiou essa base intuitiva. Frege acreditava que a aritmética poderia ser descrita por conceitos analíticos, ou seja, ela não dependeria de um espaço de verificação por meio da intuição pura. Para ratificar esse argumento, Frege expandiu a lógica incluindo seu sistema de cálculo de predicados. Conceitos lógicos, tanto para Frege quanto para Kant, seriam válidos para todos os objetos possíveis, o que explicaria a lógica não oferecer acréscimo de conteúdo aos objetos analisados. Restava a Frege mostrar que as noções aritméticas poderiam ser descritas no seu recém-criado sistema de lógica de predicados (SILVA, 2007). Frege considerava cada número natural n um conceito de segunda ordem, cuja extenCapítulo 1. Introdução 14 são é a coleção de todos os conceitos equinúmeros1 a um conceito dado. Por exemplo, o número zero pode ser definido como {X|X ≈ (x = x)}, o número um, como {X|X ≈ (x = 0)}, e assim por diante. Entretanto, Frege teve de enfrentar algumas dificuldades no desenvolvimento de sua teoria: como queria que o princípio de Hume 2 fosse válido no seu sistema, ele precisava dar uma resposta ao problema de Júlio César 3 e provar o princípio de Hume usando apenas princípios puramente lógicos. Nesse caso, se consideramos o princípio do contexto 4 e, contextualmente, o número como a extensão do conceito equinúmero a um conceito dado, o problema seria resolvido no seu sistema lógico (SILVA, 2007). Posteriormente, esse programa se esgota com o paradoxo descoberto por Russell. Frege assumia a abstração livre como princípio lógico do sistema, isto é, todo predicado lógico denotaria um objeto lógico. Russell observou que esse princípio gera uma contradição se avaliamos a extensão do predicado "x não pertence à extensão de x". Assim, a abstração deveria ter escopo limitado5, o que significava, no programa de Frege, não ser um princípio lógico6. Com o fim desse programa, a comunidade filosófica e matemática precisa revisar o conceito de princípio lógico e os modos de avaliar os axiomas. A obviedade e a simplicidade não pareciam mais suficientes para validar um axioma. O fato de o princípio da abstração gerar um paradoxo mostrava que a intuição não era um critério seguro para a escolha de axiomas. Mais do que isso, Hilbert, em 1899, axiomatizara a geometria euclidiana (HILBERT, 1929), mostrando que o monumento formal da Antiguidade, tido como ideal de perfeição axiomática, fazia algumas demonstrações não fundamentadas explicitamente nos axiomas. A intuição matemática não parecia dar uma base sólida para a avaliação dos axiomas de uma teoria. Assim, começa a aparecer a noção de que os sistemas devem ser avaliados como um todo. Não bastaria verificarmos a validade de um axioma isoladamente, mas deveríamos avaliar se o conjunto de axiomas não nos levaria a contradições. O caminho percorrido para aceitar ou rejeitar um axioma se tornava mais árido. Era preciso provar que a adição de um axioma a um conjunto de axiomas não geraria contradições. Por isso, Hilbert (1929) desenvolve um corpus metodológico de prova de consistência. 1 Dois conceitos são equinúmeros quando existe uma função bijetora entre as extensões dos conceitos. 2 O princípio de Hume é a sentença que afirma: o número de um conceito A = o número de um conceito B se, e somente se, os conceitos A e B são equinúmeros. 3 O problema de Júlio César representa a dificuldade de atribuir sentido à sentença "o número do conceito C = Júlio César". Com efeito, queremos que essa igualdade não seja o caso; porém, no sistema de Frege, é difícil eliminar essa possibilidade sem incorrer em circularidade. 4 O sentido e referência de um termo só pode ser afirmado no contexto de uma proposição. 5 Alguns predicados denotariam objetos lógicos, enquanto outros não, uma vez que, caso denotassem, implicariam contradições. 6 Seria, nesse caso, uma verdade sintética a priori. Capítulo 1. Introdução 15 Ele demonstrou que todas as proposições válidas na geometria poderiam ser reduzidas a proposições válidas na aritmética. Restaria, nesse caso, provar a consistência da aritmética. Esse seria um dos temas centrais do programa de Hilbert, que veremos a seguir. 1.2 Programa de Hilbert e os métodos finitários A partir do estudo dos fundamentos da geometria, Hilbert consolida a noção de que as provas de consistência são possíveis apenas no interior de uma teoria de base. Com a redução das afirmações formalizadas da geometria a sentenças sobre números na aritmética de Peano, ele conclui que a consistência da segunda implica a consistência da primeira. Nesse esquema, toda afirmação de consistência de uma teoria depende da consistência de uma outra. Por isso, Hilbert acreditava ser necessário instituir uma teoria elementar responsável pela consistência das demais teorias. Hilbert buscava um sistema que tivesse justificativa nas mais simples intuições. Sem nunca especificar que sistema seria esse7, ele chamaria esse corpo teórico de matemática finitária. A partir dela, ele pretendia fundamentar o estudo das teorias matemáticas, em geral, dando suporte ou não às técnicas desenvolvidas pelos matemáticos. Hilbert ambicionava resgatar teorias como a dos conjuntos de Cantor a partir de uma base sólida, pois, segundo ele, "ninguém há de nos expulsar do paraíso que Cantor nos criou" (HILBERT, 1983). Ele considerava que a falta de uma base construtiva para o infinito, o contínuo ou o terceiro excluído era uma lacuna a ser preenchida pelos matemáticos por meio dos métodos de prova de consistência finitária. E a descoberta de paradoxos em teorias não construtivas sinalizava a urgência por uma fundamentação precisa. Seu argumento dava continuidade ao que parcialmente Weierstrass/Cauchy/Bolzano tinham realizado em relação à noção de infinitesimal. A unidade infinitesimal usada no cálculo diferencial era tomada como uma entidade de fundamento intuitivo; eles substituem o uso dessa unidade pela sua definição de limite, fundada em outras grandezas matemáticas bem estabelecidas, revelando algumas imprecisões no uso dos infinitesimais. Ajustadas tais imprecisões, toda vez que um matemático fizer uso do infinitesimal, ele pode realizar substituições regulares dos limites correspondentes e obter o mesmo resultado. Com efeito, todas as demonstrações de teoremas do cálculo, que não possuam infinitesimais em sua formulação, podem ser refeitas sem o uso dessa unidade. Hilbert chamava essa técnica de método dos ideais. As entidades matemáticas que não 7 Nesse texto, entendemos a matemática finitária como uma teoria equivalente à aritmética primitiva recursiva (ARP). Capítulo 1. Introdução 16 são diretamente fundadas em concepções construtivas devem ser justificadas pela introdução de ideais. O uso dos infinitesimais auxiliaria o desenvolvimento do cálculo, tornando mais sucinto o uso das técnicas de prova; além disso, o uso de infinitesimais seria mais adequado ao modo como os humanos performam raciocínios. No entanto, essa técnica precisa estar devidamente salvaguardada por uma prova de validade da introdução do ideal, isto é, se a teoria é consistente, então a teoria com o ideal é também consistente. Nessa esteira, Hilbert defendia que o infinito, o contínuo e muitas outras entidades matemáticas tidas como não construtivas seriam, em última análise, reduzidas a entidades da matemática finitária. Definição 1 (Método dos ideais) Uma teoria T é 1. contentual se ela se refere somente a objetos com base em intuições básicas e construtivas. 2. ideal caso contrário. Dada uma teoria contentual T1 e uma teoria ideal T2, T2 está justificada em T1 se: 3. A linguagem de T2 é uma extensão da linguagem de T1 (por exemplo, em T2 poderíamos ter o cálculo com a linguagem dos infinitesimais e em T1 poderíamos ter o cálculo de Weierstrass); 4. Para cada proposição θ na linguagem de T1 provada em T2, existe um procedimento finitário que gera uma prova no sistema de T1. Segundo Detlefsen (1986), o método da introdução de ideais cumpriria duas funções: uma descritiva, que produziria uma descrição dos processos realizados por matemáticos desde a Antiguidade, traçando uma avaliação do que tornaria esses raciocínios possíveis; e outra justificacional, visando produzir provas de correção para os modos naturais de desenvolvimento matemático com base em uma teoria de caráter epistemologicamente privilegiado (matemática finitária). Trata-se, portanto, de uma forma restrita do instrumentalismo matemático. Com efeito, Hilbert não rejeita a noção de que existia uma matemática contentual, apenas limitava o seu escopo às teorias que ele julgava epistemologicamente privilegiadas. Todas as demais deveriam ser justificadas nesses sistemas através de uma prova de correção por meio do método dos ideais. Nesse caso, como defende Detlefsen (1986), o programa de Hilbert seria uma doutrina intermediária entre o Realismo e o Nominalismo em relação à matemática. Capítulo 1. Introdução 17 Na visão de Hilbert, um teorema sobre ideais funciona como um tíquete de inferência para avaliação de proposições genuínas, cujos componentes se referem a elementos da matemática contentual. Isso significa não tratar teoremas ou axiomas sobre ideais como sentenças verdadeiras, mas como ferramentas para adquirir uma atitude epistêmica em relação a proposições contentuais. Desse modo, Hilbert contrariava a noção fregeana de que provas são sequências nas quais todos os elementos são verdadeiros ou inferidos por regras lógicas a partir dos elementos anteriores. Tabela 1 – Duas noções sobre provas Prova genuína (Frege) Prova ideal (Hilbert) Verdade Procedimento que leve a P Operações de preservação da verdade Confiabilidade metacomputacional Todas as fórmulas são verdadeiras Apenas a fórmula terminal é verdadeira Diferentemente das provas genuínas, é necessário justificar a utilidade e a segurança das provas ideais. Hilbert não considerava o método dos ideais como um modo de oferecer provas para aquilo que não poderia ser provado por métodos contentuais. Ao contrário, uma vez que os modos tradicionais ofereciam grande eficiência no desenvolvimento e no ensino da matemática, o valor dos métodos ideais residiria especialmente na justificação das nossas avaliações matemáticas tradicionais. Contudo, Frege desafia Hilbert a explicar mais detalhadamente a vantagem dessa justificação. Aquilo que ficou conhecido na literatura sobre o programa de Hilbert como o problema de Frege questiona como uma prova supostamente ideal poderia fixar uma atitude epistêmica em relação a uma proposição contentual. Como uma sequência de prova que não positiva uma relação causal entre antecedentes e consequentes pode ser de qualquer valor para uma atitude epistemológica em relação a uma proposição? Como algo significativo pode ser derivado a partir de afirmações sem significado? Em relação a esses questionamentos, Hilbert defende que as provas ideais devem ser tomadas como marcas gráficas geradas por meio de operações algébricas. As teorias ideais são expressas por sua forma e a avaliação de suas asserções se dá pela validação contentual de operações sintáticas. Nesse caso, uma teoria ideal não possui uma interpretação matemática, por isso, apenas o seu maquinário gerador de teoremas deve ser interpretado contentualmente. Esse modo de pensar as teorias objeto é, até o presente, o modo como muitos lógicos fazem metamatemática ou metalógica. Se, por exemplo, alguém quer entender o funcionamento dos operadores lógicos ∧ e ¬, não deve tratá-los interpretadamente. Em geral, eles representariam símbolos gráficos aos quais atribuiríamos uma função de verdade (considerando esta Capítulo 1. Introdução 18 uma teoria contentual). Assim, seguimos provando que esses símbolos se comportam como esperado contentualmente. Teoremas ideais devem ser entendidos como marcas gráficas. Para avaliar esses sistemas, devemos realizar uma análise metacomputacional de seus resultados, entendendo os teoremas demonstrados como sequências de símbolos gerados por um procedimento computacional ou algébrico. Por essa razão, podemos dizer que as teorias ideais não são interpretadas, isto é, não é preciso atribuir sentido aos seus enunciados. Devemos, por outro lado, avaliar se existe um procedimento gerador de fórmulas que tenha como elemento final a sentença que se pretende avaliar. Tanto Frege quanto Hilbert concordavam que a potência epistemológica da computação de teoremas deve ter como base uma prova contentual no sistema ferramental que valida a computação. No entanto, ambos mantinham visões distintas em relação ao que isso significa. No caso de Frege, o conhecimento de um teorema é o resultado da interpretação dos constituintes da inferência (por exemplo, α e α → β) juntamente com a interpretação da computação desses constituintes (avaliação computacional de que podemos aplicar modus ponens nesses constituintes) para a inferência do teorema β. Por outro lado, para Hilbert, não precisamos da interpretação dos constituintes. Uma prova ideal não precisa interpretar as fórmulas intermediárias para garantir uma atitude epistemológica em relação à fórmula terminal do procedimento. Outro problema enfrentado pelo programa de Hilbert era a possível circularidade das provas ideais. Conhecida como a "crítica de Poincaré", ela é centrada no caráter aparentemente circular do uso da indução por Hilbert. Para Poincaré, Hilbert, através do método dos ideais, estaria usando a indução para justificar a aplicação da indução. Em resposta a isso, Hilbert distingue os dois usos da indução: o uso da indução em avaliações metamatemáticas de provas ideais e o uso nas próprias provas ideais. Um argumento é circular quando a razão para duvidar da conclusão é tão forte quanto a razão para duvidar de uma ou mais premissas usadas na inferência. Portanto, para sustentar a circularidade, Poincaré deve equivaler o uso da indução em teorias ideais à indução contentual usada na prova de correção do método ideal. Mais ainda, Poincaré teria de equivaler a correção dos ideais como um todo à prova de correção do uso apenas da indução (DETLEFSEN, 1986). Entretanto, se consideramos que a teoria ideal adiciona elementos não construtivos além da indução geral, é possível que o método gere contradições na presença desses novos elementos, mesmo que a indução não gere contradição na matemática contentual. A matemática finitária é um subconjunto do sistema da aritmética de Peano e, portanto, as leis Capítulo 1. Introdução 19 não construtivas do sistema maior podem gerar contradição na presença da indução. Então, a correção dos métodos ideais acrescenta informações inacessíveis sem a prova contentual, invalidando os pressupostos de Poincaré. Outro problema enfrentado por Hilbert é o problema da diluição. Esse, que é o mais importante e crucial problema para a manutenção do programa, na opinião de Detlefsen (1986), investiga a qualidade epistêmica das substituições metateóricas propostas por Hilbert. Se temos em mãos uma prova contentual e queremos substituí-la por uma prova em uma teoria ideal, devemos avaliar se essa substituição possui igual ou maior força epistemológica. Caso contrário, não seria possível justificar a teoria ideal nos termos fundacionais de Hilbert (função descritiva do programa de Hilbert), porquanto a substituição afetaria negativamente a qualidade da nossa atitude epistêmica diante das proposições contentuais. É por isso que Hilbert sustenta uma metateoria finitária: para ele, ela seria a única teoria capaz de satisfazer essa exigência, evitando a diluição epistemológica. Podemos sumarizar essa questão esclarecendo a relação entre os três componentes: teoria contentual da matemática (TC) (por exemplo, matemática finitária), teoria ideal (TI) (por exemplo, análise) e metateoria. O argumento a favor do uso de uma TI deve ser acompanhado de uma prova de correção em relação às sentenças de TC, e essa prova deve ser realizada no interior da metateoria. Desse modo, como já mencionado na descrição do método dos ideais, deveríamos provar que, se existe uma sequência de prova de uma fórmula α em TI na linguagem de TC, então existe um procedimento garantido contentualmente pela metateoria, que transforma essa prova em uma prova contentual na TC. Pode ser o caso que a metateoria usada para obter a prova contentual dilua a nossa atitude epistemológica em relação à proposição que queremos sustentar. Segundo Detlefsen (1986), o argumento para aceitar a metamatemática finitária como solução para o problema da diluição segue a seguinte linha argumentativa: 1. A evidência finitária é a evidência de uma força especial; 2. O instrumentalismo de Hilbert propõe substituir provas matemáticas finitárias (TC) por provas metamatemáticas de correção dos métodos ideais (TI); 3. Se essa troca não resulta em uma diluição epistêmica, as substituições metamatemáticas devem ser tão fortes quanto as provas finitárias que elas substituem; 4. A força especial da evidência finitária sugere que o modo mais garantido (e, talvez, o único) de fazer isso é ter como substituições metamatemáticas as próprias técnicas finitárias e, portanto, Capítulo 1. Introdução 20 5. É razoável para o instrumentalismo de Hilbert buscar uma prova finitária da confiabilidade do método dos ideais no qual se baseiam suas substituições metamatemáticas. A busca de uma prova de confiabilidade do método dos ideais esbarraria, por fim, na prova dos teoremas da incompletude. Kurt Gödel provou, em 1931, que qualquer sistema T, supostamente consistente, que seja capaz de emular a aritmética de Peano, não pode decidir todas as afirmações na linguagem de T. Além disso, ele provou que qualquer sistema dessa natureza não pode provar a sua própria consistência8. Com esse resultado, muitos argumentam que a fundamentação da matemática proposta por Hilbert é irrealizável, pois não seria possível obter uma teoria consistente em si mesma na qual as demais teorias matemáticas resguardassem sua própria consistência através do método finitário dos ideais. Existem, porém, algumas ressalvas em relação ao poder que o segundo teorema de incompletude teria para encerrar o projeto de Hilbert. Algumas contracríticas podem ser vistas nos trabalhos de Tait (1981) e Kreisel (1958). Tait, por exemplo, busca sustentar a indubitabilidade (ao invés da consistência em si mesmo) das teorias finitárias; já Kreisel argumenta a favor da manutenção da aplicação dos métodos de Hilbert para outras questões, como expressividade ou computabilidade. Entretanto, nesta tese, não buscamos reavivar esses argumentos a favor do programa de Hilbert. Diferentemente, partimos do entendimento do esquema proposto por Hilbert para entender o sentido a partir do qual certas provas de consistência se diferenciam. Por exemplo, apesar do fim do programa de Hilbert, o modo como desenvolvemos a análise da consistência entre teorias se mantém substancialmente similar ao modo como Hilbert desenvolvia sua fundamentação. Mesmo que não seja possível estudar a consistência em um sentido absoluto, podemos determinar as relações de dependência entre as teorias. Por outro lado, o teorema da incompletude de Gödel abre um novo campo de investigação, qual seja, a noção de que algumas sentenças da matemática são independentes da teoria, não importando o esforço de ampliação do sistema axiomático. No programa de Hilbert, tínhamos uma teoria contentual, uma teoria ideal e o ferramental metateórico finitário que buscava reduzir a consistência da teoria ideal à consistência da teoria contentual. Hoje, para a prova de consistência relativa entre teorias, usamos o mesmo aparato ferramental, mas com a diferença de que não reconhecemos preferencialmente uma teoria como contentual e outra como ideal: ambas são vistas pela metateoria como teorias ideais, às quais podemos ou não atribuir julgamentos contentuais. 8 Há um pressuposto subentendido nessa afirmação em relação ao qual não existe uma resposta definitiva: a noção de que o predicado Cons(pTq) expressa univocamente a consistência de uma teoria. Caso, por exemplo, exista uma outra fórmula que possa expressar a consistência de uma teoria e que seja estritamente mais fraca que Cons(pTq), então a interpretação do resultado de Gödel não é garantida. Capítulo 1. Introdução 21 Embora esse corpo técnico não possa satisfazer as demandas do programa de Hilbert em todas as suas especificidades, tal metamatemática mantém o compromisso de exibir uma prova para cada uma de suas asserções. Nesse caso, uma demonstração de consistência relativa não pode se limitar à afirmação de que "se uma teoria T1 é inconsistente, então T2 é inconsistente". Mais do que isso, devemos provar que "a partir de uma prova de uma inconsistência do tipo α ∧ ¬α em T1, podemos gerar uma prova de uma fórmula β ∧ ¬β em T2 através de um procedimento construtivo P dado". Por outro lado, como veremos a seguir, para os métodos infinitários, essa garantia não pode ser afirmada irrestritamente9. Desse modo, embora o programa de Hilbert tenha perdido muito do seu brilho com a prova dos teoremas de incompletude, seu legado continua vivo nos estudos de fundamentos da matemática. 1.3 Métodos infinitários: teoria de modelos No início do século XX, o estudo da semântica de teorias matemáticas não era considerado adequado à concepção científica do mundo e era, de modo geral, rejeitado pela filosofia analítica (FIELD, 1972). Segundo essa concepção, conceitos como verdade, falsidade, denominação ou intenção não poderiam ser reduzidos a conceitos verificáveis objetivamente e, por isso, deveriam ser eliminados da prática científica. Em muitos casos, questões semânticas não eram nem mesmo consideradas: em exposição sobre o teorema de completude de Gödel – que relaciona a provabilidade ao conceito semântico de validade lógica – Heijenoort (1967) menciona a falta de interesse de Whitehead e Russell por questões semânticas que dependeriam de recursos externos ao sistema de prova elaborado no Pricipia Mathematica. É nesse contexto que Tarski (1956) inaugura a semântica formal no artigo "The concept of truth in formalized languages". Nesse artigo, Tarski explora possibilidades para a definição de verdade, buscando dignificar a semântica como um tema propriamente científico. Segundo Kirkham (1992), a definição de verdade de Tarski dá suporte ao projeto extensionalista da verdade, isto é, pretende determinar a coleção de sentenças que são verdadeiras. Embora isso possa ser argumentavelmente inapropriado para uma definição global de verdade, satisfaz, de modo geral, os propósitos dos estudos metamatemáticos. Como veremos ao longo do trabalho, o projeto de Tarski é bem-sucedido em determinar a extensão do predicado de verdade em uma teoria 9 Frequentemente, uma prova infinitária pode garantir a existência de um procedimento de prova do mesmo modo que uma prova finitária. Esses casos serão explorados no próximo capítulo. Mostraremos também como existem casos em que essa garantia não pode ser feita e, por isso, as provas infinitárias podem servir de base para análises imprecisas da relação entre teorias. Capítulo 1. Introdução 22 formal. Para isso, busca um procedimento lógico/matemático/físico bem definido e capaz de avaliar se uma sentença possui as condições necessárias e suficientes para ser verdadeira. Conceitos semânticos para Tarski são aqueles que estabelecem relações entre expressões e objetos. Então, como fisicalista, ele acreditava que, em última análise, deveríamos definir os conceitos semânticos a partir de conceitos lógicos, matemáticos e físicos eliminando, no seu entendimento, conceitos da metafísica tradicional da ciência semântica. Especificamente, ele pretendia definir o conceito de verdade a partir do conceito de satisfação (lógico), definição (matemático) e designação (físico). Para dar sequência ao seu projeto, a definição de Tarski precisava atender a duas exigências: evitar o paradoxo do mentiroso e satisfazer a condição de adequação material. A primeira exigência deve evitar a possibilidade de formar sentenças do tipo p = "a sentença p é falsa"; pois nesse caso teríamos o absurdo: se p é verdadeira, então p é falsa porquanto p expressa a falsidade de p e, se p é falsa, então p é verdadeira, pois a negação de p expressa a veracidade de p. A segunda exigência é conhecida como esquema T e frequentemente é confundida com a própria definição de verdade de Tarski. Uma definição adequada materialmente deve satisfazer para toda sentença X a condição "X é verdadeira se, e somente se, p" e "X é uma sentença que expressa o fato p". Notadamente, o esquema T não é condição suficiente (embora necessária) para uma definição de verdade, uma vez que não especifica como funciona a coordenação entre a estrutura sintática da expressão X e o modo como X expressa o fato p. A definição de Tarski, portanto, teria como objetivo especificar esse funcionamento. Se tomamos como dado o modo como avaliamos as sentenças atômicas em um sistema proposicional, a coordenação entre as expressões e os fatos atômicos pode ser facilmente especificada a partir de um procedimento recursivo. Esse modo de tratar o problema já era comum no período em que Tarski fundamenta a sua noção de verdade. A recursão funciona regularmente para o caso proposicional porquanto, nesse sistema, toda subfórmula de uma fórmula dada é também uma fórmula bem formada. Vejamos a definição de verdade para o caso proposicional: Usamos os operadores lógicos ¬ e ∨, as fórmulas atômicas {a1, a2, . . . , an} e as fórmulas em geral {α1, α2, . . .}. Com isso, αk é verdadeira se, e somente se, 1. {∃i∃j tal que αk = αi ∨ αj e αi é verdadeira ou αj é verdadeira}; 2. ou {∃i tal que αk = ¬αi e αi é falso}; 3. ou {∃i ≤ n tal que αk é ai e ai é verdadeira}. Capítulo 1. Introdução 23 Notamos, já nesse passo, que, se possuímos uma metateoria finitária, a definição de verdade, mesmo para o caso proposicional, não pode ser oferecida de modo geral. Uma definição como a mostrada acima depende do fato de que o conjunto de fórmulas atômicas seja finito. Caso contrário, a definição de verdade deveria ter comprimento infinito pois a quantificação no item 3 seria irrestrita -, algo inaceitável do ponto de vista de uma metateoria finitária. Se, por outro lado, tomamos um fragmento infinitário da teoria dos conjuntos para descrever esse sistema, podemos definir abstratamente essa recursão para o caso infinito. A grande dificuldade de aplicar essa mesma técnica para a lógica de predicados reside no fato de as subfórmulas de uma sentença dada não serem necessariamente sentenças: x < 2 é subfórmula da sentença ∃x(x < 2), mas x < 2 não é uma sentença (sentenças são fórmulas cujas variáveis são todas ligadas; em x < 2, temos uma x como uma variável livre). Notemos que, para a lógica de predicados, não existe sentido em dizer que uma fórmula aberta (na qual existe uma variável livre) possui valor de verdade, já que apenas sentenças podem ter valor de verdade. Para evitar esse problema, Tarski elaborou um modo engenhoso de uniformizar o tratamento das fórmulas abertas e fechadas: o conceito de satisfação. Com essa definição, Tarski pretendia atribuir valor semântico a fórmulas e subfórmulas, independentemente de elas terem valor de verdade. Se ele tivesse sucesso em criar uma noção de satisfação que significasse a verdade no caso de sentenças, seu projeto estaria concluído. Apresentamos abaixo uma versão da definição de verdade de Tarski. Restringimo-nos a teorias para as quais: (i) existe um número n tal que todas as aridades dos predicados na linguagem são menores que n (ii) e o número de predicados com aridade k é sempre finito mk. Linguagem de uma teoria objeto 1. P ki é o predicado de aridade k (entre 1 e n) e índice i (i entre 1 e mk); 2. As variáveis individuais são os elementos do conjunto {x1, x2, x3 . . .}; 3. ∃ é o operador existencial e os operadores booleanos são ¬ e ∨. A satisfação por uma sequência de objetos s é um conceito semântico, assim definido: Para toda fórmula θ (θ é satisfeita por uma sequência s) se, e somente se, 1. ∃i < m1 tal que θ = 'P 1i xk', e o k'ésimo objeto de s tem a propriedade P 1i . 2. ou ∃i < m2 tal que θ = 'P 2i xkxq', e o k'ézimo objeto de s e o q'ézimo objeto de s se relacionam nessa ordem de acordo com a propriedade P 2i . Capítulo 1. Introdução 24 3. ou . . . (formato similar para cada uma das aridades da linguagem). 4. ou (θ = '¬φ′, e s não satisfaz φ). 5. ou (θ = 'α ∨ φ′, e s satisfaz φ ou s satisfaz α). 6. ou (θ ='∃xkφ', e alguma sequência que difere de s apenas no k'ézimo objeto da sequência satisfaz φ). Definição de verdade para Tarski: (Para toda sequência s) (θ é verdadeiro ⇐⇒ θ é satisfeita por todas as sequências de objetos). A satisfação exposta ainda apresenta a dificuldade apontada para o caso proposicional se houver infinitos predicados, constantes ou funções. Esse problema é solucionado por Tarski se admitirmos como metateoria uma teoria dos conjuntos (ZFC) (TARSKI, 1956). Assim, podemos incorporar quaisquer predicados usando a recursão em ZFC sobre ω ou até mesmo ordinais maiores. Mais tarde, esse tratamento foi incorporado na teoria de modelos criada por Tarski. Com um argumento similar, ele elabora um sistema matemático fundamentado em ZFC, responsável por dar semântica para as linguagens de primeira ordem. Com algum esforço, é possível verificar que esse novo tratamento é equivalente às ideias iniciais. Um tratamento detalhado desse aspecto pode ser encontrado no livro Undecidable theories (TARSKI et al., 1953). Com esse ferramental teórico e com o resultado de completude de primeira ordem de Gödel/Henkin, é possível afirmar a consistência de uma teoria a partir da apresentação de um modelo para os seus axiomas. Nesse caso, Tarski solidifica a concepção amplamente difundida de que a matemática deve ser fundamentada em teorias de conjuntos. Essa noção aparece junto com a constatação de que, no sistema de Tarski, o conteúdo semântico de uma teoria matemática é apresentado pela descrição do modelo que satisfaz a teoria estudada. Quando, portanto, falamos de métodos infinitários, referimo-nos ao conjunto de técnicas usadas em teoria de modelos (especificamente, seguimos as definições apresentadas em (MARKER, 2002)). Apresentar a construção de um modelo como modo de provar a consistência de uma teoria depende da aceitação, nos fundamentos da prova, de uma metateoria infinitária e não construtiva. Apesar disso, existem provas modelo-teoréticas cujas construções podem ser convertidas em provas de fundamento finitário por um procedimento regular (veremos isso quando falarmos de interpretações). Capítulo 1. Introdução 25 Atentamos, por fim, à diferença de propósito dos projetos que dão origem aos métodos finitários e infinitários. O primeiro tem como objetivo a fundamentação das teorias usadas pelos matemáticos a partir de uma teoria privilegiada; já o segundo busca uma semântica para as teorias usadas pelos matemáticos a partir de uma teoria privilegiada. Apesar dessa diferença, em ambos os casos, a consistência de teorias formais aparece como resultado central oferecido pelo uso das metodologias. Nesse sentido, caracterizaremos as teorias a respeito das quais ambas as abordagens são fundamentalmente equivalentes e também os contextos nos quais cada método apresenta respostas distintas. 1.4 Um Caso de Estudo: equiconsistência entre NBG e ZF Nesta tese, estudaremos a prova de equiconsistência entre NBG (teoria dos conjuntos e classes desenvolvida por von Neumann, Bernays e Gödel) e ZF. Apresentaremos a prova através de técnicas modelo-teoréticas e, em seguida, vamos nos restringir às ferramentas finitárias. A teoria dos conjuntos ZF é uma axiomatização infinita, porquanto possui axiomasesquema como a substituição e a separação10. Assim, se queremos que ZF seja considerada uma teoria base para a fundamentação da matemática, precisamos admitir que não podemos apresentar nossos fundamentos explicitamente. Von Neumann, Bernays e Gödel formulam um sistema similarmente expressivo a respeito de conjuntos e que possui uma apresentação finita: o sistema conhecido por NBG. Para perseverar nessa intenção, eles precisaram admitir a existência de classes próprias na teoria, sem incorrer no paradoxo de Bertrand Russell. Na teoria, classes próprias e conjuntos são tomados separadamente (conjuntos são um tipo especial de classe), não sendo possível afirmar irrestritamente que uma classe seja um conjunto. O desenvolvimento do sistema NBG começa com os trabalhos de Von Neumman sobre uma possível deficiência na teoria de conjuntos de Zermelo. Von Neumman queria restaurar conceitos como Universo de todos os conjuntos, Ordinais, e Cardinais; contudo, com os paradoxos de Russell, sabemos que a existência de tais entidades enquanto conjuntos implicariam absurdos. Esses conceitos foram amplamente usados nos desenvolvimentos de Cantor na teoria dos conjuntos. Neumman percebeu que, apesar de não podermos tratar a totalidade dos Ordinais ou o Universo como conjuntos, poderíamos considerá-los um tipo diferente de entidade: classes. 10 Axiomas-esquema são aqueles que mostram a forma geral de um número infinito de axiomas de uma teoria. No caso da separação ou substituição-conjunto, cada fórmula de primeira ordem na linguagem de ZF dá origem a um axioma diferente. Capítulo 1. Introdução 26 E a restrição de que "apenas conjuntos podem pertencer a classes" evitaria os paradoxos de Russell. Mais ainda, tomando-os por classes, Neumman tornaria desnecessário o uso de axiomas-esquema do sistema ZF, argumentando as vantagens fundacionais de uma axiomatização finita da teoria dos conjuntos. Desenvolvimentos posteriores seriam realizados por Bernays e Gödel: o primeiro formalizou as noções de von Neumman em uma teoria bissortida com primitivos para conjuntos e classes separadamente; e, mais tarde, Gödel desenvolveu a versão de NBG monossortida, simplificando a axiomatização anterior e facilitando o uso de muitas ferramentas lógicas (comumente apresentadas para teorias monossortidas). 1.4.1 Linguagem e axiomas: lógica de primeira ordem clássica Para a linguagem da nossa lógica de base, vamos admitir as letras gregas (α, β, γ, entre outras) como fórmulas da nossa linguagem. Tomamos ∈, = e p como símbolos de predicado; as letras iniciais do alfabeto latino (a, b, c, d) como símbolos de constantes; e as letras finais do alfabeto latino (v, x, y, z, w) como variáveis de primeira ordem. Para os símbolos de função, usaremos as letras f ou g; e, para termos, as letras t, u ou k. Quando escrevemos αx(t), devemos ler que todas as ocorrências livres da variável x na fórmula serão substituídas pelo termo t. Representamos a quantificação existencial por ∃ e a universal por ∀. Feitas as considerações sobre a linguagem, descrevemos o sistema lógico. Consideramos como axiomas lógicos: 1. Todas as tautologias. 2. Axioma da substituição lógica11: se x ocorre livre em α, αx(t) → ∃xα é um axioma. 3. Axioma da identidade: x = x. 4. Axioma da igualdade: x1 = y1 ∧ x2 = y2 ∧ . . . ∧ xn = yn → f(x1, x2, . . . , xn) = f(y1, y2, . . . , yn), para algum n e sendo f uma função n'ária. x1 = y1 ∧ x2 = y2 ∧ . . . ∧ xn = yn → (p(x1, x2, . . . , xn) ↔ p(y1, y2, . . . , yn)), para algum n e sendo p um predicado n'ário. Como regras de inferência para o sistema, tem-se: 11 Quando falarmos apenas axioma da substituição, estaremos nos referindo ao axioma de ZF. Capítulo 1. Introdução 27 1. Modus ponens: de α e α → β, inferimos β. 2. Introdução do existencial: se x não ocorre livre em β, de α → β, inferimos ∃xα → β. 3. Regra de substituição: inferimos θx(t) a partir de θ, se x é variável livre em θ e nenhuma variável de t é ligada em θ(t). 1.4.1.1 Axiomatização de NBG Existem diversas possíveis axiomatizações para NBG, inclusive (e mais usualmente), axiomatizações infinitas. Apresenta-se a seguir uma axiomatização infinita junto com uma substituição que lhe torna finita (MURAWSKI; MICKIEWICZ, 2004). Abreviações: 1. Universo dos conjuntos: x ∈ V ≡ ∃y(x ∈ y). 2. Função: func(r) ≡ ∀x∀y∀z((x, y) ∈ r ∧ (x, z) ∈ r → y = z). 3. Conjunto vazio: a constante ∅ representa ∃x∀y(y /∈ x). 4. Função membro: {x1, x2, . . . , xn} é a função que associa {x1, x2, . . . , xn} a um y tal que ∀z(z ∈ y ↔ z = x1 ∨ z = x2 ∨ . . . ∨ z = xn). 5. Par ordenado: ⟨x, y⟩ = {x, {x, y}}. 6. Tupla: ⟨x1, x2, . . . , xn⟩ é a definição recursiva finita ⟨x1, ⟨x2, . . . , xn⟩⟩. 7. Subconjunto: x ⊆ y ↔ ∀z(z ∈ x → z ∈ y). Axiomas: 1. Extensionalidade: ∀x∀y(∀z(z ∈ x ↔ z ∈ y) → x = y). 2. Classe: ∃x∀y(∃z(y ∈ z) → y ∈ x). 3. Vazio: ∃x(∀y(y /∈ x) ∧ ∃z(x ∈ z)). 4. Par: ∀x ∈ V ∀y ∈ V ∃z ∈ V (∀u(u ∈ z ↔ u = x ∨ u = y)). 5. União: ∀x ∈ V ∃y ∈ V ∀u(u ∈ y ↔ ∃v(u ∈ v ∧ v ∈ x)). 6. Partes: ∀x ∈ V ∃y ∈ V ∀u(u ∈ y ↔ u ⊆ x). Capítulo 1. Introdução 28 7. Infinito12: ∃x ∈ V (∅ ∈ x ∧ ∀u ∈ x∀v ∈ x(u ∪ {v} ∈ x)). 8. Substituição para classes: ∀x ∈ V ∀r(func(r) → ∃y ∈ V ∀u(u ∈ y ↔ ∃v ∈ x((v, u) ∈ r))). 9. Fundação: ∀x(x = ∅ → ∃y ∈ x(x ∩ y = ∅)). Axioma-esquema para classes: Se θ é uma fórmula com variáveis livres x, v1, v2, . . . , vn e todos os seus quantificadores estão relativizados para V, isto é, todo quantificador aparece da forma ∀xi ∈ V ou ∃xi ∈ V , então ∀v1 ∈ V ∀v2 ∈ V . . .∀vn ∈ V ∃z∀x(x ∈ z ↔ (x ∈ V ∧ θ(x, v1, v2, v3, . . . , vn))). Esse é um axioma-esquema e, portanto, gera um axioma para cada fórmula θ. Contudo, com a adição dos seguintes axiomas, podemos provar o axioma-esquema para classes: 10. Pertencimento para conjuntos: ∃a∀x ∈ V ∀y ∈ V ((x, y) ∈ a ↔ x ∈ y). 11. Interseção: ∀a∀b∃c∀x(x ∈ c ↔ (x ∈ a ∧ x ∈ b)). 12. Complementar: ∀a∃b∀x ∈ V (x ∈ b ↔ x /∈ a). 13. ∀a∃b∀x ∈ V ∀y ∈ V ((x, y) ∈ b ↔ x ∈ a). 14. ∀a∃b∀x ∈ V ∀y ∈ V ∀z ∈ V ((x, y, z) ∈ b ↔ (y, z, x) ∈ a). 15. ∀a∃b∀x ∈ V ∀y ∈ V ∀z ∈ V ((x, y, z) ∈ b ↔ (x, z, y) ∈ a). A prova de que esses axiomas resultam no axioma-esquema para classes é realizada por uma simples indução finita na complexidade da fórmula θ(x, v1, v2, v3, . . . , vn). Os passos indutivos são realizados a partir das seguintes observações: (i) o axioma da interseção nos garante obter o caso em que θ é da forma α ∧ β; (ii) a partir do axioma do complementar, obtemos os casos em que θ é da forma ¬α; (iii) os demais axiomas nos garante os casos atômicos θ na forma x ∈ vi, x ∈ x, vi ∈ x, bem como a inclusão de variáveis α ∧ vk1 = vk1 ∧ vk2 = vk2 ∧ . . . ∧ vkn = vkn . Por fim, a partir de (i), (ii) e (iii) a indução para o caso em que θ é da forma ∃y ∈ V (α) é obtida facilmente. 12 Essa versão do axioma do infinito é mais forte do que o usual ∃x(∅ ∈ x∧∀y ∈ x(y ∪{y} ∈ x)). No contexto dos demais axiomas, as duas versões são equivalentes. Mantivemos o axioma nesse formato apenas para preservar a fonte da axiomatização (MURAWSKI; MICKIEWICZ, 2004). Capítulo 1. Introdução 29 Ressaltamos que essa axiomatização não faz uso de dois tipos de variáveis (bissortidas)13, como ocorre, em muitos casos, nas axiomatizações para NBG, dificultando a aplicação de diversos teoremas em lógica. 1.4.2 Equiconsistência entre NBG e ZFC Em geral, a prática da teoria dos conjuntos faz uso constante de classes metateoricamente: falamos da classe de todos os conjuntos {x|x = x}, da classe dos ordinais {x|Ord(x)}, entre outros. Através de NBG, podemos internalizar esse uso para a teoria de primeira ordem, visando obter maior controle da aplicação de nossas técnicas. Para comprovar que essa internalização é coerente, precisamos mostrar que ambas as teorias concordam sobre a validade de cada fórmula que fale exclusivamente sobre conjuntos. Com efeito, devemos provar o seguinte lema: Lema 1 Se α está na linguagem de ZF (nesse contexto, todos os quantificadores são limitados a conjuntos) e NBG ⊢ α, então ZF ⊢ α. Se é o caso que vale esse lema, toda fórmula que fala sobre conjuntos e é provada no sistema NBG será também provada em ZF. O contrário vale trivialmente, uma vez que existem axiomatizações de NBG que têm ZF como subteoria. Nesse caso, se ZF ⊢ α, então NBG ⊢ α. Mais do que isso, esse lema implica a consistência relativa entre as duas teorias. Definição 2 Uma teoria T é consistente (Cons(T)) ⇐⇒ existe uma fórmula α tal que T 0 α. Assim, se vale o Lema 1 e ZF é consistente, então existe uma fórmula β tal que ZF 0 β. Desse modo, caso NBG ⊢ β, teremos, pelo Lema 1, que ZF ⊢ β é absurdo. Logo, NBG 0 β o que significa que NBG é consistente. O estudo da fundamentação da matemática passou por diversas transformações nos séculos XIX e XX. Vimos a lógica passar por um enorme desenvolvimento e, em Frege, encontrar muitos de seus limites na descrição de objetos matemáticos. Em seguida, vimos como esses estudos mostraram, em certa medida, que o modo de ver os axiomas da matemática 13 Muitas axiomatizações, especialmente as mais antigas, apresentavam NBG em um sistema lógico de dois tipos de variáveis: letras minúsculas para conjuntos e letras maiúsculas para classes, tendo, nesse sentido, dois tipos de quantificação(∀X e ∀x). Capítulo 1. Introdução 30 precisavam ser revisados. O modo individualizado de entender a verdade de um axioma não era mais suficiente para dar fundamentos sólidos à família de teorias formalizadas que surgia nesse período. Nesse sentido, aparecem os métodos de prova de consistência, buscando a avaliação das teorias matemáticas na observação do comportamento de seus axiomas em um sistema. Em seguida, elucidamos preliminarmente as diferenças entre o finitarismo de Hilbert e a semântica de Tarski, lembrando que, embora os dois projetos tenham caráter inicial distinto, ambos dão suporte às principais metodologias de prova de consistência conhecidas. Nos próximos capítulos, exploraremos as diferenças entre essas estratégias de prova de consistência, tendo o resultado de equiconsistência entre NBG e ZF como exemplo fundamental. 31 2 Comprometimento ontológico em provas de consistência relativa 2.1 Considerações preliminares sobre o problema Neste capítulo, investigaremos o comprometimento ontológico em teorias de primeira ordem. Para isso, analisaremos o uso de técnicas modelo-teoréticas em provas de consistência e exploraremos o uso do teorema da interpretação, como em Shoenfield (1967, p. 61-65), para superar algumas dificuldades de fundamentação epistemológica. Inicialmente, investigaremos o tipo de compromisso ontológico que assumimos quando um argumento supõe a existência de um modelo. Posteriormente, correlacionaremos as provas modelo-teoréticas de consistência relativa com a correspondente prova sintática obtida através da interpretação sintática entre a teoria objeto e alguma teoria de conjuntos. Esse uso da interpretação permite, como veremos, o uso fundamentado de modelos sem o comprometimento realista com essas entidades. Também exploraremos casos nos quais a abordagem de modelos pode ser enganadora. Shoenfield (1967), por exemplo, mostra confiança no poder das interpretações de capturar as modelo-relações na passagem a seguir: We have so far discussed structures1 in English. We could, of course, translate the entire discussion into any language in which there is sufficient set-theoretic notation to discuss functions, predicates, etc. (SHOENFIELD, 1967, P. 61) Shoenfield nos mostra ampla confiança no fato de podermos encontrar uma interpretação para qualquer modelo que possamos inventar. De onde vem essa confiança? Consideramos um modelo-conjunto como aquele em relação ao qual podemos provar que existe um rank na hierarquia cumulativa de Von Neumann no qual esse modelo está contido. Caso contrário, se um modelo não pode ser denotado por um conjunto na teoria base, então o chamamos de modelo-classe. De modo simples, podemos provar que, para todo modelo-conjunto, existe uma interpretação que substitui sintaticamente as relações do modelo. Não obstante, para modelos-classe, pode não ser igualmente simples exibir uma interpretação. Não possuir interpretação em ZF é suficiente para muitos descartarem a existência de modelos-classe. Nesse caso, para um modelo existir seria necessário que uma interpretação 1 Nesse contexto, estrutura é usado como sinônimo de modelo. Capítulo 2. Comprometimento ontológico em provas de consistência relativa 32 para uma teoria "confiável" estivesse disponível. Na passagem, porém, Shoenfield está se referindo, embora não explicitamente, à família de teorias matemáticas descritas por modelosconjunto. Para um filósofo realista, a existência de uma interpretação é apenas uma ferramenta epistemológica para acessar um modelo; ele acredita que um modelo-classe pode existir mesmo que não exista uma interpretação da teoria investigada para a teoria que fundamenta seu estudo. A existência de objetos matemáticos seria independente de nossa habilidade de descrevê-los em termos de alguma metateoria. Ainda assim, é preciso explicitar o interesse em descrever modelos que não são conjuntos. De fato, grande parte das teorias matemáticas podem ser semanticamente explicadas em termos de modelos-conjuntos. Entretanto, quando lidamos com as provas de consistência relativa para ZF, como a independência da hipótese do contínuo, o axioma da escolha, entre outros, temos de lidar com modelos-classe; e.g. modelos de ZF, restrições de modelos de ZF ou extensões de modelos de ZF. Outra forma de evitar o uso de classes é incluir em ZF axiomas sobre grandes cardinais ou incluir a construção de universos de Grothendieck não triviais. Por fim, investigaremos as teorias e metateorias para as quais esperamos que existam ou não interpretações. Assim, veremos que a abordagem modelo-teorética, em alguns casos, não ajuda a clarificar a questão de dependência entre teorias. Isto é, a abordagem semântica pode por vezes obscurecer a análise do comprometimento ontológico relativo entre teorias. 2.2 Modelo como interpretação Matematicamente, modelos são objetos comumente associados com o valor semântico de uma teoria. Um modelo-conjunto M é um objeto matemático em uma teoria de conjuntos; ele é composto de um conjunto de objetos M , um conjunto de relações entre objetos R, um conjunto de relações de referência para as constantes da linguagem C e um conjunto de funções s que atribuem objetos de M a variáveis da linguagem da teoria estudada; podemos escrever isso como M = ⟨M,R,C, s⟩. Pelo teorema da completude de primeira ordem, todo conjunto consistente de fórmulas tem um modelo. É por isso que, do ponto de vista de um realista, todo conjunto de axiomas, se consistente, faz referência a um grupo de objetos abstratos. Contudo, se tomamos esse passo com o devido cuidado, devemos exigir a apresentação de uma razão epistemológica para que esse grupo de objetos matemáticos de fato exista. Assumir que um conjunto de fórmulas que satisfaz certas propriedades sintáticas (não geram, através de derivações lógicas, uma Capítulo 2. Comprometimento ontológico em provas de consistência relativa 33 contradição do tipo "A ∧ ¬A") garantem a existência de entidades abstratas implicaria um grande salto em comprometimento ontológico. Esse tema foi extensivamente discutido na literatura, como podemos ver em Benacerraf e Putnam (1983) e Kirkham (1992), e não pretendemos explorar todos os aspectos desse profundo debate metafísico. Consideramos, de modo simplificado, que, ao assumirmos a existência realista de um modelo, comprometemos-nos ontologicamente de modo profundo e, mais ainda, estamos em uma posição desfavorável para justificar o conhecimento de tais entidades. Não queremos, com isso, afirmar que, para aceitar o uso de um modelo, alguém precise se posicionar como platonista ou qualquer outra posição em filosofia da matemática. Não obstante, um não platonista precisa justificar o que entende como um modelo de modo que evite os compromissos ontológicos realistas. Ademais, mesmo para um platonista como Gödel, é preciso justificar a acessibilidade de um modelo nos casos em que assumimos modelos para a teoria dos conjuntos. Gödel comenta em seu importante artigo sobre a consistência da hipótese do contínuo (GÖDEL, 1939) que um método finitário poderia ser aplicado de tal forma que estaríamos justificados ao falar da existência dos modelos discutidos no seu trabalho. Para um realista, não precisamos usar razões exclusivamente matemáticas para acreditar na existência de um modelo; ainda assim, através da descrição detalhada de um modelo e suas propriedades, um realista pode argumentar um conhecimento mais claro a respeito da sua existência. Esse método de justificação é realizado com o suporte de uma teoria dos conjuntos. Para lidar com essas questões, a interpretação como um modelo é bastante adequada. Esse método serve tanto para evitar o comprometimento ontológico como também para oferecer uma justificação para acessibilidade de modelos em relação aos quais não queremos tomar sua existência de partida. Portanto, essa estratégia tem valor para diversas e, inclusive, opostas posições em filosofia da matemática. Através de interpretações sintáticas, podemos afirmar a existência de um modelo em um sentido mais fraco do que é necessário para uma posição platonista, demandando apenas a crença nos procedimentos finitários explicitamente colocados. Também, interpretações adicionam um fundamento epistemológico para um realista, sem que isso interfira nas suas crenças ontológicas. Originalmente, o método da interpretação foi instanciado como uma estratégia geral para investigar indecidibilidade. Em Undecidable theories (TARSKI et al., 1953), Mostowski, Robinson e Tarski exploraram essa estratégia, promovendo uma visão epistemológica adequada às demandas do programa de Hilbert. Nesse sentido, se alguém obtém uma prova usando interpretações ao invés de uma prova modelo-teorética, ele ou ela estaria trocando uma metateoria infinitária por uma finitária e, portanto, decidibilidade se tornaria não Capítulo 2. Comprometimento ontológico em provas de consistência relativa 34 simplesmente uma necessidade lógica, mas um procedimento explícito. Em Shoenfield (1967), vemos um uso mais geral dessa noção na qual interpretação serve para tratar modelos sem um profundo comprometimento ontológico. Usando interpretações, tornamo-nos capazes de expressar modelos usando fórmulas em uma teoria dos conjuntos e de obter resultados através de operações finitárias. Com efeito, ao fazermos isso, podemos argumentar que a consistência de uma teoria implica a consistência da teoria interpretada. Formalmente, interpretações podem ser definidas como se segue (SHOENFIELD, 1967, p. 61-65): Definição 3 I = ⟨U, φ⟩ é uma interpretação da teoria T1 em T2 se 1. Universo: U está em L(T2) e é tal que T2 ⊢ ∃xUx. 2. Universo é fechado em relação a funções: Para cada função n'ária f em L(T2), T2 ⊢ Ux1 → Ux2 → * * * → Uxn → Uf(x1x2 . . . xn). 3. Função de tradução: φ é a função de L(T1) em L(T2), de modo que, a) Para todo predicado n'ário P em L(T1), φ(P ) é um predicado n'ário e está na linguagem de L(T2). b) Para toda função n'ária f em L(T1), φ(f) é uma função n'ária e está na linguagem de L(T2). 4. Interpretação parcial: Seja α′ obtida de α pelos seguintes procedimentos: a) Se α é atômica, então α′ é a substituição de toda ocorrência de um símbolo s por φ(s). b) Se α é β ∨ γ, então α′ é β′ ∨ γ′. c) Se α é ¬β, então α′ é ¬β′. d) Se α é ∃xβ, então α′ é ∃x(Ux ∧ β′). 5. Interpretação: Para toda fórmula α em L(T1) com x1, x2, . . . , xn variáveis livres, tomamos αI como Ux1 → Ux2 → * * * → Uxn → α′. 6. I é uma interpretação de T1 em T2: Para todo axioma não lógico φ de T1, T2 ⊢ φI . Discursivamente, uma interpretação oferece um substituto sintático das variáveis individuais, constantes e predicados em uma teoria usando relações definíveis em outra teoria. Desse modo, quando escrevemos explicitamente a interpretação, e.g. da teoria dos números Capítulo 2. Comprometimento ontológico em provas de consistência relativa 35 na teoria dos conjuntos, toda vez que alguém quiser afirmar uma relação na teoria dos números, ele ou ela pode interpretar o teorema em relações da teoria dos conjuntos (que é um procedimento finitário), provar a versão interpretada da relação na teoria dos conjuntos e, depois, afirmar uma validade sobre números sem necessariamente ter um entendimento a respeito de números. Mais ainda, se estabelecemos uma interpretação de T1 em T2, podemos derivar a consistência relativa entre essas teorias finitariamente. Nesse caso, a consistência de T2 implica a consistência de T1. Fato 1 (Teorema da interpretação) Se existe uma interpretação I de T1 em T2 e α é uma fórmula em L(T1), então: 1. se T1 ⊢ α, então T2 ⊢ αI . 2. se T2 é consistente, então T1 é consistente. (consistência relativa). Geralmente, uma prova semântica de consistência relativa começa com a suposição de um modelo M para alguma teoria T1. Depois disso, devemos realizar algumas modificações, extensões ou restrições sobre M de modo a obter um modelo que satisfaça os axiomas de T2. Isso, como já discutido, tem forte comprometimento ontológico a não ser que ofereçamos, de acordo com a posição filosófica, um método de acesso que justifique ou desvie dessa dificuldade. Interpretações podem preencher essa lacuna em um sentido específico: muitas demonstrações modelo-teoréticas de consistência relativa podem ser convertidas sem muita dificuldade para uma contraparte sintática através de interpretações. De fato, sabendo qual extensão ou restrição devemos fazer em um modelo é notadamente um guia para instanciarmos a interpretação entre as teorias. 2.3 Presunção da existência de interpretações Quando falamos sobre modelos-conjunto, oferecer um fundamento epistemológico através de interpretações é o resultado da substituição das operações modelo-teoréticas por correspondentes sintáticos. Por outro lado, em relação a modelos-classe, podemos não ter a mesma facilidade. Modelos-conjunto são geralmente usados quando investigamos propriedades de teorias matemáticas como teoria dos corpos ou aritmética; diferentemente, modelosclasse são comumente usados para modelos da própria teoria dos conjuntos ou teoria dos conjuntos alternativa como os construtíveis de Gödel, NBG ou teoria de categorias. Capítulo 2. Comprometimento ontológico em provas de consistência relativa 36 Modelos-classe são usados para provas de independência de fórmulas em teorias de conjuntos. Em moderna exposição desse assunto, em Kunen (2014), vemos extensivo uso dessa técnica, assinalando um comprometimento ontológico com algum tipo de existência de um modelo-classe. Para superar essa questão, alguém pode apresentar uma interpretação de modo a simular as relações dentro do modelo-classe. Contudo, em muitos casos, vemos autores apenas mencionando esse problema sem posterior investigação da existência de uma interpretação. Vale ressaltar que, quando essas técnicas estavam sendo desenvolvidas nas décadas de 1930 e 1950, a investigação a respeito desse aspecto era feita de modo mais cuidadoso. Por exemplo, como já mencionado, nos trabalhos preliminares de Gödel (1938), Gödel (1939) sobre a consistência da hipótese do contínuo, ele ressalta essa questão, assinalando que todas as técnicas modelo-teoréticas usadas na demonstração podem ser convertidas para noções sintáticas finitárias. Ele poderia, portanto, provar a consistência relativa de HC, explicitando uma interpretação ao invés de um modelo e, então, provar que podemos estender essa interpretação para um outro modelo. Há casos em que é natural que não tenhamos interpretações. Se, por exemplo, uma teoria T1 internaliza e prova o predicado de consistência de uma teoria T2, isso significa que não podemos expressar as relações da teoria maior simplesmente usando as ferramentas da teoria mais fraca. Isto é, não existe uma interpretação de T1 em T2. Por outro lado, nos casos em que temos uma teoria T ′ como uma extensão definível de T , então esperamos que seja possível expressar as relações de T usando as relações da teoria mais forte: T é interpretável em T ′. 2.3.1 Abordagem modelo-teorética pode ser enganadora na análise ontológica de teorias Geralmente, a força de uma teoria é associada com a ideia de que, se T1 implica a consistência de T2, podemos dizer que T1 é pelo menos tão forte quanto T2 (ou o comprometimento ontológico de T1 é maior que o de T2). Isso aparenta ser especialmente adequado quando analisamos as provas de consistência relativa semânticas2. Por exemplo, para um modelo M de uma teoria T1, se interpretamos semanticamente os objetos e relações diretamente a partir de M como objetos e relações de T2, podemos concluir que o comprometimento ontológico da segunda teoria é igual ou menor que o da primeira. 2 Comprometimento ontológico e consistência são provisoriamente considerados equivalentes por causa do teorema da completude de primeira ordem. Assim, precisamos clarificar duas suposições implícitas: estamos falando de modelos-conjuntos e nossa metateoria é alguma teoria dos conjuntos como ZF. Nesse contexto, consideramos a consistência sintática equivalente à existência de um modelo. Portanto, isso significa que podemos apenas falar a respeito de teorias necessariamente interpretáveis em ZF. Capítulo 2. Comprometimento ontológico em provas de consistência relativa 37 Entretanto, isso não é necessariamente verdadeiro. A negligência nesse assunto emerge da crença de que a abordagem modelo-teorética seria, em última instância, convertível a alguma interpretação em ZF. Contudo, isso pode não ser o caso para importantes teorias, como veremos no estudo da consistência relativa entre ZF e NBG. Frequentemente, o ponto de partida em uma prova de consistência é assumir a existência de um modelo-classe. Esse prematuro comprometimento ontológico (como se trata de um modelo-classe, não temos a garantia de que exista uma interpretação) pode obscurecer o comprometimento ontológico relativo no estudo de certas teorias. Por efeito de clarificação, tomemos duas teorias T1 e T2 em uma mesma linguagem: Suponhamos que essas teorias são demonstravelmente não equivalentes existem teoremas de T2 os quais não são demonstráveis em T1. É preciso ter disponíveis duas ferramentas para ser possível fazer a asserção de não equivalência: um conjunto de axiomas Σ; e um conjunto de regras de inferência R. De fato, precisamos adicionar suposições de modo a tornar possível qualquer afirmação a respeito da relação entre teorias. Por outro lado, consideremos que foi adicionado mais um axioma em Σ, formando Σ′. Suponhamos ainda que, na presença desse novo axioma, as teorias T1 e T2 se tornam equivalentes3. Nesse caso, forçamos a equivalência das teorias pela adição de demasiadas suposições em nossas ferramentas de análise. O mesmo pode ocorrer na análise do comprometimento ontológico relativo. A suposição de que exista um modelo-classe pode ofuscar a conclusão a respeito dessa questão. Notamos, portanto, que, se enfraquecemos nossas suposições de partida, podemos desvelar um comprometimento ontológico desbalanceado entre algumas teorias, antes ofuscado pelo excesso de ferramentas. Nessa direção, veremos que NBG não possui uma interpretação em ZF e, ao mesmo tempo, um modelo de ZF pode ser, com efeito, estendido a um modelo de NBG. Temos, nesse caso, um exemplo cujo enfraquecimento das suposições de análise revela um comprometimento ontológico mais forte de NBG em relação a ZF, quando a análise semântica obscurece essa diferença. 3 Um exemplo real para isso seria T1 como ZF1 (ZF sem o axioma da substituição e separação) e T2 como ZF2 (ZF sem substituição). O axioma espúrio da análise seria o axioma da substituição, o qual tornaria as duas teorias equivalentes se fosse tomado como um participante da análise (tomado, por exemplo, artificialmente como uma axioma lógico). Capítulo 2. Comprometimento ontológico em provas de consistência relativa 38 2.4 Análise ontológica relativa entre NBG e ZF Discutimos, até o momento, o uso de interpretações para reformular provas modeloteoréticas em procedimentos finitários. À frente, passamos pela ideia de que essa técnica é útil para um evitar o comprometimento realista; também mostramos como esse mesmo argumento pode ser usado para oferecer ao realista uma justificação para o conhecimento de modelos. Mais ainda, assertamos, que ao usarmos um modelo-classe em uma prova de consistência relativa, não temos garantias de que exista uma interpretação que suporte essa prova. Porém, para essa análise ser efetiva, é importante mostrar um exemplo relevante para essa falta de interpretação nesse tipo de aplicação. Esse exemplo é a não existência de interpretação entre NBG em ZF. 2.4.1 Prova semântica de equiconsistência de Novak (1950) Em Models of consistent systems (NOVAK, 1950), Novak afirma que NBG e ZF são equiconsistentes. Nesse artigo, ele faz uso de técnicas modelo-teoréticas para estender um dado modelo de ZF para um modelo de NBG. Com isso, Novak quer derivar que a consistência de ZF implicaria a consistência de NBG. Entretanto, como modelos de ZF ou NBG são necessariamente modelos-classe, alguém que identifique modelos com a sua interpretação a uma teoria dos conjuntos pode disputar a prova de equiconsistência de Novak. Ele requereria uma posterior explicação para o que significa a suposição inicial de que exista um modelo para ZF e como funciona de fato a extensão nesse caso. Para tornar esse resultado mais sólido, Novak teria de oferecer uma contraparte sintática para a prova através de interpretações. No seu artigo, Novak dá um tipo de fundamento para o seu uso de modelos, definindo o que ele chama de pseudomodelo. Ainda assim, ele reconhece que isso seria uma definição, em suas próprias palavras, muito "liberal"; em sua visão, contudo, isso seria suficiente para investigação de consistência. Nesse caso, obteríamos uma necessidade lógica ao invés de um procedimento explícito. Semanticamente, a extensão de um modelo M de ZF para um modelo M* de NBG segue a seguinte estratégia: 1. Todo conjunto de M representa o mesmo conjunto em M*. 2. Para toda fórmula φ com x como variável livre e na linguagem da extensão de Henkin para ZF, se não existe a ∈ M tal que M ⊢ ∀z(z ∈ a ↔ φ(z)), então adicionamos em Capítulo 2. Comprometimento ontológico em provas de consistência relativa 39 M o objeto pφq representando a classe {x|φ}. 3. Finalmente, definimos adequadamente as relações ∈ e = para esses novos objetos com os seguintes requerimentos: a) Se um objeto pertence a uma classe, então ele também é um conjunto. b) Classes são iguais quando suas fórmulas de referências são equivalentes em M. Na estratégia apresentada para estender um modelo de ZF a um modelo de NBG, notamos que NBG requereria a existência de outros objetos que não os do modelo de ZF. Porém, a partir disso não podemos derivar que o comprometimento ontológico de NBG seria maior que o de ZF. Suponhamos, por exemplo, o modelo dos números pares E definido usualmente para a soma e o produto. É fácil provar, nesse caso, que o modelo E é isomorfo ao dos números naturais N . O fato de removermos os números ímpares de N para obter E cria a ilusória sensação de que N teria "mais existência". Ainda assim, como esses modelos são isomórficos, as duas teorias são iguais, excetuando diferenças de nomenclatura. Em um sentido similar, não tomamos a adição da existência de classes como sinal de que NBG é mais comprometida ontologicamente que ZF. Para avaliar essa relação, precisamos analisar se é o caso que objetos de uma teoria podem ser compreendidos a partir de um processo de tradução dos objetos da outra teoria. Construímos um modelo para NBG adicionando novos objetos e relações em um modelo dado de ZF. No entanto, poderíamos ter feito esse mesmo processo internamente. Nesse caso, teríamos de fazer algumas modificações não muito naturais no modelo de ZF, como, por exemplo, "conjuntos em NBG não seriam exatamente os mesmos conjuntos em ZF". Consideraríamos, nesse caso, o conjunto a em NBG como o conjunto ⟨ω, a⟩ em ZF e enumeraríamos as fórmulas pθq nos ordinais finitos de ZF. Enfim, podemos, com efeito, reproduzir NBG no interior de um modelo de ZF. O sentido oposto é natural: podemos simplesmente excluir classes próprias. A partir disso, podemos dizer que a análise modelo-teorética endossa a ideia de que NBG e ZFC são do mesmo nível de comprometimento ontológico. 2.4.2 Framework simplificado para análise ontológica A suposição da existência de um modelo pode trazer demasiada presunção à análise ontológica. Em vista disso, percebemos que não devemos de equalizar o comprometimento ontológico de duas teorias T1 e T2 quando podemos reproduzir semanticamente uma na outra. Capítulo 2. Comprometimento ontológico em provas de consistência relativa 40 A partir da impossibilidade de reproduzir T1 em T2 junto com a possibilidade de reproduzir T2 em T1, devemos concluir que T1 tem um comprometimento ontológico mais forte que T2. Em um modelo da aritmética de Peano (PA), não podemos reproduzir as relações de ZF (mesmo semanticamente), embora ZF possa reproduzir todas as relações de PA. Baseado nisso, afirmamos que ZF tem maior comprometimento ontológico que PA. Por outro lado, um modelo de ZF pode expressar as relações de NBG e também NBG as de ZF, significando ser apenas provável que ambas tenham igual comprometimento. Suponhamos que temos um grupo de ferramentas para análise ontológica OT . Usando OT , podemos reproduzir uma teoria T1 em uma teoria T2, mas não podemos, com as mesmas ferramentas, reproduzir T2 em T1; concluímos que T2 tem maior comprometimento ontológico que T1. Em contraste, se temos que ambas teorias podem reproduzir as relações da outra com o maquinário de OT , temos apenas um resultado inconclusivo e a diferença de comprometimento ontológico pode ser obscurecida pelas suposições em OT . Se, por exemplo, tomamos OT como as técnicas modelo-teoréticas, não podemos ver a diferença de comprometimento ontológico da comparação entre NBG e ZF. Por outro lado, se tomamos OT como os métodos finitários de interpretação, a diferença entre essas teorias é revelada. NBG não é interpretável em ZF e, portanto, NBG possui maior comprometimento ontológico que ZF. De um ponto de vista semântico, alguém pode esperar que seja provável que exista uma interpretação de NBG em ZF. Entretanto, por redução ao absurdo, provaremos no próximo capítulo que isso não é possível: Teorema 1 Não existe interpretação de NBG em ZF. O argumento para esse teorema supõe a existência de uma interpretação de NBG em ZF. Em seguida, construiremos um modelo-conjunto (portanto, descritível por interpretação) para NBG. Contudo isso é um absurdo, uma vez que qualquer modelo para NBG é necessariamente um modelo-classe. Neste capítulo, iniciamos a investigação do comprometimento ontológico comparado entre teorias. Acentuamos que as ferramentas usadas para uma análise relativa podem contaminar a própria análise. Por causa disso, argumentamos que, para duas teorias T1 e T2, quando uma pode reproduzir a outra com tais ferramentas, a análise é inconclusiva. Porém, Capítulo 2. Comprometimento ontológico em provas de consistência relativa 41 quando é o caso que T1 reproduz T2, mas T2 não reproduz T1, então é possível concluir que T1 tem maior comprometimento ontológico que T2. Nessa direção, mostramos que, usando interpretações, a diferença de comprometimento ontológico entre ZF e NBG é revelada. Por um lado, ZF é interpretável em NBG; por outro lado, NBG não é interpretável em ZF. Ao mesmo tempo, uma análise semântica é cega para essa diferença. É importante mencionar que existe uma prova de consistência finitária entre NBG e ZF. Esse resultado foi obtido por Shoenfield (1954) e uma moderna e detalhada versão dessa prova será apresentada no próximo capítulo. Esse resultado nos instiga a pensar a respeito da relação entre a prova de consistência de Shoenfield e o resultado de que não há interpretação de NBG em ZF. Ambas as provas usam apenas noções finitárias e sintáticas e, não sem razão, poderíamos esperar que a prova finitária de equiconsistência seja sinal de que uma interpretação deva existir entre as teorias. Na prova de Shoenfield, a partir de uma contradição em NBG, somos capazes de construir uma contradição em ZF. Isso é sutilmente mais fraco que a ideia de que as relações e variáveis individuais em NBG podem ser traduzidas em relações de ZF. Tentaremos, nesse caminho, explorar o centro dessa diferença quando apresentada a prova de equiconsistência finitária e avaliaremos se é possível ampliar a noção de interpretabilidade de modo a incluir essa prova de consistência. Esperamos, assim, entender mais especificamente qual tipo de suposição em uma abordagem modelo-teorética ofusca as diferenças ontológicas entre NBG e ZF. 42 3 Relações de redução entre NBG e ZF Neste capítulo, apresentaremos uma revisão da prova de equiconsistência entre NBG e ZF modelo-teorética realizada por Novak (1950) e da prova finitária realizada por Shoenfield (1954). Em um segundo momento, provaremos que não existe uma interpretação de NBG em ZF. 3.1 Prova da equiconsistência por modelos A estratégia para a demonstração modelo-teorética segue os seguintes passos: 1. Supomos que ZF é consistente, isto é, ZF possui modelo classe; 2. Fazemos uma extensão maximal consistente de Henkin de ZF, obtendo ZF'; 3. Pelo teorema da completude de primeira ordem (SHOENFIELD, 1967, p. 43), existe um modelo classe para a extensão ZF'; 4. Sendo NBG' a teoria NBG na linguagem de ZF', definimos um modelo M para NBG' a partir da teoria ZF'; 5. Provamos que, de fato, M satisfaz todos os axiomas de NBG'. 6. Mostramos que o reduto de M para a linguagem de NBG satisfaz os axiomas de NBG. Inicialmente, tomemos N como a coleção de fórmulas de ZF' com apenas uma variável livre1. Além disso, definimos a relação ∼ entre duas fórmulas quaisquer em N . Definição 4 Para todo par de fórmulas α e β em N , dizemos que α ∼ β se, e somente se, ∀x(α(x) ↔ β(x)) está em ZF'. Fato 2 A relação ∼ é uma relação de equivalência em N . Definição 5 O símbolo pαq denota a coleção {β | β ∈ N ∧ β ∼ α}. Nesse caso, lemos o símbolo pαq como a classe de equivalência da fórmula α em N por ∼. 1 Em muitos momentos do texto a seguir, omitiremos que a fórmula suposta possui apenas uma variável livre, porquanto esperamos que o contexto das demonstrações deixe clara essa suposição. Capítulo 3. Relações de redução entre NBG e ZF 43 Sendo M a classe de todas as classes de equivalência em N por ∼ e Cons o conjunto de todas as constantes de ZF', definimos o modelo M = ⟨M,∈, Cons⟩: 1. pαq ∈ pβq se, e somente se, existe uma constante c em ZF' tal que ∀x(α(x) ↔ x ∈ c) e β(c) estão em ZF'. 2. cada constante c em Cons denota o objeto px ∈ cq. Mostraremos que M  NBG. Antes, contudo, demonstramos alguns fatos e lemas sobre o modelo M. Ressaltamos que esses lemas e fatos não são necessários para a realização da prova desejada; com efeito, os lemas a seguir provam mais do que é preciso para a equiconsistência. A decisão por demonstrar esses lemas tem como premissa a ideia de que, a partir deles, entendemos melhor o funcionamento do modelo M, porque ele é um bom candidato a modelo de NBG e como ele supera as dificuldades necessárias para satisfazer tais exigências. Lema 2 Dadas uma fórmula α e uma constante c em ZF', então M  α(px ∈ cq, pγq) se, e somente se, M  α(c, pγq).2 Prova. Provamos o lema para fórmulas α por indução na quantidade de símbolos lógicos. Hipótese de indução: Para toda fórmula α com menos de n símbolos lógicos, toda sequência de objetos pγq com número de termos maior ou igual ao número de variáveis livres de α e toda constante c, vale que M  α(px ∈ cq, pγq) se, e somente se, M  α(c, pγq). Caso α seja uma fórmula atômica, temos de analisar 3 casos e todos estes são obtidos como resultado direto da aplicação da definição das constantes no modelo. Seguidamente, tratamos os casos: 1. α(x, v) é ¬β(x, v): Aplicando a definição do modelo, temos que M  ¬β(px ∈ cq, pγq) se, e somente se, M 2 β(px ∈ cq, pγq) (1). Pela hipótese de indução, (1) é equivalente a M 2 β(c, pγq), que, por sua vez, é equivalente a M  ¬β(c, pγq). 2. α(x, v) é β(x, v) ∧ θ(x, v): Por definição, M  α(px ∈ cq, pγq) (2) se, e somente se, M  β(px ∈ cq, pγq) e M  θ(px ∈ cq, pγq). Então, pela hipótese de indução, obtemos que (2) é equivalente a M  β(c, pγq) e M  θ(c, pγq). Por fim, usamos a definição 2 Esse lema é da teoria de modelos, isto é, não se liga especificamente ao modelo M. Enunciamo-lo neste texto apenas porque o seu uso é importante na demonstração de equiconsistência. Capítulo 3. Relações de redução entre NBG e ZF 44 do modelo para recuperar a conjunção, concluindo que (2) vale se, e somente se, M  β(c, pγq) ∧ θ(c, pγq). 3. α(x, v) é ∃yβ(x, y, v): Sabemos que M  ∃yβ(px ∈ cq, y, pγq) se, e somente se, para alguma fórmula ψ, M  β(px ∈ cq, pψq, pγq) (3). Notamos que, se incluímos pψq na sequência, obtemos a fórmula β(px ∈ cq, ⟨pψq, pγq⟩), com um símbolo lógico a menos que α; assim, aplicando a hipótese de indução, concluímos que (3) é equivalente a M  β(c, ⟨pψq, pγq⟩). Seguidamente, reintroduzimos o existencial para o objeto pψq, obtendo que (3) é equivalente a M  ∃yβ(c, y, pγq) E isso finaliza o argumento indutivo.  Afirmação 1 Sendo c uma constante de ZF' e β uma fórmula de ZF' com uma variável livre, M  c ∈ pβq ⇐⇒ β(c) pertence a ZF'.3 Prova. Pela definição do modelo, M  c ∈ pβq se, e somente se, existe uma constante k de ZF' tal que ∀x(x ∈ c ↔ x ∈ k) e β(k) pertencem a ZF'. Além disso, pela extensionalidade em ZF e a substituição em ZF', ∀x(x ∈ c ↔ x ∈ k) pertence a ZF' ⇐⇒ c = k pertence a ZF'. Portanto, M  c ∈ pβq se, e somente se, existe k em ZF' tal que c = k e β(k) pertencem a ZF'. Então, pela igualdade em ZF', obtemos que β(c) pertence a ZF'.  Afirmação 2 Para toda constante c na linguagem de ZF', M  c ∈ V . Prova. Naturalmente, ∀x∃y(x ∈ y) é um teorema de ZF. Portanto, ∃y(c ∈ y) pertence a ZF' para alguma constante c. Então, pelo Afirmação 1, M  c ∈ p∃y(x ∈ y)q e, seguidamente, M  ∃x(c ∈ x) por introdução do existencial. Essa última fórmula é a forma não abreviada da expressão c ∈ V e, assim, temos a demonstração desejada.  Afirmação 3 Sendo c uma constante de ZF', então M  pαq ∈ c se, e somente se, existe uma constante k de ZF' tal que M  pαq = k e k ∈ c pertence a ZF'. 3 Em muitas passagens do texto, esse argumento será realizado implicitamente. Capítulo 3. Relações de redução entre NBG e ZF 45 Prova. A prova disso segue direto da aplicação da definição de pertencimento, igualdade e constante no modelo: M  pαq ∈ c se, e somente se, ∀x(α(x) ↔ x ∈ k) e k ∈ c pertencem a ZF'; M  pαq = px ∈ kq se, e somente se, ∀x(α(x) ↔ x ∈ k) está em ZF' e vale para qualquer constante M  k = px ∈ kq  Lema 3 M  pαq ∈ V se, e somente se, M  pαq = px ∈ cq, para alguma constante c. Prova. Pela definição, M  pαq ∈ V se, e somente se, existe uma fórmula β tal que M  pαq ∈ pβq e isso vale se, e somente se, existe uma constante c e uma fórmula β tal que ∀x(α(x) ↔ x ∈ c) e β(c) pertencem a ZF'. Mas ∀x(α(x) ↔ x ∈ c) pertence a ZF' se, e somente se, M  pαq = px ∈ cq. Portanto, M  pαq ∈ V implica M  pαq = px ∈ cq, para alguma constante c. Para a prova conversa, tomamos que M  pαq = px ∈ cq. Pelo Afirmação 2, M  c ∈ p∃y(x ∈ y)q, então, pela igualdade no modelo, concluímos que M  pαq ∈ p∃y(x ∈ y)q e, portanto, M  pαq ∈ V .  Lema 4 Para toda fórmula α em ZF, 1. M  ∀x ∈ V α(x) se, e somente se para toda sequência de constantes c em ZF', M  α(c); 2. M  ∃x ∈ V α(x) se, e somente se para alguma sequência de constantes c am ZF', M  α(c). Prova. (Item 1): É suficiente realizar o argumento para a sequência de variáveis x com apenas um elemento. Para generalizar o argumento, basta considerar a aplicação sucessiva do resultado para o caso com apenas uma variável. Por definição, M  ∀x ∈ V α(x) se, e somente se, para toda pβq ∈ V , M  α(pβq). (Prova Direta) Supomos o absurdo: para toda pβq ∈ V , M  α(pβq) e existe uma constante c tal que M 2 α(c). Logo, M 2 α(px ∈ cq). Mas, tomando β como x ∈ c, obtemos, pelo Lema 3, M  px ∈ cq ∈ V e, em seguida, pelo Lema 2, o absurdo M  α(c). Capítulo 3. Relações de redução entre NBG e ZF 46 (Prova conversa) Supomos o absurdo: para toda constante c, M  α(c) e existe uma pβq ∈ V tal que M 2 α(pβq). Pelo Lema 3, existe uma constante k tal que M  pβq = k; por isso, M 2 α(pβq) implica o absurdo M 2 α(k). Para a prova do (Item 2) o procedimento é muito semelhante.  Lema 5 Sendo α* o resultado da substituição de todas as quantificações do tipo Qx em uma sentença α por Qx ∈ V , α ∈ ZF ′ se, e somente se, M  α*. Prova. Fazemos a prova por indução na complexidade das fórmulas. 1. Caso atômico: a) α é c1 ∈ c2: pelo Lema 2, M  c1 ∈ c2 se, e somente se, M  px ∈ c1q ∈ px ∈ c2q e isso, por definição, é equivalente a c1 ∈ c2 pertencer a ZF'. b) α é c1 = c2: pelo Lema 2, M  c1 = c2 se, e somente se, M  px ∈ c1q = px ∈ c2q e isso, por definição, é equivalente a ∀x(x ∈ c1 ↔ x ∈ c2) pertencer a ZF'. Isto, pela extensionalidade em ZF', vale se, e somente se, c1 = c2 pertence a ZF'. 2. α é ¬β: porque ZF' é maximal consistente, ¬β pertence a ZF' se, e somente se, β não pertence a ZF'. Isto, pela hipótese de indução, é equivalente a M 2 β*, que, por definição, é equivalente a M  ¬β*. 3. α é β ∧ γ: como ZF' é maximal consistente, β ∧ γ pertence a ZF' é equivalente a β e γ pertencem a ZF'. Então, por hipótese de indução, concluímos que isto é equivalente a M  β* e M  γ* – ou seja, M  (β ∧ γ)*. 4. α é ∃xβ: pela construção de Henkin, sabemos que ∃xβ(x) pertence de ZF' se, e somente se, sendo c constante especial relativa a fórmula β(x), β(c) pertence a ZF'. Por hipótese de indução, isto é equivalente a M  β*(c); pelo Lema 2, M  β*(c) se, e somente se, M  β*(px ∈ cq). Então, pelo Lema 4, M  β*(px ∈ cq) é equivalente a M  ∃x ∈ V β*(x).  Com o Lema 5, mostramos que as fórmulas, quando relativizadas para o universo dos conjuntos V , conservam os teoremas de ZF'. Isso mostra que o modelo "preserva" as fórmulas Capítulo 3. Relações de redução entre NBG e ZF 47 que falam apenas sobre conjuntos e, portanto, devemos nos ocupar apenas com aquelas fórmulas que falam fundamentalmente sobre classes. No contexto da prova de conservatividade por modelos, isso significa dizer que a prova de satisfação por M dos axiomas do vazio, do par, da união, das partes e do infinito são corolários desse Lema, como veremos mais à frente. Lema 6 (Versão fraca do axioma-esquema para classes) Dada uma fórmula α com apenas uma variável livre x e cujos quantificadores são todos limitados a V , M  ∀x(x ∈ pαq↔ x ∈ V ∧ α(x)). Prova. É suficiente provar que, dada uma fórmula β arbitrária, é válido que M  pβq ∈ pαq se, e somente se, M  pβq ∈ V ∧ α(pβq). A prova será feita a seguir por indução na complexidade de α. (Observação: Negação da satisfação) Usando a definição do modelo, temos que M 2 pπq ∈ pψq se, e somente se, para toda constante c, se M  pπq = c, então ¬ψ(c) pertence a ZF'. 1. α é atômica: a) α é x ∈ c: Sabemos, pela definição das constantes no modelo, que M  pβq ∈ px ∈ cq se, e somente se, M  pβq ∈ c. Como pβq ∈ c implica pβq ∈ V , segue que M  pβq ∈ px ∈ cq se, e somente se, M  pβq ∈ V ∧ pβq ∈ c. b) α é c ∈ x: pela definição do modelo, M  pβq ∈ pc ∈ xq se, e somente se, existe uma constante d tal que (1) ∀x(x ∈ d ↔ β(x)) e c ∈ d pertencem a ZF'. Pela instanciação do universal para a constante c em (1), concluímos que β(c) e, disso, M  c ∈ pβq; por (1) e pelo Lema 3, podemos concluir que pβq ∈ V . c) α é x ∈ x: pela definição do modelo, M  pβq ∈ px ∈ xq se, e somente se, existe uma constante d tal que ∀x(x ∈ d ↔ β(x)) e d ∈ d pertencem a ZF'. Como d ∈ d não pertence a ZF', pelo axioma da fundação, então sabemos que M 2 pβq ∈ px = xq. Por outro lado, M  pβq ∈ pβq se, e somente se, existe uma constante d tal que (1) ∀x(x ∈ d ↔ β(x)) e (2) β(d) pertencem a ZF'. Segue, pela instanciação do universal em (1) para d e por (2), que d ∈ d pertence a ZF' – absurdo; e, portanto, (1) e (2) não podem ambas pertencerem a ZF', provando que M 2 pβq ∈ pβq. Isto é, ambos os lados da equivalência do lema são falsos para qualquer que seja o pβq. Capítulo 3. Relações de redução entre NBG e ZF 48 d) α é x = x: sabemos (1) M  pβq ∈ px = xq, é equivalente a existir uma constante d tal que (2) ∀x(x ∈ d ↔ β(x)) e d = d pertençam a ZF'. Como d = d pertence a ZF', independentemente da escolha de β, então (1) vale se, e somente se, existe d tal que (2) pertence a ZF' e isso, pelo Lema 3, é equivalente a M  pβq ∈ V . Uma vez que (3) ∀x(β(x) ↔ β(x)) pertence a ZF', independentemente de qual seja o β, então M  pβq = pβq. Concluímos, portanto, que (1) vale se, e somente se, M  pβq ∈ V ∧ pβq = pβq. 2. α(x) é ¬γ(x): (conversa) Supomos que M  ¬γ(pβq) e M  pβq ∈ V . Por definição, temos que M 2 γ(pβq) e, portanto, por hipótese de indução, M 2 pβq ∈ pγq. Segue, pela definição do modelo (usando a observação mencionada acima), que, para toda constante c, se ∀x(x ∈ c ↔ β(x)) pertence a ZF', então ¬γ(c) pertence a ZF'. Como M  pβq ∈ V implica na existência de uma constante k tal que ∀x(x ∈ k ↔ β(k)), então ¬γ(k) pertence a ZF'. Disso, concluímos que existe uma constante k tal que M  pβq = k e M  k ∈ p¬γq. Por fim, concluímos que M  pβq ∈ p¬γq. (direta) Naturalmente, pelos Lema 3 e Afirmação 2, M  pβq ∈ p¬γq implica M  pβq ∈ V e M  pβq = px ∈ cq para alguma constante c. Além disso, por hipótese de indução, temos que, para toda constante k, γ(k) pertence a ZF' se, e somente se, M  γ(px ∈ kq). Como, de M  pβq ∈ p¬γq, obtemos que γ(c) não pertence a ZF', então M 2 γ(px ∈ cq) e, portanto, M  ¬γ(pβq). 3. α(x) é γ(x) ∧ θ(x): (conversa) Supomos que M  pβq ∈ V ∧γ(pβq)∧θ(pβq). Por definição, M  pβq ∈ V ∧ γ(pβq) e M  pβq ∈ V ∧ θ(pβq). Segue, pela hipótese de indução, que M  pβq ∈ pγq e M  pβq ∈ pθq. Logo, temos que existe uma constantes c tal que ∀x(x ∈ c ↔ β(x)), γ(c) e θ(c) pertencem a ZF'. Disso, concluímos que γ(c) ∧ θ(c) pertence a ZF' e, novamente pela definição do modelo, obtemos que M  pβq ∈ pγ(x) ∧ θ(x)q. (direta) Por M  pβq ∈ pγ(x) ∧ θ(x)q, temos que M  pβq ∈ V , M  pβq = c e γ(c)∧θ(c) pertence a ZF'. Por isso, obtemos que γ(c) e θ(c) pertencem a ZF' e, portanto, M  γ(pβq) e M  θ(pβq). 4. α(x) é ∃y ∈ V γ(y, x): (conversa) Supomos que M  ∃y ∈ V γ(y, pβq) e M  pβq ∈ V . Segue, pelo Lema 3, que existe uma constante c tal que M  γ(px ∈ cq, pβq). E, pelo Lema 2, temos que M  γ(c, pβq). Como a fórmula γ(c, x) tem apenas uma variável livre e menos símbolos lógicos que α(x), podemos aplicar a hipótese de indução, obtendo M  pβq ∈ pγ(c, x)q. Capítulo 3. Relações de redução entre NBG e ZF 49 Então, usando a definição do modelo, obtemos que, para uma constante k, ∀x(x ∈ k ↔ β(x)) (1) e γ(c, k) (2) pertencem a ZF'. Em ZF', podemos concluir, a partir de (2), que ∃y(∃z(y ∈ z) → γ(y, k)), cuja a forma abreviada é ∃y ∈ V (γ(y, k)) (3). De (1) e (3), obtemos que M  pβq ∈ p∃y ∈ V (γ(y, x))q. (direta) Supomos M  pβq ∈ p∃y ∈ V (γ(y, x))q. Disso concluímos que M  pβq ∈ V , M  pβq = c e ∃y ∈ V (γ(y, c)) pertence a ZF'. Da última, obtemos, para alguma constante k, γ(k, c) em ZF'. Segue que M  pβq ∈ pγ(k, x)q. Assim, pela hipótese de indução, obtemos que M  γ(k, pβq). Portanto, pelo Lema 4, concluímos que M  ∃y ∈ V γ(y, pβq).  Os Lema 4, Lema 2 e Lema 6 são de fundamental importância para solidificar o entendimento da prova de equiconsistência. É a partir dessas ideias que vamos provar que M satisfaz o axioma-esquema para classes. Toda vez que instanciamos uma quantificação restrita a V na linguagem de NBG para um objeto pαq (Lema 4), podemos obter uma fórmula equivalente (Lema 2) cujo objeto é substituído por alguma constante de ZF'; e isso é a base para a redução do caso geral do axioma-esquema de classes para o caso apresentado como versão fraca do axioma no Lema 6 (isso será observado em detalhes na prova do axioma mais à frente no texto). É aqui também que percebemos porque é necessário realizar a extensão maximal de ZF antes de compor o modelo. Caso não fosse realizada a extensão, seria preciso restringir a definição do modelo de modo que o Lema 4 perderia validade e, nesse caso, não poderíamos reduzir o Lema 6 (pela mesma estratégia) ao axioma-esquema para classes. 3.2 Prova da satisfação dos axiomas de NBG' Seguimos agora com a prova de que o modelo M satisfaz cada um dos axiomas de NBG. Inicialmente, provamos o seguinte lema, o qual agrupa (junto com o Lema 5) a demonstração de satisfação pelo modelo dos axiomas do vazio, do par, da união, das partes e do infinito: Lema 7 Para toda α em ZF', a fórmula 1. QyQ1x1 . . . Qnxn(y ∈ z ↔ y ∈ V ∧ α) é logicamente equivalente a Qy ∈ VQ1x1 . . . Qnxn(y ∈ z ↔ α); Capítulo 3. Relações de redução entre NBG e ZF 50 2. QyQ1x1 . . . Qnxn(y ∈ z → α) é logicamente equivalente a Qy ∈ VQ1x1 . . . Qnxn(y ∈ z → α). 3. QyQ1x1 . . . Qnxn(y ∈ z ∧ α) é logicamente equivalente a Qy ∈ VQ1x1 . . . Qnxn(y ∈ z ∧ α). Prova. A demonstração desse lema segue tautologicamente do fato de que y ∈ z → ∃x(y ∈ x) é uma tautologia (a forma abreviada desta fórmula é y ∈ z → y ∈ V ). Dado que A → B é tautológico, enunciamos explicitamente as equivalências: 1. A ↔ (C ∧B) é tautologicamente equivalente a B → (A ↔ C) e, portanto, dado que y ∈ z → y ∈ V , (y ∈ z ↔ y ∈ V ∧ α) ⇐⇒ y ∈ V → (y ∈ z ↔ α) 2. A → C é tautologicamente equivalente a B → (A → C) e, portanto, dado que y ∈ z → y ∈ V , (y ∈ z → α) ⇐⇒ y ∈ V → (y ∈ z → α) 3. A ∧ C é tautologicamente equivalente a B → (A ∧ C) e, portanto, dado que y ∈ z → y ∈ V , (y ∈ z ∧ α) ⇐⇒ y ∈ V (y ∈ z ∧ α)  O que se quer dizer com esse lema é a ideia de que, quando temos uma bi-implicação, implicação ou conjunção na qual uma das variáveis quantificadas ocorre do lado esquerdo de uma relação de pertencimento, (x ∈ ..), então a relativização para V desta variável é logicamente obtida; assim, poderíamos substituir "sem efeitos" a axiomatização de NBG, trocando (quando satisfeitas as condições do lema) os axiomas sem a relativização por axiomas relativizados. Com efeito, essa construção é comum a alguns dos axiomas de ZF e NBG; mais ainda, a ideia desse lema aparece implicitamente na prova de alguns dos lemas da seção anterior e nas demais demonstrações que se seguem. Poderíamos ter feito essa troca na apresentação de NBG, omitindo essa análise e evitando a prova de equivalência – porém, decidimos manter a axiomatização proposta por (MURAWSKI; MICKIEWICZ, 2004). Axioma para existência de Classes Proposição 1 M  ∃x∀y(y ∈ V → y ∈ x) Capítulo 3. Relações de redução entre NBG e ZF 51 Prova. Pelo Lema 3, se uma fórmula β é tal que M  pβq ∈ V , então existe uma constante c em ZF' para a qual vale M  pβq = px ∈ cq. Como ∀x(x ∈ c ↔ x ∈ c) e c = c pertencem a ZF', então M  c ∈ px = xq. Segue, portanto, que M  pβq ∈ px = xq. Ou seja, para toda fórmula β, M  pβq ∈ V → pβq ∈ px = xq. E, disso, decorre que M  ∃x∀y(y ∈ V → y ∈ x).  Axioma do Vazio Proposição 2 M  ∃x(∀y(y /∈ x) ∧ ∃z(x ∈ z)) Prova. Uma vez que não existe uma constante c em ZF' tal que c = c pertence a ZF', então M  pαq /∈ px = xq. Logo, M  ∀y(y /∈ px = xq). O vazio em ZF' é representado pela constante φ. Nesse caso, as fórmulas ∀x(x = x ↔ x ∈ φ) e ∀z(z /∈ φ) pertencem a ZF'. Por isso, M  px = xq ∈ p∀z(z /∈ x)q e, portanto, M  ∃z(px = xq ∈ z)).  Axioma do Par Proposição 3 M  ∀x ∈ V ∀y ∈ V ∃z ∈ V ∀u(u ∈ z ↔ u = x ∨ u = y) Prova. Pelo Lema 7, ∀x ∈ V ∀y ∈ V ∃z ∈ V ∀u(u ∈ z ↔ u = x ∨ u = y) é equivalente a ∀x ∈ V ∀y ∈ V ∃z ∈ V ∀u ∈ V (u ∈ z ↔ u = x ∨ u = y). Logo, como, pelo Lema 5, M  ∀x ∈ V ∀y ∈ V ∃z ∈ V ∀u ∈ V (u ∈ z ↔ u = x ∨ u = y), segue o resultado.  A prova para os axiomas da União e das Partes é bastante similar à prova do axioma do par. Axioma da União Proposição 4 M  ∀x ∈ V ∃y ∈ V ∀u(u ∈ y ↔ ∃v(u ∈ v ∧ v ∈ x)) Axioma das Partes Capítulo 3. Relações de redução entre NBG e ZF 52 Proposição 5 M  ∀x ∈ V ∃y ∈ V ∀u(u ∈ y ↔ u ⊆ x) Axioma do Infinito Proposição 6 M  ∃x ∈ V (∅ ∈ x ∧ ∀u ∈ x∀v ∈ x(u ∪ {v} ∈ x)) Prova. Pelo axioma do infinito em ZF', sabemos que existe uma constante w, tal que ∅ ∈ w ∧ ∀u ∈ w∀v ∈ w(u ∪ {v} ∈ w) (1) pertence a ZF'. Por definição e pela Afirmação 3, M  ∀u ∈ w∀v ∈ w(u ∪ {v} ∈ w) se, e somente se, existem c e k tais que, se c ∈ w e k ∈ w pertencem a ZF', então c ∪ {k} ∈ w pertence a ZF'. Supondo que c ∈ w e k ∈ w pertencem a ZF', c ∪ {k} ∈ w pertence a ZF' segue diretamente da aplicação de (1) e, portanto, vale M  ∀u ∈ w∀v ∈ w(u ∪ {v} ∈ w). O fato de que M  ∅ ∈ w segue direto de (1) e da definição do modelo. Assim, temos que M  ∅ ∈ w ∧ ∀u ∈ w∀v ∈ w(u ∪ {v} ∈ w)). Disso, segue a demonstração por introdução do existencial.  Axioma da Substituição para Classes Proposição 7 M  ∀x ∈ V ∀r(func(r) → ∃y ∈ V ∀u(u ∈ y ↔ ∃v ∈ x((v, u) ∈ r))) Prova. Provaremos essa proposição ajustando-a ao mecanismo dos Lema 5 e Lema 7. Isso funciona precisamente porque o lado direito da implicação no axioma da substituição para classes está na forma descrita no Lema 7. Para quaisquer fórmulas β e α, temos a seguinte equivalência pelo Lema 5: ∃y∀u(u ∈ y ↔ ∃v ∈ c(α(⟨v, u⟩))) pertence a ZF' se, e somente se, M  ∃y ∈ V ∀u ∈ V (u ∈ y ↔ ∃v ∈ c(α(⟨v, u⟩))). Isso, por sua vez, pelo Lema 6, é equivalente a M  ∃y ∈ V ∀u ∈ V (u ∈ y ↔ ∃v ∈ c(⟨v, u⟩ ∈ pα(x)q)) 4. 4 A condição ⟨v, u⟩ ∈ V é vácua, porquanto se refere a um termo construído a partir de constantes em ZF'. Desse modo, existe uma constante especial k instância ⟨v, u⟩ e, pela Afirmação 2, k ∈ V . Capítulo 3. Relações de redução entre NBG e ZF 53 Usando ideia similar, pelos Lema 5 e Lema 7, obtemos que ∀x∀z∀y(α(⟨x, y⟩) ∧ α(⟨z, y⟩) → x = z) pertence a ZF' se, e somente se, M  ∀x ∈ V ∀z ∈ V ∀y ∈ V (α(⟨x, y⟩) ∧ α(⟨z, y⟩) → x = z) e, pelo Lema 6, a última é equivalente a M  ∀x ∈ V ∀z ∈ V ∀y ∈ V (⟨x, y⟩ ∈ pα(x)q ∧ ⟨z, y⟩ ∈ pα(x)q→ x = z), cuja forma abreviada é M  func(pαq). A partir das duas equivalências, obtemos tautologicamente que ∀x∀z∀y(α(⟨x, y⟩) ∧ α(⟨z, y⟩) → x = z) → ∃y∀u(u ∈ y ↔ ∃v ∈ c(α(⟨v, u⟩))) pertence a ZF' (1) se, se somente se, M  func(pαq) → ∃y ∈ V ∀u ∈ V (u ∈ y ↔ ∃v ∈ c(⟨v, u⟩ ∈ pα(x)q)). Uma vez que (1) é precisamente o axioma da substituição para conjuntos em ZF' instanciado para a constante c, então obtemos M  func(pαq) → ∃y ∈ V ∀u ∈ V (u ∈ y ↔ ∃v ∈ c(⟨v, u⟩ ∈ pα(x)q)). Disso, pelo Lema 7, pela introdução do universal e pelo Lema 4, obtemos o resultado desejado.  A seguir, provamos o axioma esquema para classes, que descreve a fundamental diferença entre NBG e ZF. Com efeito, os lemas desse capítulo foram estruturados de forma a tornar esta demonstração a mais natural possível. Axioma esquema para classes Proposição 8 Se θ é uma fórmula com variáveis livres x, v1, v2, . . . , vn e todos os seus quantificadores estão relativizados para V, isto é, todo quantificador aparece da forma ∀xi ∈ V ou ∃xi ∈ V , então M  ∀v ∈ V ∃z∀x(x ∈ z ↔ (x ∈ V ∧ θ(x, v))). Prova. Dada uma fórmula θ com as variáveis livres x, v1, v2, . . . , vn (v) e todos os seus quantificadores estão relativizados para V, tomamos uma sequência qualquer de constantes c1, c2, . . . , cn (c). Como a fórmula x ∈ V ∧ θ(x, c) possui apenas x como variável livre, então, pelo Lema 6, obtemos M  ∀x(x ∈ pθ(x, c)q ↔ (x ∈ V ∧ θ(x, c)). Aplicando a introdução do Capítulo 3. Relações de redução entre NBG e ZF 54 existencial nessa fórmula, concluímos que M  ∃z∀x(x ∈ z ↔ (x ∈ V ∧ θ(x, c))). Como as constantes consideradas são quaisquer, podemos aplicar o Lema 4, obtendo M  ∀v ∈ V ∃z∀x(x ∈ z ↔ (x ∈ V ∧ θ(x, v))).  Extensionalidade Proposição 9 M  ∀z∀y(∀x(x ∈ y ↔ x ∈ z) → y = z). Prova. Sendo α e β duas fórmulas quaisquer, supomos que M  ∀x(x ∈ pαq↔ x ∈ pβq). Pelo Lema 7, concluímos que M  ∀x ∈ V (x ∈ pαq↔ x ∈ pβq) e, pelo Lema 6, M  ∀x ∈ V (α(x) ↔ β(x)). Então, pelo Lema 4, para toda constante c, M  (α(c) ↔ β(c)). Disso, pelo Lema 6, segue que M  (c ∈ pα(x) ↔ β(x)q) e, pela Afirmação 1, temos que, para toda constante c, α(c) ↔ β(c) pertence a ZF'. Se ∃x(α(x) ∧ ¬β(x)) pertence a ZF', então existe uma constante k especial tal que α(k) ∧ ¬β(k) – absurdo, pois α(k) ↔ β(k). Portanto, como ZF' é maximal consistente, ¬∃x(α(x)∧¬β(x)) (1) pertence a ZF'. Notadamente, (1) é logicamente equivalente a ∀x(α(x) → β(x)), então, analogamente, obtemos que ∀x(β(x) → α(x)) pertence a ZF'. Unindo esses dois resultados, obtemos que ∀x(α(x) ↔ β(x)) pertence a ZF'. Isso, pela definição do modelo, é equivalente a Capítulo 3. Relações de redução entre NBG e ZF 55 M  pαq = pβq. Supomos M  ∀x(x ∈ pαq↔ x ∈ pβq) e obtemos M  pαq = pβq. Então M  ∀x(x ∈ pαq↔ x ∈ pβq) → pαq = pβq. Por fim, como α e β são fórmulas quaisquer, concluímos que M  ∀z∀y(∀x(x ∈ y ↔ x ∈ z) → y = z)  Axioma da Fundação Proposição 10 M  ∀x(x = ∅ → ∃y ∈ x(x ∩ y = ∅)) Antes de demonstrarmos a validade do modelo para esse axioma, provamos que vale o axioma da fundação adaptado para fórmulas em ZF'. Lema 8 Para toda fórmula β em ZF', se ∃xβ(x) vale em ZF', então existe uma constante c em ZF' tal que β(c) ∧ ¬∃x(x ∈ c ∧ β(x)) pertence a ZF'. Prova. Supondo que β é tal que ∃xβ(x) pertence a ZF', e sendo cβ uma constante especial relativa à fórmula β, então β(cβ) pertence a ZF'. Notadamente, existe um ordinal a tal que cβ ∈ Va. Mais ainda, sabemos que existe o conjunto A definido por {x|x ∈ Va ∧β(x)}. Assim, pelo axioma da fundação em ZF, vale que A = φ → ∃y(y ∈ A ∧ ¬∃x(x ∈ A ∧ x ∈ y)). e, como cβ ∈ A, então A = φ; logo ∃y(y ∈ A ∧ ¬∃x(x ∈ A ∧ x ∈ y)). Sendo c a constante especial da fórmula y ∈ A ∧ ¬∃x(x ∈ A ∧ x ∈ y), vale em ZF' que c ∈ A ∧ ¬∃x(x ∈ A ∧ x ∈ c) Além disso, temos em ZF' que x ∈ c → x ∈ Va, pois c ∈ A; portanto, (x ∈ A ∧ x ∈ c) ↔ (x ∈ c ∧ β(x)). Capítulo 3. Relações de redução entre NBG e ZF 56 E, como c ∈ A → β(c), segue que β(c) ∧ ¬∃x(x ∈ c ∧ β(x)) pertence a ZF'.  Prova. (Proposição 10) Dada uma fórmula β em ZF' tal que ∃xβ(x) pertence a ZF', então vale em ZF' pelo Lema 8 que β(c) ∧ ¬∃x(x ∈ c ∧ β(x)) para alguma constante c. Em particular, vale que px ∈ cq ∈ pβq em M, pela Afirmação 1. Supomos o absurdo de que existe uma fórmula γ tal que M  pγq ∈ pβq ∧ pγq ∈ px ∈ cq. Temos, nesse caso, que existe uma constante k tal que k ∈ c∧β(k) pertence a ZF'. Portanto, ∃x(x ∈ c ∧ β(x)) pertence a ZF', pelo axioma da substituição (lógica). Absurdo, porque ¬∃x(x ∈ c ∧ β(x)) pertence a ZF'. Logo não existe γ tal que M  pγq ∈ pβq e M  pγq ∈ px ∈ cq. Nesse caso, obtemos que M  ¬∃x(x ∈ pβq ∧ x ∈ px ∈ cq) e, seguidamente, que M  pβq ∩ px ∈ cq = φ. Como px ∈ cq ∈ pβq vale no modelo, concluímos que M  ∃y ∈ pβq(y ∩ pβq = φ). Sabemos que a suposição inicial {∃xβ(x) pertence a ZF'} é equivalente a {M  pβq = φ}. Dessa forma, podemos concluir que, para toda fórmula β, M  pβq = φ → ∃y ∈ pβq(y ∩ pβq = φ), e, portanto, M  ∀x(x = ∅ → ∃y ∈ x(x ∩ y = ∅)).  3.3 Prova finitária de equiconsistência A prova finitária de equiconsistência entre NBG e ZF foi fornecida por Shoenfield (1954) no artigo "A relative consistency proof". Esse artigo é escrito na linguagem do Principia Mathematica (Whitehead e Russell) e faz uso extensivo das técnicas desenvolvidas no Grundlagen der Mathematik (Hilbert e Bernays). Por essa razão, o desenvolvimento desta seção se deu por uma escavação, uma engenharia reversa, na qual as ferramentas utilizadas eram Capítulo 3. Relações de redução entre NBG e ZF 57 desvendadas pelas pistas deixadas no artigo. Além disso, a mudança do sistema axiomático traz diversas dificuldades adicionais e, em muitos momentos, a prova muda completamente. Vamos expor a técnica usada para a prova de equiconsistência. Antes, porém, precisamos retomar a técnica da prova finitária do teorema de Herbrand. Para isso, passaremos pelas definições necessárias, em seguida, enunciaremos o teorema de Hilbert-Ackermann e, por fim, a parte necessária da estratégia de demonstração do teorema de Herbrand. Definição 6 Uma fórmula α é aberta quando todas as variáveis que ocorrem na fórmula são livres. Definição 7 Uma teoria T é aberta quando todos os seus axiomas são fórmulas abertas. Definição 8 α é uma quasi-tautologia ⇐⇒ α é consequência tautológica de axiomas de igualdade e identidade. Teorema 2 (Hilbert-Ackermann) Uma teoria aberta T é inconsistente ⇐⇒ existe uma quasi-tautologia α igual a ¬β1 ∨ ¬β2 ∨ . . . ∨ ¬βk, tal que βi é uma instância dos axiomas de T . A prova desse teorema é feita finitariamente em Shoenfield (1967, p. 48 52). É importante conhecer esse teorema porquanto ele é equivalente ao teorema de Herbrand para o caso existencial, como veremos adiante. Definição 9 Sendo Q um dos quantificadores ∀ ou ∃, então uma fórmula prenexa é da forma: Qx1Qx2 . . . Qxnθ, com θ sendo uma fórmula aberta. Chamamos θ de a matriz de Qx1Qx2 . . . Qxnθ. Notação 1 Usamos o sobrelinhado (v) para indicar sequências finitas de comprimento qualquer (v1, v2, . . . , vn), maior ou igual a zero (n). Podemos escrever a fórmula prenexa, sem perda de generalidade, com os quantificadores explícitos ∀ e ∃, ao invés de usarmos o quantificador implícito Q. A fórmula geral tem o seguinte formato: Capítulo 3. Relações de redução entre NBG e ZF 58 ∃z1∀y1 . . . ∃zk∀yk θ[x, z1, y1, . . . , zk, yk], sendo x a sequência de variáveis livres na matriz θ. Usar essa forma simplificará nossa notação porque, na prova do teorema de Herbrand, o tratamento das quantificações existenciais e universais são diferentes. Definição 10 Uma fórmula α é existencial quando α é uma fórmula prenexa da forma ∃x1∃x2 . . . ∃xnθ, com θ sendo uma fórmula aberta. Para as fórmulas prenexas, vale o seguinte teorema: Teorema 3 Para qualquer fórmula α, existe uma α′, de modo que: 1. α′ é uma fórmula prenexa; 2. ⊢ α ↔ α′; 3. α′ é obtida por um procedimento recursivo primitivo; Chamamos α′ a forma prenexa de α. A seguir vamos expor a forma normal de Herbrand. Ela pode ser entendida como a representação de uma fórmula qualquer por uma fórmula existencial através de um procedimento de eliminação dos quantificadores universais. Tal eliminação se dá pela introdução de símbolos de função na linguagem. Definição 11 (forma normal de Herbrand) Sendo α uma fórmula qualquer, construímos αH através do seguinte procedimento recursivo primitivo: 1. α0 é a forma prenexa de α; 2. Se αi é uma fórmula existencial, então αH é αi; 3. Se αi é da forma ∃x1∃x2 . . . ∃xn∀yγ, introduzimos um novo símbolo de função f , tal que: αi+1 é ∃x1∃x2 . . . ∃xnγy(f(x1, x2, . . . , xn)). Se αi é da forma ∀yγ, introduzimos um novo símbolo de constante c, tal que: αi+1 é γy(c); Capítulo 3. Relações de redução entre NBG e ZF 59 De modo geral, podemos representar a forma normal de Herbrand da fórmula prenexa ∃z1∀y1 . . . ∃zk∀yk θ[x, z1, y1, . . . , zk, yk], por ∃z1 . . . ∃zk θ[x, z1, f1(z1), . . . , zk, fk(z1, . . . , zk)]. . Teorema 4 (Herbrand) Seja T uma teoria sem axiomas não lógicos cuja linguagem é L. Então, para toda fórmula prenexa α em L, vale: ⊢T α na linguagem L ⇐⇒ existe uma quasi-tautologia β1 ∨ β2 . . . ∨ βk, na qual, para todo i, βi é uma instância da matriz de αH . Prova. (Estratégia detalhada) O procedimento de prova do teorema de Herbrand segue as seguintes etapas: 1. Caso α seja uma fórmula existencial, o teorema vale como corolário do teorema de Hilbert-Ackermann: Suponha que α seja da forma ∃x1∃x2 . . . ∃xnβ, com β uma fórmula aberta. Nesse caso, ¬α é logicamente equivalente a ∀x1∀x2 . . . ∀xn¬β. Assim, T ⊢ ¬α ↔ ¬β. Por isso, ⊢T α ⇐⇒ a teoria {¬β} for inconsistente. Pelo teorema de HilbertAckermann, pois {¬β} é uma teoria aberta, {¬β} é inconsistente ⇐⇒ existe uma quasi-tautologia ¬(¬β1) ∨ ¬(¬β2) ∨ . . . ∨ ¬(¬β1), com βi instâncias de β para todo i. Mas isto é equivalente a β1 ∨ β2 ∨ . . . ∨ β1, finalizando a demonstração. 2. Tomamos, para o caso geral, uma fórmula prenexa α na linguagem de L ∃z1∀y1 . . . ∃zk∀yk θ[x, z1, y1, . . . , zk, yk]. 3. Sendo LH a linguagem L estendida pela adição das funções introduzidas na construção de αH e TH uma teoria sem axiomas não lógicos cuja linguagem é LH , devemos provar que: ⊢T α ⇐⇒ ⊢TH αH . 4. Como αH é uma fórmula existencial, obtemos a quasi-tautologia para a lógica na linguagem LH. Assim, Capítulo 3. Relações de redução entre NBG e ZF 60 ⊢T α ⇐⇒ ⊢TH αH ⇐⇒ existe uma quasi-tautologia com instâncias de αH Por essa razão, a prova do item 3 termina a demonstração. 5. Para a prova do item 3, mostraremos somente a estratégia para a prova conversa, ou seja, T ⊢ α ⇐ T ′ ⊢ αH , já que a prova direta é relativamente simples. 6. Sendo Tc a extensão de Henkin de T , no sentido de Shoenfield (1967, p. 46), e sendo Tc+eq a adição dos axiomas de equivalência5 de Herbrand (SHOENFIELD, 1967, p. 52) em Tc, demonstra-se que: a) Tc é extensão conservativa de T . b) Tc+eq é extensão conservativa de Tc Esses dois fatos serão importantes para os passos seguintes. 7. Supomos, portanto, que existe uma quasi-tautologia β1 ∨ β2 . . . ∨ βq em LH, com βi instância da matriz de αH . Faremos um procedimento de substituição das funções introduzidas para obtenção de αH por constantes introduzidas em Lc. Mais especificamente, se αH é da forma θ[x, z1, f1(z1), . . . , zk, fk(z1, . . . , zk)] e βi é da forma θ[t, u1, f1(u1), . . . , uk, fk(u1, . . . , uk)], definimos as sequências de constantes especiais d(u1), d(u1, u2), . . . , d(u1, . . . , uk) introduzidas para eliminação das funções da seguinte maneira: Notação 2 a) z i→ é a sequência de termos da sequência z a partir do termo de índice i; b) z i→j é a sequência de termos da sequência z a partir do termo de índice i até o termos de índice j; c) (z)i é o i'ésimo termo da sequência z; A constante (d(u1))i é a constante especial referente à fórmula 5 Se c1 e c2 são constantes especiais das fórmulas ∃xα1(x) e ∃xα2(x), então o axioma de equivalência em relação a essas constantes é ∀x(α1(x) ↔ α2(x)) → c1 = c2. Capítulo 3. Relações de redução entre NBG e ZF 61 ∃(y1)i(¬∀y1 (i+1)→∃z2∀y2 . . . ∃zk∀yk θ[t, u1,d(u1) 1→(i−1) , f1(z1) i→ , *]), sendo * uma abreviação para indicar o restante da sequência u2, f2(u1), . . . , uk, fk(u1, . . . , uk). E, de modo geral, (d(u1, u2, . . . , ui))j é a constante especial referente à fórmula ∃(yi)j(¬∀yi (j+1)→∃zi+1∀yi+1 . . . ∃zk∀yk θ[t, *,d(u1, . . . , ui) 1→(j−1) , f1(zi) j→ , *]). Com a sucessiva aplicação do axioma da substituição e do modus ponens, obtemos que, se β′i é a fórmula θ[t, u1, d1(u1), . . . , uk, dk(u1, . . . , uk)], então ⊢Tc+eq β′i → α. 8. Notemos que nos termos u podem ocorrer variáveis. Contudo, para garantir o uso das propriedades dos axiomas de equivalência em Tc+eq, precisamos que todas as variáveis sejam substituídas por constantes especiais. Isso será necessário para a finalização da prova. Por isso, fazemos uma segunda transformação na quasi-tautologia. Aqui os axiomas de equivalência cumprem um papel importante: eles garantem que quaisquer duas fórmulas equivalentes tenham como referência uma única constante6. Com a adição apenas dos axiomas especiais, não temos essa garantia, uma vez que poderíamos ter dois elementos distintos satisfazendo uma mesma fórmula da forma ∃xα. Introduzimos constantes especiais quaisquer e distintas para cada variável de u, obtendo u′. Em seguida, provamos, usando os axiomas especiais de equivalência, que ⊢Tc+equ1 = u1′ → d(u1) = d(u1′) ⊢Tc+equ1 = u1′ ∧ u2 = u2′ → d(u1, u2) = d(u1′, u2′) ... ⊢Tc+equ1 = u1′ ∧ uk = uk ′ → d(u1, . . . , uk) = d(u1′, . . . , uk ′) 6 Perceber essa característica foi fundamental para estabelecer a relação entre as técnicas usadas no artigo de prova de consistência de Shoenfield (1954) e as técnicas apresentadas no livro Grundlagen der Mathematik (HILBERT; BERNAYS, 1968). Nesse artigo, anterior ao seu livro-texto de lógica matemática (SHOENFIELD, 1967), Shoenfield faz uso do épsilon cálculo de Hilbert como forma de garantir a unicidade das constantes especiais. Na forma mais moderna de tratar essa relação, fazemos a introdução conservativa de axiomas de equivalência. Capítulo 3. Relações de redução entre NBG e ZF 62 9. Usamos, então, o procedimento descrito em Shoenfield (1967, p. 55) para obter a fórmula β′′1 ∨ β′′2 . . . ∨ β′′q , sendo β′′i a substituição das funções e das variáveis introduzidas pelas constantes especiais mostradas acima. Lembramos que essa segunda transformação garante que ⊢Tc+eq β′′i → α pelo mesmo procedimento do item 7. Supondo que C1, C2, . . . , Cm é a sequência da prova da quasi-tautologia que usa apenas axiomas de identidade e igualdade em T , prova-se que a transformação que levou β1 ∨ β2 . . . ∨ βk a se tornar β′′1 ∨ β′′2 . . . ∨ β′′k preserva tautologicamente a sequência. Então, β′′1 ∨ β′′2 . . . ∨ β′′k é consequência tautológica de C ′′1 , C ′′2 , . . . , C ′′m. Resta provar que cada C ′′i é teorema de Tc+eq, quando Ci é um axioma de T , para obtermos a prova de β′′1 ∨ β′′2 . . . ∨ β′′k em Tc+eq. Nesse caso, cada Ci é um axioma de igualdade, identidade ou instância de axioma de igualdade ou identidade. Notamos que, quando obtemos C ′′i , transformamos Ci em axiomas de igualdade ou identidade, a não ser que Ci seja uma instância de um axioma de identidade. Este último, porém, é facilmente provado em Tc+eq a partir dos proposições mostradas no fim do item anterior. 10. Como ⊢Tc+eq β′′1 ∨ β′′2 . . . ∨ β′′k e ⊢Tc+eq β′′i → α, então ⊢Tc+eq α. 11. Como Tc+eq é extensão conservativa da lógica em L, então, por fim, vale que ⊢T α.  3.3.1 Prova Finitária de Equiconsistência Para entendimento da prova finitária, é importante atentar aos procedimentos 7 e 8 da seção anterior. Neles são realizadas transformações sintáticas para obtenção das fórmulas β′′i , eliminando as funções introduzidas para obtenção da fórmula normal de Herbrand. Ressaltamos que cada introdução de uma função para eliminação de uma quantificação universal é realizada de modo independente das demais funções introduzidas. Nesse sentido, podemos restringir o procedimento de eliminação a certas quantificações universais. Com efeito, podemos eliminar uma, algumas ou todas as funções introduzidas para obtenção da forma normal de Herbrand. Para a demonstração do teorema de equiconsistência, usaremos a parte direta do teorema de Herbrand para obtenção da quasi-tautologia e, em sequência, faremos o procedimento da prova conversa restrito às variáveis limitadas para conjuntos. Antes de realizar esse procedimento, eliminaremos todas as quantificações universais que não forem restritas a conjuntos nos axiomas de NBG. Provaremos, portanto, que as quantificações universais irrestritas são facilmente eliminadas da axiomatização apresentada. Capítulo 3. Relações de redução entre NBG e ZF 63 Proposição 11 Extensionalidade: ⊢ (∀z ∈ V (z ∈ x ↔ z ∈ y) → x = y) ↔ (∀x∀y(∀z(z ∈ x ↔ z ∈ y) → x = y)) . Prova. Pelo axioma da substituição, temos que {∀x∀y(∀z(z ∈ x ↔ z ∈ y) → x = y)} ⊢ ∀z(z ∈ x ↔ z ∈ y) → x = y. E, pelo teorema da generalização, temos que {∀z(z ∈ x ↔ z ∈ y) → x = y} ⊢ ∀x∀y(∀z(z ∈ x ↔ z ∈ y) → x = y). Resta provar que ⊢ (∀z(z ∈ x ↔ z ∈ y) → x = y) ↔ (∀z ∈ V (z ∈ x ↔ z ∈ y) → x = y), Sabemos que (α → β ∧ ¬α → β) → θ é tautologicamente equivalente a β → θ. Logo ∀z(z ∈ x ↔ z ∈ y) → x = y é tautologicamente equivalente a (∀z ∈ V (z ∈ x ↔ z ∈ y)∧∀z /∈ V (z ∈ x ↔ z ∈ y)) → x = y. Contudo, como sabemos que, por definição, z ∈ V ↔ ∃w(z ∈ w), então z /∈ V é equivalente a ∀w(z /∈ w), e, por isso, ∀z /∈ V (z ∈ x ↔ z ∈ y) é tautológico (as condições da equivalência z ∈ x e z ∈ y nunca são satisfeitas). Temos, portanto: ∀z(z ∈ x ↔ z ∈ y) → x = y ⇐⇒ (∀z ∈ V (z ∈ x ↔ z ∈ y) ∧ ∀z /∈ V (z ∈ x ↔ z ∈ y)) → x = y ⇐⇒ ∀z ∈ V (z ∈ x ↔ z ∈ y) → x = y  Note-se que podemos usar procedimento semelhante para limitar essa quantificação a conjuntos, sempre que tivermos um quantificador universal ∀z para uma fórmula na qual ocorre z ∈ x. Embora essa técnica não funcione em todo caso, para a axiomatização de NBG exposta nesse artigo o procedimento se efetiva. Não vamos aqui expor as demonstrações para cada axioma, pois todas são muito semelhantes. Temos, nesse sentido, o seguinte teorema: Teorema 5 Sendo α um axioma de NBG, então existe uma α′ tal que α′ é uma eliminação ou restrição (para V ) de todos os quantificadores universais que ocorrem em α e ⊢ α′ ↔ α. Fazemos ainda uma modificação em NBG. Os quantificadores existenciais irrestritos podem ser eliminados das instâncias do axioma-esquema para classes. Adicionamos, para cada instância ∀v ∈ V ∃z∀x(x ∈ z ↔ (x ∈ V ∧ α(x, v))), a constante cα e substituímos o axioma por ∀v ∈ V ∀x ∈ V (x ∈ cα ↔ (x ∈ V ∧ α(x, v))). Em seguida, substituímos todos os demais axiomas de NBG pela versão obtida pela aplicação do Teorema 5. A teoria resultante dessas substituições chamamos de U . Capítulo 3. Relações de redução entre NBG e ZF 64 Devemos, portanto, provar o seguinte teorema: Teorema 6 Para toda fórmula γ, se NBG ⊢ γ, então U ⊢ γ. Prova. Para esse teorema, basta tratarmos o caso em que γ é um axioma esquema para classes. A partir disso e do Teorema 5, obtemos com facilidade que U prova todos os axiomas de NBG, garantindo o resultado. Tomando uma α com n variáveis livres e com todos os quantificadores limitados a V , provaremos que, se NBG prova o axioma para classes instanciado para α, então U ⊢ ∀v ∈ V ∃z∀x(x ∈ z ↔ (x ∈ V ∧ α(x, v))) (3.1) (chamamos essa fórmula de θ). Pelo axioma da substituição e pelo teorema da generalização, podemos eliminar os quantificadores universais do axioma-esquema para classes. Desse modo, U ⊢ θ ⇐⇒ U ⊢ (v ∈ V ) → ∃z∀x(x ∈ z ↔ (x ∈ V ∧ α(x, v))). (3.2) Como x e z não ocorrem no lado esquerdo da implicação, então U ⊢ θ ⇐⇒ U ⊢ ∃z∀x((v ∈ V ) → (x ∈ z ↔ (x ∈ V ∧ α(x, v)))). (3.3) Sendo θ′ a fórmula ∀v ∈ V ∀x ∈ V (x ∈ cα ↔ (x ∈ V ∧ α(x, v))). Do mesmo modo, eliminamos de θ′ os quantificadores, obtendo U ⊢ ∀x((v ∈ V ) → (x ∈ cα ↔ (x ∈ V ∧ α(x, v)))). Então, pelo axioma da substituição e modus ponens, U ⊢ ∃z∀x((v ∈ V ) → (x ∈ z ↔ (x ∈ V ∧ α(x, v)))). Assim, U ⊢ θ, concluindo a demonstração.  Seguimos para a prova do lema: Lema 9 Seja α uma sentença livre de variáveis para classes. Se α é um teorema de U , então existe uma demonstração de α em U que é livre de quantificações em variáveis para classes. Capítulo 3. Relações de redução entre NBG e ZF 65 Prova. Por hipótese, temos uma demonstração de α em U . Seja γ [x] a conjunção dos axiomas usados na demonstração dada, em que x é a sequência de variáveis para classes que ocorrem nos axiomas. Nesse caso, pelo teorema da redução (SHOENFIELD, 1967, p. 42): T ⊢ ∀xγ[x] → α, ou, equivalentemente, T ⊢ ∃x(γ[x] → α), pois x não ocorre em α, em que T é a teoria sem axiomas não lógicos cuja linguagem é a linguagem de U . Seja θ[x] uma forma prenexa de γ[x] → α. A fórmula θ[x] é da forma ∃z1∀y1...∃zk∀ykβ[x, z1, y1, ..., zk, yk]. Pela equivalência para demonstrabilidade entre uma sentença prenexa qualquer e sua forma normal de Herbrand, T ⊢ ∃xθ[x] se e somente se ⊢TH ∃x∃z1...∃zkβ[x, z1, f1(x, z1), ..., zk, fk(x, z1, ..., zk)], em que TH é a teoria obtida a partir de T pela adição dos símbolos de função introduzidos na forma normal de Herbrand de ∃xθ[x]. Seja β′ a fórmula aberta β[x, z1, f1(x, z1), ..., zk, fk(x, z1, ..., zk)]. Pelo teorema de Herbrand, existe uma disjunção β′1 ∨ ... ∨ β′m que é uma quasitautologia, de modo que cada disjunta β′i é uma instância de β′ na linguagem de TH . Vamos construir uma demonstração apropriada de α na teoria Uc+eq obtida a partir de U pela adição de constantes especiais, de axiomas especiais para constantes e de axiomas especiais da igualdade. De início, substituímos as variáveis livres em β′1 ∨ ... ∨ β′m por constantes especiais. O resultado dessa substituição é uma disjunção de m sentenças que é quasi-tautologia em Uc+eq. Essa quasi-tautologia é o ponto de partida da nossa demonstração de α em Uc+eq. Capítulo 3. Relações de redução entre NBG e ZF 66 Em seguida, substituímos, nessa disjunção quasi-tautológica, as ocorrências de f1(a, b1), . . . , fk(a, b1, ..., bk) por sequências de constantes especiais apropriadas, seguindo o procedimento apresentado nos item 7 e 8 da prova do teorema de Herbrand. O resultado é uma disjunção β′1c ∨ ...∨ β′mc, consequência tautológica de instâncias de axiomas da igualdade, de axiomas da identidade, de axiomas especiais da igualdade e do teorema da igualdade, havendo ocorrência de quantificação apenas nas variáveis z1, y1, ..., zk, yk. Seja θic a fórmula ∃z1∀y1...∃zk∀ykβ[ti, z1, y1, ..., zk, yk], obtida a partir de βic por recomposição das quantificações ∃z1∀y1...∃zk∀yk. Os termos fechados na sequência ti estão em Uc+eq. Cada uma das disjuntas θic implica a correspondente β′ic em Uc+eq, como vimos no primeiro parágrafo do item 9 na estratégia de prova do teorema de Herbrand. Para demonstrar isso, usamos apenas propriedades básicas da implicação e dos quantificadores ∃z1...∃zk e os axiomas especiais para as constantes empregadas na substituição das ocorrências de f1(a, b1),...,fk(a, b1, ..., bk) descrita acima. Do exposto até aqui segue que Uc+eq ⊢ θ1c ∨ ... ∨ θmc, sem usar quantificações em variáveis para classes. Entretanto, como θ[x] é uma forma prenexa de γ[x] → α, temos Uc+eq ⊢ θ[x] ↔ (γ[x] → α), equivalência demonstrada usando apenas variantes de quantificações que ocorrem em γ[x] → α, portanto, nenhuma quantificação em variáveis para classes. Por outro lado, pela regra da substituição, Uc+eq ⊢ θ[ti] ↔ (γ[ti] → α). Como θ[ti] é θic, concluímos, usando consequência tautológica, que Uc+eq ⊢ γ[t1] ∧ ... ∧ γ[tm] → α, sem usar quantificação em variáveis para classes. Capítulo 3. Relações de redução entre NBG e ZF 67 Por outro lado, γ[x] é uma conjunção de axiomas de Uc+eq. Cada γ[t1] pode ser demonstrada em Uc+eq usando apenas consequências tautológicas e instâncias da regra da substituição. Portanto, Uc+eq ⊢ α, sem usar quantificação em variáveis para classes. Para terminar a demonstração, basta observarmos que uma demonstração de uma sentença α de U em Uc+eq pode ser transformada em uma demonstração em U da mesma sentença α, e que essa transformação introduz apenas quantificações diretamente ligadas aos axiomas especiais utilizados (SHOENFIELD, 1967, p. 52). Como não usamos axiomas especiais com quantificações em variáveis para classes, segue o resultado.  De posse desse resultado, provaremos de modo finitário o Lema 1 da página 29. Prova. (Lema 1) Supondo uma sentença α com todos os quantificadores restritos a conjuntos e tal que NBG ⊢ α, temos, pelo Lema 9, que existe uma prova em U na qual não ocorrem quantificadores irrestritos. Essa sequência de prova chamamos Seq. Faremos transformações nessa sequência de prova de modo que se mantenham as consequências tautológicas, que não se alterem a sentença α e que os axiomas transformados sejam teoremas de ZF. As transformações a serem realizadas serão descritas a seguir. Sejam x1, x2, . . . , xk as variáveis livres que ocorrem em Seq, adicionamos ao segmento inicial dessa nova sequência as fórmulas x1 ∈ V, x2 ∈ V, . . . , xk ∈ V , obtendo Seq*1 . Faremos, em seguida, a transformação *ZF das fórmulas de Seq*1 . Toda ocorrência do tipo 1. cθ = cα, substituímos por ∀y ∈ V (y ∈ cθ ↔ y ∈ cα) 2. cθ ∈ x, substituímos por ∃y ∈ V (y = cθ ∧ y ∈ x) 3. cθ ∈ cα, substituímos por ∃y ∈ V (y = cθ ∧ y ∈ cα) 4. x = cα, substituímos por ∀y ∈ V (y ∈ x ↔ y ∈ cα) 5. x ∈ cθ, substituímos por θ(x) Capítulo 3. Relações de redução entre NBG e ZF 68 Essas transformações aplicadas sucessivamente nas fórmulas da sequência Seq*1 eliminam todas as ocorrências das constantes cθ, formando a sequência Seq*2 . Lembramos que, para cada axioma lógico Axiomj em Seq*1 , é preciso verificar se Axiom*ZFj é também um axioma lógico ou consequência de ZF unido às fórmulas x1 ∈ V, x2 ∈ V, . . . , xk ∈ V . No segundo caso, substituímos o axioma Axiom*ZFj em Seq*2 pela sequência de prova de Axiom*ZFj . Assim, obtemos uma Seq*3 . Conhecemos a seguinte proposição a respeito de funtores (SHOENFIELD, 1967, p. 30): Definição 12 No contexto desta tese, usaremos a noção de funtor como funções na metalinguagem de fórmulas em fórmulas. Proposição 12 Um funtor * de fórmulas em fórmulas satisfaz as seguintes propriedades para toda fórmula α e β: 1. (¬α)* é ¬α* 2. (α ∨ β)* é α* ∨ β* Desse modo, se δ é consequência tautológica de γ1, γ2, . . . , γn , então δ* é consequência tautológica de γ*1 , γ*2 , . . . , γ*n. Portanto, essas transformações não afetam a sequência tautologicamente. Contudo, algumas das instâncias dos axiomas lógicos deixam de ser axiomas lógicos. Vejamos o que ocorreria com as instâncias de axiomas lógicos em que ocorrem constantes de U . 1. Axioma da substituição Não existe uma instância do axioma da substituição θx(c) → ∃xθ em Seq*1 porque não ocorrem quantificações irrestritas na prova em U . 2. Axioma da identidade (cα = cα)* ZF é ∀y ∈ V (α(y) ↔ α(y)), que é uma tautologia. 3. Axioma da igualdade a) x1 = cα ∧ x2 = y2 → x1 ∈ x2 ↔ cα ∈ y2. Então, após a transformação, obtemos: Capítulo 3. Relações de redução entre NBG e ZF 69 (∀z ∈ V (z ∈ x1 ↔ α(z)) ∧ x2 = y2) → (x1 ∈ x2 ↔ ∃w ∈ V (∀z ∈ V (z ∈ w ↔ α(z)) ∧ w ∈ y2)) Vamos mostrar que esta fórmula é teorema de ZF e das fórmulas x1 ∈ V, x2 ∈ V, . . . , xk ∈ V . Se temos que ∀z ∈ V (z ∈ x1 ↔ α(z)) ∧ x2 = y2 e supomos que x1 ∈ x2, então, pelo corolário 2 do teorema da igualdade em Shoenfield (SHOENFIELD, 1967, p. 36), obtemos ∀z ∈ V (z ∈ x1 ↔ α(z)) ∧ x1 ∈ y2. Em seguida, pelo axioma da substituição e x1 ∈ V , ∃x1 ∈ V (∀z ∈ V (z ∈ x1 ↔ α(z)) ∧ x1 ∈ y2). Usando o teorema da variante (SHOENFIELD, 1967, p. 35), ∃w ∈ V (∀z ∈ V (z ∈ w ↔ α(z)) ∧ w ∈ y2). Por outro lado, se supomos que ∃w ∈ V (∀z ∈ V (z ∈ w ↔ α(z)) ∧ w ∈ y2), então, como ∀z ∈ V (z ∈ x1 ↔ α(z)), provamos, usando a extensionalidade em ZF, que ∃w ∈ V (w = x1 ∧ w ∈ y2). Assim, obtemos que x1 ∈ y2. Como, por hipótese, x2 = y2, concluímos que x1 ∈ x2, finalizando a demonstração. b) x1 = y1 ∧ cα = y2 → x1 ∈ cα ↔ y1 ∈ y2. A estratégia para o item b é similar à do item a. c) x1 = y1 ∧ cα = cβ → x1 ∈ cα ↔ y1 ∈ cβ. Para esse caso, obtemos com a transformação: x1 = y1 ∧ ∀z ∈ V (α(z) ↔ β(z)) → α(x1) ↔ β(y1) Por isso, como x1 e y1 são variáveis livres na fórmula, a fórmula transformada é consequência tautológica de ∀x1 ∈ V ∀x2 ∈ V e instâncias de axiomas de identidade. d) cβ = cα ∧ cγ = y2 → cβ ∈ cγ ↔ cα ∈ y2. e) cβ = cα ∧ x2 = y2 → cβ ∈ x2 ↔ cα ∈ y2. f) cβ = cα ∧ cγ = cψ → cβ ∈ cγ ↔ cα ∈ cψ. Os itens d, e e f são obtidos com a combinação das estratégias usadas nos itens a e c. Capítulo 3. Relações de redução entre NBG e ZF 70 Vejamos, em seguida, o que ocorre para os axiomas de U com a transformação *ZF : São afetados somente as instâncias dos axiomas de extensionalidade, o esquema para classes, a substituição para classes e a fundação (somente aqueles nos quais ocorrem constantes de U). 1. Extensionalidade. Avaliamos dois casos: ∀y ∈ V (y ∈ x ↔ y ∈ cθ) → x = cθ ∀y ∈ V (y ∈ cα ↔ y ∈ cθ) → cα = cθ. Como resultados, temos respectivamente ∀y ∈ V (y ∈ x ↔ θ(x)) → ∀y ∈ V (y ∈ x ↔ θ(x)) ∀y ∈ V (α(x) ↔ θ(x)) → ∀y ∈ V (α(x) ↔ θ(x)) ambas tautologias. 2. Esquema para classes. Sendo v1, v2, . . . , vn variáveis livres que ocorrem em θ ∀v1v2 . . . vn ∈ V ∀y ∈ V (y ∈ cθ ↔ θ(y)) Com a transformação, obtemos ∀v1v2 . . . vn ∈ V ∀y ∈ V (θ(y) ↔ θ(y)) que é uma tautologia. 3. Substituição para classes. ∀x ∈ V (func(cθ) → ∃y ∈ V ∀w(w ∈ y ↔ ∃v ∈ x((v, w) ∈ cθ))) se torna ∀x ∈ V (∀v1v2v3 ∈ V (θ(v1, v2) ∧ θ(v1, v3) → v2 = v3) → ∃y ∈ V ∀w1(w1 ∈ y ↔ ∃w2 ∈ x(θ(w2, w1)))) que é exatamente o axioma da substituição para ZF. 4. Fundação. (cθ = ∅ → ∃y ∈ V (y ∈ cθ → cθ ∩ y = ∅)) se torna ∃x ∈ V θ(x) → ∃y ∈ V (θ(y) → ∀w(w /∈ y ∨ ¬θ(w))); Supondo ∃x ∈ V θ(x), então ZF ⊢ ∃x(x ∈ Va ∧ θ(x)), para algum ordinal a (Va é a construção do universo V até o passo de ordinal a). Sendo A = {x|x ∈ Va ∧ θ(x)}, segue que ZF ⊢ A = ∅. Pela regularidade em ZF, ∃y(y ∈ A → A ∩ y = ∅). Isso é equivalente a Capítulo 3. Relações de redução entre NBG e ZF 71 ∃y(θ(y) ∧ y ∈ Va → ∀w¬(w ∈ y ∧ θ(w) ∧ w ∈ Va)) (como w ∈ y → w ∈ Va) ∃y(θ(y) ∧ y ∈ Va → ∀w¬(w ∈ y ∧ θ(w))) Ou seja, a fórmula transformada é um teorema de ZF. Quando ocorrem sem uso de constantes, os axiomas de U podem ser entendidos como axiomas de ZF, por causa da introdução das fórmulas xi ∈ V . 1. A extensionalidade ∀y ∈ V (y ∈ x ↔ y ∈ z) → x = z, no contexto das fórmulas x ∈ V e z ∈ V , representa exatamente a extensionalidade em ZF. 2. O mesmo vale para os axiomas de substituição e fundação. 3. O axioma-esquema para classes não apresenta esse tipo de ocorrência, pois não aparece com variáveis livres em U . Desse modo, na sequência Seq*3 : 1. Ocorrem fórmulas da forma x ∈ V , 2. Ocorrem axiomas lógicos, 3. Ocorrem axiomas de ZF, 4. E todas as demais fórmulas são obtidas por inferências lógicas a partir das fórmulas anteriores. Isto é uma prova em ZF. Como nenhuma das transformações afeta a fórmula final α, provamos, enfim, que ZF ⊢ α, concluindo a demonstração.  3.4 Não existe interpretação de NBG em ZF Antes de seguirmos com a prova do Teorema 1, mostramos algumas definições e proposições: Definição 13 Sendo V um modelo de ZF e M uma classe V -definível, dizemos que o modelo M = (M,∈) tal que ∈M=∈V é um modelo V -natural. Capítulo 3. Relações de redução entre NBG e ZF 72 Definição 14 Dado um modelo M na linguagem LZF (apenas pertencimento como predicado) e uma interpretação I = ⟨U, φ⟩ de LZF em LZF (escrevemos ∈I por φ(∈)), então definimos o modelo MI = (A,∈IM) em L como A = {x | M  U(x)} e ∈IM= {⟨x, y⟩ | M  U(x) ∧ U(y) → x ∈I y} Proposição 13 Dado um modelo M na linguagem LZF e uma interpretação I = ⟨U,∈I⟩ de LZF em LZF , então para toda sentença α M  αI ⇐⇒ MI  α A proposição a seguir é um fortalecimento do resultado obtido por Freire e Tausk (2009), no qual eles mostram: se existe um modelo transitivo para ZF, então não pode haver interpretação conjunto de ZF em ZF. Aqui, substituímos a condição de "existe modelo transitivo" por "ZF não prova o predicado de inconsistência da própria ZF". Proposição 14 Dada uma interpretação I = ⟨U,∈I⟩ de ZF em ZF , se ZF ⊢ {x | U(x)} é um conjunto, então ZF ⊢ ¬Con(ZF ). Prova. Tomemos I como na suposição da proposição, que ZF é consistente e que ZF ⊢ {x | U(x)} é um conjunto. Sendo pαq o número de Gödel da fórmula α representada em ZF e dado que MI é um conjunto para todo M  ZF , definimos recursivamente o conjunto T para cada modelo M  ZF : Notação 3 a([k] = b) é a substituição do k'ésimo elemento da sequência a por b. ⟨pαq, a⟩ ∈ T se, e somente se, a ∈ M I e (1) se α é atômica da forma xi ∈ xj, ⟨ai, aj⟩ ∈ (∈M I ) (2) se α é da forma β ∧ γ : ⟨pβq, a⟩ ∈ T e ⟨pγq, a⟩ ∈ T (3) se α é da forma ¬β : ⟨pβq, a⟩ /∈ T (4) se α é da forma ¬∃xkβ : ⟨pβq, a([k] = b)⟩ ∈ T para algum b ∈ M I Por indução finita sobre a complexidade das fórmulas, prova-se sem dificuldades que M  ⟨pφq, a⟩ ∈ T se, e somente se, MI  φ(a) Capítulo 3. Relações de redução entre NBG e ZF 73 Dado que PrZF (x, y) é o predicado de provabilidade para ZF definido em ZF que representa a sentença "x é número da prova de y". Então, dizemos que Th(ZF ) = {y | ∃xPrZF (x, y)}. Assim, como MI  ZF , então M  Th(ZF ) ⊆ T . Como MI 2 ∅ ∈ ∅, então p∅ ∈ ∅q /∈ T . Disso, obtemos M  p∅ ∈ ∅q /∈ Th(ZF ). Uma vez que M é arbitrário, obtemos pelo teorema da completude em ZF que se ZF tem modelo, então ZF ⊢ p∅ ∈ ∅q /∈ Th(ZF ). Isso é um absurdo pelo teorema da incompletude de Gödel em ZF. Logo, ZF ⊢ ¬Con(ZF ).  Definição 15 Sendo V um modelo para ZF e M um modelo V -natural. Dizemos que M reflete uma fórmula φ(x) se, e somente se, para todo a ∈ M V  φ(a) ⇐⇒ M  φ(a) Teorema 7 [Teorema da reflexão] (KUNEN, 2014) Sendo V um modelo de ZF e dadas quaisquer fórmulas φ1, φ2, . . . , φn, então, existe um ordinal a tal que M = (Va,∈) reflete φi para i entre 1 e n. Mostraremos que o resultado pretendido no Teorema 1 é uma consequência do teorema da reflexão com o fato de que NBG é finitamente axiomatizável: Prova. Teorema 1 (Não existe interpretação de NBG em ZF) Supomos que exista uma interpretação I de NBG em ZF. A partir disso, chegaremos a um absurdo. Como o número de axiomas de NBG é finito, existe uma fórmula α que é a conjunção de todos os axiomas de NBG: α é Axiom1 ∧ Axiom2 ∧ . . . ∧ Axiomn. Então NBG ⊢ α e, pela Definição 3 (definição de interpretação), ZF ⊢ αI . Supondo V  ZF , então V  αI . Pelo teorema da reflexão, existe um ordinal a tal que Va  αI . Segue que V Ia  α. Uma vez que Va é um conjunto, obtemos que o domínio de V Ia é também um conjunto. Definimos o modelo V * em LZF a seguir: 1. Domínio D de V * é tal que D = {x | V Ia  ∃y(x ∈ y)}. 2. E o predicado ∈V *= {⟨x, y⟩ | V Ia  x ∈ y}. Capítulo 3. Relações de redução entre NBG e ZF 74 Notemos que, da conservatividade de NBG em relação a fórmulas restritas a conjuntos, obtemos que V *  ZF . Mais ainda, como o domínio de V Ia é um conjunto, segue que D também é um conjunto. Isso significa que ZF ⊢ Con(ZF ), absurdo pelo teorema da incompletude.  75 4 Sobre o que conta como tradução Neste capítulo, estudaremos a relação entre os diversos métodos de prova de consistência relativa e a noção de tradução entre teorias. Analisaremos como a noção de consistência relativa é indissociavelmente contextual e, a partir disso, buscaremos esclarecer como, de fato, as teorias são "parcialmente" ou "completamente" traduzidas umas nas outras. Em um segundo momento, buscaremos tornar homogêneos os diversos métodos de tradução, definindo um esquema geral de tradução em relação ao qual os métodos analisados são casos particulares. 4.1 Análise preliminar dos métodos de consistência como tradução Os métodos de prova de consistência relativa estabelecem que a suposição de que uma teoria T1 é consistente implica que uma outra teoria T2 é também consistente. Para efetivar essa relação, é necessário estabelecer um vínculo entre as sentenças das duas teorias T1 e T2, de forma que possamos positivamente gerar um modelo para T2 a partir de um suposto modelo para T1 ou negativamente gerar uma contradição em T1 a partir de uma suposta contradição em T2. Se, por exemplo, tomamos T1 como ZFC e T2 como PA, então a relação de consistência relativa pode ser estabelecida pela prova de que o modelo usual para a aritmética N = ⟨ω,+,×, 0, Suc⟩ é um conjunto em ZFC. Estabelecemos, assim, que se os objetos aos quais ZFC faz possivelmente referência de fato existem, então podemos reinterpretar a referência a esses tais objetos de tal forma que eles preencham os requerimentos existenciais de PA. Com efeito, essa relação de consistência relativa oferece um método para reinterpretar as sentenças de PA sobre números em sentenças de ZFC sobre conjuntos: a afirmação "existe um x" em PA é reinterpretada como "existe um ordinal finito x" em ZFC, a relação de "x maior que y" é reinterpretada como "x e y são ordinais finitos e y pertence a x" e assim por diante. Notadamente, provar uma relação entre as consistências de duas teorias implica estabelecermos alguma relação de tradução entre elas. Ainda assim, a relação estabelecida ocorre no contexto de uma metateoria que torna possível efetivar a transferência dos requerimentos existenciais. Por isso, devemos avaliar se essa metateoria não comprometeria a relação de tradução e, em caso afirmativo, em que medida. Tomemos, para efeito de esclarecimento, um caso mais simples: Se consideramos que o sistema lógico é neutro com relação ao sentido de "equivalênCapítulo 4. Sobre o que conta como tradução 76 cia", então podemos dizer, por exemplo, que α∨(α∧β) é equivalente a α. Entretanto, quando dizemos que o axioma da escolha é equivalente ao princípio da boa ordem, fazemos mais do que uma equivalência puramente lógica. A prova dessa equivalência faz uso dos axiomas de ZF e, portanto, esses axiomas são equivalentes no contexto de ZF. Ou seja, os axiomas não são absolutamente equivalentes, embora as teorias ZF + escolha e ZF + boa ordem sejam absolutamente equivalentes. O que queremos chamar atenção é o fato de que ZF turva as distinções finas entre os axiomas da escolha e a boa ordem. De fato, se alguém está exclusivamente interessado em tratar o contexto no qual ZF é o caso, então não há problema algum em falar ou tratar os axiomas como equivalentes. E, provavelmente, existem poucos contextos interessantes para a prática matemática nos quais esses dois axiomas não são equivalentes. Contudo, não podemos evitar o fato de que a afirmação de que "escolha" e "boa ordem" são equivalentes é contextual. O que ocorre aqui é o fato de que a própria ideia de equivalência é contextual (mesmo que esse contexto seja neutro em algum sentido): duas fórmulas são equivalentes em um sistema de prova determinado. Não existem duas fórmulas ou teorias equivalentes por si mesmas, como não existem duas teorias relativamente consistentes por si mesmas. A consistência relativa se dá em um contexto determinado de ferramentas. Consideremos o cenário no qual uma metateoria suficientemente forte como ZFC analisa duas teorias Ta e Tb. Se ZFC prova a consistência de Ta e Tb, então ZFC enxerga Ta e Tb como equiconsistentes, mesmo que ambas as teorias sejam muito distintas em comprometimento ontológico. Tomemos Ta como PA e Tb como a aritmética de segunda ordem (SOA). De fato, ZFC prova a consistência de ambas as teorias, porém, isso não tem qualquer significado com relação à transferência de requerimentos existenciais da PA em SOA. Afinal, poderíamos "emular" a construção do modelo da SOA a partir de um modelo de PA, simplesmente reproduzindo a prova da consistência de SOA em ZFC implicitamente. Portanto, embora a consistência relativa estabeleça uma relação de tradução, essa não é única nem independente do contexto metateórico. Não é única, porquanto podem existir outras formas efetivar a relação de consistência. E não é independente, por ser realizada no interior de uma teoria responsável por afirmar o vínculo. 4.2 Tradução Ideal e a relatividade na tradução 4.2.1 Relatividade da tradução A questão da indeterminação tem lastro extensivo na ciência do final do século XIX e de todo século XX. Muito das nossas melhores teorias para as ciências naturais como para Capítulo 4. Sobre o que conta como tradução 77 as questões humanas tem como partida a própria noção de que existe uma indeterminação fundamental naquilo que, por suposto, quereríamos determinar. Wilhelm Dilthey, buscando legitimar as ciências humanas como um campo de estudo autônomo em relação às ciências naturais, enfatizou a característica fundamentalmente interpretativa das conclusões sobre os humanos: determinar o comportamento de um humano qualquer pode mudar o curso das suas próprias atitudes. Ele contrastava as humanidades com a dureza objetiva das ciências naturais – supondo que esse tipo de indeterminação não é próprio do distanciamento objetivo característico das ciências da natureza. Essa distinção, porém, não sobreviveria por muito tempo. Heisenberg mostrou que determinar a posição e velocidade de uma partícula depende da interação do observador através de ondas eletromagnéticas. Assim, a determinação de uma variável depende fundamentalmente da indeterminação da outra. Outra fundamental indeterminação, a qual daremos ênfase, foi introduzida por Quine em seus reconhecidos artigos Two dogmas of empiricism (QUINE, 2000) (TD) e Ontological relativiity (QUINE, 1964) (ORel) e no livro Word and object (QUINE et al., 2013) (WObj). No primeiro, ele faz uma contundente crítica à tradicional distinção entre sentenças sintéticas e analíticas; a partir disso, concentra-se em afirmar a indeterminação das traduções entre quaisquer duas linguagens no experimento da tradução radical (WObj). No segundo, ele mostra que essa ausência de distinção, junto com a indeterminação dos modelos do teorema de Löwenheim-Skolem, implica a indeterminação da relação de referência. Nesse caso, toda relação de referência é fundamentalmente vinculada à escolha de uma teoria base para a qual se interpretam os requerimentos existenciais da teoria, isto é, a ontologia de uma teoria é invariavelmente relativa à escolha de uma teoria base. Se em TD e WObj Quine descreve a indeterminação das traduções no nível epistemológico, em ORel ele relativiza a ontologia de uma teoria à tradução em uma teoria base: "Specifying the universe of a theory makes sense only relative to some background theory, and only relative to some choice of a manual of translation of the one theory into the other". Oferecer uma ontologia para uma teoria, portanto, equivale à redução de uma teoria em uma teoria base segundo uma tradução. As traduções são, para Quine, subdeterminadas por qualquer experimento empírico, mas não por um tipo de relativismo. Quine partiu da noção de redução modelo-teorética entre teorias de primeira ordem para mostrar a relatividade da relação de referência. Porém, a própria redução não estaria sujeita ao mesmo tipo de relativismo. Nesse caso, se a relação de tradução tem um defeito constitutivo, então ele seria o de ser contextual – mas não o de ser subdeterminada. Segundo Quine, a relação de tradução poderia ser reconstruída a partir do recurso sintático que ele denominou "proxy function". A não relatividade, nesse caso, está ligada ao entendimento de que as traduções não são propriamente objetos, que tais funções "need not exist as an object Capítulo 4. Sobre o que conta como tradução 78 in the universe even of a backgroud theory" (QUINE, 1964). Essa saída, porém, é tanto restrita sobre o escopo das traduções, quanto invariavelmente interpretada dos mecanismos performados pela teoria de base. É restrita porque traduções não apenas ocorrem entre uma teoria de base e uma teoria objeto, mas também entre duas teorias não familiares à teoria base. É interpretada porque uma teoria de primeira ordem não é capaz de capturar a afirmação de que um "determinado conjunto de fórmulas representam a teoria T". Só é possível entender o que foi realizado pela teoria base como uma tradução se interpretamos o resultado fora do escopo da teoria base ou se concedemos a ela recursos definicionais e de segunda ordem. Se PA é Gödel-internalizada em ZFC, isso significa dizer que, (1) para cada fórmula da linguagem de PA, existe um conjunto em ZFC que representa a fórmula de PA, (2) para cada sequência de fórmulas de PA, existe um conjunto que representa a sequência de fórmulas de PA e, por fim, (3) que, se uma sequência representa uma prova em PA, então ZFC prova que o conjunto que representa a sequência satisfaz uma propriedade definível em ZFC. Todas essas afirmações não são afirmações de ZFC, mas de uma metateoria que fixa o vínculo entre as duas teorias. Do ponto de vista de ZFC, simplesmente se está provando teoremas sobre certos conjuntos e a afirmação de que essas provas falam sobre PA deve ser interpretada em uma outra metateoria. Quando Gödel realiza a internalização da aritmética na própria aritmética, ele não assume estar internalizando propriamente a aritmética; diferentemente, só é possível entender a internalização a partir do teorema da representação que é construído na Aritmética primitiva recursiva (APR). Eventualmente, isso significa que a relação de internalização só faz sentido se consideramos uma terceira teoria (no caso, APR), enxergando as duas aritméticas. Algo semelhante ocorre no caso de ZFC interpretando PA: devemos tomar em consideração ao menos uma APR que se responsabiliza por firmar que a representação de PA em ZFC é uma representação de PA – caso contrário, não é possível entender nesse procedimento mais do que ZFC provando teoremas interessantes. De modo mais geral, reforçamos a ideia de que qualquer relação de tradução entre teorias pode apenas ser entendida em uma terceira teoria. Isso significa que o caso em que reduzimos aparentemente uma teoria T em uma teoria base Tm é, com efeito, a avaliação da relação entre T e Tm em uma terceira teoria TM e a redução proporcionada por Gödel não nos permite mais do que dizer que Tm e TM podem ser sintaticamente as "mesmas". Com efeito, não existe relação de tradução em que consideramos apenas duas teorias, uma relação de tradução só pode ocorrer se analisamos três teorias, ainda que isso seja realizado de forma que duas dessas teorias coincidam. Essa questão fica ainda mais evidente se consideramos o ambiente das provas de independência em teoria de conjuntos. Quando, por abreviação e conveniência, chamamos a teoria dos construtíveis de Gödel L de um modelo para ZFC, não fazemos mais do que de Capítulo 4. Sobre o que conta como tradução 79 fato afirmar que existe uma interpretação entre as duas teorias. Nesse caso, não é possível fazer uma internalização completa no mesmo sentido aplicado nos casos já mencionados. Precisamente, se, nos casos anteriores, a internalização nos proveria um predicado de verdade para a teoria internalizada, não vale o mesmo para essas teorias de conjuntos – se consistentes, nenhuma delas é capaz de internalizar um predicado de verdade para a outra. Notadamente, a teoria de base (APR), para esse caso, não é capaz de oferecer uma ontologia nem mesmo relativa para as teorias de conjunto, e ainda assim é capaz de falar sobre a "tradução" entre elas. Ainda permanece em aberta a pergunta: (QEx) "quem afirma que os recursos sintáticos firmados na terceira teoria são uma relação de tradução?". De fato, essa parece uma nova questão de representação, em sentido similar ao da pergunta no caso da redução, embora mais grave. Como lembra Bogossian em (BOGHOSSIAN, 1996), o próprio Quine em TD analisa dois tipos distintos de analiticidade: o primeiro, no qual a substituição de termos sinônimos para formar verdades lógicas tem como base a sinonímia entre um termo T e um termo T' introduzido definicionalmente; e o segundo, no qual a base é uma relação de sinonímia intuída por falante competente. No primeiro caso, a relação de sinonímia é trivial e de pouca influência na crítica quineana, enquanto a segunda é foco de duras críticas. Com efeito, QEx é uma pergunta cuja resposta sofre dos mesmos problemas dos dogmas empiristas. Se queremos analisar as traduções de modo que não sofram tais críticas, devemos negar a ela o status de questão capaz de expressar sentido e, portanto, (1) assumir que as duas teorias analisadas na tradução foram definidas no ambiente da teoria base TB e (2) assumir que "ser tradução" é um elemento teoricamente definido em TB. Assumir (1) é excessivamente conveniente, embora pouco problemático; assumir (2) é artificial. Analisemos essas duas hipóteses em mais detalhes. A análise da suposição (1) tem como partida a pergunta sobre o que significa tomar uma dada teoria como metateoria ou teoria base. Com efeito, essa pergunta não é levantada com frequência por ser óbvia ou por negligência. Quando, por exemplo, estudamos a relação de satisfabilidade em ZFC, através da teoria de modelos, fazemos muito mais do que usar ZFC como teoria de base1. O esquema para a descrição da relação de satisfabilidade é a redução de uma teoria qualquer definida por predicado em ZFC e cuja representação é garantida como teorema de uma aritmética de base (na qual se faz a indução dos resultados). A noção do que é uma teoria internalizada "é teoria", por sua vez, deve ser um predicado em ZFC cuja representabilidade (2') é garantida de modo similar à suposição (2). Ainda que, novamente, tomemos como não problemática a suposição (2'), teríamos de admitir que não é possível 1 Por "tomar como teoria base", entendemos: quando um agente toma como teoria de base uma teoria TM em uma linguagem L, ele se compromete a descrever qualquer outra teoria Tx em L e todas afirmações de Tx devem ser entendidas como afirmações em TM . Capítulo 4. Sobre o que conta como tradução 80 entender uma teoria que não foi de partida internalizada. Isso significa que, se um agente A1 tem TM como teoria base e um segundo agente A2 apresenta uma teoria Tx desconhecida por A1, então A1 não pode oferecer qualquer entendimento sobre Tx, uma vez que não poderíamos apresentar um predicado de representação "essa internalização representa Tx"2. Supomos ainda que o problema em (1) é resolvido e seguimos com a questão apontada na suposição (2). Como vimos, a tradução deve ser definida como um predicado em uma teoria base que firma com teorema o vínculo entre duas teorias. Essa necessidade impõe precisamente o que o Quine queria evitar a respeito das traduções, i.e., que elas fossem objetos. Nesse caso, é relativamente simples mostrar que o que conta como uma tradução é relativo à escolha de uma meta-metateoria. Pensemos, por exemplo, o caso da interpretação entre PA e ZF sem o axioma do infinito e com a adição da negação do axioma do infinito (ZF−Inf ) (KAYE; WONG, 2007). Explicitamente, esse resultado pode ser descrito como uma prova em APR (teoria base) de que, se ThT (α) é o predicado internalizado na teoria base que afirma que α é teorema da teoria T e sendo I a interpretação de PA em ZF−Inf , então APR ⊢ ∀α ∈ LPA(ThPA(α) → ThZF−Inf (αI)). (4.1) Tomamos uma fórmula indecidível δ em PA. Se um modelo de APR (nesse caso, relativizado à meta-metateoria) satisfaz ThPA(δ), então o número que representa a prova deve ser um número não standard. Portanto, é possível montar um modelo de APR tal que ThPA(δ) é verdadeira, enquanto δ é falsa – digamos que esse modelo é M. Notadamente, para M, a fórmula αI é verdadeira em ZF−Inf e, ao mesmo tempo, é tradução da fórmula α de PA. Ainda assim, o modelo vê essa mesma fórmula como falsa. Então nos deparamos com a situação estranha, na qual uma fórmula falsa é traduzida em uma fórmula verdadeira. Nesse caso, I não conta como uma tradução relativamente à escolha de M. Ainda assim, poder-se-ia insistir na contextualização, afirmando que a tradução de uma teoria T1 em outra teoria T2 faz sentido apenas quando é fixada a ontologia para cada uma das teorias. Ou seja, pensaríamos a tradução entre duas teorias no contexto em que todas as suas sentenças fossem decididas pela estipulação dos modelos M1 e M2. Embora considere essa solução uma inversão de prioridade, consideramo-la por ora. Em Satisfaction is not absolute, Hamkins e Yang (2014) mostram que dois modelos para ZFC podem concordar sobre qual é o modelo standard para PA e, ainda assim, discordarem sobre quais fórmulas o modelo 2 Esse problema de representação não é facilmente resolvido sem que extrapolemos o ambiente das teorias de primeira ordem. Endossamos, nesse sentido, a tese defendida por Freire em (FREIRE, 2018) de que a identidade de uma teoria matemática não é um sistema formal, mas uma normatividade instituída pela prática. No caso de uma teoria puramente formal como o caso de Tx, adicionamos que a sua identidade é instituída na prática com sistemas formais. Esse movimento para a normatividade permite que a comunicação entre os agentes se deva à troca de informação no nível normativo, e a representabilidade de Tx por A1 se dá pela mesma relação que A1 já mantém com as próprias teorias do seu escopo conhecido. Capítulo 4. Sobre o que conta como tradução 81 standard de PA satisfaz. Isso significa que a decisão sobre a meta-metateoria pode determinar o valor de certas fórmulas do próprio modelo de T1 ou T2. Se, portanto, traduzirmos uma fórmula como essa para uma outra teoria, não saberíamos se devemos mapeá-las para uma sentença verdadeira ou falsa na outra teoria enquanto não fixamos a meta-metateoria. Assim, ainda que se fixe o contexto da teoria de base como condição para se falar da tradução, ela ainda é subdeterminada em relação à meta-metateoria. Mas, como dito, o problema é, antes, uma inversão de prioridade. Oferecer uma ontologia para uma teoria aparece como um problema muito mais complexo do que o de oferecer uma tradução entre duas teorias – evidência para isso é o fato de que se pode falar muito da tradução entre duas teorias sem que para isso se toque no assunto de uma ontologia. A ontologia para uma teoria é a resposta para a pergunta "com o que a teoria se compromete?", enquanto a tradução é a resposta para a pergunta "como uma teoria pode oferecer um entendimento para o comprometimento de uma outra teoria?". Podemos ter uma resposta mais compreensível e consensual para a pergunta "qual a tradução de unicórnio em japonês?" antes de termos uma resposta para a pergunta "existem unicórnios?" – e dizer que a resposta para a primeira depende da resposta para a segunda parece irrazoável. Portanto, as traduções são relações entre duas teorias estabelecidas em uma terceira teoria. A necessidade de que o mapeamento seja subscrito em uma teoria está ligado diretamente ao fato de que é preciso um ambiente teórico que seja responsável por afirmar que o mapeamento em questão preserva aquilo que se quer preservar, i.e. que o mapeamento de fato conta como uma tradução. As traduções argumentavelmente não sofreriam dessa necessidade apenas no caso "relaxado" apontado por Quine em Ontological reduction; nesse caso, apenas é exigida a preservação de verdade – e talvez se possa justificar que "nenhuma condição se impõe sobre o que conta como tradução". Porém, como o próprio Quine aponta, isso é demasiado relaxado para contar como uma tradução. Por outro lado, da necessidade de um tratamento teórico para a tradução surge, como vimos, a relatividade da tradução. Aceitar essa tese, contudo, não poderia ser aceitável para o programa quineano, porquanto parte significativa desse programa se apoia sobre o conceito de redução ontológica. 4.3 Tradução idealizada Uma forma de restaurar o tratamento da filosofia da matemática e da física após o ataque ao significado é atribuir legitimidade à reduções ontológicas entre as teorias já implicadas em uma linguagem contextualizada. É por essa razão que Quine enfatiza o tratamento das reduções ontológicas. Contudo, mostramos que as traduções também estão sujeitas ao mesmo tipo de relativismo que a noção de significado. Entendemos que o próprio Quine imCapítulo 4. Sobre o que conta como tradução 82 poria um limite ao seu relativismo quando chagasse a esse ponto. Apesar disso, ainda somos simpáticos aos seus questionamentos – embora pouco simpáticos às suas conclusões. Por isso, revisamos as implicações de Quine quanto ao significado, à analiticidade e, por extensão, às traduções. Em On what there is, Quine estabelece o conceito de comprometimento ontológico para as teorias de primeira ordem. Estaríamos comprometidos com a existência de entidades capazes de assumir o papel das variáveis ligadas nos axiomas, tornando-os verdadeiros. Mais à frente, em ORel, Quine mostra que somos incapazes de oferecer uma ontologia determinada para o critério de comprometimento ontológico em um sentido absoluto e, por isso, somos forçados a falar da ontologia em um sentido relativo. Notadamente, Quine antes pergunta sobre o que a "a existência deve realizar" e depois mostra que podemos apenas relativamente realizar tal exigência. Porém, para ele, o mesmo não ocorre com o conceito de tradução: as traduções são simplesmente definidas como uma ferramenta que preserva verdade e estrutura booleana em Ontological reduction and the world of numbers (QUINE, 1964) de um modo bastante particular. É, por isso, necessário reavivar a questão sobre o que conta como uma tradução pela introdução da pergunta: "o que uma tradução deve fazer?". Ou ainda "o que alguém que realiza uma tradução espera realizar?". Para bem formular essa questão, fazemos correlação com pergunta sobre existência. Se, no caso da existência, queremos saber o que a afirmação da teoria exige que exista, no caso da tradução queremos substituir a linguagem de tal modo que a exigência de existência se preserve. Por isso, partimos da definição (ainda a ser mais detalhada): Com uma tradução de uma teoria T1 em outra teoria T2 se espera que aquilo que T1 se compromete que exista seja transferido para o que T2 se compromete que exista. Em outras palavras, uma tradução deve funcionar como a transferência do comprometimento ontológico entre teorias. O que queremos fazer com essa definição é enfatizar que a relação entre o conceito de tradução e os mapeamentos realizados nas teorias de primeira ordem é a relação de formalização. Muito do que se observa na literatura do assunto é que se parte do fato que as traduções realizam a transferência de requerimentos existenciais e a afirmação de tradução entre duas teorias garante a redutibilidade de uma ontologia em outra. Consideramos isso uma inversão de princípios – uma transparência exagerada a respeito do que pode ou não contar como uma tradução. Seguimos agora com a análise mais acurada do que essa pergunta pode nos oferecer. Daremos um passo para trás, buscando entender o que seria possivelmente uma traCapítulo 4. Sobre o que conta como tradução 83 dução ideal. Não queremos, com isso, estabelecer uma metodologia que obtém relações ideais de tradução, mas afirmar algumas propriedades necessárias (não suficientes) para que um método possa implicar uma tradução no seu máximo sentido. Também não queremos dizer que se trata de uma tradução a ser almejada, ao contrário, queremos usar desse experimento abstrato para reforçar um problema sutil, qual seja, o de que satisfazer o que se deseja com uma tradução idealizada não é nada trivial. Inicialmente e (ao meu ver) sem prejuízo, consideramos um esquema conceitual bastante simplificado, no qual os nomes e descrições definidas possuem apenas relações de referência a objetos do mundo. Evitaremos o problema da tradução radical apontado em TD e WOb, supondo a existência de um mediador ideal (MU). Quine nos mostrou que é preciso que dois falantes sejam possuidores de estruturas linguístico/conceituais equivalentes para que eles possam estabelecer qualquer comunicação efetiva a respeito de uma tradução entre as teorias usadas por cada um deles. Esse MU é capaz de entender ambas as línguas que se quer traduzir. Nesse caso, ele será responsável por assegurar que os falantes de fato se referem aos mesmos objetos quando eles, de fato, realizam uma correta descrição definida que substitui a descrição usada por um outro falante na sua própria língua. Assumindo o MU como um mediador, evitamos o problema epistemológico e nos focamos no que constitui idealmente uma tradução. Em vista dessas considerações, parece ser possível estabelecer uma tradução entre dois falantes de duas distintas línguas. Quando um deles A se referir a um objeto por uma descrição definida a1, o outro falante B poderia, por tentativa e erro finalmente acertar a descrição definida equivalente b1 na sua própria língua. A partir de alguns acertos, os falantes A e B poderiam começar a buscar níveis mais complexos de linguagem até que se estabeleça uma efetiva tradução. Chamamos atenção a um aspecto importante que possibilita a tradução nesse caso: estamos supondo como fixado o objeto das referências. Ou seja, existe, ao menos em princípio, um modo não linguístico de acesso ao objeto do mundo, seja pela visão, audição, tato ou qualquer via indireta de captação dessas mesmas informações. Se um falante descreve "a pedra", podemos ver, escutar ou tocar nesse referente. No caso de uma descrição do tipo "o prefeito da cidade", a identificação desse referente pode ocorrer por vias obtusas e complexas; caso uma das linguagens não possua um único predicado que seja equivalente a "ser prefeito", ele ainda poderia usar um predicado como "chefe de X". A referência "chefe de X" ainda depende do conceito "moradores da cidade" e esse conceito deve ser traduzido em um aninhamento progressivo de tentativas e erros até que se possa estabelecer uma efetiva tradução. Capítulo 4. Sobre o que conta como tradução 84 Podemos dizer que esse esquema tradutivo é equivalente ao proposto pelos membros do Círculo de Viena. Talvez irrefletidamente, tenha-se considerado os sentidos humanos suficientemente capazes de cumprir o papel mediador para que um dos falantes pudesse assegurar a correção de sua tradução. É precisamente nesse ponto que o ataque de Quine ocorre: ainda que ambos possam ter a "impressão" de que eles estão usando descrições definidas equivalentes, não é possível obter um método experimental que garanta a equivalência. Se, por outro lado, assumimos que há um falante das duas línguas, ele sempre saberá se a relação de referência está equivocada ou correta e é precisamente por essa razão que dizemos que o problema epistemológico se desmonta na presença de MU. De fato, até o momento, lidamos apenas com as fórmulas que possuem a referência para assegurar o entendimento. Contudo, isso não engloba todos os casos de tradução, podemos, como bem o fazemos, traduzir sentenças que não possuem referentes, como a sentença "o rei da França é careca". Ainda que a tomemos simplesmente como falsa, não podemos dizer que essa sentença não possui tradução em outra linguagem. Podemos dizer que a tradução preserva o sentido de Frege ou o método de verificação como no caso dos positivistas; independentemente disso, a sentença, embora sem referente, possui um "referente em potencial" e isso deve ser preservado. Se a França voltasse a ter rei e esse rei fosse careca, a sentença em ambas as línguas deve deixar de ter valor de verdade falsa ou "ser sem significado" e passar a ser verdadeira. Isso não significa uma negação do Holismo sobre o significado – de fato, é perfeitamente aceitável admitir que, ao invés de aceitar que a sentença passe a ser verdadeira, se revise outra suposição teórica. Basta-nos que ambos os falantes sejam sensíveis à mudança de valor de verdade da proposição em questão. E, se for o caso que essa mudança acarrete o entendimento (através de MU) nos falantes de que eles não estão usando um mesmo referente, então isso se ajustará nas próximas iterações com MU. Não é o caso que o simples mapeamento das fórmulas com referência deve preservar o valor de verdade, isso garante apenas que a tradução "funcione" para o universo experiencial particular que os falantes vivem no momento. Para que, de fato, haja uma tradução no sentido mais forte, é preciso (e razoável) que as línguas preservem a tradução mesmo que se altere a realidade ou caso haja alguma nova descoberta das ciências. Por isso, a tradução ideal deve ser capaz de fixar as relações de referência, as flechas que ligam os nomes aos objetos. Consideramos apenas as teorias que fazem referência direta a objetos do mundo. Existe muita controvérsia se teorias desse tipo seriam mesmo possíveis. Assumimos como possíveis apenas como experimento abstrato. Isso não influenciará a discussão, porquanto, em última análise, queremos falar de teorias que não fazem referência direta como as teorias de primeira ordem. Capítulo 4. Sobre o que conta como tradução 85 A tradução ideal entre duas teorias de referência direta T1 e T2 deve ser um mapeamento entre as fórmulas de T2 em T1 tal que o requerimento existencial de uma fórmula de T2 seja o mesmo que o requerimento existencial da correspondente em T1. Para o caso das teorias que não fazem referência direta, o quadro muda. Os termos da teoria não apontam diretamente para o mundo, mas apenas exigem que aqueles objetos capturados pelos quantificadores satisfaçam um certo conjunto de propriedades. Nesses casos, deixamos de exigir que uma sentença traduzida aponte para o mesmo objeto que a sentença original – é necessário apenas que a coleção dos objetos apontados por ambas as teorias sejam isomorfos. Uma teoria de primeira ordem não fixa as referências, mas apenas como cada objeto capturado pelos quantificadores se relaciona um com os outros3. Ou seja, ZFC não fixa as suas referências como "conjuntos", nem PA fixa as suas referências como "números". Números podem ser referências para ZFC como conjuntos podem ser referências para PA. Essa é a dimensão que permite que teorias "que intencionam falar sobre diferentes coisas" possam ser traduzidas umas nas outras. Caso a teoria de conjuntos pudesse fixar os seus objetos com um quantificador do tipo ∀conjunto(x), então seria estranho falar em tradução de números na teoria dos conjuntos. Afinal, as relações de referência possuem as pontas restritas a um universo objetivo de referências. Como bem sabemos isso tanto não é possível em primeira ordem como não é desejável. É por isso que, ao falarmos de teorias de primeira ordem, afirmamos relações de referência a coleções de objetos "a menos de isomorfismo". Para termos um critério de correção para a tradução, precisamos ter um critério para dizer que as teorias referem ao "mesmo" objeto como tínhamos com o MU. Esse critério é, nesse caso, contextual. Dado um possível modelo de referências R1 para a teoria T1 e um possível modelo de referências R2 para a teoria T2, então a referência r1 de uma descrição definida traduzida dtrad(T1) é a "mesma" que a referência r2 da descrição original d em T2 se, e somente se, r1 se relaciona com todos os demais objetos traduzidos em R1 do mesmo modo que r2 se relaciona com todos os demais objetos de R2. Ainda, por que, no caso das teorias que não fixam a referência, devemos manter que a tradução preserva sentido? Dado uma descrição definida d(x), não podemos saber se a descrição possui referente até que a teoria prove que ∃xd(x). Contudo, mesmo que ainda não saibamos se isso é ou não o caso, a tradução deve ser capaz de estabelecer essa "transferência de requerimento existencial". De fato, algumas teorias de primeira ordem são decidíveis e, por essa razão, existe um procedimento que determina em definitivo se o predicado refere ou não. Para os casos de tradução entre teorias decidíveis, é argumentavelmente válido supor 3 No artigo In defense of a dogma, Grice e Strawson (1956) enfatizam esse aspecto como uma crítica ao TD de Quine. Capítulo 4. Sobre o que conta como tradução 86 que a tradução não precisa se concentrar em fixar as relações de referência, mas apenas que todas as descrições estejam mapeadas isomorficamente. Porém, isso não é válido em todo caso, se uma teoria é incompleta, existem descrições d(x) sobre as quais não podemos saber se elas têm referente ou não – é dever, nesse caso, preservar o requerimento existencial do mesmo modo que devemos preservar a tradução para "rei da França" ainda que ele não exista no momento. Entretanto, nesse caso, deixamos de falar de "fixar a relação de referência" e passamos a dizer que a tradução deve "fixar a relação de referência em um contexto isomorfo". Nesse caso, podemos afirmar quando a referência de uma sentença traduzida é a "mesma" que a da sentença original em todo o caso em que as referências para as teorias T1 e T2 estão completamente determinadas. Para que fosse possível afirmar um critério de "igualdade do sentido" independentemente dos modelos fixados para as teorias, seria necessário que as descrições dTrad(T1) e d tivessem a "mesma" referência para quaisquer dois modelos R1 e R2 de T1 e T2 respectivamente. Esse critério, todavia, não é possível irrestritamente. Não parece, ao menos em princípio, possível estabelecer uma tradução ideal entre quaisquer duas teorias. 4.3.1 Condições de idealização Como vimos, a característica fundamental de uma tradução é transferir os requerimentos existenciais. Ou seja, ela deveria ocorrer no nível das setas de referência, ao invés de ocorrer no nível das fórmulas. No nível das fórmulas esperamos formalizar um aparato capaz de fixar a transferência desejada para o nível das setas de referências. Caso todas as relações de referência a objetos de uma teoria possam ser convertidas em relações de referência a objetos de outra teoria, poderíamos dizer que a segunda consegue capturar todo importe ontológico da outra teoria e, portanto, consegue preservar os requerimentos existenciais da primeira teoria. Chamamos essa transferência de requerimentos existenciais de tradução ideal. Porém, lidar diretamente com a ideia de tradução é voltar ao mesmo problema da fixação do modelo pretendido para uma teoria, porquanto a relação de referência pressupõe as duas pontas da relação fixadas: fórmulas e objetos do modelo. O que se chama tradicionalmente de tradução é um mapeamento Map entre fórmulas de uma teoria T1 em fórmulas de outra teoria T2 que (i) preserva algumas propriedades da teoria traduzida e, principalmente, (ii) garante o resultado de consistência relativa entre as teorias (se T2 é consistente, então T1 é consistente). Consideramos, alinhados com a tradição, que uma prova de consistência relativa é fortemente ligada ao conceito de tradução. Contudo, se queremos falar da ideia de tradução ideal (isto é, da transferência de requerimentos existenciais), devemos minimizar nossas expectativas, afirmando que o mapeamento Map implica um aspecto (parcial ou total) da tradução ideal. Capítulo 4. Sobre o que conta como tradução 87 Esse modo de lidar com um conceito nos recoloca no chão e nos autoriza a falar significativamente de conceitos como tradução, analiticidade e significado. Recuperar essas idealizações é, ao mesmo tempo, recuperar o uso normativo da dicotomia que se lhes impõe e dar por cabo a ideia de que podemos realizar perfeitamente os seus requisitos. Reconhecer, pois, que posso admitir não haverem sentenças analíticas e ao mesmo tempo dizer que a atividade filosófica e a científica são fundamentalmente diferentes, por conta da dicotomia normativa imposta pela analitização ou não de conceitos. Com efeito, não haveria uma diferença fundamental entre qualquer sentença de um filósofo e de um cientista – sendo todas sujeitas à revisão empírica – mas haveria uma diferença fundamental na atitude diante de cada sentença. Sobre o conceito de "solteiro", um prefere discutir sobre a sentença "solteiros são em geral mais novos que os casados" e o outro prefere discutir se "solteiros são não-casados" – e todos sabemos quem é um e quem é outro. Não é, contudo, autorizado a qualquer conceito C a possibilidade de idealização. É preciso (1) que seja possível haver boas razões para dizer que certos X's são mais C do que outros Y's; (2) que o contexto no qual se relativiza a comparação é sujeito a menor relatividade que o contexto da afirmação de C. Com efeito, grande porção dos conceitos filosóficos se justificam precisamente desse modo e a ideia de inescrutabilidade do significado e analiticidade é simplesmente o resultado da inobservância de que, em última análise, qualquer conceito filosófico estaria sujeito em maior ou menor grau à mesma inescrutabilidade. Se não existem boas razões para que as sentenças α ou β sejam idealmente analíticas, existem boas razões para dizer que α ∨ β seja mais analítica que α e também que β; se não existem boas razões para dizer que o significado extensional de uma sentença é medido pela semântica de Tarski, existem bons motivos para dizer que outras opções são ruins; se, por fim, existem boas razões para dizer que interpretações não conseguem capturar tudo que uma tradução deve realizar, existem boas razões para dizer que interpretações realizam isso melhor do que o mero mapeamento de sentenças verdadeiras em sentenças verdadeiras. É a partir desse argumento que recuperamos a tradução: ainda que não exista um mapeamento entre fórmulas de uma linguagem em fórmulas de outra linguagem que transfira por completo os requerimentos existenciais de uma teoria na primeira linguagem para os requerimentos existenciais de uma teoria na outra linguagem, ainda existem motivos para entendermos certos métodos como capturando aspectos da tradução negligenciados por outros métodos. Isso, por outro lado, nos faz liberalizar o que conta como "tradução". Qualquer mapeamento que transfira em algum sentido comprometimentos ontológicos entre duas teorias pode contar como uma tradução. A questão, nesse caso, passa a ser a observação de que certas reduções não contam como um transporte completo de uma ontologia em uma outra e uma análise mais acurada do quanto essa imperfeição contamina a análise das ontologias Capítulo 4. Sobre o que conta como tradução 88 é necessária. Se, contudo, supomos que interpretações são o único método legítimo de tradução, então o caso em que nenhuma dentre duas teorias interpreta a outra seria intratável; nesse caso, a liberalização do que conta como uma tradução pode oferecer caminhos para a comparação entre ontologias onde não se era possível. 4.4 O sentido de tradução em uma prova de consistência relativa O que devemos preservar no mapeamento entre as fórmulas de duas teorias para que seja possível afirmar que existe uma transferência de requerimentos existenciais? Uma possível resposta para essa pergunta é simplesmente afirmar que todas as fórmulas verdadeiras de uma teoria devem ser mapeadas em fórmulas verdadeiras de outra teoria. Isso resulta da observação de que o contrário parece absurdo: se "2+2 = 4" for levada a uma sentença falsa de uma teoria qualquer, então é porque não houve tradução. Contudo, a própria noção de que fórmulas "são verdadeiras" está sujeita a indeterminações. Tomamos como "verdadeiras" todas as fórmulas que são verdadeiras em algum modelo? Tomamos como "verdadeiras" as fórmulas que são verdadeiras em um "modelo pretendido"? Tomamos como "verdadeiras" apenas fórmulas que são teoremas de uma teoria? É no mínimo razoável admitir que "2 + 2 = 4" seja traduzida em uma fórmula que sei que não é falsa. É também aceitável admitir que "2 + 2 = 4" seja traduzida em uma fórmula verdadeira no "modelo pretendido", como também que seja traduzida em um teorema. Supomos, provisoriamente, que todos os teoremas de uma teoria T1 devem ser mapeados em teoremas de uma teoria T2. Como bem observado pela tradição no assunto, um mapeamento que impõe apenas essa restrição é demasiado flexível: basta, por exemplo, que se mapeie todos os teoremas de T1 em algum teorema de T2. Entretanto, impondo a condição de que se α é mapeada em β, então ¬α é mapeada em ¬β – somos capazes de realizar alguma análise ontológica. O caso em que T1 é uma teoria inconsistente já não admite um mapeamento desse tipo em uma teoria consistente T2. Notadamente, isso significa que uma teoria inconsistente é ontologicamente irredutível a uma teoria consistente. De fato, uma teoria inconsistente se compromete com a existência de qualquer objeto, enquanto uma teoria consistente se compromete apenas com a existência de um universo particular de objetos. Outros tipos de exigência podem ser impostos para os mapeamentos, de modo que possamos afirmar vínculos mais estreitos entre duas ontologias. Podemos impor a preservação da estrutura booleana, como podemos impor que quantificações existenciais mantenhamse quantificações existenciais. Cada uma dessas restrições tem um papel na efetivação da transferência de comprometimento ontológico e, de modo geral, diremos que a soma de todas essas restrições resulta no método de mapeamento. Capítulo 4. Sobre o que conta como tradução 89 Em particular, um método de mapeamento é frequentemente utilizado no estudo das reduções ontológicas: as provas de consistência relativa (PCR). Pelo teorema de completude de primeira ordem, sabemos que a consistência de uma teoria implica uma ontologia. Por essa razão, a prova de que a consistência de uma teoria T1 implica a consistência de uma teoria T2 é uma boa razão para se supor que a ontologia de T2 é redutível à ontologia de T1. Porém, como vimos nas seções anteriores, isso não é suficiente para afirmar a redução. Nesse caso, chamaremos de o sentido de tradução de uma PCR aquilo que há de transferência de comprometimento ontológico nessa PCR. 4.4.1 O esquema geral para o sentido de tradução As interpretações impõem excessivas restrições sobre o que conta como uma tradução. O esquema de interpretação demanda que cada fórmula α de uma teoria T1 seja interpretada como uma fórmula única αI na linguagem de T2. O procedimento para determinar αI é 1. Regular: predicados, constantes e funções de T1 são interpretados por predicados, constantes e funções definíveis em T2. 2. Uniforme: predicados, constantes e funções são sempre interpretados do mesmo modo, independente de onde ou como ocorrem nas fórmulas de T1. 3. Universalmente regular: quantificadores interpretados são quantificadores limitados por um único predicado em T2. No tratamento das linguagens naturais, somos habituados a fazer traduções nas quais o contexto pesa substancialmente no processo gerador da frase traduzida. Com efeito, o caso em que as exatas palavras do dicionário substituídas em uma frase forma uma frase na outra língua com o sentido desejado é de um tipo especial e, geralmente, está associado a construções bastante simples de ambas as línguas. Entretanto, nas linguagens formais, a exigência de uniformidade parece mais natural, embora não necessária: não é, em absoluto, estranho supor uma tradução da relação de pertencimento que signifique algo quando falamos de "conjuntos de uma espécie" e outra quando falamos de "conjuntos de uma outra espécie". Argumento similar pode ser usado para negar a necessidade da universal regularidade. É possível imaginar que o contexto dos quantificadores mude de acordo com a sentença que se deseja traduzir. Isto é, o predicado que define o universo de interpretação poderia ser variável de acordo com as fórmulas que estão sendo analisadas. Naturalmente, é necessário que esse universo alterne de um modo ordenado, mantendo a coesão necessária para que a condição Capítulo 4. Sobre o que conta como tradução 90 de correção seja possivelmente obtida. Porém, nada em princípio impede que o universo de interpretação varie com o contexto. Por isso, para criar uma noção flexibilizada de interpretação, partimos da análise de duas forças antagônicas: 1. relaxar, de acordo com as condições de equivalência e inteligibilidade, as características (2) e (3) da interpretação. 2. mantendo uma versão do teorema da interpretação de tal forma que ele ainda implique a consistência relativa. O teorema da interpretação afirma que, se todos os axiomas de uma teoria T1 são interpretados em teoremas de uma teoria T2, então todos os teoremas de T1 são interpretados em teoremas de T2. Isso significa que a interpretação preserva a estrutura lógica dos argumentos em T1. De modo similar, esperamos que uma versão flexibilizada satisfaça: Se T2 enxerga como verdadeiro cada axioma de T1 trazido através da tradução para um universo compreensível a T2, então o mesmo vale para qualquer teorema de T1. Convertemos essa condição em linguagem simbólica usando a seguinte notação: 1. αTr(T2) denota "α trazida para o universo compreensível de T2"; 2. ⊢s denota "enxergar como verdadeiro" de modo apropriado à definição de Tr(T2). Segue, portanto, em linguagem simbólica o esquema geral de interpretação: Teorema 8 (Esquema geral de interpretação) Dadas duas teorias T1 e T2 e sendo que para todo axioma αi de T1 vale que T2 ⊢s αTr(T2)i , então: T1 ⊢ α ⇒ T2 ⊢s αTr(T2) Por fim, para ser possível obter a PCR, basta que se imponha sobre o ⊢s e Tr(T2) a seguinte condição: Definição 16 Se T2 ⊢s αTr(T2) ∧ ¬αTr(T2), então existe alguma β em T2 tal que T2 ⊢ β ∧ ¬β. Capítulo 4. Sobre o que conta como tradução 91 Um método que satisfaça essas condições apresenta grande claim por realizar transferência de comprometimentos existenciais. Porém, ainda se é necessário responder se existe ou não método que satisfaça essas exigências que não seja o próprio método de interpretação. De fato, é possível nesse esquema capturar as provas de consistência relativa nas quais se supõe a existência de um modelo para uma teoria e se prova que existe modelo para a outra4. É precisamente isso que faremos no próximo capítulo. 4 Muitas das provas de consistência relativa por modelos são redutíveis a provas por interpretações. Porém, isso não vale irrestritamente. Um exemplo para isso é a prova de equiconsistência entre NBG e ZFC de Novak. 92 5 Explorando o esquema geral de redução Comumente toma-se as interpretações como o único conceito de tradução admissível. Apesar disso, como vimos no capítulo anterior, defendemos a posição de que todo método de tradução deve ser considerado com suspeita. Ao invés de afirmar que um método privilegiado é uma tradução, devemos começar pelas perguntas: o que uma tradução deve fazer? O que ela deve preservar? Argumentamos que a tradução de uma teoria T1 deve preservar características da teoria traduzida de modo que as possíveis relações de referência da teoria T2 possam ser emuladas através das relações de referência de T1. Isso, porém, é dificilmente formalizável. Depende extensivamente de quão flexível somos em admitir que tipos particulares de emulação de fato representam as relações de referência que deveriam. Frequentemente, uma teoria é interpretável em uma outra e, ainda assim, não é possível construir uma tradução no caso de sermos mais exigentes com relação à emulação. Esse é o caso de PA e ZFfin1. Essas teorias são mutualmente interpretáveis e, ainda assim, não são bi-interpretáveis2. Apesar de ZFfin interpretar PA, ela não consegue enxergar a cópia de si mesma em PA como uma cópia isomórfica (o requerimento extra das biinterpretações). Esse resultado foi recebido pela comunidade matemática como evidência para não tomarmos ZFfin como o equivalente conjuntista de PA. Ao contrário, foi adicionado o axioma dos conjuntos hereditariamente finitos a ZFfin (ZFt−fin); Kaye e Wong (2007) provaram que essa nova teoria é de fato bi-interpretável com PA. O resultado mencionado acima mostra que ser mais exigente pode revelar aspectos sutis da relação de redutibilidade. Podemos, nesse caso, entender a falha da bi-interpretação como evidência de que a flexibilidade das interpretações mútuas criaram a ilusão de que as teorias eram ontologicamente equivalentes – enquanto uma noção mais restrita de emulação mostra que, de fato, ZFfin não pode reduzir PA às suas relações de referência. Isso significa que devemos tomar os métodos mais restritos como o verdadeiro conceito de tradução? Acreditamos que não, ainda pode ser o caso que um método mais exigente não possa oferecer qualquer redução entre duas teorias em particular, i.e. a tradução é tão inflexível que nenhuma comparação pode ser feita. 1 ZFfin representa a teoria de conjuntos Zermelo-Fraenkel sem o axioma do infinito e com a negação do axioma do infinito. 2 Definiremos bi-interpretações mais à frente no texto. Por agora, precisamos apenas estar conscientes de que bi-interpretações são exigências sobre uma relação de interpretação mútua entre duas teorias. Capítulo 5. Explorando o esquema geral de redução 93 Neste capítulo, investigaremos o caso em que não existe interpretação entre duas teorias e, ainda assim, existe um modo de estabelecer uma comparação entre elas. A ideia de estabelecer essa comparação não é estranha: é amplamente comum provar a consistência relativa entre duas teorias pela demonstração de que podemos usar o modelo de uma teoria para gerar um modelo para a outra teoria. É geralmente assumido (mas enganosamente) que esse tipo de construção implica a existência de uma interpretação entre as teorias avaliadas. Esse é o caso, por exemplo, da prova de consistência relativa de ZF e NBG por Novak (1950). Conquanto possamos provar que existe um modelo para NBG a partir da suposição de um modelo para ZF, não existe uma interpretação de NBG em ZF. Vamos, portanto, apresentar um modo através do qual a construção de Novak possa ser usada para oferecer um sentido de tradução de NBG em ZF. 5.1 O problema das traduções modelo-teoréticas Como argumentado, queremos reinterpretar a construção de Novak como uma tradução. Contudo, essa parece uma tarefa impossível, uma vez que as técnicas modelo-teoréticas (quando usadas necessariamente) são de natureza infinitária. Não é, com efeito, possível por técnicas tradicionais reduzir NBG a ZF sem recorrer ao infinito atual. E nos parece sem sentido falar de traduções para as quais temos apenas descrições infinitárias. Assumimos, desse modo, a tarefa de oferecer um tipo de tradução que acomode essa crítica. Mas como? O passo principal para realizar essa tarefa é separar a descrição da tradução da prova de que a tradução é correta. Enquanto o método de tradução deve, de algum modo, ser construtivo, a correção para a mesma tradução não depende por princípio de nenhum tipo de performance. Definição 17 Dividimos 1. Mapeamento tradutivo: o processo gerador de fórmulas que emulam o significado da fórmula original. 2. Correção da tradução: a prova de que o mapeamento entre as fórmulas preserva o significado original. A nossa ideia será empurrar todos os aspectos infinitários da redução modelo-teorética para a sua prova de correção. Ainda assim, devemos ter cuidado com o modo como geramos as fórmulas traduzidas. Isso deve ser executado pela flexibilização da técnica de interpretação; nesse caso, seremos capazes de dizer que as interpretações são um caso particular do tipo modelo-teorético de tradução. Capítulo 5. Explorando o esquema geral de redução 94 5.2 Tradução tipo-modelo Ao lidarmos com interpretações, tomamos cada predicado da linguagem traduzida e substituímos por uma única fórmula na teoria tradutora. Aqui, rejeitamos esse impedimento, admitindo que cada predicado pode ser mapeado em um número de fórmulas (podendo ser enumerável). O contexto de ocorrência deve ser suficiente para determinar qual é/são a/as correta/s interpretação/ões para o predicado/s. Essa é uma abordagem para a ideia de que interpretações para cada predicado podem variar de acordo com o contexto em que eles ocorrem nas fórmulas. Consideremos o modo como, de fato, podemos gerar tais traduções. Primeiramente, consideremos a simplificação notacional que não afetará os nossos resultados: tomemos como base a transformação em fórmulas prenexas. Isso, embora não prejudicial, provoca a necessidade de uma prova extra: que quaisquer métodos de prenexação têm o mesmo efeito sobre a tradução. Se em uma interpretação lidamos com cada variável quantificada na ordem de sua ocorrência, então o procedimento para obtermos αI a partir de α será finalizado em n (o número de quantificadores ocorrendo em α) passos. Por exemplo, se temos a fórmula ∀x∃y∀z(xPy ∧ yPz → xPz), a interpretação ocorrerá nos seguintes passos: ∀x ∈ U∃y∀z(xP Iy ∧ yPz → xP Iz), ∀x ∈ U∃y ∈ U∀z(xP Iy ∧ yP Iz → xP Iz), ∀x ∈ U∃y ∈ U∀z ∈ U(xP Iy ∧ yP Iz → xP Iz). Com efeito, a interpretação de α gera uma sequência de n passos α, α2, α3, . . . , αn−1, αI . Em contraste, o novo método formará uma árvore de profundidade n. Cada nó da árvore vai então ramificar em cada uma das possíveis substituições para o predicado interpretado. Vejamos uma versão ilustrativa e simplificada da árvore que geraríamos para a mesma fórmula ∀x∃y∀z(xPy ∧ yPz → xPz) (abreviamos U(x, ∃y(xPy → yPy)) e U(y, (xPy → yPy)) por Ux e Uy). Cada interpretação para o predicado P será anotada por I1, I2, . . . , In. Capítulo 5. Explorando o esquema geral de redução 95 ∀x∃y(xPy → yPy) ∀x ∈ Ux∃y(xP Iiy → yPy) ∀x ∈ Ux∃y ∈ Uy(xP Iiy → yP Iiy) ... ∀x ∈ Ux∃y ∈ Uy(xP Iiy → yP I2y) ∀x ∈ Ux∃y ∈ Uy(xP Iiy → yP I1y) ... ∀x ∈ Ux∃y(xP I2y → yPy) ∀x ∈ Ux∃y ∈ Uy(xP I2y → yP Iiy) ... ∀x ∈ Ux∃y ∈ Uy(xP I2y → yP I2y) ∀x ∈ Ux∃y ∈ Uy(xP I2y → yP I1y) ∀x ∈ Ux∃y(xP I1y → yPy) ∀x ∈ Ux∃y ∈ Uy(xP I1y → yP Iiy) ... ∀x ∈ Ux∃y ∈ Uy(xP I1y → yP I2y) ∀x ∈ Ux∃y ∈ Uy(xP I1y → yP I1y) Continuamos com a definição precisa da árvore de tradução. Antes, alguma notação simplificará o nosso trabalho. Para um predicado binário P 3 em T1, definimos um funtor IP : ⟨β1, β2⟩ −→ α e um conjunto Id de todas as fórmulas de duas variáveis livres (x1 e x2) em T2. Como Id é um conjunto ordenável, podemos denotar IP ⟨φ, γ⟩ por P I(n,m) , sendo φ a n'ésima fórmula em Id e γ a m'ézima fórmula em Id. Finalmente, chamamos xiP I(n,m)xj a substituição de x1 e x2 por xi e xj em P I(n,m) . Definimos a transformação *(xi,Ik) para fórmulas abertas: 1. Se α é xiPxj, então α*(xi,Ik)*(xj ,Iq) é x′iP I(k,q)x′j. 2. Se α é xiPxj, então α*(xj ,Iq)*(xi,Ik) é x′iP I(k,q)x′j. 4 3 Consideramos somente teorias com apenas um predicado binário, porquanto os demais casos seguem facilmente. 4 O propósito de ter xi substituído por x′i garante que a transformação *(xi,Il) não afete a variável xi. Mais à frente, usaremos simplesmente xi, já que podemos evitar a quantificação dupla usando as fórmulas variantes equivalentes. Esperamos que isso seja suficientemente claro pelo contexto. Capítulo 5. Explorando o esquema geral de redução 96 3. Se xi não ocorre em α, então α*(xi,Ik) é α. 4. Se α é γ ∨ β, então α*(xi,Ik) é γ*(xi,Ik) ∨ β*(xi,Ik) . 5. Se α é ¬γ, então α*(xi,Ik) é ¬γ*(xi,Ik) . O conjunto Id é responsável por fixar a uniformidade do tratamento das variáveis. Usando a estrutura acima, podemos garantir que cada variável x é afetada pela transformação do tipo *(x,Ik) uma única vez. A relação de identidade usa a mesma estrutura. É necessário internalizar o funtor I= com as mesmas propriedades de IP mostradas acima. O que fixa a relação entre o predicado P e = é o fato que ambas estão vinculadas ao mesmo conjunto Id. Apesar disso, como lidamos com lógica de primeira ordem, precisamos impor algumas condições extras sobre I=. A descrição dessas condições será realizada mais à frente no trabalho. Definição 18 Seja α uma fórmula prenexa da forma Q1x1Q2x2 . . . Qnxnβ em T1, então αTr(T2) é uma árvore tal que α é o nó inicial e 1. cada nó de nível i é da forma Q1x1 ∈ Ux1 . . . Qixi ∈ Uxi(Qi+1xi+1 . . . Qnxnβ *(x1,Ik1 ) *(x2,Ik2 ) ...*(xi,Iki )). 2. o nó pai do nó descrito no item anterior é o seguinte nó Q1x1 ∈ Ux1 . . . Qi−1xi−1 ∈ Uxi−1(Qixi . . . Qnxnβ *(x1,Ik1 ) *(x2,Ik2 ) ...*(xi−1,Iki−1 )). 3. e para cada q esse nó pai tem um filho β*(x1,Ik1 )*(x2,Ik2 )...*(xi,Iq). Dizemos que a tradução é, com efeito, o processo gerador dessa finita (ou potencialmente infinita) árvore. Isso é suficiente para garantirmos que a tradução seja inteligível, dado que a árvore pode ser escrita como uma precisa e finita descrição (mesmo no caso potencialmente infinito). No entanto, ainda precisamos definir a validade para cada árvore de acordo com o Esquema Geral de Interpretação e a Condição. Seguidamente, definimos recursivamente a validade para a árvore das fórmulas prenexas. Isso será feito em duas etapas: definimos a condição de validade para as folhas e então o modo recursivo pelo qual propagamos o resultado das folhas para o restante da árvore. Para esse propósito, definimos S : Form −→ Form como o funtor que recebe folhas e retorna uma sentença que pode ser avaliada no sistema regular de prova: Capítulo 5. Explorando o esquema geral de redução 97 Definição 19 (Validade para folhas) Seja α uma sentença prenexa em T1. Se β é uma folha em αTr(T2), então T2 ⊢s β se, e somente se, T2 ⊢ S(β) Definição 20 (Validade para nó) Seja α uma sentença prenexa em T1, então 1. Se a quantificação tratada em β é universal, então T2 ⊢s β se, e somente se, T2 ⊢s γ para cada filho de β. 2. Se a quantificação tratada em β é existencial, então T2 ⊢s β se, e somente se, T2 ⊢s γ para algum filho de β. A definição ainda não impõe as restrições necessárias para os requerimentos de uma tradução. A razão para isso, por um lado, é que ainda não impusemos restrições sobre os predicados xi ∈ Uxi . E, por outro lado, não impusemos que a interpretação da igualdade satisfaz versões do axioma da identidade e igualdade. Entretanto, prosseguimos com definições incompletas, preenchendo os vazios assim que eles se tornem necessários para provar o esquema geral de interpretação. 5.2.1 Condição Prenexa Até o momento, lidamos apenas com as sentenças prenexas. Por isso, precisamos de um mecanismo que traga as fórmulas em geral para os seus equivalentes prenexos de um modo organizado. Prosseguimos pela expansão da definição de ⊢s para as fórmulas em geral: Definição 21 Seja α uma fórmula qualquer em T1, α′ a forma prenexa de α e α′′ o fechamento universal de α′, então αTr(T2) é (α′′)Tr(T2). Notadamente, a definição de validade em ⊢s está consequentemente definida. É suficiente dizer que T2 ⊢s αTr(T2) se, e somente se, T2 ⊢s (α′′)Tr(T2). Porém, é necessário demonstrar que isso preserva as equivalências prenexas da teoria original, i.e. duas fórmulas prenexas equivalentes levam ao mesmo resultado no sistema ⊢s: Definição 22 (Condição de equivalência prenexa) Sejam α1 e α2 formas prenexas de α. T ⊢s (α1)Tr(T ) ⇐⇒ T ⊢s (α2)Tr(T ) Capítulo 5. Explorando o esquema geral de redução 98 Inicialmente, analisamos o simples caso em que α é ∀xβ∨∃yγ, α1 e α2 são ∀x∃y(β∨γ) e ∃y∀x(β ∨ γ). Por uma exposição mais simples, tomamos Id como um conjunto com apenas dois elementos. Nesse caso, obtemos duas árvores de tradução (abreviamos *(x,Ik) por *xk , o contexto deixa isso claro): α1 := ∀x∃y(β ∨ γ) ∀x ∈ Ux∃y(β*x2 ∨ γ*x2 ) ∀x ∈ Ux∃y ∈ Uy(β*x2 *y2 ∨γ*x2 *y2 ) ∀x ∈ Ux∃y ∈ Uy(β*x2 *y1 ∨γ*x2 *y1 ) ∀x ∈ Ux∃y(β*x1 ∨ γ*x1 ) ∀x ∈ Ux∃y ∈ Uy(β*x1 *y2 ∨γ*x1 *y2 ) ∀x ∈ Ux∃y ∈ Uy(β*x1 *y1 ∨γ*x1 *y1 ) e α2 := ∃y∀x(β ∨ γ) ∃y ∈ Uy∀x(β*y2 ∨ γ*y2 ) ∃y ∈ Uy∀x ∈ Ux(β*y2 *x2 ∨γ*y2 *x2 ) ∃y ∈ Uy∀x ∈ Ux(β*y2 *x1 ∨γ*y2 *x1 ) ∃y ∈ Uy∀x(β*y1 ∨ γ*y1 ) ∃y ∈ Uy∀x ∈ Ux(β*y1 *x2 ∨γ*y1 *x2 ) ∃y ∈ Uy∀x ∈ Ux(β*y1 *x1 ∨γ*y1 *x1 ) Suponhamos que T ⊢s α1. Pela estrutura da árvore, isso significa que {T ⊢ ∀x ∈ Ux∃y ∈ Uy(β*x1 *y1 ∨ γ*x1 *y1 ) ou T ⊢ ∀x ∈ Ux∃y ∈ Uy(β*x1 *y2 ∨ γ*x1 *y2 )} e {T ⊢ ∀x ∈ Ux∃y ∈ Uy(β*x2 *y1 ∨ γ*x2 *y1 ) ou T ⊢ ∀x ∈ Ux∃y ∈ Uy(β*x2 *y2 ∨ γ*x2 *y2 )}. Se queremos provar que T ⊢s α2, devemos mostrar que isso implica {T ⊢ ∃y ∈ Uy∀x ∈ Ux(β*y1 *x1 ∨ γ*y1 *x1 ) e T ⊢ ∃y ∈ Uy∀x ∈ Ux(β*y1 *x2 ∨ γ*y1 *x2 )} ou {T ⊢ ∃y ∈ Uy∀x ∈ Ux(β*y2 *x1 ∨ γ*y2 *x1 ) e T ⊢ ∃y ∈ Uy∀x ∈ Ux(β*y2 *x2 ∨ γ*y2 *x2 )}. Pela definição de T ⊢s α1 e porque x/y não ocorrem em γ/β, concluímos {T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y1 ou T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y2 } e {T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y1 ou T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y2 }. E, similarmente, precisamos implicar: {T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y1 e T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y1 } ou {T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y2 e T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y2 }. Capítulo 5. Explorando o esquema geral de redução 99 Contudo, essa implicação não é o caso em geral. É suficiente notar o caso em que T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y1 T 0 ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y2 T 0 ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y1 T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y2 Esse caso satisfaria T ⊢s α1, mas não satisfaria T ⊢s α2. Para solucionar esse problema, devemos exigir que a prova de correção para a tradução não ocorra em T , mas em alguma extensão completa de T que satisfaça a relação desejada. Podemos, como fazemos, vincular a relação de satisfação a um extensão completa de T. Nesse caso, a condição prenexa é satisfeita naturalmente. Isso significa que nossa relação ⊢s é relativa à escolha de uma extensão completa da teoria tradutora: o s em ⊢s, de fato, representa a estratégia para completar a teoria original e o funtor S. Precisamos, portanto, emendar a condição sobre as folhas em ⊢s: Definição 23 (Emendado) Se α é uma sentença prenexa em T1 e T s2 uma extensão completa de T2, então 1. Se β é uma folha em αTr(T2), então T2 ⊢s β se, e somente se, T s2 ⊢ S(β). 2. Se a quantificação tratada em β é universal, então T2 ⊢s β se, e somente se, T2 ⊢s γ para cada filho de β. 3. Se a quantificação tratada em β é existencial, então T2 ⊢s β se, e somente se, T2 ⊢s γ para algum filho de β. Ainda assim, a condição exigida poderia ser um pouco mais fraca do que tomar T s como completa. Precisamos apenas que a teoria seja completa sobre a linguagem das folhas em ⊢s: Definição 24 (Subcondição de equivalência prenexa) Tr(T ) em L e T s são tais que, para toda α em L, se T ⊢s αTr(T ), então, para toda folha α*i na árvore αTr(T ), T s ⊢ S(α*i) ou T s ⊢ S(¬α*i) Para simplificar as provas dessa seção, consideramos S como o funtor identidade. A prova do lema seguinte será similar para qualquer S adequado: Capítulo 5. Explorando o esquema geral de redução 100 Lema 10 Se Tr(T ) em L e T satisfazem a subcondição de equivalência prenexa, então satisfazem a condição de equivalência prenexa. Prova. Apenas mostraremos a estratégia da prova, em que a subcondição é suficiente para superar as dificuldades apresentadas acima. Suponhamos que T ⊢s αTr(T )1 , então {T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y1 ou T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y2 } e {T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y1 ou T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y2 }. Como T é completa para as folhas em αTr(T )1 , obtemos {T ⊢ ∀x ∈ Uxβ*x1 ou T ⊢ ∃y ∈ Uyγ*y1 ou T ⊢ ∀x ∈ Uxβ*x1 ou T ⊢ ∃y ∈ Uyγ*y2 }. e {T ⊢ ∀x ∈ Uxβ*x2 ou T ⊢ ∃y ∈ Uyγ*y1 ou T ⊢ ∀x ∈ Uxβ*x2 ou T ⊢ ∃y ∈ Uyγ*y2 }. Por sua vez, isso implica tautologicamente {(T ⊢ ∀x ∈ Uxβ*x1 ou T ⊢ ∃y ∈ Uyγ*y1 ) e (T ⊢ ∀x ∈ Uxβ*x2 ou T ⊢ ∃y ∈ Uyγ*y1 )} {(T ⊢ ∀x ∈ Uxβ*x1 ou T ⊢ ∃y ∈ Uyγ*y2 ) e (T ⊢ ∀x ∈ Uxβ*x2 ou T ⊢ ∃y ∈ Uyγ*y2 )}. Portanto, {T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y1 e T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y1 } {T ⊢ ∀x ∈ Uxβ*x1 ∨ ∃y ∈ Uyγ*y2 e T ⊢ ∀x ∈ Uxβ*x2 ∨ ∃y ∈ Uyγ*y2 }. Assim, T ⊢s αTr(T )2 . O que resta na prova pode ser feito por simples indução.  A subcondição pode parecer excessivamente arbitrária. De fato, isso não deveria ser necessariamente um problema; mantemos como princípio que qualquer método explícito de realizar traduções implica arbitrariedades. A expressividade de qualquer técnica de tradução é fundada na admissão de algumas restrições e, nesse sentido, fixar algumas restrições menos comprometedoras ampliam nossa capacidade de realizar traduções. Com efeito, o único modo de não impor restrições é não afirmar qualquer método de tradução. Apesar disso, mantemos que a subcondição não é desmotivada. Quando, por exemplo, consideramos o caso regular de interpretação, observamos que a condição vale trivialmente. Isto é, se T ⊢ αI , então T ⊢ αI ou T ⊢ ¬αI . Como ⊢s, cada "teorema" traduzido tem uma árvore de tradução completamente compreensível. Naturalmente, o oposto também seria admissível: é razoável manter que o entendimento de uma sentença traduzida não depende da avaliação completa da árvore. Com efeito, admitimos que um sistema ainda mais flexível pode ser definido. Contudo, fixamos esse nível de restrição porque é suficiente para dar conta das provas modelo-teoréticas de consistência relativa. Capítulo 5. Explorando o esquema geral de redução 101 5.2.2 Condição de Coerência Como dito anteriormente, precisamos provar a conexão do sistema proposto com a consistência relativa. Então, provamos o seguinte: Teorema 5.1 (para a condição de coerência) Se T ⊢s αTr(T ) e T ⊢s (¬α)Tr(T ), então existe β tal que T s ⊢ β e T s ⊢ ¬β. Prova. Notamos que, se a fórmulas prenexa α é da forma Qx(α′), então existe uma outra para ¬α da forma Q′x(¬α′) (Sendo Q′ a quantificação dual de Q). Então, para cada nível das árvores αTr(T ) e ¬αTr(T ), estaremos lidando com uma quantificação universal e outra existencial. Mais ainda, observamos que as folhas em ambas árvores são organizadas de um modo similar. Se sobrepusermos as árvores, as folhas superpostas serão tais que: se Qx ∈ Ux(α*) é a folha de uma árvore, então Q′x ∈ Ux(¬α*) é a folha da outra (nesse caso, dizemos que as folhas têm a mesma posição). Em vista desse comentário, provamos por indução que se T ⊢s αTr(T ) e T ⊢s (¬α)Tr(T ), então pelo menos uma folhaQx ∈ Ux(α*) em αTr(T ) e a folha de mesma posiçãoQ′x ∈ Ux(¬α*) em (¬α)Tr(T ) são tais que T s ⊢ Qx ∈ Ux(α*) e T s ⊢ Q′x ∈ Ux(¬α*). Naturalmente, a fórmula Q′x ∈ Ux(¬α*) é logicamente equivalente a ¬(Qx ∈ Ux(α*)), assim, se o resultado vale, existe uma fórmula β ≡ Qx ∈ Ux(α*) tal que T s ⊢ β e T s ⊢ ¬β como desejado. Por indução, supomos que, para algum nível k da árvore, vale a afirmação para dois nós de mesma posição T ⊢s Q1x1 ∈ Ux1 . . . Qkxk ∈ UxkQx(α*⟨1,2,...,k⟩) (5.1) T ⊢s Q′1x1 ∈ Ux1 . . . Q′kxk ∈ UxkQ′x(¬α*⟨1,2,...,k⟩), (5.2) sendo *⟨1,2,...,k⟩ a abreviação de alguma sequência da forma *(x1,Id1 ) *(x2,Id2 ) . . . *(xk,Idk ). Para o nível seguinte, pelo menos um dos quantificadores Qk+1 ou Q′k+1 é universal. Suponhamos, sem perder generalidade, que Qk+1 é universal; nesse caso, Q′k+1 é existencial. Porque a segunda equação acima vale e Q′k+1 é existencial, sabemos que, para algum filho *⟨1,2,...,k,k+1⟩ do nó *⟨1,2,...,k⟩, T ⊢s Q′1x1 ∈ Ux1 . . . Q′kxk ∈ UxkQ′k+1xk+1 ∈ Uxk+1Q′x(¬α*⟨1,2,...,k,k+1⟩). (5.3) Por outro lado, para qualquer filho γi de *⟨1,2,...,k⟩ em αTr(T ), T ⊢s γi. Em particular, T ⊢s Q1x1 ∈ Ux1 . . . Qkxk ∈ UxkQk+1xk+1 ∈ Uxk+1Qx(α*⟨1,2,...,k,k+1⟩). (5.4) como desejado. Capítulo 5. Explorando o esquema geral de redução 102 Como o caso em que k = 0 é equivalente à suposição do teorema, então esse argumento finaliza a indução.  5.2.3 Preservando derivações em lógica de primeira ordem Provaremos que as regras e axiomas lógicos são preservados no sistema ⊢s. A partir disso, o esquema geral de interpretação segue naturalmente. Começamos por provar o seguinte lema sobre tautologias: Lema 11 Se α é uma tautologia, então ⊢s α. Prova. A prova é uma consequência natural do fato que *(x1,i1) *(x2,i2) . . . *(xn,in) preserva a estrutura booleana das fórmulas. Se a fórmula original é uma tautologia, então cada folha da árvore de tradução é uma tautologia.  Especificaremos a seguir as condições para a operação de identidade. O primeiro objetivo é recuperar o axioma da identidade: Lema 12 Se α é um axioma de identidade x = x, então ⊢s αTr(T ). A tradução para (x = x)Tr(T ) tem folhas da forma ∀x ∈ Ux(x =I(k,k) x); então, para cada k, precisamos que T ⊢ ∀x ∈ Ux(I=⟨αk, αk⟩(x, x)) Para esse propósito, adicionamos a primeira restrição sobre o funtor I=: Definição 25 (Condição de identidade) O funtor I= em Tr(T ) deve ser tal que a fórmula I=⟨αk, αk⟩(x, x) é uma quasi-tautologia. Mais ainda, o axioma da identidade deve valer em qualquer contexto. Por essa razão, devemos ter uma fórmula U que encapsule todos os possíveis contextos U(x, α). Definição 26 (Condição sobre o universo de quantificação) Existe uma fórmula U tal que, para toda α, T ⊢ x ∈ U(x, α) → x ∈ U . Com isso, fixamos o contexto para identidade U(x, x = x) = U . Seguimos com a avaliação do axioma de igualdade: Capítulo 5. Explorando o esquema geral de redução 103 Lema 13 Se α é um axioma de igualdade: 1. x = y → f(x) = f(y) 2. x = y ∧ z = w → (xPz ↔ yPw) então ⊢s αTr(T ). Notadamente, se temos um axioma da forma x = y ∧ z = w → x ∈ z ↔ y ∈ w, então as folhas terão a forma: ∀x, y, z, w ∈ Ux,y,z,w((x =I(i,j) y) ∧ (z =I(k,q) w) → (x =P(i,k) z) ↔ (y =P(j,q) w)) Aqui inserimos mais uma restrição sobre o funtor de identidade, ele não deve depender da estrutura do predicado P . Entretanto, como o funtor IP é muito amplo, a restrição incide pesadamente sobre a identidade. Em último caso, isso faz com que as fórmulas sobre x e y sejam intersubstituíveis. O mesmo argumento sobre o contexto quantificacional se aplica ao caso da igualdade. Por essa razão, a abreviação ∀x, y, z, w ∈ Ux,y,z,w deve ser ∀x, y, z, w ∈ U . Definição 27 (Condição de igualdade) O funtor I= ;e tal que ⊢ I=⟨αi, αj⟩(x, y) → ∀z ∈ U(αi(z) ↔ αj(z)) Essa condição é, naturalmente, compatível com a condição de identidade, uma vez que é consequência tautológica da condição de igualdade no caso i = j. Resta-nos mostrar que o lema segue dessa condição: Prova. [13] Mostraremos que, para todo i, j, k, q, se a condição vale, então ∀x, y, z, w ∈ U((x =I(i,j) y) ∧ (z =I(k,q) w) → (x =P(i,k) z) ↔ (x =P(i,k) z)). Suponhamos (x =I(i,j) y) ∧ (z =I(k,q) w), então, obtemos ∀a ∈ U(αi(a) ↔ αj(a)) ∧ ∀a ∈ U(αk(a) ↔ αq(a)). Disso, concluímos, pelo teorema da igualdade, ∀x, z ∈ U(IP ⟨αi, αk⟩(x, z) ↔ IP ⟨αj, αq⟩(x, z)). Isso, por sua vez, implica ∀x, z, y, w ∈ U(IP ⟨αi, αk⟩(x, z) ↔ IP ⟨αj, αq⟩(y, w)). Capítulo 5. Explorando o esquema geral de redução 104  Continuamos com a prova do axioma da substituição para a lógica. Lema 14 Se α é um axioma da substituição lógica, ⊢s αTr(T ). Agora precisamos definir o tratamento para as constantes. Nesse caso, fixamos uma fórmula em Id para cada constante e então as tratamos como fazemos para as variáveis: 1. cI é alguma α ∈ Id. 2. se α é xiPc, então α*(xi,Ik) é IP ⟨αi, cI⟩(x′i, xc). 3. se α é cPxi, então α*(xi,Ik) é IP ⟨cI , αi⟩(xc, x′i). A condição para que isso seja bem definido é a seguinte: Definição 28 (Condição para constantes) Para toda constante T ⊢s (∃!x(x = c))Tr(T ). Notamos que a transformação para as constantes pode ser emulada como qualquer variável. A única diferença importante é que, para as constantes, a árvore de tradução não ramifica. Por essa razão, introduzimos a notação: *(x,Ic) que é equivalente a *(x,Ii), quando a i'ézima fórmula de Id é a fórmula da constante c. Seguimos com a prova do lema. Prova. Um axioma da substituição γ(c) → ∃xγ(x) tem como forma prenexa uma fórmula do tipo ∃xQy(β(c, y) → β(x, y)). Segue que a folha da árvore de tradução é da forma: ∃x ∈ UxQy ∈ Uy(β *(x,Ic)*(y1,Ik1 ) ...*(yn,Ikn ) → β*(x,Ik0 )*(y1,Ik1 )...*(yn,Ikn )) (5.5) Chamamos o lado esquerdo da fórmula anterior β1 e o lado direito β2. Se tomamos a ramificação do primeiro nível onde Ik0 = Ic, observamos que todas as folhas nesse ramo são tais que β1 = β2. Notadamente, isso significa que todas as folhas são tautologias nesse ramo. Então, se Ii = Ic T ⊢s ∃x ∈ Ux(γ(c) → γ(x))*(x,Ii) . Isso, por sua vez, é suficiente para obter o lema, já que a quantificação sobre x é existencial.  Capítulo 5. Explorando o esquema geral de redução 105 Lema 15 (Modus Ponens) Se T ⊢s α e T ⊢s α → β, então T ⊢s β. Prova. Tenhamos especial atenção à árvore de tradução para α → β. Notadamente, a forma prenexa pode assumir muitos formatos equivalentes. Para facilitar a prova, escolhamos os passos de prenexação de modo conveniente: Operações de prenexação: Substituímos 1. α por uma variante de α. 2. ¬∀xα por ∃x¬α. 3. ¬∃xα por ∀x¬α. 4. Qx(α) ∨ β por Qx(α ∨ β) (válido somente se x não ocorre livre em β). 5. α ∨Qx(β) por Qx(α ∨ β) (válido somente se x não ocorre livre em α). Fazemos a prenexação de α → β (¬α ∨ β) seguindo os seguintes passos: 1. Obtemos a forma prenexa de ¬α e β separadamente, resultando em Qαx((¬α)′) ∨Qβy((β)′) (Pode ser o caso que precisemos aplicar a operação 1 algumas vezes para evitar que as quantificações das fórmulas sejam as mesmas). 2. Aplicamos 5 para extrair todas as quantificações do tipo Qβy. 3. Aplicamos 4 para extrair todas as quantificações do tipo Qαx. Usando esse procedimento, obtemos: Qαx Qβy((¬α)′ ∨ (β)′) (5.6) Então, notamos que as transformações na árvore afetarão (β)′ apenas depois que todas que afetem (¬α)′ tenham sido aplicadas. Por causa disso, as árvores de tradução para α e ¬α ∨ β se tornam similares até o nível final de α (nível k). Por outro lado, os ramos a partir desse nível em ¬α ∨ β são estruturalmente similares à árvore de β. O nó de nível k em ¬α ∨ β tem a forma: Qβy(¬α* ∨ β) (5.7) Capítulo 5. Explorando o esquema geral de redução 106 Porém, pelo mesmo procedimento usado em 5.1, deve haver um nó de nível k tal que T ⊢s Qβy(¬α* ∨ β) (5.8) e T ⊢s α* (5.9) Analisemos os ramos para α → β a partir do nó Qβy(¬α* ∨ β). Notadamente, esse ramo é s-válido se T s prova a fórmula da forma (¬α* ∨ β*′) do mesmo modo estrutural que a validade para a árvore de β. Isto é, se para cada *′, T s prova (¬α* ∨ β*′) e também (β*′), então T ⊢s β. Com efeito, como T ⊢ α*, então, para cada *′, obtemos T ⊢ (¬α*∨β*′). Então, T ⊢ β*′ por modus ponens. Portanto, T ⊢s β como desejado.  Resta-nos provar a regra de introdução do quantificador existencial; Lema 16 Se T ⊢s α → β e x não ocorre livre em β, então T ⊢s ∃xα → β. Prova. Como x é variável livre em α, então não é em β. Podemos, sem perder generalidade, arbitrar que o primeiro nível da árvore para α → β se refere ao tratamento da variável livre x quantificada universalmente. Então, obtemos T ⊢s α*1 → β para todo *1. Por definição T ⊢s ∃xα → β no caso em que T ⊢s α*1 → β para alguma *1. E isso é naturalmente o caso, uma vez que isso vale para toda *1.  Isso finaliza o tratamento lógico da tradução tipo-modelo. E então podemos dizer que, se Tr(T2) e ⊢s satisfazem todas as condições descritas nessa seção e T2 ⊢s αTr(T1) para toda α ∈ T1, então satisfaz o esquema geral de interpretação e a condição de coerência. 5.3 Definindo a tradução de NBG em ZF Para definirmos a tradução de NBG em ZF, vamos nos apoiar na construção oferecida por Novak (1950). Para alguma extensão completa de Henkin ZFs de ZF, definimos o modelo contável M de NBG como segue: Capítulo 5. Explorando o esquema geral de redução 107 1. Seja ∼ a relação de equivalência de fórmulas com uma única variável livre em ZFs: α ∼ β ≡ ∀x(α(x) ↔ β(x)). Denotamos a classe de equivalência para uma fórmula qualquer por pαq. 2. M é o conjunto de todas as classes de equivalência pαq. 3. pαq ∈M pβq se, e somente se, existe uma constante c em ZFs tal que ∀x(α(x) ↔ x ∈ c) e β(c) estão em ZFs. 4. toda constante de Henkin c denota px ∈ cq. A partir dessa definição, provamos no capítulo 3 que M  NBG. Nosso objetivo será, portanto, mostrar que essa construção pode ser emulada no sistema de tradução descritos nas seções anteriores. A principal dificuldade é emular as constantes de Henkin introduzidas em ZFs. Primeiramente, usamos uma indexação das variáveis para arranjar o conjunto Id em nosso favor: Seja GN(α) o número de Gödel da fórmula, então n(α) = min{GN(β) | ZF s ⊢ ∀x(β(x) ↔ α(x))}. (5.10) Sejam os índices especiais o conjunto de todos os n(α). A partir disso, dividimos as variáveis especiais como yn(α1), yn(α2), . . . e as variáveis normais x1, x2, x3, . . . Definimos então o nosso conjunto Id: γ ∈ Id se, e somente se, γ tem uma única variável normal livre. (5.11) Definimos o funtor parar a relação de pertencimento: I∈⟨α, β⟩ = ∃z(∀w(α(w) ↔ w ∈ z) ∧ β(yn(α))) (5.12) Basicamente, o funtor diz que α é uma fórmula que representa um conjunto e a variável especial para α é um "membro" de β. Notadamente, temos uma variável livre yn(α) que requer especificação; entretanto, vinculamos todas as ocorrências de fórmulas equivalentes a uma única variável especial – assim, uma vez que forcemos yn(α) a ser o conjunto cujos membros coincidem com α, então as ocorrências equivalentes serão vinculadas à mesma variável. A especificação das variáveis especiais é feita no funtor final para ⊢s: Capítulo 5. Explorando o esquema geral de redução 108 S(β) =∃w∀z(α1(z) ↔ z ∈ w) → yn(α1) = w∧ ∃w∀z(α2(z) ↔ z ∈ w) → yn(α2) = w∧ ... ∧∃w∀z(αk(z) ↔ z ∈ w) → yn(αk) = w → β onde yn(α1), yn(α2), . . . , yn(αk) são as variáveis especiais que ocorrem em β. O truque de usar as variáveis especiais é suficiente para emular as constantes especiais de Henkin na técnica de Novak. Mais ainda, é apenas uma verificação de rotina provar que o funtor S não afetará as condições expostas nas seções anteriores. O problema aqui seria apenas que não usamos toda a força do método. Simplesmente usamos a ramificação da árvore de tradução para inserir a construção canônica para um modelo. Ainda assim, oferecemos uma base para a atribuição de sentido de tradução para um tipo particular de redução modelo teorética. Esse método pode ser aplicado genericamente para toda construção que use classes definíveis sobre a construção canônica de Henkin – e isso pode ser realizado no mesmo espírito usada acima. 5.4 Combinando interpretações Interpretações são extensivamente usadas no estudo de reduções entre teorias. Ainda assim, podemos encontrar alguma dificuldade em argumentar a favor de um tipo particular de interpretação ser a redução intencionada. Quando oferecemos uma interpretação I de uma teoria T1 em uma teoria T2, requeremos que, para cada α ∈ T1, T2 ⊢ αI . O que pode ser o caso (e em geral é) é que T2 prova βI para muitas fórmulas indecidíveis β em T1. Modelo-teoreticamente, isso significa que a interpretação em T2 está descartando muitos possíveis modelos para T1. Naturalmente, podemos entender que T2 descarta apenas os modelos ruins de T1, contudo pode ser o caso que T2 esteja eliminando precisamente o modelo intencionado para T15. Ao usarmos o conceito ampliado de interpretação, queremos minimizar o número de modelos excluídos por uma interpretação padrão. O método que iremos explorar nesta seção 5 É amplamente aceito que a interpretação ordinal em ZFC para os números naturais é o modelo intencionado da aritmética (mesmo que não tenhamos um critério formal para determinar isso). Entretanto, a determinação desse modelo ainda depende de fórmulas indecidíveis em ZFC. Por isso, ao tentar coordenar a decisão sobre fórmulas indecidíveis de ZFC e de PA, podemos obter uma incompatibilidade entre a extensão de PA e a interpretação de PA na extensão de ZFC. Capítulo 5. Explorando o esquema geral de redução 109 é a ideia de combinar interpretações. Nesse caso, mudamos o requerimento sobre as fórmulas abertas em *(xi,Jk): Cada composição de *(xi,Jk) deve levar a uma interpretação em particular para as linguagens em questão {I0, I1, . . . , In−1}. Qualquer método para realizar isso é suficiente. Definimos apenas um tipo particular: 1. Se α é γ ∨ β, então α*(xi,Jk) é γ*(xi,Jk) ∨ β*(xi,Jk) . 2. Se α é ¬γ, então α*(xi,Jk) é ¬γ*(xi,Jk) . Se a fórmula em questão é uma folha, geramos a interpretação correspondente: Seja ai ∈ {0, 1} e (a1a2 . . . aq)2 mod(n) o resto na divisão por n da representação decimal da representação binária a1a2 . . . aq. Seja γ uma fórmula atômica e k = (k1k2 . . . kq)2 mod(n), então γ *(xi,Jk1 ) *(xi,Jk2 ) ...*(xi,Jkq ) é γIk (5.13) Exploramos um caso ilustrativo: Seja T1 = {∀x∃yα, ∃x∀yβ, ∃x∀yγ} e digamos que I0 e I2 são interpretações de T1 em T2. Mais ainda I1 interpreta em T2 as fórmulas {∀x∃yα, ∃x∀yβ,¬∃x∀yγ} I3 interpreta em T2 as fórmulas {∀x∃yα,¬∃x∀yβ, ∃x∀yγ} Suponhamos que todas essas interpretações usam o mesmo universo de quantificação U , seja *(xi,Jk) escrito como *k e tomemos Id como {J0, J1}. Notamos que *0*0 = I0, *0*1 = I1, *1*0 = I2 e *1*1 = I3. Avaliemos a árvore de tradução para β′ = ∀x∃yβ: β′ path J1 β′I3 β′I2 path J0 β′I1 β′I0 Capítulo 5. Explorando o esquema geral de redução 110 Como T2 ⊢ β′I0 e T2 ⊢ β′I1 , então, o caminho 0 é válido universalmente – por sua vez, o nó inicial é válido existencialmente. Então T2 ⊢s β′Tr(T2). Similarmente, concluímos que T2 ⊢s α′Tr(T2) e T2 ⊢s γ′Tr(T2). Finalmente, T2 ⊢s T Tr(T2)1 . Então, temos um novo método de tradução de T1 em T2, usando as interpretações I0, I1, I2 e I3. Apesar disso, apenas I0 e I2 são interpretações das teorias originais. Nós podemos permitir alguma flexibilidade nos requerimentos das interpretações que fazem com que as interpretações I3 e I4 sejam significativas. Mais ainda, podemos uma redefinição de I0 e I2: I0 interpreta em T2 as fórmulas {¬∀x∃yα, ∃x∀yβ,¬∃x∀yγ} I2 interpreta em T2 as fórmulas {¬∀x∃yα, ∃x∀yβ, ∃x∀yγ} Agora estamos em uma situação em que nenhum membro de I é uma interpretação de T1 em T2. Mas, porquanto ainda temos que T2 ⊢s T Tr(T2)1 , todas essas interpretações em conjunto podem compor uma tradução de T1 em T2 através de um sentido ampliado de tradução. Como discutimos antes, esse resultado deve implicar a consistência relativa entre as teorias. Portanto, esse esquema mostra que podemos de fato usar uma pluralidade de interpretações parciais para provar um resultado de consistência relativa. E isso pode ser verdadeiro mesmo no caso em que a teoria estudada não seja interpretável na teoria tradutora. Trabalhamos com tipos flexíveis de tradução, permitindo diversas mudanças estruturais na tradicional interpretação. Ao fazermos isso, nos tornamos capazes de incluir como tradução a prova de consistência relativa entre ZF e NBG. Mais ainda, mostramos que o conceito ampliado de tradução pode alcançar novas condições para modelos excluídos por excessivos requerimentos de uniformidade. Para obter tais relações, descrevemos os requisitos do esquema geral de interpretação e da condição de coerência. Seguidamente, permitimo-nos usar em nosso favor o que foi deixado indefinido. Ainda assim, não exploramos todo o potencial expressivo dessa metodologia. Então, novos desenvolvimentos podem oferecer novas condições de verdade para teorias como PA, ZF e outras. 111 6 Nenhum método de tradução é ontologicamente neutro Nos capítulos anteriores, mostramos argumentos negativos para a não neutralidade ontológica das traduções. Isto é, os métodos apresentados, quando feitos mais restritos, revelam diferenças sutis entre algumas teorias – relações mútuas de tradução passam a ser relações assimétricas na tradução mais exigente. Neste capítulo, mostraremos uma série de argumentos positivos. Nossa intenção, porém, não é tanto demonstrar o fenômeno da não neutralidade quanto é exibir os mecanismos do ambiente metateórico que influenciam a relação entre teorias analisadas. A base para esses argumentos seguirá o seguinte formato: 1. As traduções são um complexo de requerimentos estruturais e validades metateóricas. 2. Traduções realizadas em um ambiente metateórico que permita a construção da ontologia para uma teoria (prova da consistência) tem pouco ou nulo sentido de "transferência dos requerimentos existenciais". Diremos que, nesse caso, a metateoria "enxerga" a consistência da teoria objeto. 3. Os métodos de tradução são tipos particulares de prova de consistência relativa. Assumese a consistência de uma teoria (de modo indireto, uma ontologia) e prova-se a consistência de uma outra teoria nos limites metodológicos impostos pelo método de redução. 4. Isso significa que o "sentido puro de transferência de requerimentos existenciais" está diretamente relacionado ao nível de dependência da suposição de consistência da teoria base da tradução para a prova da consistência da teoria traduzida. 5. Mostraremos uma formalização do conceito "enxergar parcialmente" a consistência de uma teoria objeto. Ainda que a metateoria base da tradução não enxergue a consistência de uma teoria objeto, ela pode enxergar famílias de subteorias da teoria como consistentes. 6.1 Puro sentido de tradução Até o momento, buscamos encontrar um elevado grau de generalidade para a definição dos métodos de tradução. Agora, buscaremos explorar a possibilidade de que algum Capítulo 6. Nenhum método de tradução é ontologicamente neutro 112 tipo especial de mapeamento entre fórmulas possa estabelecer uma pura transferência de requerimentos existênciais. De fato, traduções podem ser contaminadas pela metateoria na qual reside a tradução, pela uniformidade do mapeamento entre as fórmulas traduzidas ou mesmo por outras razões. Contudo, ainda que não possamos isolar precisamente aquilo que é pura transferência de requerimentos existenciais em um método de tradução, podemos nos referir significativamente àquilo que ocorre na tradução que é pura transferência. A mistura azeotrópica de água e álcool (95% álcool) é tal que o processo de destilação, por mais refinado que seja, não pode isolar as duas substâncias. Isso não significa que não possamos nos referir significativamente ao que há de álcool puro na mistura (e o fazemos, precisamente, dizendo álcool 95%). Do mesmo modo, nos referimos ao que chamaremos de puro sentido de tradução de uma prova de consistência relativa (PCR). Definição 29 O puro sentido de tradução de uma prova de consistência relativa é aquilo que há de transferência de requerimentos existenciais no mapeamento entre fórmulas estabelecido na prova de consistência relativa. Tomaremos como hipótese simplificadora que "construir uma ontologia" para uma teoria pode ser substituído pela capacidade de "provar a consistência". Embora sejam conceitos diferentes, eles são bastante correlatos: o teorema da completude de primeira ordem é evidência contundente de que, para uma metateoria suficientemente expressiva, a capacidade de construir uma ontologia para uma teoria é equivalente à capacidade de provar o predicado de consistência. Entendemos, naturalmente, que essa correlação não é perfeita. Apesar disso, tomaremos isso como princípio, partindo da suposição de que as divergências correlacionais não são suficientes para invalidar as análises feitas neste capítulo. Investigaremos, inicialmente, mapeamentos que esperamos serem vazios de puro sentido de tradução, i.e. casos em que não haveria transferência de requerimentos existenciais. Consideremos um agente A para quem a metateoria TM de tradução e uma metodologia de tradução são fixadas. Nesse caso, diremos que a metateoria é o prisma pelo qual A enxerga as teorias a serem traduzidas umas nas outras. Suponhamos que uma teoria T é tal que TM pode internalizar o predicado de consistência Con(pTq) (e, portanto, pela hipótese simplificadora, pode oferecer uma ontologia para T ). Notemos que, nesse ambiente metateórico, qualquer tradução de T em uma teoria T * esconde a construção direta (em TM) da prova de que T é consistente. Ou seja, a ontologia produzida na tradução de T não depende causalmente da suposição de que T * é consistente. Entendemos que essa é a razão pela qual o puro sentido de tradução é esvaziado para o caso em que a metateoria pode provar a consistência das teorias analisadas. Capítulo 6. Nenhum método de tradução é ontologicamente neutro 113 Nessa direção, entendemos que, quanto mais uma PCR depende da suposição de que a teoria analisada é consistente, maior é o puro sentido de tradução da PCR. E, conversamente, quanto mais o agente pode enxergar a consistência de uma teoria, menor é o sentido puro de tradução da PCR. Tese 1 Dado um método de tradução Tr de uma T1 em T2 realizado em uma metateoria TM , o grau de transferência de requerimentos existenciais é proporcional ao quanto TM depende da suposição de que T2 possui uma ontologia para ser capaz de construir uma ontologia para T1. Ou, considerando a hipótese simplificadora, Tese 2 Dado um método de tradução Tr de uma T1 em T2 realizado em uma metateoria TM , o grau de transferência de requerimentos existenciais é proporcional ao quanto TM depende da suposição de que T2 é consistente para ser capaz de demonstrar a consistência de T1. Porém, ainda é necessário oferecer um entendimento para a ideia de "enxergar mais/ menos a consistência de uma teoria". Duas categorias naturais para a qualificação de quanto um agente enxerga a consistência de uma teoria são os simples sim ou não. Entretanto, perguntamos: existem categorias intermediárias? E, se isso for o caso, é possível comparar os diferentes graus em que o agente enxerga a consistência das teorias? 6.2 Enxergar parcialmente a consistência de uma teoria Tomemos o caso de um agente que tem por metateoria ZFC e deseja avaliar ZFC como teoria. Se consistente, ZFC não prova o predicado de consistência da própria ZFC por causa do segundo teorema da incompletude de Gödel. Contudo, pelo teorema da reflexão em ZFC, o agente prova a consistência de todos os conjuntos finitos de teoremas de ZFC. O agente não pode "enxergar" a consistência de ZFC – isso, todavia, não significa que ele não acessa aspectos da consistência de ZFC. Com efeito, ele enxerga qualquer aspecto da consistência de ZFC – ele somente não pode ver todos os aspectos em conjunto como consistente. Tendo como base esse exemplo, definimos um conjunto que expressa a força com que um agente com uma metateoria TM enxerga a consistência de uma teoria T : Realizamos mais uma simplificação: consideramos que as teorias podem ser identificadas com a sua extensão fechada por dedução. Não haveria, portanto, diferença em falar de uma teoria T e o conjunto de todos os teoremas de T (Th(T ) = {A | T ⊢ A}). Capítulo 6. Nenhum método de tradução é ontologicamente neutro 114 Definição 30 (Força da consistência) Dada uma teoria TM e uma teoria T , o conjunto força de T em TM é FTM (T ) = {Th(A) | Th(∅) ( A ⊆ Th(T ) ∧ TM ⊢ Cons(pAq)} O conjunto força expressa todos os aspectos consistentes de uma teoria T que um agente, cuja metateoria é TM , enxerga. Será a partir dessa ideia que modelaremos a ideia de dependência na prova de consistência relativa usada na Tese 2. Fato 3 Se TM1 ⊢ Cons(T ) e TM1 ⊢ Cons(T ), então FTM1 (T ) = FTM2 (T ). Esse resultado é natural, expõe um princípio importante do caso no qual dois agentes diferentes enxergam a consistência de uma dada teoria: se ambos agentes veem T como consistente, então eles enxergam igualmente toda a consistência de T . De modo indireto, esse princípio corrobora com a ideia de que, quando uma metateoria TM enxerga a consistência de uma teoria T , não importa se tomamos uma metateoria T ′M mais "forte" que TM , esse processo não amplia a visão sobre a consistência da teoria T , afinal, todas as teorias que veem a consistência em si de T , veem-na com a mesma intensidade (ou similar, se considerarmos que a representação do conceito força não é perfeita). Ainda devemos considerar os cenários em que uma metateoria TM não é capaz de expressar o predicado de provabilidade ou consistência para as teorias analisadas. Esse seria, por exemplo, o caso de PA sem o axioma da indução (PA−). Nesse caso, TM não seria capaz de expressar qualquer aspecto parcial da consistência de uma teoria qualquer T . De fato, quando uma metateoria não é capaz de internalizar a noção de prova ou realizar inferências indutivas, ela não pode ser capaz de falar sobre o conceito de consistência para as teorias analisadas. Contudo, é precisamente nesse caso que perdemos a capacidade de estabelecer relações de tradução: uma teoria como PA− não é capaz de realizar as induções necessárias para garantir a correção de um mapeamento entre fórmulas de duas teorias; mais ainda, não é nem mesmo claro como uma teoria como PA− pode justificar que os seus mecanismos de definição internalizam as sintaxes de teorias, garantindo alguma representação dos sistemas analisados. Todas as gradações entre o caso em que a metateoria TM não é capaz de expressar a consistência de uma teoria T e o caso em que TM não prova Con(T ) representam distintos graus nos quais o agente enxerga parcialmente a consistência de T . Capítulo 6. Nenhum método de tradução é ontologicamente neutro 115 6.3 Dependência da suposição Con(T ) Consideremos o caso em que um agente ATM analisa o puro sentido de tradução de uma PCR de Tx em T . Notadamente, se ATM fosse capaz de enxergar a consistência de T , então ATM deveria enxergar também a consistência de Tx pela consistência relativa. Assim, o puro sentido de tradução entre as teorias seria vazio – composto exclusivamente de considerações a respeito da consistência de Tx. Por outro lado, quando é o caso que ATM enxerga apenas parcialmente a consistência de T e de Tx, o sentido de tradução é composto pelo complexo de um puro sentido de tradução e considerações parciais a respeito da consistência de T e de Tx. Vejamos como isso funciona em mais detalhes (inicialmente apenas sob a ótica da dependência de Con(T )). Tomemos um caso simples, no qual T possui n axiomas {α1 α2, . . . , αn}. Supomos ainda que TM enxerga a consistência dos fragmentos T1 = {α1, α2, . . . , αk} e T2 = {αk+1, αk+2, . . . , αn}, embora não enxergue a consistência de T . A prova de que a consistência de T implica a consistência de uma teoria Tx não é dependente completamente da suposição de que T é consistente. Com efeito, a implicação depende da suposição de que a união dos conjuntos consistentes T1 e T2 se mantenha consistente, uma vez que – isoladamente – as consistências dos fragmentos foram assumidas no framework de análise. Por essa razão, a relação de tradução entre as duas teorias não estabelece uma pura transferência de requerimentos existenciais. Esse caso preliminar, porém, ainda é uma minimização do problema. Existe mais infecção da metateoria do que se supõe nessa análise particular. Isso não é um problema, uma vez que não pretendemos precisar efetivamente qual é a infecção do sentido de tradução. A formalização aqui cumpre o papel de tornar compreensível, ou mesmo convincente, o argumento em favor da existência dessa classe de impurezas no sentido de tradução e o modo como isso ganha efeito. Isto é, existem considerações sobre a consistência de fragmentos de T em TM que fazem parte intrinsecamente da efetivação da tradução entre T e Tx. Seguimos com uma análise mais aprofundada das considerações sobre a infecção da metateoria. Tomemos, no mesmo exemplo, que TM também enxerga a consistência dos fragmentos T ′1 ={α1, α2, . . . , αq} T ′2 ={αq+1, . . . , αk, . . . αt} T ′3 ={αt+1, αt+2, . . . , αn} Notadamente, esse é outro aspecto da consistência de T que ATM é capaz de enxergar e, portanto, a relação de tradução estabelece a dependência da consistência de Tx da suposição Capítulo 6. Nenhum método de tradução é ontologicamente neutro 116 de que a união das teorias consistentes T1 e T2 continue consistente ou a união das teorias consistentes T ′1, T ′2 e T ′3 continue consistente. Essa disjunção enfraquece ainda mais o puro sentido de tradução analisado. Digamos que avaliamos um fragmento A de Tx e que a tradução de A em T faz uso das fórmulas B = {αq+3, . . . , αt} (isto é, B ⊂ T ′2). Assim, se tomamos o caso da união de T1 e T2 para avaliarmos a pureza da tradução, veremos que a tradução de B em A depende efetivamente que a união preserve a consistência. Contudo, se tomarmos o caso da união T ′1, T ′2 e T ′3, veremos que a tradução de B em A não depende que a união dos três fragmentos preservem a consistência – a tradução do fragmento é, nessa situação, tão arbitrária quanto era o caso em que ATM enxerga a consistência da teoria a ser traduzida. Ou seja, se tivéssemos nos restringido à primeira partição da teoria T , veríamos a tradução do fragmento B como significativa; com a observação da segunda partição de T , passamos a ver que a tradução do fragmento B não é necessariamente significativa. Avaliamos os fragmentos cujas partes são vistas como consistentes por ATM , porém, podem haver modos de particionar T nos quais certas partes sejam vistas como consistente, enquanto o restante não. Supomos, continuando o exemplo acima, que tomamos uma partição de T T ′′1 ={α1, α2, . . . , αt+2} T ′′2 ={αt+3, αt+4, . . . , αn} tal que o agente enxerga a consistência de T ′′1 , mas não a de T ′′2 . Sob o prisma desse caso, a consistência de Tx dependeria que a união da teoria consistente T ′′1 com as fórmulas T ′′2 se mantenham consistentes. Naturalmente, esse caso é menos expressivo que o caso T1, T2 e o caso T ′1, T ′2, T ′3; mesmo assim, como a adição de partições significativas para análise diminui a dependência da hipótese de que T é consistente para formar a consistência de Tx, então nenhum caso pode ser deixado de fora para uma análise completa do fenômeno. Ainda resta considerar um modo completo o que tomamos como subteoria. De fato, uma análise voltada exclusivamente para os axiomas da teoria T apresenta uma dimensão muito restrita do que significa ser subteoria de T . Para observar isso, basta avaliar o caso da teoria T * = {α1 ∧ . . . ∧ αn}. Notadamente, T * e T representam axiomatizações distintas para uma mesma teoria e, nesse caso, esperamos que a análise da infecção da metateoria seja independente da escolha por T * ou T . Contudo, se nos restringimos a uma análise das Capítulo 6. Nenhum método de tradução é ontologicamente neutro 117 partições dos axiomas de uma teoria, a análise de T * perderia substancialmente força. Mais ainda, se tomarmos o caso em que adicionamos a T um teorema α de T , então formamos a teoria T# que é também a axiomatização da mesma teoria T . Por essas duas razões, não devemos avaliar as subteorias pelas partições de seus axiomas, mas pela partição do conjunto de todos teoremas da teoria, isto é, Th(T ) – como fizemos na definição do conjunto força. Um conjunto Σ ⊆ Th(T ) representa um conjunto de verdades parciais sobre os objetos da teoria axiomatizada e, no sentido modelo-teorético, representa um conjuntos de fórmulas tais que todo modelo de T é também modelo de Σ. A partir dessa ideia, expandimos a análise da consistência de T por ATM para todos os fragmentos de T que TM pode ver como consistentes. Primeiro, definimos a noção "ser um conjunto de fragmentos dos teoremas de T": Frag(A, T ) ⇐⇒ ⋃︁ A = Th(T )∧ ∀x ∈ A(x = Th(x))∧ ∀x ∈ A(x ( Th(T )) Seguidamente, definimos a função que filtra os elementos de uma partição que são vistos por ATM como consistentes: FragConsTM (A) = {x ∈ A | TM ⊢ Cons(x)} E, por fim, definimos o conjunto de todos os aspectos consistentes de partições dos teoremas de T : AspConsPartTM (T ) = {⟨Frag,Restante⟩ | Part(A, T )∧ Frag = FragConsTM (A) ∧Restante = Th(T ) − ⋃︁ Frag} De posse dessas definições, podemos precisar com maior clareza a relação de dependência da hipótese de que T é consistente na prova de consistência relativa de T para Tx. Supondo a sequência ⟨A1, B1⟩, ⟨A2, B2⟩, . . . , ⟨An, Bn⟩, . . . como uma ordenação dos elementos de AspConsPartTM (T ) A afirmação de que Tx é consistente depende que a união ⋃︀A1 preserve a consistência de cada um de seus elementos e preserve-se a consistência de ⋃︀A1 com os elementos de B1 ou a união ⋃︀A2 preserve a consistência de cada um de seus elementos e preserve-se a consistência de ⋃︀A2 com os elementos de B2... Capítulo 6. Nenhum método de tradução é ontologicamente neutro 118 ou a união ⋃︀An preserve a consistência de cada um de seus elementos e preserve-se a consistência de ⋃︀An com os elementos de Bn... Simplificando a notação, diremos que PreservaCons(⋃︀, ⟨Ax, Bx⟩) representa a afirmação de que a operação de união preserva a consistência de cada elemento de Ax e do resultado dessa união com os elementos de Bx. Por isso, diremos que a conclusão de que Tx é consistente depende causalmente da suposição de que⋁︁ {PreservaCons( ⋃︁ , ⟨A,B⟩) | ⟨A,B⟩ ∈ AspConsPartTM (T )}. Chamaremos essa afirmação de Dep(TM )(T ). Notemos que, embora trate-se de uma afirmação infinitária, ela é necessariamente mais fraca do que a afirmação de consistência para T . Prosseguimos com a análise da relação de redução, atentando à teoria traduzida. 6.4 A prova de consistência em uma tradução Nos casos significativos de tradução, as PCRs estabelecidas dependem da suposição de que a teoria tradutora é consistente para se efetivar. Nesse caso, quando a metateoria TM vê as teorias objeto como consistentes, a PCR não oferece uma relação de causalidade entre as consistências das teorias. Entretanto, ainda que exista uma relação de dependência da suposição de consistência da teoria tradutora, essa dependência corresponde somente à afirmação do tipo Dep(TM )(T ). Estabelecemos, assim, que as suposições metateóricas enfraquecem a dependência da suposição de consistência na relação tradutiva. Porém, nos resta avaliar o que ocorre em relação à teoria traduzida, i.e. em relação ao que estabelecemos a respeito da consistência da teoria traduzida. Como vimos, o puro sentido de tradução é a dependência da suposição de consistência de T para ser capaz de provar a consistência de Tx. Além de não estabelecermos a dependência totalmente, também não provamos a consistência de Tx completamente. Do mesmo modo que TM enxerga parcialmente a consistência de T , TM também enxerga parcialmente a consistência de Tx. Por isso, a conexão de fato estabelecida em TM na PCR é de uma suposição parcial da consistência de T implicar parcialmente a consistência de Tx. Partimos da suposição Con(T ) e provamos cada uma das afirmações parciais a respeito da consistência de Tx. Ou seja, supondo a sequência ⟨C1, D1⟩, ⟨C2, D2⟩, . . . , ⟨Cn, Dn⟩, . . . como uma ordenação dos elementos de AspConsPartTM (Tx), estabelecemos que a união ⋃︀C1 preserva a consistência de cada um de seus elementos e preserva-se a consistência de ⋃︀C1 com os elementos de B1 Capítulo 6. Nenhum método de tradução é ontologicamente neutro 119 E a união ⋃︀C2 preserva a consistência de cada um de seus elementos e preserva-se a consistência de ⋃︀C2 com os elementos de B2... E a união ⋃︀Cn preserva a consistência de cada um de seus elementos e preserva-se a consistência de ⋃︀Cn com os elementos de Bn... Reunimos essa afirmação infinitária:⋀︁ {PreservaCons( ⋃︁ , ⟨A,B⟩) | ⟨A,B⟩ ∈ AspConsPartTM (Tx)}. Chamaremos essa afirmação de Gap(TM )(Tx). Em resumo, um método de tradução em uma teoria TM : 1. depende menos da suposição de consistência de T e 2. estabelece uma conexão incompleta com Con(pTxq). Experimentemos o cenário idealizado onde sabemos a expressividade de duas teorias T1 e T2. Consideremos que T2 é mais expressiva que T1 no cenário e tomemos uma metateoria TM capaz de expressar as relações sintáticas necessárias para representar reduções ontológicas. Suponhamos que TM realiza traduções tanto de T1 em T2 quanto de T2 em T1. Esse caso é possível? Esperamos que T2 reduza T1 – porém, não esperamos a relação inversa. Com efeito, a relação de redução de T2 em T1 pode ocorrer precisamente porque fomos facilitados pelas ferramentas da metateoria. Uma vez que TM enxerga diversos fragmentos consistentes de T2, a prova requer apenas que a relação de redução preencha as lacunas sobre a consistência de T2 que a metateoria TM ainda não enxerga (Gap(TM )(T2)). É precisamente por essa razão que a relação de redução de uma teoria mais expressiva pode ser realizada em uma teoria menos expressiva. Concluímos, portanto, que o ambiente metateórico facilita o estabelecimento das relações de tradução. Quando avaliamos se uma teoria pode ser reduzida a uma outra, sabemos que o ambiente de análise provavelmente facilitará que a relação se efetive. Esse resultado conceitual evidencia um dos aspectos mais importantes da presente tese: relações simétricas de tradução não podem ser tomadas como definitivas – devem, ao contrário, ser compreendidas como um convite para análises mais detalhadas da relação de redução entre as teorias analisadas. Por outro lado, podem haver casos em que os mecanismos de TM , junto com a metodologia de tradução, não são suficientes para extrair potencial da suposição de que T2 é Capítulo 6. Nenhum método de tradução é ontologicamente neutro 120 consistente suficiente para obter a consistência de T1. Se esse for o caso, estaríamos em um ambiente metateórico incapaz de realizar a maior expressividade de T2. Como, por suposição, T2 é mais expressiva que T1, a suposição Con(T2) deveria ser mais forte que Con(T1), e o Gap(TM )(T1) deveria ser mais facilmente demonstrável que Gap(TM )(T2). Em virtude disso, se TM não reduz T1 a T2, também não deveria ser possível extrair a consistência de T2 a partir da consistência de T1. Entretanto, para que esse fosse o caso, temos de assumir que o ambiente metateórico facilita em igual proporção qualquer redução. Isso não pode ser assumido sem uma análise mais profunda. De fato, o caso em que TM reduz Ta em Tb mas não reduz Tb em Ta depõe fortemente a favor da expressividade de Tb ser maior do que a de Ta. Ainda assim, o resultado não é definitivo. Idealmente, um resultado definitivo deve ser indubitável no seguinte sentido: Tese 3 Uma teoria Tb é ontologicamente mais expressiva que uma teoria Ta se 1. para algum método de tradução TM reduz Ta em Tb e não reduz Tb em Ta; 2. e qualquer método T ′M que reduza Tb a Ta é tal que Ta também é reduzida a Tb. Ou seja, Tb é indubitavelmente mais expressiva quando algum método depõe a favor de Tb ser mais expressiva, e nenhum outro método depõe a favor do contrário. Existem casos em que esse tipo de afirmação pode ser obtido, embora tenham um escopo bastante limitado. Para contornar essa dificuldade, estabeleceremos o conceito de hierarquia de traduções no capítulo 8. 6.5 Cenário integrado Foi negligenciada, até o momento, a maneira como ocorre o mapeamento entre as fórmulas das teorias em questão. Em muitos casos de tradução, a metateoria mantém-se a mesma, mudando-se apenas as exigências a respeito da uniformidade no mapeamento entre as fórmulas das teorias analisadas. Espera-se, portanto, que métodos com maiores exigências de uniformidade evitem com maior eficiência a infecção ontológica do que os métodos que exigem menor uniformidade. Esse aspecto, todavia, não fica transparente a partir das análises feitas até o momento neste capítulo. Realizaremos uma formalização que enfatiza a relação oferecida pelos mapeamentos entre as fórmulas das teorias analisadas. Entretanto, não esperamos que a formalização represente por completo o processo de infecção. Queremos, diferentemente, que a formalização Capítulo 6. Nenhum método de tradução é ontologicamente neutro 121 aponte motivos para os mapeamentos mais uniformes serem mais resistentes à interferência da metateoria. O método que adotaremos parte do princípio de que não temos muitas ferramentas para avaliar a infecção além da afirmação de que certos mapeamentos são significativos enquanto outros não. Arbitraremos, portanto, um sistema de pontuação para a significância de uma tradução baseado na avaliação de significância ou não da fragmentação sucessiva das teorias analisadas. Quando tomamos os fragmentos consistentes das teorias nas seções anteriores, não restringimos o número de fragmentações das teorias a serem considerados; agora, porém, adotaremos a simplificação de que tomamos sempre as fragmentações em duas subteorias. Definição 31 Dada uma subteoria A de T e seja Ax a imagem das fórmulas de A em teoremas de Tx. Dizemos que a subteoria A é significativa no mapeamento de T em Tx se a metateoria TM não prova o predicado de consistência nem de Ax nem de A. Definimos as árvores de subteorias de uma teoria T : Definição 32 Uma árvore Ar é árvore de subteorias de T em TM se: 1. T é o nó inicial; 2. se A ∈ Ar(T ) e TM ⊢ Con(pAq), então A é uma folha; 3. se A ∈ Ar(T ) e TM 0 Con(pAq), então o nó A possui (se houver) dois filhos B e C tais que a) B e C são subteorias próprias de A; b) B ∪ C é equivalente a A. A partir das árvores de subteorias, avaliaremos o grau de significância do mapeamento das fórmulas de T em fórmulas de uma teoria Tx. Notemos que, em uma árvore de subteorias, se A é um nó com filhos B e C, então necessariamente a união de B e C representa um aspecto significativo obtido pelo mapeamento. Por outro lado, se A é um nó folha, o mapeamento de A não pode ser significativo. Por isso, se consideramos η(A) como a função nos números reais de 0 a 1 que avalia a significância do mapeamento fixado para uma teoria A, então esperamos que: 1. Se B é filho de A, então η(B) < η(A). (não menor igual, porquanto se assume que a possibilidade de ramificação deve aumentar a significância); Capítulo 6. Nenhum método de tradução é ontologicamente neutro 122 2. Se o mapeamento de A não é significativo, então η(A) é mínimo. Nesse contexto, arbitramos a função η(A) em um mapeamento fixado: 1. se o mapeamento de A na teoria tradutora não é significativo, então η(A) = 12 ; 2. se o mapeamento de A é significativo e A possui filhos B e C, então η(A) = η(B) + η(C) − η(B).η(C). Notadamente, a função arbitrada satisfaz as exigências descritas. A prova desse fato é uma simples manipulação aritmética. Vejamos um exemplo de árvore avaliada para a função η: η = 255256 η = 12 η = 127 128 η = 3132 η = 78 η = 12 η = 3 4 η = 12 η = 1 2 η = 34 η = 12 η = 1 2 η = 34 η = 12 η = 1 2 De fato, uma árvore de subteorias representa alguma ramificação das subteorias até aquelas cujos mapeamentos não são significativos. E, quanto maior o número de folhas, mais a relação estabelecida ganha significância. Entretanto, a escolha do valor mínimo ainda tem bastante relevância. Se tomamos o valor mínimo de η como 110 , obtemos a árvore avaliada: Capítulo 6. Nenhum método de tradução é ontologicamente neutro 123 η = 56.953.279 100.000.000 η = 110 η = 5.217.031 10.000.000 η = 40.951100.000 η = 2711.000 η = 110 η = 19 100 η = 110 η = 1 10 η = 19100 η = 110 η = 1 10 η = 19100 η = 110 η = 1 10 Embora entenda que a estrutura da avaliação seja adequada, faltam critérios para determinar o valor mínimo para a função η. Um estudo mais detalhado dos métodos para determinar o grau da infecção ontológica ainda é necessário1. Apesar disso, ainda que os valores não estejam bem delimitados, a estrutura elaborada é suficiente para entendermos o modo como a não uniformidade dos mapeamentos permitem uma maior infecção ontológica. Definimos com maior clareza o que chamamos de uniformidade. O caso mais natural de uniformidade é a situação em que usamos uma tradução de uma teoria nela mesma por uma tradução que opere como a identidade. Se, por exemplo, o mapeamento entre as fórmulas de T e T é a identidade Id(α) = α, então, não importa qual metateoria consideramos, devemos ter a maior uniformidade possível para a tradução de T em qualquer teoria. Por isso, afirmamos: O grau de uniformidade em um mapeamento representa quanto o mapeamento entre as fórmulas das duas teorias é similar estruturalmente ao mapeamento da teoria traduzida nela mesma pela tradução identitária. A partir disso, esperamos que a uniformidade possua duas características principais: (i) proteja as traduções da infecção metateórica; e (ii) seja o caso para os mapeamentos intuitivamente mais uniformes. Tomemos, para esse efeito, a seguinte definição: 1 É especialmente necessário considerar a possibilidade de as ramificações serem infinitas. Ainda não temos uma resposta a oferecer. Tanto não sabemos a extensão de casos em que é possível haver ramificações infinitas, quanto não sabemos o modo como abordar esses casos. Aparentemente, isso se resolveria caso não limitássemos as ramificações a duas. Isso deverá ser tratado em trabalhos futuros. Capítulo 6. Nenhum método de tradução é ontologicamente neutro 124 Definição 33 Fixada uma metateoria TM , um mapeamento entre fórmulas de uma teoria T1 em fórmulas T2 é uniforme se, e somente se, para toda subteoria A1 de T1, sendo A2 as fórmulas de A1 mapeadas em T2, TM ⊢ Con(pA1q) ↔ Con(pA2q). Notemos que a definição resulta na máxima significância possível em uma metateoria fixada. A estrutura das árvores de subteorias em uma tradução depende somente da teoria traduzida. O papel do mapeamento e da teoria tradutora têm efeito somente quando começamos o processo de avaliação da significância. Nesse caso, os nós (não folhas) que são avaliados como não significativos funcionam para a análise como novas folhas na árvore avaliada (são avaliados com o mínimo valor em η). Notemos, todavia, que esse tipo de caso ocorreria somente se o mapeamento não fosse uniforme. Em outras palavras, a uniformidade resulta na situação em que os mapeamentos ocorrem de tal maneira organizados que, em qualquer árvore de subteorias, somente as folhas serão avaliadas com o valor mínimo da função η. E, por essa razão, concluímos que métodos diferentes em uma metateoria podem oferecer análises ontológicas distintas. A causa desse fenômeno, por fim, é representada pela noção de uniformidade dos mapeamentos – que, por sua vez, pode ser entendido como a similaridade dos mapeamentos com as traduções identitárias. 6.5.1 Comentário sobre o caso da redução de uma teoria nela mesma Não é porque uma tradução Tr mapeia uma teoria nela mesma que Tr representa um mapeamento identitário. Isto é, ainda que realizemos uma tradução de uma teoria T na própria T , é possível estarmos realizando significativas alterações nas ontologias. Para mostrar essa possibilidade, definimos a noção de fidelidade de uma tradução: Definição 34 Uma tradução de uma teoria T1 em uma teoria T2 é fiel se, e somente se, para todo modelo M, M é modelo de T1 se, e somente se, M é modelo da versão traduzida de T1 em T2. De modo geral, as traduções exigem apenas que todo modelo da versão traduzida de uma teoria seja também modelo da teoria original. Isso é natural; oferecer uma tradução representa a ideia de exibir uma semântica compatível com aquilo que a teoria afirma. Por causa disso, algo pode ser perdido: podemos eliminar certos modelos como possibilidade ao realizar a tradução. Representamos isso com a seguinte ilustração: Capítulo 6. Nenhum método de tradução é ontologicamente neutro 125 Figura 1 – Lentes das traduções. Os olhos na ilustração representam a teoria tradutora, e as lentes representam o método de tradução. Nesse caso, a tradução, que permite ao observador entender uma teoria, é também responsável por reduzir o escopo de modelos compatíveis possivelmente capturados pelo observador. O caso em que a redução ontológica é fiel não elimina qualquer modelo como possibilidade da versão interpretada. Exemplos do tipo infiel são fartos: o caso ilustrado poderia ser a redução da teoria de conjuntos ZF interpretando por forcing ZF +¬ CH. Essa redução, em particular, elimina de ZF todos os modelos em que vale a hipótese do contínuo. Ainda assim, essa interpretação é uma tradução de ZF em ZF. Nesse caso, é natural a afirmação de que traduções de teorias nelas mesmas podem alterar radicalmente a ontologia da teoria. Ainda assim, traduções fiéis devem ser possivelmente estabelecidas para a relação de uma T consigo mesma. Por essa razão, admitimos que os métodos de tradução devem estabelecer pelo menos alguma tradução fiel de todas as teorias T em T . No caso de interpretações, basta-nos mapear todas as fórmulas nelas mesmas, tomando o universo de interpretação U(x) como a fórmula x = x e todos os predicados interpretados como eles mesmos. Assim, a versão interpretada da teoria será precisamente a própria teoria. Com efeito, a interpretação não é neutra porquanto a transferência de comprometimento ontológico é estabelecida na conexão causal da suposição de consistência de T e da conclusão de consistência de T . Sabemos, ainda assim, que T possui o mesmo comprometimento ontológico que ela mesma em virtude do conceito de identidade – ao invés da relação de tradução. Por essa razão, podemos usar a relação entre os fragmentos consistentes de T com T como parâmetro para compreender a relação de T com outras teorias. É nesse sentido que consideramos a uniformidade dos mapeamentos correlata com a similaridade do mapeamento com o mapeamento identitário. 126 7 Bi-interpretações em teoria de conjuntos As bi-interpretações podem ser entendidas como um método mais restritivo de interpretações mútuas. Se uma interpretação mútua exige que existam interpretações I de uma teoria T1 em uma teoria T2 e J de T2 em T1 – as bi-interpretações exigem que a interpretação J funcione como o mapeamento inverso das fórmulas mapeadas por I e que I como o inverso das por J . Esse requisito adicional se expressa formalmente na seguinte definição: Definição 35 Uma bi-interpretação B = ⟨I, J⟩ entre as teorias T1 e T2 é o caso em que 1. I = ⟨UI , φI⟩ é uma interpretação de T1 em T2. 2. J = ⟨UJ , φJ⟩ é uma interpretação de T2 em T1. 3. Existe uma função bijetora f : {x | x = x} −→ {x | UI(x)} definível em T1 tal que para toda fórmula φ com n variáveis livres em LT1 T1 ⊢ φ(x1, x2, . . . , xn) ↔ φI J(f(x1), f(x2), . . . , f(xn)). 4. Existe uma função bijetora g : {x | x = x} −→ {x | UJ(x)} definível em T2 tal que para toda fórmula φ com n variáveis livres em LT2 T2 ⊢ φ(x1, x2, . . . , xn) ↔ φJ I(g(x1), g(x2), . . . , g(xn)). Essa definição tem um correspondente para bi-interpretação entre modelos: Definição 36 Uma bi-interpretação B = ⟨I, J⟩ entre os modelos M e N é o caso em que 1. I e J são interpretações entre as linguagens de M e N . 2. MI é isomórfico a N . 3. N J é isomórfico a M. 4. Existe um isomorfismo entre MIJ e M definível em M e um isomorfismo entre N J I e N definível em N . A partir dessas definições, obtemos o corolário: Capítulo 7. Bi-interpretações em teoria de conjuntos 127 Corolário 1 Se B é uma bi-interpretação de todo modelo de T1 em algum modelo de T2 e de todo modelo de T2 em algum modelo de T1, então B é uma bi-interpretação entre T1 e T2. Prova. Inicialmente, provamos, por indução na complexidade das fórmulas, o seguinte fato para bi-interpretações ⟨I, J⟩ entre modelos: Sendo g o isomorfismo de M em MIJ , então, para todo a ∈ M, vale MIJ  φ(g(a)) ⇐⇒ M  φJ I(g(a)) 1Caso atômico: sendo P um predicado na linguagem de M, sabemos por definição que MIJ  P (g(a)) ⇐⇒ M  UJ(g(a)) → P J I(g(a)) Como, por definição, M  UJ(g(a)), então MIJ  P (g(a)) ⇐⇒ M  P J I(g(a)) 2Os casos α ∧ β e ¬α são feitos por passos triviais de indução. 3Caso ∃xα: Notadamente, MIJ  ∃xφ(x, g(a)) ⇐⇒ existe k ∈ M IJ tal que MIJ  φ(k, g(a)). Pela bijeção g, existe um b tal que g(b) = k. Logo a ultima expressão é equivalente a MIJ  φ(g(b), g(a)). Por hipótese de indução, isso vale se, e somente se, M  φJ I(g(b), g(a)) Pela definição do isomorfismo, sabemos que M  UI(g(a)) e que M  U IJ (g(a)). Portanto obtemos o equivalente M  ∃xUI(x) ∧ U IJ (x) ∧ φJ I(x, g(a)) Isso que, por sua vez é equivalente à fórmula desejada. A partir desse resultado, retornamos à prova do corolário. Pela suposição, sabemos que, para todo M, se M  T1, então MI  T2. Mais especificamente, se M  T1, então, para toda α ∈ T2, MI  α. E essa última é equivalente a M  αI . Logo, concluímos que T1  αI para toda α ∈ T2. Pelo teorema da completude de primeira ordem, T1  αI para Capítulo 7. Bi-interpretações em teoria de conjuntos 128 toda α ∈ T2 e, portanto, I é uma interpretação de T2 em T1. Analogamente, concluímos que J é uma interpretação de T1 em T2. Em seguida, provamos que as exigências 3 e 4 das bi-interpretações. Pelo isomorfismo, sabemos que, para toda fórmula φ(x): M  φ(a) ⇐⇒ MIJ  φ(g(a)) Pelo fato provado no início da demonstração, temos que M  φ(a) ⇐⇒ M  φJ I(g(a)) Como g é definível em M, escrevemos a fórmula definível φg(x, y) que define a função g. Assim podemos reescrever M  φJ I(g(a)) como M  ∃y(φg(a1, y1) ∧ φg(a2, y2) ∧ . . . ∧ φg(an, yn) ∧ φJ I(y)). Segue, que para todo a ∈ M , M  φ(a) ↔ ∃y(φg(a1, y1) ∧ φg(a2, y2) ∧ . . . ∧ φg(an, yn) ∧ φJ I(y)). Disso, concluímos, pelo teorema de completude de primeira ordem, que T1 ⊢ φ(x) ↔ ∃y(φg(x, y) ∧ φJ I(y)) Por procedimento análogo, obtemos o item 4 para T2 e isso finaliza a prova.  A partir da definição por modelos, podemos dizer informalmente que uma bi-interpretação é a situação em que, dado um modelo M, (1) obtemos o modelo definível N , (2) em N , obtemos uma cópia M de M, (3) em M, obtemos uma cópia N de N , (4) é o caso que M vê que M é uma cópia de si mesmo e (5) é o caso que N vê que N é uma cópia de si mesmo. Removemos a exigência (5) para conceituar a seguinte relação assimétrica de redução: Definição 37 O par de interpretações B = ⟨I, J⟩ é uma semi-bi-interpretação de N em M quando 1. I e J são interpretações entre as linguagens de M e N . 2. MI é isomórfico a N . 3. N J é isomórfico a M. Capítulo 7. Bi-interpretações em teoria de conjuntos 129 4. Existe um isomorfismo entre MIJ definível em M. Representamos graficamente a definição de semi-bi-interpretação a seguir: Figura 2 – Relação entre modelos semi-bi-interpretáveis. Quando temos relações mútuas de redução entre duas teorias, esperamos que isso represente algum nível de similaridade entre as ontologias das teorias. Ainda assim, tais ontologias podem ser expressadas de modos bastante distintos, por exemplo, através de linguagens diferentes ou formulações diferentes de axiomas. Podemos qualificar essa mesma questão para o caso em que admitimos haver um núcleo comum entre as teorias mutualmente redutíveis: dado um núcleo T , quanta flexibilidade temos para definir extensões T1 e T2 de T que sejam mutualmente redutíveis? Se fixamos as interpretações como método de redução, há bastante flexibilidade independentemente de qual T consideremos. Contudo, o caso em que fixamos as bi-interpretações ou semi-bi-interpretações muda completamente: existem casos em que não há qualquer flexibilidade, e.g. se existe redução mútua entre duas extensões de uma teoria T , então as extensões tem de ser precisamente as mesmas. Definimos formalmente essas noções a seguir: Definição 38 Uma teoria T é sólida se, e somente se, para quaisquer dois modelos M,N  T , se B é uma semi-bi-interpretação de N em M, então M e N são isomórficos. Definição 39 Uma teoria T é tight se, e somente se, para quaisquer duas extensões T1 e T2 de T na linguagem de T , se existe uma bi-interpretação B entre T1 e T2, então T1 e T2 são iguais (no sentido de que possuem os mesmos teoremas). Capítulo 7. Bi-interpretações em teoria de conjuntos 130 7.1 Quaisquer duas extensões diferentes de ZF não são bi-interpretáveis Nesta seção, provaremos o seguinte resultado: Teorema 9 As teorias de conjunto ZF e MK são sólidas (Enayat). Mais ainda, PA é sólida (Visser). No início de 2018, eu e o professor Hamkins provamos o resultado. Porém, descobrimos que o teorema foi recentemente provado por Enayat, no artigo Variations on visserian theme (ENAYAT, 2017), como um desenvolvimento de resultados obtidos por Albert Visser. Visser prova o caso para PA no artigo Categories of theories and interpretations (VISSER, 2004), enquanto Enayat prova os casos ZF e MK. Mostraremos aqui a estratégia desenvolvida por Hamkins e eu. Prova. (mostraremos apenas o caso ZF é sólida) Supomos dois modelos M,N  ZF tais que N é definível em M, M é definível em N e b é um isomorfismo de M em M definível em M. Ou seja, o modelo N é semi-biinterpretável em M. Inicialmente, provamos que N "vê" o predicado interpretado ∈M como uma relação bem fundada (de agora em diante, escreveremos ∈ para ∈M, simplesmente ∈ para ∈M, ∈* para ∈N e ε para o pertencimento da metateoria). Definição 40 Uma relação R em um modelo A é bem fundada em relação ao modelo base B se, e somente se, qualquer X ε B tal que X ⊆B A possui um B-elemento R-minimal, i.e. existe a ∈B X tal que para todo b ∈B X não é o caso que ⟨a, b⟩ ∈B RA. Escrevemos, nesse caso: B  R é bem fundada em A Afirmação 4 N  ∈ é uma relação bem fundada em M. Prova. Tomamos um conjunto A ⊆∈* M tal que A ε N (e, portanto, A ε M). Provaremos que A tem um ∈*-elemento ∈ -minimal. Tomamos a classe A′ = {x | x ∈* A}M em M. Em seguida, obtemos a classe A′′ = {b−1(x) | x ∈ A′}M. Pela fundação em M, A′′ tem um elemento ∈-minimal a em M. Argumentamos que b(a) é ∈ -minimal em A. Capítulo 7. Bi-interpretações em teoria de conjuntos 131 Supondo k ∈ A, então b−1(k) ∈ A′′ . Como a é ∈-minimal em A′′ , b−1(k) /∈ a e, portanto, pelo isomorfismo b, k /∈ b(a). Como k é um ∈ -elemento qualquer de A, o conjunto b(a) é ∈ -minimal em A.  Introduzimos a noção V AB(i) como a hierarquia de A até o ordinal i na perspectiva de B (i é um ordinal em B): Definição 41 Dados dois modelos A e B na linguagem do pertencimento 1. V AB(0) = {}B; 2. se n ∈ M é um ordinal sucessor, V AB(n) = {x ∈ A | ∃y ⊂B V AB(n−1) ∀z(z ∈B y ↔ z ∈A x)}B; 3. se n ∈ M é um ordinal limite, V AB(n) = B⋃︁ k<n V AB(k); 4. V AB = B⋃︀ k∈Ord V AB(k). Queremos que a construção V MN coincida com a própria classe M . Nesse caso, devemos provar que N tem ordinais suficientes para passar por todos os níveis de M, e que cada nível da construção está em correta correspondência com os níveis em M. Provamos a seguir a segunda afirmação: Afirmação 5 Para todo ordinal n em N tal que exista um ordinal correspondente em M, é válido em N que ∀x(x ∈ V Mn ↔ x ∈* V MN (n)). Prova. Provamos o fato por indução: (1) Caso em que n é um ordinal sucessor: Supomos que a ∈* V MN (n). Por definição, existe um b ⊆N V MN (n−1) tal que ∀z(z ∈* b ↔ z ∈ a). Notemos que para qualquer z z ∈ a =⇒ z ∈* b =⇒ z ∈* V MN (n−1) HI=⇒ z ∈ V Mn−1 Por isso, obtemos a ⊆M V Mn−1 e, portanto, a ∈ V Mn . Assim, a ∈* V MN (n) → a ∈ V Mn . Capítulo 7. Bi-interpretações em teoria de conjuntos 132 Supomos, por outro lado, que a ∈ V Mn . Tomemos o conjunto a′ = {x | x ∈* V MN (n−1) ∧ x ∈ a}N . Por definição, a′ ⊆N V MN (n−1). Também por definição sabemos que z ∈* a′ =⇒ z ∈ a. Tomemos um z tal que z ∈ a, segue que z ∈ V Mn−1. Por hipótese de indução, obtemos z ∈* V MN (n−1). Segue que z ∈* a′. Mais ainda, obtemos que z ∈* a′ ↔ z ∈ a. Portanto, a ∈* V MN (n) pela definição de V MN (n). Assim, a ∈ V Mn → a ∈* V MN (n) finalizando o caso sucessor. (2) Caso em que n é ordinal limite: Supomos que a ∈* V MN (n). Como n é limite, então, por definição, existe um k tal que a ∈* V MN (k). Por hipótese de indução, isso implica a ∈ V Mk – que, por sua vez, resulta em a ∈ V Mn . Por similar procedimento, provamos que a ∈ V Mn =⇒ a ∈* V MN (n), finalizando a demonstração.  Afirmação 6 Os ordinais de N são um segmento inicial dos ordinais de M. Prova. Supondo que não vale o fato, temos que os ordinais de M são um segmento inicial próprio dos ordinais de N uma vez que ∈ é bem fundada em N . Nesse caso, existe um ordinal k ε N maior que todos os ordinais de M. Desse modo, M ⊆ V MN (k). Como V MN (k) é um conjunto em N , então M é um conjunto em N – i.e. M ε N . Como N ⊆ M , obtemos que M ε M . Isso é absurdo, pois M está em bijeção com M.  Afirmação 7 Os modelos N , M e M têm os mesmos ordinais. Prova. Pelo resultado anterior, resta-nos provar somente que os ordinais de M são um segmento inicial dos ordinais de N . Supondo que ordinais de N são um segmento inicial próprio dos ordinais de M, então, de modo semelhante à prova da Afirmação 5, obtemos que V NM é um conjunto em M. Como M ⊆ N , obtemos o absurdo.  Prosseguimos com a seguinte afirmação: Afirmação 8 A relação ∈ é pequena à esquerda em N , i.e. para todo a ε M a classe {x | x ∈ a}N é um conjunto em N . Capítulo 7. Bi-interpretações em teoria de conjuntos 133 Prova. Dado um conjunto a ε M , sabemos que existe um ordinal k tal que a ∈ V Mk . Portanto, pela Afirmação 5, a ∈* V MN (k). Consequentemente, temos que {x | x ∈ a ∧ x ∈* V MN (k)}N = {x | x ∈ a}N é um conjunto em N .  Afirmação 9 M ∈* é bem fundada em N . Prova. Supomos que ∈* não é bem fundada em N e tomamos A ε M, A ⊆M N tal que A não possui um ∈-elemento ∈*-minimal. Então, construímos uma sequência maximal s0, s1, s2 . . . de M-elementos de A, tal que para todo i, si+1 ∈* si. Naturalmente, a sequência s deve possuir o tamanho de um ordinal limite α em M. Pela substituição em M, obtemos a sequência k0, k1, k2 . . ., sendo ki = o−1(rankN (si)) (o é o isomorfismo dos ordinais de M nos ordinais de N ). Notadamente, k é uma sequência decrescente de ordinais em M e, portanto, α não pode ser um ordinal limite.  Afirmação 10 ∈* é pequena à esquerda em M. Prova. Dado que A ε N , sabemos que existe um ordinal k tal que A ∈* V Nk . Segue, pela Afirmação 5, que A ∈ V NM(k) e, portanto, ∀x ∈* A(x ∈ V NM(k)). Como V NM(k) é um conjunto em M segue o resultado.  Construiremos a partir de agora o isomorfismo I de M em N por recursão em M. A função i1 = {⟨∅M, ∅N ⟩}M é o primeiro nível da construção. Definimos in : V MN (n) −→ V Nn : 1. Se n é um ordinal sucessor, in(a) = ⎧⎪⎨⎪⎩in−1(a), se a ∈ * V MN ((n−1)) {in−1(z) | z ∈ a}N , caso contrário 2. Se n é um ordinal limite, in = ⋃︁ k<n ik Capítulo 7. Bi-interpretações em teoria de conjuntos 134 Atentemos que {in−1(z) | z ∈ a}N é de fato um conjunto em N porquanto ∈ é pequena à esquerda em N . Provaremos indutivamente que in é uma bijeção e, para todo x e y em V MN (n), é válido que x ∈ y ↔ I(x) ∈* I(y). Suponhamos que esse seja o caso até um ordinal n. 1in+1 é injetora: Tomemos in+1(a) = in+1(b), então teremos três casos: 1. a, b ∈* V MN (n): Isso significa que in+1(a) = in(a) = in(b) = in+1(b). Então, pela hipótese de indução a = b; 2. a ∈ V MN (n) e b /∈ V MN (n): in+1(b) = {in(z) | z ∈ b}N = in(a). Pela hipótese de indução in(a) ∈* V Nn , assim todo ∈ -membro z de b é tal que existe um nível k menor que n tal que in(z) ∈* V Nk . A partir do isomorfismo in sabemos que z ∈* V MN (k) e, portanto, b ∈* V MN (n) – contradição. 3. a /∈ V MN (n) e b /∈ V MN (n): {in(x) | x ∈ a}N = {in(x) | x ∈ b}N Pela extensionalidade em N , para todo y em N ∃x(y = in(x) ∧ x ∈ a) ↔ ∃z(y = in(z) ∧ z ∈ b). (7.1) Porque x ∈ a implica x ∈* V MN (n), então x ∈ a implica in(x) ∈* V Nn por hipótese de indução. Suponhamos que x ∈ a, nesse caso, existe um y tal que in(x) = y. Então, pela Eq. (7.1), existe z tal que y = in(z) e z ∈ b. Como in é uma bijeção, vale x = z – e então x ∈ b. Com argumento similar, obtemos que x ∈ b → x ∈ a; então, a partir da extensionalidade em M, concluímos a = b. 2in+1 é sobrejetora: Notadamente o caso em que a ∈* V Nn é trivial, uma vez que a função in+1 coincide com in no domínio V MN (n) sobre o contradomínio V Nn . Como in é sobrejetiva, então in+1 é sobrejetiva sobre V Nn . Capítulo 7. Bi-interpretações em teoria de conjuntos 135 Tomemos a ∈* V N(n+1) tal que a /∈ * V Nn . Nesse caso, sabemos que a ⊆* V Nn . Nosso objetivo é mostrar que existe uma cópia desse conjunto em M e então obter o conjunto apropriado em M tal que sua imagem seja a. Como M vê ∈* como pequena a esquerda e usando a substituição sobre in, concluímos que a′ = {i−1n (x) | x ∈* a}M é um conjunto em M. Seja aM = {b−1(x) | x ∈ a′}M um conjunto obtido pela substituição em M, então temos que aM = b(aM) ∈ M. Provamos em seguida que in+1(aM) = a. Primeiramente, suponhamos o absurdo aM ∈* V MN (n). Notadamente, aM ∈ V Mn pelo isomorfismo b. Assim, é válido que para cada x existe um k < n tal que x ∈ aM → x ∈ V Mk . Seja w qualquer membro de N tal que w ∈* a – segue que i−1n (w) ∈* a′ e b−1(i−1n (w)) ∈ aM. Portanto, b−1(i−1n (w)) ∈ V Mk . Do isomorfismo b, concluímos que i−1n (w) ∈* V MN (k) e, do isomorfismo in, que w ∈* V Nk . Como w é arbitrário, assertamos que ∈*-elementos de a são de rank abaixo de n, o que, por sua vez, implica a contradição a ∈* V Nn . Esse argumento também implica que aM ∈* V MN (n+1). Consequentemente, pela definição de in+1: in+1(aM) = {in(z) | z ∈* aM}N . Pelo isomorfismo b in+1(aM) = {in(z) | b−1(z) ∈ aM}N . Pela definição de aM in+1(aM) = {in(z) | z ∈ a′}N . Pela definição de a′ in+1(aM) = {in(z) | ∃x(i−1(x) = z ∧ x ∈* a)}N . E, como in é um isomorfismo, concluímos que in+1(aM) = {x | x ∈* a}N = a. Então in+1(aM) = a e, consequentemente, in+1 é uma sobrejeção sobre V Nn+1 como desejado. É suficiente agora provar que in+1 preserva a relação de pertencimento: 3 M  x ∈ y ↔ in+1(x) ∈* in+1(y) O caso em que y ∈* V MN (n) é válido por hipótese de indução, então podemos assumir que y /∈* V MN (n) e y ∈* V MN (n+1). Segue que in+1(y) = {in(z) | z ∈ y}N . Capítulo 7. Bi-interpretações em teoria de conjuntos 136 Suponhamos que x ∈ y. Nesse caso, x deve ser um ∈*-elemento de V MN (n) pela hierarquia de M. Isso significa que in+1(x) = in(x) e, assim, in(x) ∈* {in(z) | z ∈ y}N = in+1(y). Por outro lado, se tomamos in+1(x) ∈* in+1(y), então in+1(x) ∈* {in(z) | z ∈ y}N . Consequentemente, existe um elemento a tal que in(a) = in+1(x) e a ∈ y. Como in é injetiva, a = x e x ∈ y como desejado. Isso finaliza o caso para os ordinais sucessores. Devemos agora verificar os casos limites. Suponhamos que, para todo k < n, a função ik é um isomorfismo de V MN (k) em V Nk . Provaremos que in é um isomorfismo de V MN (n) em V Nn . 1 in é injetiva: Suponhamos que in(a) = in(b) e a, b ∈* V MN (n). Porquanto n é um limite, existe um k < n tal que a, b ∈* V MN (k). Temos que ik(a) = ik(b) pela hipótese de indução, logo a = b já que ik é injetiva. 2 in é sobrejetiva: Seja b um ∈*-membro de V Nn , então existe um k < n tal que b ∈* V Nk . Assim, b é está na imagem de ik pela hipótese de indução. Como ik ⊆ in, então, a função in é sobrejetiva. 3 M  x ∈ y ↔ in+1(x) ∈* in+1(y): Como a, b ∈* V MN (n), existe k tal que a, b ∈* V MN (k). Portanto, a ∈ b se, e somente se, ik(a) ∈* ik(b) pela hipótese de indução. E, pela construção de in, temos que a ∈ b se, e somente se, in(a) ∈* in(b).  Notadamente, as provas por indução usadas no teorema parecem fazer uso fundamental dos axiomas de ZF. Por essa razão, Enayat conjectura: Conjectura 1 (Ali Enayat) ZF é minimal em relação à propriedade tight. Isto é, qualquer subteoria própria de ZF não é tight. Contudo, observamos que o uso fundamental dos axiomas ocorre em especial para a indução transfinita. Nesse caso, o axioma da substituição tem um valor fundamental: o caso limite α da indução transfinita depende da substituição para realizar a união do tipo Capítulo 7. Bi-interpretações em teoria de conjuntos 137 ⋃︀ x ∈ α(F (x)). Porém, esse caso indutivo requer que a substituição valha apenas para os conjuntos bem ordenados. Teorema 10 A teoria ZF sem separação e com substituição apenas para conjuntos bem ordenados é tight. Mais ainda, essa teoria é uma subteoria própria de ZF. A prova desse teorema é precisamente a reconstrução da prova anterior com especial atenção aos casos em que se usa a substituição. Hamkins e Freire (2018) provam que o axioma da substituição bem ordenada é equivalente à substituição completa em ZF sem substituição – contudo, a prova faz uso fundamental do axioma da separação. Por essa razão, dizemos que esse teorema responde negativamente à conjectura de Enayat. Apesar disso, a conjectura merece reformulação como mostraremos a seguir: Definição 42 Chamamos de Z a teoria ZF sem o axioma da substituição. Conjectura 2 (Reformulada) Qualquer extensão de Z que seja consistente com a negação de alguma instância do axioma da substituição não é tight. O primeiro passo para responder a essa conjectura é perguntar sobre a teoria que não possui qualquer instância do axioma da substituição. Teorema 11 A teoria Z não é tight. Antes de provar esse resultado, devemos explorar um pouco a técnica de Mathias (2001) para produzir modelos de Z onde falha a substituição. 7.2 Construção de Mathias Existem diversas técnicas para gerar modelos de Z onde falha a substituição. Entretanto, obtemos em geral modelos com ordinais limitados. Ou seja, uma importante dificuldade na construção de modelos onde falha a substituição é se manter compatível com a existência dos ordinais do modelo base. É precisamente essa a inovação da técnica desenvolvida por Mathias (2001). A construção de Mathias é compatível com a existência de todos os ordinais do modelo base. A construção tem por base a definição a seguir de classe fecunda: Definição 43 Uma classe T é fecunda caso: Capítulo 7. Bi-interpretações em teoria de conjuntos 138 1. x ∈ T implica ⋃︀x ⊆ x; 2. On ⊆ T (não é necessário); 3. x ∈ T e y ∈ T implica x ∪ y ∈ T ; 4. x ∈ T e y ⊆ P (x) implica x ∪ y ∈ T . Definição 44 O axioma da pertencimento transitivo (PT) é a fórmula que diz que todo conjunto é membro de um conjunto transitivo. Teorema 12 Se T é uma classe fecunda, então M = ⟨⋃︀T,∈⟩ é um modelo supertransitivo e satisfaz Z + PT. Seguimos agora com a construção de uma classe fecunda: Definição 45 Dada uma função Q : ω −→ Vω, então definimos a função f : ω −→ ω dos cortes em x pela função Q: fQx (n) = ||x ∩Q(n)||, sendo ||A|| a cardinalidade do conjunto A. Definição 46 Dada uma família G de funções g : ω −→ ω e dada uma função Q : ω −→ Vω, então definimos TQ,G = {x | ⋃︁ x ⊆ x ∧ fQx ∈ G} A seguir descrevemos as condições sobre G e Q tal que a classe TQ,G seja fecunda: Proposição 15 Se G e Q apresentam as seguintes propriedades: 1. para todo ordinal α, fQα ∈ G; 2. se f ∈ G e g ∈ G, então f+g ∈ G (sendo f+g a função tal que f+g(n) = f(n)+g(n)); 3. se g ∈ G e f ≤ g (∀n(f(n) ≤ g(n))), então f ∈ G; 4. se ⋃︀x ⊆ x e fQx ∈ G, então fQP (x) ∈ G, então TQ,G é fecunda. Descrevemos agora um tipo particular de função que possui as propriedades necessárias para gerar a classe fecunda. Capítulo 7. Bi-interpretações em teoria de conjuntos 139 Definição 47 Definimos a função bn : ω −→ ω, para n finito: 1. b0(n) = n. 2. bk+1(n) = 2bk(n). Exemplos: b3(n) = 22 2n , b5(n) = 22 22 2n As funções bn serão responsáveis por limitar o crescimento do número de elementos de elementos dos ranks maiores: Por isso, definimos a nossa classe de funções F (G): F = {f : ω −→ ω | ∃k ∈ ω(f ≤ bk)}. Definimos a nossa função R (Q) simplesmente como R(n) = Vn. Nesse caso, podemos provar que Teorema 13 TR,F é uma classe fecunda. Verifiquemos que o modelo de Z que essa classe fecunda gera não possui o conjunto Vω e, portanto, a substituição falha para o conjunto ω: Proposição 16 Sendo M = ⟨⋃︀TR,F ,∈⟩, então Vω /∈ M . Prova. Supondo que Vω ∈ M , então deve existir A ∈ TR,F tal que Vω ∈ A. Como A é um conjunto transitivo, então Vω ⊆ A. Mais ainda fRA ∈ F . Por isso, existe um k ∈ ω tal que fRA ≤ bk. Consequentemente, para todo n ∈ ω ||A ∩R(n)|| = ||Vn|| ≤ bk(n) Mostraremos que existe um n tal que esse não é o caso. Notadamente, podemos representar ||Vn|| pela função recursiva h(n + 1) = 2h(n), sendo h(0) = 0. No caso de k > 3, nossa ideia é mostrar que h(bk(1)) > bk(bk(1)), obtendo a contradição. Os casos k = 1, 2 ou 3 podem ser mostrados com exemplos diretamente. Seguimos com a seguinte afirmação: Afirmação 11 Para todo a > 3, vale h(a) > 2 × a. Capítulo 7. Bi-interpretações em teoria de conjuntos 140 Prova. Provamos por indução finita. Tomemos o caso inicial a = 4, então h(a) = 16 e 2.4 = 8. Logo h(4) > 2 × 4. Supomos que, para todo q ≤ k, vale h(q) > 2.q. Então tomamos h(k + 1) = 2h(k) > 22×k, por hipótese de indução. Provamos novamente por indução que, para todo k > 3, 22×k > 2(k + 1). Para o caso, inicial temos 22×4 = 256 > 2(4 + 1) = 10. Supondo que 22×q > 2(q + 1), provamos que 22×(q+1) > 2((q + 1) + 1). Notadamente, 22×(q+1) = 2(2×q+2) = 22×q × 4 > 2(q + 1) × 4 = 2(4 × q + 4) > 2(q + 2) = 2((q + 1) + 1) Logo, h(k + 1) = 2h(k) > 22×k > 2(k + 1), finalizando a prova.  Notadamente, h(n) = bn(0), bn+1(0) = bn(1) e bn(bn(1)) = h(2 × n + 1) para todo n. Todos esses fatos são o resultado de simples verificação. Mostraremos por indução que, se k > 3, então h(bk(1)) > bk(bk(1)). Supondo válida a hipótese até q, temos: h(bq+1(1)) = h(bq+2(0)) = h(h(q + 2)). Além disso, bq+1(bq+1(1)) = h(2 × (q + 1) + 1). Como h(q + 2) > 2 × (q + 2) > 2 × (q + 1) + 1, então h(bq+1(1)) = h(h(q + 2)) > h(2 × (q + 1) + 1) = bq+1(bq+1(1)), finalizando a prova.  7.3 A teoria de conjuntos de Zermelo não é tight Provaremos nesta seção o Teorema 11. Para isso, faremos uso da construção de Mathias descrita na seção anterior. Primeiramente, definimos a seguinte "cópia" do universo V de conjuntos no modelo base: Definição 48 Definimos a classe V (x): Capítulo 7. Bi-interpretações em teoria de conjuntos 141 1. V (x)0 = ∅. 2. dado um ordinal α, V (x)α+1 = {x} ∪ (P (V (x)α ) − {∅}). 3. se β é um ordinal limite, V (x)β = ⋃︀ i∈β V (x) i . Então, provamos o seguinte lema: Lema 17 Seja x um conjunto infinito e transitivo que satisfaz ∃k ∈ ω∀n ∈ ω(||x ∩ Vn|| ≤ bk(n)), então V (x)α ∈ M para todo ordinal α. Prova. Notadamente, se n ∈ ω, o conjunto Vn possui somente conjuntos hereditariamente finitos. Por essa razão, para qualquer α temos que (x ∪ V (x)α ) ∩ Vn = x ∩ Vn Como, por suposição, existe k ∈ ω tal que ||x ∩ Vn|| ≤ bk(n) para todo n ∈ ω, segue que fR x∪V (x)α ∈ F . Mostramos que x ∪ V (x)α é transitivo. Para esse efeito, provaremos Afirmação 12 se a ∈ b ∈ V (x)α e b = x, então a ∈ V (x)α . Por simples indução, prova-se que, para todo γ, ∅ /∈ V (x)γ . Seguimos com a prova por indução. Tomemos que a ∈ b ∈ V (x)β+1 e b = x. Por definição, temos que b ∈ P (V (x) β ) e, portanto, b ⊆ V (x)β . Nesse caso a ∈ V (x) β e, assim, 1. se a = x, então a ∈ V (x)β+1 por definição; 2. se a = x, então, por hipótese de indução, a ⊆ V (x)β . Como a ∈ V (x) β , então a = ∅. Logo, por definição, a ∈ V (x)β+1. Demonstramos agora o caso em que β é um ordinal limite. Tomemos que a ∈ b ∈ V (x)β . Assim, existe um ordinal γ < β tal que b ∈ V (x)γ . Portanto, por hipótese de indução, a ∈ V (x)γ . Segue que a ∈ V (x)β por definição. Desse resultado, obtemos sem dificuldades que x∪V (x)α é um conjunto transitivo para todo α. Seguimos com a prova de que V (x)α ∈ M para todo α. Como x ∪ V (x) α+1 é transitivo e fR x∪V (x)α ∈ F , então x ∪ V (x)α+1 ∈ TR,F . Logo, como V (x)α ∈ V (x) α+1, então V (x)α ∈ M . Capítulo 7. Bi-interpretações em teoria de conjuntos 142  A partir desse resultado, observamos que, embora Vω não esteja no modelo M, uma cópia V (ω)ω dele está no modelo. Mais ainda, uma cópia V (ω) do modelo original V está inteiramente contida em M. Nossa dificuldade agora será mostrar que V (ω) é uma classe definível em M: Lema 18 A classe V (ω) é definível em M. Prova. Naturalmente, V (ω) não pode ser definida por recursão em M, uma vez que não vale o axioma da substituição. Contudo, ainda nos resta a possibilidade de definir a classe em um único golpe, sem recorrer à construção por níveis. É isso que vamos fazer. A chave para que a estratégia funcione é que os modelos de Mathias satisfazem PT. Seguimos com a definição: Informalmente, x ∈ V ′(ω) ⇐⇒ toda sequência de pertencimento em x passa por ω. Formalmente, x ∈ V ′(ω) ⇐⇒ ∃y(y é transitivo ∧ x ⊆ y)∧ ∀(f : ω −→ y)(f(0) = x ∧ ∀i ∈ ω(f(i+ 1) ∈ f(i) ∨ f(i) = ∅) → ∃n ∈ ω(f(n) = ω))). Demonstraremos que, de fato, V ′(ω) = V (ω): Afirmação 13 V ′(ω) = V (ω). Prova. Por indução na hierarquia de V , provamos que ∀x∃α(x ∈ V ′(ω) → x ∈ V (ω)α ) Tomemos x ∈ Vi tal que x ∈ V ′(ω). Se y ∈ x, então y ∈ V ′(ω) e y ∈ Vj para algum j < i; assim, concluímos que y ∈ V (ω)β para algum ordinal β por hipótese de indução. Seja α = ⋃︁ {k | ∃y ∈ x(k é o menor ordinal tal que y ∈ V (ω)k )}, provaremos que x ∈ V (ω)α+1. Pela Afirmação 12, obtemos o seguinte fato: Capítulo 7. Bi-interpretações em teoria de conjuntos 143 Fato 4 Se β ≤ α, então V (ω)β ⊆ V (ω)α . Se x = ω, então, por definição, V (ω)α+1. Se x = ω (e sabemos que x = ∅), tomamos que y ∈ x ∈ V (ω)α . Segue que y ∈ V (ω) β , para algum β ≤ α. Então pelo Fato 4, y ∈ V (ω)α . Portanto, x ⊆ V (ω)α . Logo, x ∈ P (V (ω)α ) – o que, por sua vez, implica x ∈ V (ω)α+1, finalizando a indução. Seguidamente, demonstraremos por indução em V (ω) que ∀x(x ∈ V (ω) → x ∈ V ′(ω)). Seja η uma função de funções de pertencimento em ω + 1 tal que η(f) = ⎧⎪⎨⎪⎩k, sendo k o menor ordinal tal que f(k) = ωω, caso não exista tal k. E seja pSeq(x) o conjunto de todas as sequências de pertencimento de um conjunto x. Supomos que x ∈ V (ω)α e x = ω. Então, para todo y ∈ x, existe β < α tal que y ∈ V (ω) β . Por hipótese de indução, y ∈ V ′(ω) e, portanto, para toda f ∈ pSeq(y), η(f) é um ordinal finito. Tomemos uma g ∈ pSeq(x) qualquer e definamos h(n) = g(n + 1). Notadamente h ∈ pSeq(g(1)). Como g(1) ∈ x, então η(g(1)) é um ordinal finito. Assim, concluímos que η(g) também deve ser um ordinal finito. Isso significa que x ∈ V ′(ω), finalizando a indução.  A prova dessa afirmação finaliza a demonstração do lema.  Lema 19 Existe um isomorfismo I de V em ⟨V (ω),∈⟩, definível em V . Prova. Definimos o isomorfismo recursivamente: ∅(ω) = ω. a(ω) = {x(ω) | x ∈ a} Por indução, prova-se que para todo a ∈ V , a(ω) ∈ V (ω). 1. x(ω) é injetora: Se a(ω) = b(ω), então {x(ω) | x ∈ a} = {x(ω) | x ∈ b}. Supondo y ∈ a, obtemos que y(ω) ∈ a(ω). Logo y(ω) ∈ b(ω). Portanto, existe z ∈ b tal que z(ω) = y(ω). Por hipótese de Capítulo 7. Bi-interpretações em teoria de conjuntos 144 indução, isso implica y = z e, portanto, y ∈ b; i.e. y ∈ a → y ∈ b. Analogamente, obtemos que y ∈ b → y ∈ a. Logo, pela extensionalidade, a = b. Antes de provar que o mapeamento é sobrejetor, definimos a função x−(ω) de V (ω) em V : ω−(ω) = ∅, a−(ω) = {x−(ω) | x ∈ a}. A prova da sobrejeção será simplesmente a prova de que essa função é a inversa da anterior. 2. x(ω) é sobrejetora: Tomemos a ∈ V (ω). Mostraremos por ∈-indução que (a−(ω))(ω) = a: (a−(ω))(ω) = {x−(ω) | x ∈ a}(ω) = {y(ω) | y ∈ {x−(ω) | x ∈ a}} = {(z−(ω))(ω) | z ∈ a} e, por hipótese de indução, = {z | z ∈ a} = a Por fim, provamos que o isomorfismo preserva as relações de pertencimento: 3. x ∈ y ↔ x(ω) ∈ y(ω): Se x ∈ y, então, como y(ω) = {a(ω) | a ∈ y}, x(ω) ∈ y(ω). Por outro lado, se x(ω) ∈ y(ω), então existe a ∈ y tal que a(ω) = x(ω); uma vez que a função é injetora, obtemos que a = x e, portanto, x ∈ y.  Como V (ω) é uma cópia isomórfica de V , então ela pode definir uma cópia M(ω) de M. Notemos que, para que uma bi-interpretação entre V e M seja estabelecida, basta que o isomorfismo entre M e a cópia M(ω) seja definível em M. Lema 20 Existe um isomorfismo de M em M(ω) definível em M. Prova. Notadamente, o isomorfismo deverá ser precisamente a função que relaciona os conjuntos a de M aos conjuntos a(ω). Entretanto, enfrentamos novamente a dificuldade de construir uma definição sem o auxílio da recursão. Sendo cl(x) o menor conjunto transitivo que contém x, cl(ω) a versão dessa função em M(ω), definimos para a ∈ M Notação 4 ⟨A,E⟩ i∼= ⟨B,E ′⟩ é a sentença que afirma que i é um isomorfismo da estrutura ⟨A,E⟩ na estrutura ⟨B,E ′⟩. Capítulo 7. Bi-interpretações em teoria de conjuntos 145 f(a) = x tal que x ∈ M (ω) ∧ ∃i : M −→ M (ω)(⟨cl(a),∈⟩ i∼= ⟨cl(ω)(x),∈⟩ ∧ i(a) = x) Mostraremos que a função é bem formada (existe um único x que satisfaz a sentença definidora para cada a) e que, de fato, f(a) = a(ω) para todo a. Em seguida, provaremos que a função é definível em M. Afirmação 14 Para cada a ∈ M , existe um único conjunto y transitivo em M(ω) tal que ⟨cl(a),∈⟩ i∼= ⟨y,∈⟩. Prova. Supomos que existem dois conjuntos y e z transitivos em M(ω) e duas funções i e j tais que ⟨cl(a),∈⟩ i∼= ⟨y,∈⟩ e ⟨cl(a),∈⟩ j∼= ⟨z,∈⟩. Pela transitividade de cl(a) e da (ω)-transitividade de y e z, obtemos que i(∅) = j(∅) = ω. Seguimos com a prova por indução em V : Supomos por indução que, para β < α e todo x ∈ cl(a) com x ∈ Vβ, vale i(x) = j(x). Tomemos d ∈ Vα e d ∈ cl(a). Se b ∈ i(d), pelo isomorfismo i, obtemos que existe c ∈ M tal que i(c) = b e, nesse caso, c ∈ d. Segue que c ∈ Vγ para algum γ < α. Por isso, i(c) = j(c) = b e, portanto, pelo isomorfismo j, obtemos que b ∈ j(d). Analogamente, obtemos que b ∈ j(d) implica b ∈ i(d). Assim, pela extensionalidade, temos que i(d) = j(d). Logo, obtemos y = z. Portanto, se existe y tal que ⟨cl(a),∈⟩ i∼= ⟨y,∈⟩, então ele é único.  Naturalmente, y = cl(ω)(a(ω)) satisfaz a propriedade ⟨cl(a),∈⟩ i∼= ⟨y,∈⟩ e é o único conjunto em M (ω) que satisfaz. Além disso, nesse caso, teremos i(a) = a(ω) como desejado. Resta-nos apenas provar que a função é definível em M. Para isso, devemos mostrar que, para todo a ∈ M , o isomorfismo i com a(ω) é membro de M . Isso, contudo é a simples consequência de que cl(a×a(ω)) satisfaz os requisitos de tamanho dos cortes por nível em Vω.  Com isso, finalizamos a prova de que existe uma bi-interpretação entre os modelos V e M. Prova. [Teorema 11] Ambos os modelos V e M são modelos de Z. Como demonstramos, esses modelos são bi-interpretáveis. Mais ainda, V e M discordam sobre a validade de Capítulo 7. Bi-interpretações em teoria de conjuntos 146 pelo menos uma instância do axioma esquema de substituição. Portanto, Z não é uma teoria tight.  Tanto a construção de Mathias quanto as bi-interpretações mostradas acima são bastante maleáveis em relação à qual instância da substituição queremos eliminar. De fato, podemos construir modelos M supertransitivos de Zermelo e PT tais, para um ordinal limite k, Va ∈ M para todo a < k e Vb /∈ M para todo b ≥ k. Teorema 14 Dado um ordinal limite k, existe modelo M  Z + PT tal que Va ∈ M para todo a < k e Vb /∈ M para todo b ≥ k. A construção do modelo segue os mesmos passos, com algumas pequenas alterações nas definições: Fixado um ordinal limite k, definimos Definição 49 Dada uma função Q : k −→ Vk, então definimos a função f : k −→ k dos cortes em x pela função Q: fQx (a) = ||x ∩Q(a)||, a < k sendo ||A|| a cardinalidade do conjunto A. Definimos a classe TQ,G do mesmo modo e obtemos as mesmas condições para a classe ser fecunda. Em relação às funções bn, precisamos incluir os casos limites: Definição 50 Definimos a função ba : k −→ Ord para cada a < k: 1. b0(n) = n; 2. ba+1(n) = 2ba(n); 3. se a é limite, ba(n) = ( ⋃︀{bq(0) | q < a})n. Fazemos um pequeno ajuste em F : F = {f : k −→ Ord | ∃a ∈ k(f ≤ ba)}. Tomamos R(n) = Vn e então obtemos, pelo mesmo procedimento, o teorema: Capítulo 7. Bi-interpretações em teoria de conjuntos 147 Teorema 15 TR,F é uma classe fecunda. Obtemos também por prova muito similar que Proposição 17 Sendo M = ⟨⋃︀TR,F ,∈⟩, então Vk /∈ M e, se a < k, então Va ∈ M . Seguimos com a construção de V (k)n ∈ M . No caso, obteremos a bi-interpretação de M e V como desejado. Por fim, obtemos o resultado de não-tightness apenas quando falamos de um k definível: Teorema 16 Dado um ordinal k definível, a teoria Z(Vk) = Z +PT+ (existe Va para a < k) não é tight. Esse resultado, portanto, é uma das possíveis aproximações de ZF a partir de Z em que todos os elementos não são tight, i.e. a sequência crescente (em relação ao k escolhido) das teorias Z(Vk) tem como limite a própria teoria ZF e nenhuma das teorias é tight. Isso, porém, não responde a Conjectura 2. Existem muitas outras formas de realizar aproximações de ZF a partir de Z e, um resultado definitivo deverá ser feito pela complexidade das fórmulas no axioma da substituição. 7.4 Bi-interpretação modelo a modelo Ainda que duas teorias T1 e T2 não sejam bi-interpretáveis, alguns modelos de T1 podem ser bi-interpretáveis com modelos de T2. Em vista disso, é natural considerar o caso em que todos os modelos de uma teoria são bi-interpretáveis com modelos de uma outra teoria (e todos da outra com modelos da uma). A diferença central em relação às bi-interpretações entre teorias é que a definições de uma bi-interpretação B entre modelos M1  T1 e M2  T2 pode não ser a bi-interpretação de um modelo M′1 com nenhum modelo de T2 e, mesmo assim, existir uma bi-interpretação B′ de M′1 com M′2  T2. Estudaremos, portanto, a possibilidade de ocorrer a situação descrita acima. Definição 51 Duas teorias T1 e T2 são fracamente bi-interpretáveis (ou bi-interpretáveis modelo a modelo) quando: 1. Todo modelo de T1 é bi-interpretável com algum modelo de T2. Capítulo 7. Bi-interpretações em teoria de conjuntos 148 2. E todo modelo de T2 é bi-interpretável com algum modelo de T1. Em geral, propriedades válidas para qualquer modelo de teorias implicam a validade para as próprias teorias. Esse é, por exemplo, o caso do teorema de completude de primeira ordem: se todo modelo para uma teoria valida uma sentença α, então a teoria prova α. Por isso, seria esperado que, se duas teorias são fracamente bi-interpretáveis, então elas seriam bi-interpretáveis. Isso, contudo, não ocorre, como veremos a seguir. Notemos que a construção das interpretações entre V  ZF e a construção de Mathias apropriada M  Z + PT+ (não existe Vω) são as mesmas fórmulas independentemente da escolha particular do modelo base V . Dizemos, nesse caso, que o par ⟨I, J⟩ é a bi-interpretação entre V e M. Assim, temos M = V I e V (ω) = MJ . Consideremos a seguinte teoria: ZM = {φ | ZF ⊢ φI} ∪ {φ ↔ φIJ | φ ∈ L∈}. Nossa intenção é mostrar que ZM é uma teoria recursivamente descrita que axiomatiza os modelos M para cada modelo de V de ZF . Porém, ZM não está descrita de modo recursivo. Então, definimos uma teoria equivalente e recursivamente descrita (porquanto ZF é recursivamente descrita): ZM ′ = {φJ | φ ∈ ZF} ∪ {φ ↔ φIJ | φ ∈ L∈}. Provamos o seguinte lema: Lema 21 Para toda sentença φ ZF  φI ⇐⇒ ZM ′  φ, e para toda sentença θ ZM ′  θJ ⇐⇒ ZF  θ. Prova. Pelo resultado da bi-interpretação, sabemos que, para toda φ, ZF  φ ↔ φJ I . Pela definição de ZM', J é uma interpretação de ZF em ZM'. Provaremos que I é uma interpretação de ZM' em ZF. Se α ∈ ZM ′, então α = γJ para alguma γ ∈ ZF ou α = β ↔ βIJ para alguma β. No primeiro caso, como ZF  γ ↔ γJ I , então ZF  γJ I e, portanto, ZF  αI . No segundo caso, αI = βI ↔ βIJ I é uma instância de γ ↔ γJ I e, portanto, ZF  αI . Pelo teorema da interpretação, temos que ZF  α ⇒ ZM ′  αJ ZM  β ⇒ ZF  βI Capítulo 7. Bi-interpretações em teoria de conjuntos 149 Supomos que ZM ′  αJ , então ZF  αJ I . Portanto, ZF  α. Se, por outro lado, ZF  βI , então ZM ′  βIJ – logo, ZM ′  β.  Provamos a seguir que ambas axiomatizações são equivalentes: Lema 22 N  ZM se, e somente se, N  ZM ′. Prova. Supomos que N  ZM ′ e que φ ∈ ZM . Por definição, ZF  φI ou φ ↔ φIJ . O segundo caso é trivial, já que ZM ′ possui todos os axiomas da forma φ ↔ φIJ . Seguimos com a prova do primeiro caso. Pelo resultado anterior, temos que N J  ZF . Portanto, N J  φI . Isso significa que N  φIJ . Como N  φ ↔ φIJ , então N  φ. Consequentemente, obtemos que N  ZM . Por outro lado, se supomos N  ZM e θ ∈ ZM ′. Se θ = φ ↔ φIJ para alguma φ, então N  θ pela definição de ZM. Caso contrário, θ = γJ para alguma γ ∈ ZF . Como I é uma interpretação de ZM' em ZF, temos que ZF  θI e, portanto, N  θ pela definição de ZM.  Com esse resultado, podemos dizer que ZM (Zermelo-Mathias) é uma teoria axiomatizável recursivamente. Seguimos com a prova do seguinte teorema: Teorema 17 Existem teorias T1 e T2 tais que: Todos os modelos de T1 são bi-interpretáveis com algum modelo de T2, todos os modelos de T2 são bi-interpretáveis com modelos de T1, mas as teorias T1 e T2 não são biinterpretáveis. Isto é, T1 e T2 são fracamente bi-interpretáveis, mas não são bi-interpretáveis. Prova. Tomemos as seguintes teorias: 1. T1 = ZF . 2. T2 = {α ∨ β | α ∈ ZF ∧ β ∈ ZM}. (T2 = ZM ∨ ZF ) Demonstraremos a seguinte afirmação: Afirmação 15 M  T2 se, e somente se, M  ZF ou M  ZM . Capítulo 7. Bi-interpretações em teoria de conjuntos 150 Prova. Dado que M  T2, supomos que M 2 ZF e M 2 ZM . Nesse caso, devem existir α ∈ ZF e β ∈ ZM tais que M 2 α e M 2 β. Portanto, M 2 α ∨ β – absurdo, pois α ∨ β ∈ T2. Se M  ZF ou M  ZM , então, para toda α ∈ ZF e β ∈ ZM , M  α ou M  β. Portanto, M  α ∨ β – e isso significa que M  T2.  Seguimos com a prova de que T1 e T2 são fracamente bi-interpretáveis. Supondo que M  T1, então M  T2. Portanto, o par ⟨Id, Id⟩, sendo Id = ⟨x = x,∈⟩ (interpretação identidade), é uma bi-interpretação de M em M. Se N  T2, então N  T1 ou N  ZM . No primeiro caso, a bi-interpretação é a identidade. No segundo caso, usamos a bi-interpretação ⟨I, J⟩ do Teorema 11. Portanto, N J é modelo de ZF e é bi-interpretável com N . Provamos que T1 e T2 são fracamente bi-interpretáveis. Resta-nos provar que as teorias não são bi-interpretáveis. Supomos que o par ⟨G,H⟩ é uma bi-interpretação de T1 em T2 e que M  ZM . Assim, temos que M  T2, e, portanto, MG  T1. Como T1 = ZF , sabemos que MG  T2. Segue que MGG  T1 e que MG e MG G são bi-interpretáveis. Uma vez que ambos são modelos de ZF e ZF é tight, então MG e MGG são isomórficos (MG ∼= MGG). Mais ainda, pela suposição de que ⟨G,H⟩ é uma bi-interpretação, sabemos que MGG H ∼= MG e que MGH ∼= M. Consequentemente, obtemos MG ∼= M. Isso é um absurdo, porquanto ZM e ZF discordam sobre quais instâncias do axioma da substituição são válidos.  7.5 Relação entre ZF e PA Elaboramos no capítulo 5 como a interpretação mútua entre ZFfin e PA turva diferenças sutis entre os sistemas. Com efeito, enquanto não adicionamos o axioma dos hereditariamente finitos a ZFfin, a teoria não é capaz de definir um isomorfismo com a sua própria cópia em PA. Esse resultado é amplamente referido pela comunidade matemática como o descobrimento do equivalente conjuntista de PA. Não subscrevemos a essa posição e a entendemos como excessivamente arbitrária. Se falamos "equivalente" conjuntista no sentido de que faz uso da linguagem do pertencimento, de fato, ZFcfin é um equivalente conjuntista de PA. Contudo, se se deseja implicar mais do que isso, acreditamos que estejam errados. Conjuntos são um conceito axiomatizado incompletamente por ZF, por ZF sem funCapítulo 7. Bi-interpretações em teoria de conjuntos 151 dação ou mesmo por teorias bastante fracas como Z ou Kripke-Platek. Não obstante alguém subscreva a um universo ou a um multiverso de conceitos conjuntistas, o caso em que incluímos a negação de um axioma como em ZFfin deve ser tomada com cuidado. Quando trabalhamos com teorias como ZF + CH e ZF + ¬ CH, lidamos com o conflito entre duas possíveis noções de conjunto – diante disso, um universalista responde estarmos diante de um dilema epistêmico: não sabemos qual dos conceitos é o correto; um multiversalista responde estarmos diante de um dilema ontológico: ambos são conceitos válidos. Isso não ocorreria caso negássemos o axioma da união ou extensionalidade, diante disso, devemos dizer que não falamos mais sobre conjuntos. Entendemos que o axioma do infinito faz parte dos axiomas fundamentais como extensionalidade ou união, afinal, o próprio nascimento da teoria moderna de conjuntos é diretamente relacionado com o entendimento de grandezas infinitas. Isso não significa que precisamos afirmar o infinito – ainda falamos de conjuntos quando estudamos ZF sem o axioma do infinito. Portanto, se falamos de uma teoria que axiomatiza parcialmente conjuntos, ela deve ser ao menos compatível com a afirmação do infinito. Então, se buscamos um equivalente conjuntista para PA, deveríamos formular axiomatizações da teoria de conjuntos que ainda sejam compatíveis com os axiomas fundamentais da teoria de conjuntos (por exemplo, ZF). Porém, obtemos o resultado: Teorema 18 Nenhum modelo de ZF é bi-interpretável com qualquer qualquer modelo de PA. Prova. Se tomamos M  ZF bi-interpretável com A  PA. Pela bi-interpretação de PA e ZFcfin, obtemos que M é bi-interpretável com um modelo N  ZFfin. Estamos, portanto, em uma situação bastante similar à do Teorema 9. O modelo N é capaz de definir uma cópia M de M e o isomorfismo de M e M é definível em M (adotamos a mesma convenção ε , ∈, ∈*, ∈ adotada na prova Teorema 9). A partir disso, obtemos que a relação ∈ é bem fundada em N como na prova do teorema Teorema 9. E, consequentemente, os ordinais de N são segmento dos ordinais de M ou os de M são segmento dos de N . Notadamente, ω ε M e, nesse caso, ω ε M . 1. Supomos que os ordinais de M são segmento próprio dos ordinais de N : Dado que i é o mergulho dos ordinais de N nos de M. Sabemos que i−1(ω) = a para algum a em N . Como N não possui conjuntos indutivos, existe b ∈* a tal que b+ 1 /∈ a. Pelo mergulho, sabemos que i(b) ∈ ω e, portanto, o sucessor c de i(b) em M ∈ -pertence a ω. Assim, i−1(c) ∈ a. Como i−1(c) = b+ 1, temos o absurdo. 2. Supomos que os ordinais de N são segmento próprio dos ordinais de M. Capítulo 7. Bi-interpretações em teoria de conjuntos 152 Sabemos que ⟨ω + 1, ∈ ⟩ é uma classe bem ordenada em N . Se essa não for uma classe própria em N , obtemos o absurdo como em (1). Se ⟨ω + 1, ∈ ⟩ é uma classe própria em N , então ⟨ω + 1, ∈ ⟩ é isomórfico (pela função j) a classe dos ordinais em N . Diante disso, obtemos que j−1(ω) = a, para algum ordinal em N . Então, como em (1), concluímos o absurdo de que a é um conjunto indutivo.  A partir desse resultado, obtemos também o corolário: Corolário 2 Nenhuma subteoria de qualquer extensão consistente de ZF é bi-interpretável com qualquer extensão de PA. Uma forma de aprofundar o entendimento do resultado é notar que (1) algumas teorias não são bi-interpretáveis porque não é possível alinhar todas as bi-interpretações de cada par de modelos em uma única bi-interpretação, enquanto (2) outras teorias não são bi-interpretáveis porque existem modelos de uma teoria que não são bi-interpretáveis com nenhum modelo da outra teoria. O segundo caso é precisamente o que ocorre entre ZF e PA. Por essa razão, "enfraquecer ZF" tomando subteorias cada vez mais fracas nunca nos levará a uma teoria bi-interpretável com PA. Afirmamos, portanto, que não existe um equivalente conjuntista para PA. 153 8 Hierarquia de traduções: análise ontológica Neste capítulo, apresentaremos uma análise ontológica de teorias a partir de diversos métodos de tradução, reunindo muito do que foi discutido até o momento nesta tese. 1. Primeiramente, mostraremos que, para cada método de tradução, obtemos a estrutura de reticulado para as teorias de primeira ordem clássicas, no qual a relação de tradutibilidade representa a relação de ordem. 2. Depois, definiremos uma hierarquia de traduções. A hierarquia tem como definição a ideia de que cada método de maior hierarquia é um caso particular dos métodos menores. 3. A partir dessa definição, mostraremos um método de linearização dos reticulados gerados por cada método separadamente. Linearização aqui não significa tornar linear, mas diminuir a largura do reticulado. Idealmente, uma hierarquia completa poderia tornar o reticulado totalmente linear. 4. Em seguida, mostraremos um esquema concreto dos métodos e teorias trabalhadas nessa tese. 5. Por fim, mostraremos que é possível obter diversas hierarquias de tradução – inclusive usando métodos de lógicas não clássicas para análise da comparação ontológica de teorias clássicas. 8.1 Universo ontológico de teorias de primeira ordem Como vimos nos capítulos anteriores, reduções entre teorias como interpretações ou redução por modelos influenciam as próprias ontologias que são responsáveis por comparar. Tomando isso como base, faremos uma ampla investigação do universo ontológico das teorias de primeira ordem. Começamos por definir abstratamente a comparação ontológica oferecida por um método de redução qualquer: Definição 52 A relação M(r) ≫ é uma redução ontológica básica em uma metateoria M através do método r se para todas as teorias T1, T2 e T3: 1. M ⊢ T1 M(r) ≫ T2 → (Cons(T1) → Cons(T2)). (Condição de medida) Capítulo 8. Hierarquia de traduções: análise ontológica 154 2. M ⊢ T1 M(r) ≫ T1. (Condição reflexiva) 3. se M ⊢ T1 M(r) ≫ T2 e M ⊢ T2 M(r) ≫ T3, então M ⊢ T1 M(r) ≫ T3 (Condição de transitividade) 4. M ⊢ T1 M(r) ≫ T2 → T1 ∪ T M(r) ≫ T2. (Condição de fortalecimento) 5. M ⊢ T1 M(r) ≫ T2 → T1 M(r) ≫ T ∩ T2. (Condição de enfraquecimento) Nesse caso, a relação T1 M(r) ≫ T2 deve ser lida como "T1 pode internalizar a ontologia de T2 com r em uma metateoriaM". Além disso, se queremos estabelecer uma relação assimétrica de redução, devemos exigir algo como M ⊢ T1 M(r) ≫ T2 ∧ ¬(T2 M(r) ≫ T1). Como a metateoria M deve ser mais fraca que as teorias que ela é responsável por comparar (para que a comparação seja significativa), esse resultado não é possível para casos interessantes; M não seria capaz de provar essa relação para teorias que ela já prova a consistência. Definimos, portanto, a comparação ontológica contextualizada ( M(r) ◁ ). Definição 53 (informal) M(r) vê T1 como ontologicamente mais expressiva que T2 se, e somente se, 1. M(r) produz uma redução de T2 em T1 e 2. M(r) produz uma redução de T1 em T2 somente se M vê T2 como uma teoria inconsistente. Definição 54 Dizemos que T1 M(r) ◁ T2 caso M ⊢ T1 M(r) ≫ T2 ∧ (T2 M(r) ≫ T1 → ¬Cons(T2)) E essa relação deve ser entendida como M(r) depõe a favor da afirmação "T1 é ontologicamente mais forte que T2". Proposição 18 A relação M(r) ◁ é transitiva. Prova. Suponhamos que M ⊢ T1 M(r) ◁ T2 e M ⊢ T2 M(r) ◁ T3. Por definição, obtemos que M ⊢ T1 M(r) ≫ T2 e M ⊢ T2 M(r) ≫ T3. Então, pela transitividade de M(r) ≫ , obtemos que M ⊢ T1 M(r) ≫ T3. Provaremos a implicação M ⊢ T3 M(r) ≫ T1 → ¬Cons(T3). Supomos, nesse caso, que T3 M(r) ≫ T1. Capítulo 8. Hierarquia de traduções: análise ontológica 155 Dessa suposição, obtemos T2 M(r) ≫ T1 pela transitividade de M(r) ≫ . Como T2 M(r) ≫ T1 → ¬Cons(T2), então ¬Cons(T2). Além disso, sabemos que Cons(T3) → Cons(T2). Portanto, ¬Cons(T3). Assim, se supomos T3 M(r) ≫ T1, obtemos ¬Cons(T3). Logo, pelo teorema da dedução, obtemos que M ⊢ T3 M(r) ≫ T1 → ¬Cons(T3).  Notemos também que a relação é quasi-irreflexiva: Proposição 19 M ∪ Cons(T ) ⊢ ¬T M(r) ◁ T . Prova. Notemos que ¬T M(r) ◁ T é logicamente equivalente a T M(r) ≫ T ∧ Cons(T ). Logo, M ⊢ ¬T M(r) ◁ T ↔ Cons(T ). Segue que M ∪ Cons(T ) ⊢ ¬T M(r) ◁ T .  Seguimos agora com a descrição do universo ontológico na perspectiva de uma teoria M e um método r. Primeiro definimos as classes de teorias indistinguíveis: Definição 55 [T ]M(r) é a classe {T ′ | T M(r) ≫ T ′ ∧ T ′ M(r) ≫ T}. Naturalmente, [T ]M(r) é uma classe de equivalência. Definimos também a relação de ordem sob o universo de teorias (omitiremos M(r) a partir desse momento quando o contexto for suficiente para o entendimento): Definição 56 [T1] ≥ [T2] se, e somente se, T1 ≫ T2. Fato 5 A relação ≥ é uma ordem parcial em Ut = {[T ] | T é uma teoria de primeira ordem em uma linguagem contável}. Proposição 20 ⟨Ut,≥⟩ é uma ordem parcial limitada. Prova. Naturalmente, a classe [∅] ≤ [T ] para qualquer teoria T e, portanto, a estrutura tem um mínimo. Por outro lado, sendo Tinc uma teoria inconsistente, [Tinc] ≥ [T ] para qualquer teoria T e, portanto, a estrutura tem um máximo. Segue que ⟨Ut,≥⟩ é uma ordem parcial limitada.  Uma pergunta importante para o entendimento da classe Ut é se a estrutura ainda é um reticulado quando retiramos as pontas [∅] e [Tinc]. O caso em que retiramos [∅] é mais Capítulo 8. Hierarquia de traduções: análise ontológica 156 complicado e ainda não sabemos se todo par de teorias possui uma cota inferior. Contudo, se retiramos [Tinc] para M = PA e r = interpretações, então obtemos facilmente que a estrutura é tal que todo par de membros possui cota superior. Teorema 19 Sendo M = PA, r = interpretações e Utr = Ut − {[Tinc]}, a estrutura ⟨Utr,≤⟩ é tal que quaisquer dois membros possuem uma cota superior. Prova. Tomemos duas teorias quaisquer T1 e T2. Consideremos as teorias T I1 e T J2 tais que 1. a linguagem de T I1 é uma variante da linguagem de T1 (PI para cada predicado P ) adicionada de um predicado unário UI . 2. a linguagem de T2 é uma variante da linguagem de T2 adicionada de um predicado unário UJ . 3. α ∈ T I1 se, se somente se, a) α é a restrição de todos os quantificadores de uma fórmula α′ ao predicado UI . b) e α′ é a variante (troca dos predicados P por P I) de uma fórmula em T1. 4. α ∈ T J2 se, se somente se, a) α é a restrição de todos os quantificadores de uma fórmula α′ ao predicado UJ . b) e α′ é a variante (troca dos predicados P por P J) de uma fórmula em T2. Se consideramos que [T1], [T2] ∈ Utr, então [T1] = [Tinc] e [T2] = [Tinc]. Nesse caso, se supomos o absurdo PA ⊢ T I1 ≫ Tinc, obtemos a contradição PA ⊢ T1 ≫ Tinc, porquanto T1 naturalmente interpreta T I1 tomando UI por x = x. Assim, obtemos que [T I1 ] = [Tinc] e, analogamente, que [T J2 ] = [Tinc]. Por similar argumento, concluímos que [T I1 ∪ T J2 ] = [Tinc]. Por sua vez, a teoria T I1 ∪ T J2 interpreta T1 pela interpretação UI e interpreta T2 pela interpretação UJ . Logo [T I1 ∪ T J2 ] é uma cota superior comum de [T1] e [T2].  Em geral, os métodos de tradução satisfazem alguma propriedade similar à [T I1 ∪ T J2 ] M(r) ≫ T1, T2. Isso, por sua vez, seria suficiente para provar que a estrutura Utr possue cotas superiores para todos os pares de membros. Por isso, podemos dizer com bastante generalidade que o universo de ontologias pode ser representado pelo diagrama a seguir (círculos representam os indistinguíveis e as setas representam a relação M(r) ◁ ): Capítulo 8. Hierarquia de traduções: análise ontológica 157 [TM⊢Cons(T )]] [TM⊢¬Cons(T )] [T1.1] [T1.2] ... [T2.1] [T2.2] [T2.3] [T2.4] ... [T3.1] [T3.2] [T3.3] ... Com efeito, cada método de tradução com sua metateoria apropriada nos oferecerá uma estrutura diferente. Suspeitamos que se trate de um reticulado ou um semi-reticulado (quaisquer dois elementos possuem um supremo). No entanto, ainda podemos estabelecer alguma regularidade se lidamos com famílias de métodos especialmente escolhidos. É precisamente isso que faremos a seguir com as hierarquias de traduções. 8.2 Hierarquia de traduções O conceito de hierarquia de traduções que desejamos definir tem por objetivo dissolver possíveis dilemas entre diferentes métodos de tradução. Notadamente, a relação T1 M(r) ◁ T2 está muito próxima de ser uma relação definitiva, i.e. ela depõe a favor de que a ontologia de T1 seja mais expressiva que a de T2 e é provável não existir um outro método de tradução que deponha contrariamente. Baseados na discussão sobre a não neutralidade do capítulo 6, definimos: Definição 57 A teoria M é relevante para a comparação de T1 e T2 se, e somente se, os predicados de consistência de T1 e de T2 são indecidíveis em M . Nesse sentido, propomos a seguinte tese: Tese 4 Se M é relevante para a comparação de T1 e T2, M ⊢ T1 M(r) ◁ T2 e, para qualquer M ′ relevante para as teorias, M 0 T2 M ′(r′) ◁ T1, então T1 é ontologicamente mais expressiva que T2. Essa tese não é, contudo, facilmente alcançável para maior parte dos pares de teorias. Esse não é o caso quando lidamos com extensões de uma dada teoria T : Capítulo 8. Hierarquia de traduções: análise ontológica 158 Teorema 20 Se T é subteoria de uma teoria consistente T ′ e existe uma teoria consistente M relevante para T e T ′ tal que M ⊢ T ′ M(r) ◁ T , então T ′ é ontologicamente mais expressiva que T . Prova. Suponhamos que existe um M ′ relevante para T e T ′ e um método apropriado r′ tal que M ′ ⊢ T M ′(r′) ◁ T ′. Como T é subteoria de T , obtemos M ′ ⊢ T ′ M ′(r′) ≫ T . Portanto vale M ′ ⊢ ¬Cons(T ′), contradizendo a suposição de que M ′ é relevante para a comparação de T e T ′.  Por outro lado, podem haver casos em que métodos diferentes disputam qual entre duas teorias é mais forte: Definição 58 Dizemos que existe um dilema entre os métodos M1(r1) e M2(r2) se, e somente se, existem duas teorias Tx e Ty tais que ambos os métodos são relevantes para as teorias e vale M1 ⊢ Tx M1(r1) ◁ Ty e M2 ⊢ Ty M2(r2) ◁ Tx. Encontrar casos de métodos dilemáticos não é uma tarefa simples. Conjecturo que existem tais casos, todavia. Por essa razão, propomos uma análise do universo ontológico baseada em uma hierarquia de traduções. A ideia é, em poucas palavras, que a ausência de dilemas entre duas metodologias é geralmente atribuída ao fato de que uma metodologia é o caso particular de uma outra. Por isso definimos: Definição 59 M1(r1) ⊇ M2(r2) se, e somente se, 1. para todas as teorias T1 e T2, se M2 ⊢ T1 M2(r2) ≫ T2, então M1 ⊢ T1 M1(r1) ≫ T2. 2. e se M2 ⊢ Cons(T ), então M1 ⊢ Cons(T ). Fato 6 Se M1(r1) ⊆ M2(r2), então não existe dilema entre os métodos. Fato 7 ⊆ é uma ordem parcial sob a classe de métodos de tradução. Definição 60 Uma hierarquia de métodos é uma sequência de métodos linearmente ordenada pela relação ⊆. Na seção anterior, mostramos a estrutura do universo de ontologias oferecido por método de tradução. Essa representação muda de acordo com o fortalecimento/enfraquecimento Capítulo 8. Hierarquia de traduções: análise ontológica 159 da metateoria M ou da imposição/relaxamento de restrições em r: enfraquecendo, podemos positivamente tornar teorias indistinguíveis em teorias comparáveis ou negativamente tornar teorias indistinguíveis em teorias incomparáveis; fortalecendo, podemos positivamente tornar teorias incomparáveis em teorias comparáveis/indistinguíveis ou negativamente tornar teorias comparáveis em teorias indistinguíveis. A seguir ilustramos esse fato (círculos representam classes de teorias indistinguíveis, setas a relação ◁, setas pontilhadas representa a relação que foi perdida no fortalecimento e as letras A, B, C e D representam classes de teorias): Figura 3 – Comparação fortalecimento/enfraquecimento Analisemos o caso representado na figura. Com o fortalecimento do método de tradução M1 (esquerda) para M2 (direita), passamos a distinguir A de B e C de D – entretanto, a comparação de B e C foi perdida. 1. M1 depõe a favor de A e B serem mais fracas que C e D. 2. M2 depõe a favor de A ser mais fraca que B e de C ser mais fraca que D. 3. M2 depõe a favor de A ser mais fraca que C e de B ser mais fraca que D. Essas informações são todas compatíveis e possuem alguma redundância. Então, se reunimos todas essas informações, obtemos a ordem linear representada pelas setas em vermelho: Capítulo 8. Hierarquia de traduções: análise ontológica 160 Figura 4 – Uso simultâneo de duas metodologias De modo geral, queremos mostrar que uma hierarquia de traduções nos proporciona um universo de comparações ontológicas mais detalhado e mais próximo de uma ordem linear de grupos de teorias. Definamos, portanto, a relação de ordem em uma hierarquia de traduções em vez de tomarmos, como antes, um único método: Definição 61 Dada uma hierarquia de métodos H, dizemos que T1 ∼H T2 se, e somente se, 1. para algum M(r) ∈ H, [T1]M(r) = [T2]M(r); 2. e para todo M ′(r′) ∈ H, a) M ′ ⊢ [T1]M ′(r′) = [T2]M ′(r′) ou b) M ′ ⊢ ¬(T1 M ′(r) ≫ T2) → ¬Cons(T2) e M ′ ⊢ ¬(T2 M ′(r) ≫ T1) → ¬Cons(T1).1 Proposição 21 ∼H é uma relação de equivalência. Prova. As propriedades reflexiva e simétrica são triviais. Provamos que ∼H é transitiva: Notadamente, existe M(r) ∈ H tal que [T1]M(r) = [T3]M(r) porquanto H é uma hierarquia de métodos. 1 A decisão por escrever ¬(T2 M ′(r) ≫ T1) → ¬Cons(T1) em vez do equivalente Cons(T1) → (T2 M ′(r) ≫ T1), pode parecer arbitrária. Contudo, decidimos pela primeira escrita porque entendemos ser mais natural no contexto: duas teorias são "equivalentes" no contexto de uma hierarquia de traduções se (1) algum método depõe a favor de serem iguais e (2) se algum método depõe contrariamente é porque a metateoria vê a teoria a ser traduzida como inconsistente. Capítulo 8. Hierarquia de traduções: análise ontológica 161 Suponhamos que T1 ∼H T2 e T2 ∼H T3 e tomemos um método M(r) ∈ H. Nesse caso, sabemos que vale (2-a) para ou (2-b) da definição para cada um dos pares T1-T2 e T2-T1. (Caso 1) (2-a) é o caso para T1-T2 e T2-T3: Nesse caso, sabemos que M ⊢ [T1]M(r) = [T2]M(r) e M ⊢ [T2]M(r) = [T3]M(r). Logo M ⊢ [T1]M(r) = [T3]M(r). (Caso 2) (2-a) é o caso para T1-T2 e (2-b) para T2-T3. Suponhamos que ¬(T3 M(r) ≫ T1). Então, como M ⊢ T2 M(r) ≫ T1, concluímos que ¬(T3 M(r) ≫ T2). Uma vez que M ⊢ ¬(T3 M(r) ≫ T2) → ¬Cons(T3), obtemos ¬Cons(T3). Assim, M ⊢ ¬(T3 M(r) ≫ T1) → ¬Cons(T3). Analogamente, obtemos que M ⊢ ¬(T1 M(r) ≫ T3) → ¬Cons(T2). E do fato que M ⊢ [T1]M(r) = [T2]M(r), obtemos que M ⊢ Cons(T1) ↔ Cons(T2). Portanto, M ⊢ ¬(T1 M(r) ≫ T3) → ¬Cons(T1). (Caso 3) (2-a) é o caso para T2-T3 e (2-b) para T1-T2. Análogo ao caso 2. (Caso 4) (2-b) é o caso para T1-T2 e T2-T3. Supondo Cons(T3), obtemos que T3 M(r) ≫ T2. Isso, por sua vez, implica que Cons(T3) → Cons(T2). Obtemos, portanto, Cons(T2). Novamente pela suposição inicial, obtemos que T2 M(r) ≫ T1. Logo, pela transitividade de ≫, temos que T3 M(r) ≫ T1. Assim, M ⊢ Cons(T3) → T3 M(r) ≫ T1, o que é equivalente a M ⊢ ¬(T3 M(r) ≫ T1) → ¬Cons(T3). O fato de que M ⊢ ¬(T1 M(r) ≫ T3) → ¬Cons(T1) é obtido analogamente.  As classes de equivalência [T ]H geradas por ∼H são tais que qualquer duas teorias em [T ]H são indistinguíveis em algum método de H e todos os demais métodos em H dizem que elas são indistinguíveis ou distinguíveis apenas se o método vê uma das teorias como inconsistente. Seguimos com a definição de ordem: Definição 62 [T1]H ≤ [T2]H se, e somente se, [T1]H = [T2]H ou existe um M(r) ∈ H tal que T1 M(r) ◁ T2. Proposição 22 ≤ é uma ordem parcial sobre as classes de equivalência [T ]H . Prova. Por definição a relação é reflexiva. Capítulo 8. Hierarquia de traduções: análise ontológica 162 Provamos que a relação é transitiva: Suponhamos que [T1]H ≥ [T2]H e [T2]H ≥ [T3]H e nenhuma das classes é a mesma. Então existe M e M ′ tal que T1 M(r) ◁ T2 e T2 M ′(r′) ◁ T3. (Supomos M(r) ⊇ M ′(r′)) Nesse caso, M ′ ⊢ T1 M ′(r′) ≫ T2. Pela transitividade M ′ ⊢ T1 M ′(r′) ≫ T3. Se supomos que T3 M ′(r′) ≫ T1, obtemos T3 M ′(r′) ≫ T2 e, portanto, ¬Cons(T3). Logo M ′ ⊢ T3 M ′(r′) ≫ T1 → ¬Cons(T3). Assim, temos que M ′ ⊢ T1 M ′(r′) ◁ T3 – i.e. [T1]H ≥ [T3]H . (Supomos M ′(r′) ⊇ M(r)) Nesse caso, obtemos que M ⊢ T2 M(r) ≫ T3. Por transitividade, M ⊢ T1 M(r) ≫ T3. Suponhamos que T3 M(r) ≫ T1. Segue que T2 M(r) ≫ T1 e, portanto, ¬Cons(T2). Novamente pela suposição, obtemos que T3 M(r) ≫ T2 – assim, obtemos que Cons(T2) ↔ Cons(T3). Dessa forma, temos ¬Cons(T3). Isso significa que temos M ⊢ T1 M(r) ◁ T3 – i.e. [T1]H ≥ [T3]H . Provamos que a relação é antissimétrica: Suponhamos que [T1]H ≥ [T2]H , [T2]H ≥ [T1]H e [T2]H = [T1]H . Então existe M e M ′ tal que T1 M(r) ◁ T2 e T2 M ′(r′) ◁ T1. Pela simetria da suposição, podemos tomar, sem perder generalidade, que M ′(r′) ≥ M(r). Supomos um W (s) ∈ H. (Supomos M(r) ⊇ W (s)) Nesse caso, obtemos que W ⊢ T1 W (s) ≫ T2 ∧ T2 W (s) ≫ T1. Por isso, [T1]W (s) = [T2]W (s). (Supomos M(r) ⊆ W (s)) Da suposição inicial, obtemos M ⊢ T2 M(r) ≫ T1. E, disso, que M ⊢ ¬Cons(T2) e M ⊢ ¬Cons(T1). Pela hierarquia, obtemos que M ′ ⊢ ¬Cons(T2) e M ′ ⊢ ¬Cons(T1), portanto, vale o caso 2-b da definição de ∼H . Segue que [T1]H = [T2]H .  A estrutura ⟨{[TH ] | T},≤⟩ é similar às desenvolvida na seção anterior e [∅]H e [Tinc]H são máximo e mínimo respectivamente na estrutura. Obtemos, assim, um novo reticulado mais detalhado e mais linearizado que os reticulados obtidos pelos métodos isoladamente. Capítulo 8. Hierarquia de traduções: análise ontológica 163 8.3 Casos de comparação Como vimos na seção anterior, existe um ganho informacional ao tomarmos uma hierarquia de traduções. Entretanto, fizemos isso abstratamente. Nesta seção, mostraremos brevemente uma instância das hierarquia de traduções, atentando às análises que isso nos pode oferecer. Vimos no capítulo 5 que as reduções modelo-teoréticas contam como uma tradução entre teorias como NBG e ZF. Mais do que isso, a metodologia conta como uma generalização do método das interpretações. Com efeito, as interpretações dependem de uma metateoria como PA e a redução modelo teorética depende de uma metateoria capaz de construir o modelo canônico de Henkin como, por exemplo, a aritmética de segunda ordem PA2. Por essa razão, Notação 5 Escrevemos 1. PA(int) para o método interpretação (int) realizado na metateoria PA. 2. PA2(mod) para o método modelo teorético (mod) realizado na metateoria PA2. Essas metodologias naturalmente satisfazem os requisitos de uma redução ontológica básica. Mais ainda, elas satisfazem os requisitos suficientes para dizermos que PA(in) ⊆ PA2(mod). Esses métodos podem, portanto, ser usados em conjunto para estabelecer comparações ontológicas. Contudo, ainda resta mostrar que existem casos em que ter PA2(mod) agrega valor à análise. Para esse efeito, seria necessário obter casos em que duas teorias não podem ser interpretadas e, ainda assim, a comparação modelo teorética é efetiva. Teorema 21 Existem duas teorias T1 e T2 tais que nenhuma é interpretável na outra, mas ambas são tradutíveis modelo teoreticamente. Prova. [não detalhada] Seja S uma teoria capaz de internalizar o predicado de provabilidade. Podemos definir um predicado que representa a construção Cons(pS∪Cons(pxq)q), através de uma combinação dos predicados usuais de consistência e de substituição em fórmulas. Como vale o lema da diagonal em S, obtemos uma fórmula A tal que S ⊢ A ↔ Cons(pS ∪ Cons(pAq)q). Então, tomamos T1 = S ∪ A e T2 = S ∪ Cons(pAq). Notadamente, cada uma dessas teorias é capaz de provar o predicado de consistência da outra: T1 ⊢ Cons(pT2q) e Capítulo 8. Hierarquia de traduções: análise ontológica 164 T2 ⊢ Cons(pT1q). Pelo segundo teorema da incompletude de Gödel, não pode haver uma interpretação de qualquer uma das duas na outra. Porém, ambas as teorias são capazes de construir o modelo canônico de Henkin a partir da suposição de consistência outra.  Seguimos com a definição de uma expansão para a nossa hierarquia de tradução. Definimos, o seguinte método de redução: Definição 63 (Interpretação forte) J é uma interpretação forte de T1 em T2 se 1. J é uma interpretação de T1 em T2; 2. e existe uma subteoria T * de T2 tal que existe uma bi-interpretação B = ⟨J, J ′⟩ entre T * e T1. Sendo PA(intF ) o método da interpretação forte na metateoria PA, tomamos a seguinte hierarquia de traduções: H = {PA(intF ), PA(int), PA2(mod)}. Tomemos também [Tcon]M(r) como o conjunto de todas as teorias T para as quais M ⊢ Cons(T ) e [Tincon]M(r) como o conjunto de todas as teorias T para as quais M ⊢ ¬Cons(T ). Baseados nos resultados dos capítulos anteriores, representaremos graficamente parte do universo ontológico para cada método, incluindo as teorias ZFfin, ZFcfin, PA, ZF e NBG: Figura 5 – Universo com PA2(mod). Capítulo 8. Hierarquia de traduções: análise ontológica 165 Figura 6 – Universo com PA(int). Figura 7 – Universo com PA(intF). Por fim, reunimos todos esses métodos na análise oferecida pela hierarquia de traduções: Figura 8 – Universo com toda a hierarquia 8.4 Comentário sobre hierarquias alternativas Uma vez que pensamos com cuidado sobre os possíveis métodos de tradução, percebemos que compor métodos de tradução significativos pode ser um árduo trabalho de definição. Mais ainda quando tentamos compor uma hierarquia alternativa e relevante à proposta na Capítulo 8. Hierarquia de traduções: análise ontológica 166 seção anterior. Exporemos algumas alternativas que nos parecem mais naturais. Não faremos, porém, uma análise comparativa entre os métodos, expondo motivos para uns serem melhores/piores que outros ou melhor/piores que a hierarquia base. Notemos que as bi-interpretações exigem uma simetria desnecessária. Por isso, definimos Definição 64 (Interpretação fiel) J é uma interpretação fiel de T1 em T2 se 1. J é uma interpretação de T1 em T2. 2. e existe uma função f definível em T2 tal que para toda fórmula α(x) T1 ⊢ α(x) se, e somente se, T2 ⊢ αJ(f(x)). Definição 65 (Interpretação quasi-forte) J é uma interpretação quasi-forte de T1 em T2 se 1. J é uma interpretação de T1 em T2; 2. e existe uma subteoria T * de T2 tal que J é uma interpretação fiel de T1 em T *. Não consideramos a interpretação fiel natural para a hierarquia, porquanto ela exige que as teorias sejam muito próximas em força para que seja possível realizar traduções. Com efeito, ela não satisfaz a condição de fortalecimento da Definição 52. Por essa razão, precisamos realizar a adaptação apresentada na interpretação forte ou quasi forte – exigimos a fidelidade da tradução para alguma subteoria da teoria tradutora. A interpretação quasi forte é uma condição intermediária entre as interpretações e a interpretação forte. Entretanto, ainda existem diversos enfraquecimentos naturais entre esses dois métodos. Podemos, por exemplo, enfraquecer a interpretação fiel Definição 66 (Interpretação quasi-fiel) J é uma interpretação quasi-fiel de T1 em T2 se 1. J é uma interpretação de T1 em T2. 2. e para toda sentença α T1 ⊢ α se, e somente se, T2 ⊢ αJ Capítulo 8. Hierarquia de traduções: análise ontológica 167 e então usar para definir (quasi-fiel)-forte e (quasi-fiel)-quasi-forte. Algo similar pode ser feito se substituímos o uso de bi-interpretações pelas bi-interpretações modelo a modelo: Definição 67 (Interpretação fiel extensão a extensão) A coleção de interpretações Int é uma interpretação fiel extensão a extensão de duas teorias T1 e T2 quando, para qualquer extensão maximal consistente T ′1 de T1, existe uma interpretação fiel J ∈ Int de T ′1 em uma extensão maximal consistente T ′2 de T2 e, para qualquer extensão maximal consistente T ′′2 de T2, existe uma interpretação fiel I ∈ Int de T ′′1 em uma extensão maximal consistente T ′2 de T2. E, a partir disso, definimos as respectivas versões forte e quasi-forte. Mostramos as diversas possibilidade de exigências posteriores às interpretações, fortalecimentos em diversas gradações e formas. Definimos métodos que são interpretações que exigem tais e tais propriedades de uniformidade. Contudo, ainda podemos trabalhar sobre a própria interpretação. Ao invés de gerar exclusivamente exigências sobre a uniformidade dos mapeamentos, criamos demandas sobre o modo com os teoremas são demonstrados nas suas versões interpretadas: Definição 68 (Interpretação sublógica) Sejam L′ uma restrição de uma lógica L e I uma interpretação da linguagem de T1 na linguagem de T2. Se, para todo axioma A de T1, vale que T2 ⊢L′ AI , então I é uma L′-interpretação de T1 em T2. A partir dessa definição, podemos investigar algumas características não clássicas de reduções ontológicas sem abrir mão da posição clássica a respeito de certas teorias de primeira ordem. Notamos que, enquanto podemos tomar T1 e T2 como teorias clássicas, ainda podemos restringir a interpretação entre as teorias a sistemas não clássicos. Se, por exemplo, tomamos L′ como a lógica intuicionista, então, ao termos uma L′-interpretação de T1 em T2, podemos garantir que cada teorema interpretado de T1 usa argumentos não construtivos nos mesmos momentos em que a prova original e, portanto, a tradução preserva uma noção de construtividade dos resultados da teoria original. Por esclarecimento, consideremos que a sequência s = ⟨α1, α2, . . . , αn⟩ é uma sequência de prova em T1. Nesse caso, a prova interpretada será formada pela substituição de cada axioma A que ocorre na prova pela sequência de prova ProofAI de AI em T2. Sem perder generalidade, podemos dizer que os primeiros k elementos de s são axiomas Ai de T1. Então, a prova interpretada terá a seguinte forma: ⟨ProofAI1 , P roofAI2 , . . . , P roofAIk , α I k+1 . . . α I n⟩. Capítulo 8. Hierarquia de traduções: análise ontológica 168 E essa prova usa precisamente o mesmo número de argumentos não construtivos que a prova original, uma vez que ProofAIi não introduz argumentos não construtivos por suposto. Notadamente, isso garante que todas as provas construtivas da teoria original terão provas correlatas na teoria interpretada que também são construtivas. Por fim, a partir de cada nova versão de interpretação sublógica, podemos repetir versões similares aos fortalecimentos da interpretação mostrados acima. 169 Considerações finais Nessa tese, analisamos o conceito de tradução de teorias de primeira ordem por diversos ângulos. Enfatizamos como as traduções são estreitamente relacionadas às provas de consistência relativa e, nesse caso, qualquer método tradutivo deve ao menos implicar a consistência relativa das teorias analisadas. Usamos como exemplo central as diversas formas pelas quais podemos reduzir as teorias ZFC e NBG umas nas outras. O interesse por esse caso é especialmente relevante porquanto, embora sejam vistas pela comunidade matemática como "equivalentes", essa equivalência é relativa à grande flexibilidade do ambiente onde as reduções entre elas ocorrem. Como vimos, Quine argumenta que o comprometimento ontológico de uma teoria de primeira ordem é relativo a escolhas ideológicas. Ele demonstra que a ontologia de uma teoria é relativa tanto a decisão sobre a ontologia da metateoria quanto à seleção de uma interpretação particular para os seus termos. Entendemos que uma redução ontológica foi performada quando alguém usa de ferramentas de uma teoria para descrever ou traduzir os comprometimentos ontológicos de uma outra teoria. Nessa tese, foram exploradas as consequências do fato de que interpretações – em sentido lógico – são somente um tipo de redução. Argumentamos que as reduções ontológicas são vítimas de um tipo similar de relatividade observado por Quine. Especificamente, exploramos e defendemos a afirmação de que reduções ontológicas são (i) relativas às suposições metateóricas nas quais as reduções são realizadas, e (ii) relativas a quão permissivo ou exigente somos em relação ao modo como as fórmulas de uma teoria são mapeadas na teoria alvo. Por essa razão, elucidamos o caráter não neutro das reduções ontológicas com relação às teorias reduzidas. A própria flexibilidade do método de tradução, que permite que uma teoria fale no lugar de outra, pode ser o motivo pelo qual algumas nuances da teoria interpretada sejam perdidas na tradução. Requerimentos excessivos sobre os mapeamentos entre duas linguagens resulta em nenhuma das teorias ser capaz de traduzir a outra; por outro lado, ser demasiado flexível pode permitir a tradução mútua de teorias muito diferentes em nível de comprometimento ontológico. Exigir uma bi-interpretação para comparar as teorias de conjunto ZF + CH e ZF + ¬ CH pode ser considerado excessivo, uma vez que nenhuma subteoria de qualquer delas está em bi-interpretação com a outra. Ainda assim, requerer apenas que uma tradução preserve teoremas (um dos requisitos das interpretações) nos permite não mais do que distinguir teorias consistentes de inconsistentes. Portanto, argumentamos que encontrar uma comparação ontológica sensível é, não raro, similar a tarefa de afinar um insConsiderações finais 170 trumento: procurar por métodos de tradução que estabeleçam a redução mútua ou nenhuma redução e, principalmente, métodos que estabeleçam relações assimétricas de redução. Entretanto, ainda há muito trabalho a ser feito, especialmente em relação aos capítulos 5, 6, 7 e 8: 1. No capítulo 5, exploramos tipos de tradução que incorporam as técnicas modeloteoréticas. Fazendo isso, entendemos legitimar como métodos de tradução tipos específicos de provas que partem da suposição de um modelo para uma teoria e geram modelos para uma outra. Além disso, mostramos brevemente como o esquema geral de tradução pode ser usado para incorporar ainda outros métodos como o da combinação de interpretações. Dois pontos ainda não foram explorados: (1) os limites para quais métodos podemos definir satisfazendo o esquema geral e (2) o poder expressivo da combinação de interpretações. No segundo caso, esperamos que seja possível realizar traduções novas para teorias como PA, ZF – permitindo condições de verdade que não são possíveis para as interpretações tradicionais. 2. No capítulo 6, mostramos porque e como a ontologia da metateoria infecta as comparações ontológicas, fazendo, por exemplo, com que ontologias menos expressivas possam capturar ontologias mais expressivas na tradução. Resta ainda um estudo detalhado sobre como formalizar com precisão o grau de infecção da metateoria. Elaboramos as diversas vias pelas quais a infecção ocorre, mas não equacionamos o grau de infecção de modo que possamos, por exemplo, realizar comparações. 3. No capítulo 7, provamos uma família de resultados sobre bi-interpretações e conceitos similares para teorias de conjunto (e um resultado sobre PA). Respondemos parcialmente a conjectura de Enayat, mostrando que uma família de extensão da teoria de conjuntos de Zermelo não é tight. Contudo, ainda estamos distante da prova completa da conjectura. Além disso, não sabemos se a teoria NBG é ou não tight. A resposta para essa questão deve ser bastante esclarecedora: suspeitamos que a propriedade de tightness é fundamentalmente vinculada à propriedade de reflexão das teorias. Como NBG não reflete todos seus fragmentos finitos, esperamos que NBG não seja tight. A confirmação dessa hipótese será mais um indicativo de que a reflexão é necessária (ou importante) para que uma teoria seja tight. 4. No capítulo 8, reunimos os diversos resultados apresentados nessa tese em uma análise ontológica ampla. Consideramos os universos ontológicos gerados por método abstratos de tradução e também a construção do universo ontológico no contexto de uma hierarquia de métodos compatíveis. Em seguida, consideramos os ganhos informacionais Considerações finais 171 proporcionados por uma hierarquia de tradução para o caso concreto das teorias trabalhadas ao longo do texto. Com efeito, ainda podemos expandir a análise considerando diversas extensões/reduções de ZF e NBG, extensões/reduções de PA, bem como outras teorias. Mais ainda, expomos algumas das possibilidades de gerar hierarquias de tradução alternativas. Trabalhos futuros podem explorar cada uma dessas possibilidade e/ou comparar cada par de hierarquias. 172 Referências BENACERRAF, P.; PUTNAM, H. Philosophy of mathematics: Selected readings. [S.l.]: Cambridge University Press, 1983. Citado na página 33. BOGHOSSIAN, P. A. Analyticity reconsidered. Noûs, JSTOR, v. 30, n. 3, p. 360–391, 1996. Citado na página 78. DETLEFSEN, M. Hilbert's program: an essay on mathematical instrumentalism. [S.l.]: Springer Science & Business Media, 1986. v. 182. Citado 3 vezes nas páginas 16, 18 e 19. ENAYAT, A. Variations on a visserian theme. arXiv preprint arXiv:1702.07093, 2017. Citado na página 129. FIELD, H. Tarski's theory of truth. The Journal of Philosophy, JSTOR, v. 69, n. 13, p. 347–375, 1972. Citado na página 21. FREIRE, R. A. Interpretation and truth in set theory. In: Contradictions, from Consistency to Inconsistency. [S.l.]: Springer, 2018. p. 183–205. Citado na página 79. FREIRE, R. A.; TAUSK, D. V. Inner models of set theory can't satisfy V = L. 2009. Preprint. Citado na página 72. GÖDEL, K. The consistency of the axiom of choice and of the generalized continuumhypothesis. Proceedings of the National Academy of Sciences of the United States of America, National Academy of Sciences, v. 24, n. 12, p. 556, 1938. Citado na página 36. GÖDEL, K. Consistency proof for the generalized continuum hypothesis. Proc. Nat. Acad. Sci. USA, World Scientific, v. 25, p. 220–224, 1939. Citado 2 vezes nas páginas 33 e 36. GRICE, H. P.; STRAWSON, P. F. In defense of a dogma. Philosophical Review, Duke University Press, v. 65, n. 2, 1956. Citado na página 84. HAMKINS, J. D.; FREIRE, A. R. The axiom of well-ordered replacement is equivalent to full replacement over Zermelo + foundation. 2018. Disponível em: <http://jdh.hamkins. org/replacement-for-well-ordered-sets-is-equivalent-to-full-replacement/>. Citado na página 136. HAMKINS, J. D.; YANG, R. Satisfaction is not absolute. to appear in the Review of Symbolic Logic, p. 1–34, 2014. Disponível em: <http://jdh.hamkins.org/satisfaction-is-not-absolute>. Citado na página 79. HEIJENOORT, J. V. From Frege to Gödel: a source book in mathematical logic, 1879-1931. [S.l.]: Harvard University Press, 1967. v. 9. Citado na página 21. HILBERT, D. Foundations of geometry. Open Court, La Salle. USA, 1929. Citado na página 14. Referências 173 HILBERT, D. On the infinite. [S.l.]: Cambridge University Press, 1983. Citado na página 15. HILBERT, D.; BERNAYS, P. Grundlagen der mathematik.[von] D. Hilbert Und P. Bernays. 1968. Citado na página 61. KAYE, R.; WONG, T. L. On interpretations of arithmetic and set theory. Notre Dame Journal of Formal Logic, University of Notre Dame, v. 48, n. 4, p. 497–510, 2007. Citado 2 vezes nas páginas 79 e 91. KIRKHAM, R. L. Theories of truth: A critical introduction. MIT Press, 1992. Citado 2 vezes nas páginas 21 e 33. KREISEL, G. Hilbert's programme. Dialectica, JSTOR, p. 346–372, 1958. Citado na página 20. KUNEN, K. Set theory an introduction to independence proofs. [S.l.]: Elsevier, 2014. Citado 2 vezes nas páginas 36 e 73. MARKER, D. Model theory: an introduction. [S.l.]: Springer Science & Business Media, 2002. Citado na página 24. MATHIAS, A. R. Slim models of Zermelo set theory. The Journal of Symbolic Logic, Cambridge University Press, v. 66, n. 2, p. 487–496, 2001. Citado na página 136. MURAWSKI, R.; MICKIEWICZ, A. John von Neumann and Hilbert's school of foundations of mathematics. Studies in Logic, Grammar and Rhetoric, 2004. Citado 2 vezes nas páginas 27 e 50. NOVAK, I. L. Models of consistent systems. Fundamenta Mathematica, p. 87–110, 1950. Citado 5 vezes nas páginas , 38, 42, 92 e 105. PUTNAM, H. The analytic and the synthetic. In: Putnam 1975. [S.l.: s.n.], 1962. p. 215–227. Nenhuma citação no texto. QUINE, W. V. Ontological reduction and the world of numbers. The Journal of Philosophy, JSTOR, v. 61, n. 7, p. 209–216, 1964. Citado 3 vezes nas páginas 76, 77 e 81. QUINE, W. V. Two dogmas of empiricism. Perspectives in the Philosophy of Language, Broadview Press, p. 189–210, 2000. Citado na página 76. QUINE, W. V.; CHURCHLAND, P. S.; FØLLESDAL, D. Word and object. [S.l.]: MIT press, 2013. Citado na página 76. SHOENFIELD, J. R. A relative consistency proof. The Journal of Symbolic Logic, Cambridge Univ Press, v. 19, n. 01, p. 21–28, 1954. Citado 4 vezes nas páginas 41, 42, 56 e 61. SHOENFIELD, J. R. Mathematical logic. [S.l.]: Addison-Wesley Reading, 1967. v. 21. Citado 10 vezes nas páginas 31, 34, 42, 57, 60, 61, 64, 67, 68 e 69. Referências 174 SILVA, J. J. da. Filosofias da matemática. [S.l.]: Unesp, 2007. Citado 2 vezes nas páginas 13 e 14. TAIT, W. W. Finitism. The Journal of Philosophy, JSTOR, v. 78, n. 9, p. 524–546, 1981. Citado na página 20. TARSKI, A. The concept of truth in formalized languages. In: Logic, semantics, metamathematics. [S.l.]: Oxford, 1956. v. 2, p. 152–278. Citado 2 vezes nas páginas 21 e 24. TARSKI, A.; MOSTOWSKI, A.; ROBINSON, R. M. Undecidable theories. [S.l.]: Elsevier, 1953. v. 13. Citado 2 vezes nas páginas 24 e 33. VIERO, A. Sistemas Axiomáticos Formalizados. A questão da desinterpretação e da formalização da axiomática. [S.l.]: Coleção CLE, 2011. Citado na página 13. VISSER, A. Categories of theories and interpretations. Logic Group Preprint Series, v. 228, 2004. Citado na página 129.