UNIVERSIDADE ESTADUAL PAULISTA – UNESP FACULDADE DE FILOSOFIA E CIÊNCIAS PROGRAMA DE PÓS-GRADUAÇÃO EM FILOSOFIA CAMPUS DE MARÍLIA O ESTATUTO CIENTÍFICO DA CIÊNCIA COGNITIVA EM SUA FASE INICIAL: Uma análise baseada na perspectiva epistemológica de Thomas Kuhn ALAN RAFAEL VALENTE Marília/SP 2019 UNIVERSIDADE ESTADUAL PAULISTA – UNESP FACULDADE DE FILOSOFIA E CIÊNCIAS PROGRAMA DE PÓS-GRADUAÇÃO EM FILOSOFIA CAMPUS DE MARÍLIA O ESTATUTO CIENTÍFICO DA CIÊNCIA COGNITIVA EM SUA FASE INICIAL: Uma análise baseada na perspectiva epistemológica de Thomas Kuhn Alan Rafael Valente Dissertação apresentada ao Programa de Pós Graduação em Filosofia da Universidade Estadual Paulista "Júlio de Mesquita Filho" (UNESP), para a obtenção do título de Mest re em Filosofia. Área de Concentração: Filosofia da Mente, Epistemologia e Lógica. Orientação: Prof. Dr. Marcos Antonio Alves Marília/SP 2019 ALAN RAFAEL VALENTE O ESTATUTO CIENTÍFICO DA CIÊNCIA COGNITIVA EM SUA FASE INICIAL: Uma análise baseada na perspectiva epistemológica de Thomas Kuhn Dissertação apresentada ao Programa de Pós-Graduação em Filosofia da Universidade Estadual Paulista, Campus de Marília, como requisito para a obtenção do título de Mestre em Filosofia, sob a orientação do Prof. Dr. Marcos Antonio Alves. Área: Filosofia da Mente, Epistemologia e Lógica. Linha de pesquisa: Filosofia da Mente, Ciência Cognitiva e Semiótica Data de Exame de Defesa: 28/02/2019 Membros da Banca Examinadora Titular 1 (Orientador) Prof. Dr. Marcos Antonio Alves (UNESP) Titular 2 Prof. Dr. Osvaldo Frota Pessoa Jr. (USP) Titular 3 Prof. Dr. Max Rogério Vicentini (UEM) Suplente interno 1: Prof. Dr. Kleber Cecon (UNESP,) Suplente externo 2: Prof. Dr. Ramon Souza Capelle de Andrade (UNILAB) Às pessoas que sempre acreditaram em mim. Agradecimentos Agradeço, inicialmente, ao meu orientador, professor Marcos Antonio Alves, pelas orientações e exemplos diários sobre respeito, dignidade e trabalho árduo. Agradeço-lhe pelas suas lições, ainda que duras, mas que estão além dos ensinamentos atinentes apenas à atividade acadêmica. É um imenso prazer ter sido orientado por tal pessoa exemplar. Aos membros da banca examinadora, Prof. Dr. Max Rogério Vicentini e Prof. Dr. Osvaldo Frota Pessoa Jr, pelos comentários e sugestões. Aos bons amigos que fiz no decorrer desta jornada em Marília, com os quais compartilhei problemas, experiências, dúvidas, tristezas, alegrias etc. João Caggiano, Janderson Pereira, Marcos Alexandre, Thyago Furco, Ricardo Peraça e os companheiros de Magic e RPG, agradeço-lhes por terem transformado os dias escuros em noites mais claras. Agradeço à CAPES, pelo auxílio financeiro prestado durante a pesquisa de Mestrado, sem o qual não seria possível ter chegado aos resultados apresentados nesta Dissertação. Finalmente, agradeço aos meus pais, João e Leotilde, os quais, apesar das dificuldades, sempre me apoiaram. Os efeitos mais prováveis da História da Ciência sobre os campos que ela registra são indiretos, por meio da promoção de um maior entendimento da própria atividade científica. Ainda que dificilmente possa resolver enigmas particulares da pesquisa, uma apreensão mais clara da natureza do desenvolvimento científico pode estimular a reconsideração de questões como educação, administração e política científica. Thomas Kuhn Qualquer ideia, embora antiga e absurda, é capaz de aperfeiçoar nosso conhecimento. A ciência absorve toda a história do pensamento e a utiliza para o aprimoramento de cada teoria. [...] Paul Feyerabend RESUMO Nesta Dissertação desenvolvemos uma análise do estatuto científico da ciência cognitiva, em sua fase inicial, mais especificamente no período entre as décadas de 1940 e 1970. Como ponto de partida, utilizamos a abordagem epistemológica de Thomas Kuhn sobre as revoluções científicas. Para alcançar esse objetivo, dividimos a dissertação em três capítulos. No primeiro, expomos alguns dos principais conceitos relacionados à abordagem de Kuhn referentes à estrutura das revoluções científicas. Um dos conceitos-base dessa perspectiva é a noção de paradigma. Um paradigma estabelece e norteia a atividade de uma comunidade científica. Ele é constituído, dentre outras coisas, por teorias empiricamente testáveis, métodos de pesquisa, experimentos, formas de procedimentos, conjuntos de leis e princípios. Indica, ainda, os problemas a serem desenvolvidos pela comunidade científica, determinando uma agenda científica. Via de regra, a fase inicial de uma nova área de pesquisa é marcada por um momento de luta paradigmática, caracterizando-se pela existência de diversos paradigmas rivais. Desde o momento em que um deles passa a ser dominante, a área de pesquisa alcança o estatuto de ciência normal. Uma vez apresentada, de maneira geral, a abordagem de Kuhn, no segundo capítulo passamos a tratar da ciência cognitiva em sua fase inicial. Ainda com raízes na cibernética, esse movimento intelectual, em seus primeiros momentos, almejava instaurar uma ciência dos processos cognitivos. Essa perspectiva adota por princípio metodológico a concepção de que certas máquinas servem de modelo do processamento cognitivo e são fundamentais para o seu entendimento. Buscamos avaliar se, em sua fase inicial, a ciência cognitiva já começa como ciência normal ou se ela começa como pré-ciência. Para isso, analisamos a história da ciência cognitiva, procurando compreender os seus problemas, princípios metodológicos, principais características. Por fim, no terceiro capítulo, retomamos a problemática levantada no decorrer da Dissertação e apresentamos as noções de modelo e representação no começo da ciência cognitiva, expondo dois modelos adotados naquele momento: as Máquinas de Turing e as Redes Neurais Artificiais. Com isso, averiguamos em que medida poderíamos identificar a existência de paradigmas nesta área de pesquisa e se algum deles seria dominante. Por fim, tratamos de duas de suas grandes vertentes, o cognitivismo e o conexionismo, avaliando se elas configurariam paradigmas rivais. Indicamos razões para fundamentar e consolidar a hipótese de que a ciência cognitiva não começa como ciência normal, o que procuramos explicitar em nossas considerações finais. Palavras-chave: Paradigma. Ciência Cognitiva. Cognitivismo. Conexionismo. Ciência Normal. ABSTRACT In this dissertation, we seek to develop an analysis of the scientific status of cognitive science in its initial phase, more specifically the period between the 1940s and 1970s. As a starting point for this analysis, we use Thomas Kuhn's epistemological approach to revolutions scientific research. To achieve this goal, we divided the dissertation into three chapters. In the first, we present some of the main concepts related to Kuhn's approach to the structure of scientific revolutions. One of the basic concepts of this perspective is the notion of paradigm. A paradigm establishes and guides the activity of a scientific community. It is constituted, among other things, by empirically testable theories, methods of research, experiments, forms of procedures, sets of laws and principles. It also indicates the problems to be developed by the scientific community, determining a scientific agenda. As a rule, the initial phase of a new area of research is marked by a moment of paradigmatic struggle, characterized by the existence of several rival paradigms. From the moment one of them becomes dominant, the area of research reaches the status of normal science. Having presented, in general, Kuhn's approach, in the second chapter we turn to cognitive science in its initial phase. Still rooted in cybernetics, this intellectual movement, in its first moments, aimed to establish a science of cognitive processes. This perspective adopts by methodological principle the conception that certain machines serve as a model of cognitive processing and are fundamental for their understanding. We seek to assess whether, in its initial phase, cognitive science already begins as normal science or whether it begins as a pre-science. For this, we analyze the history of cognitive science, trying to understand its problems and the methodological principles. Finally, in the third chapter, we return to the problematic raised during the course of the Dissertation and present the notions of model and representation at beginning of cognitive science. We discuss the two models adopted at that time, namely Turing Machines and the Artificial Neural Network, and discuss the notion of representation underlying them. With this, we investigate to what extent we could affirm the existence of paradigms in this new emerging area. Finally, we dealt with two of its great strands, cognitivism and connectionism, evaluating whether they could be considered rival paradigms in this area. Reasons are given to substantiate and consolidate the hypothesis that cognitive science does not begin as normal science, which we seek to make explicit in our final considerations. Keywords: Paradigm. Cognitive Science. Cognitivism. Connectionism. Normal Science. SUMÁRIO INTRODUÇÃO ______________________________________________________ 9 CAPÍTULO 1 A ESTRUTURA DAS REVOLUÇÕES CIENTÍFICAS SEGUNDO KUHN 1.1 Apresentação __________________________________________________ 15 1.2 Os Paradigmas ________________________________________________ 15 1.3 Pré-ciência ____________________________________________________ 21 1.4 Ciência Normal ________________________________________________ 26 1.5 Crise _________________________________________________________ 28 1.6 Revolução Científica ____________________________________________ 32 CAPÍTULO 2 O ESTATUTO CIENTÍFICO DA CIÊNCIA COGNITIVA EM SUA FASE INICIAL: CONTEXTO HISTÓRICO 2.1 Apresentação __________________________________________________ 35 2.2 O Conceito e as principais características da Ciência Cognitiva ________ 35 2.3 Contexto Histórico para o surgimento da Ciência Cognitiva ___________ 38 2.4 As Conferências Macy __________________________________________ 41 2.5 As conferências Macy, o contexto da cibernética e o surgimento da ciência cognitiva ______________________________________________________ 56 CAPÍTULO 3 O ESTATUTO CIENTÍFICO DA CIÊNCIA COGNITIVA EM SUA FASE INICIAL: CONTEXTO EPISTÊMICO 3.1 Apresentação __________________________________________________ 64 3.2 A Ciência Cognitiva após a Cibernética ____________________________ 64 3.3 Modelos e Representações na Ciência Cognitiva _____________________ 69 3.4 Cognitivismo __________________________________________________ 72 3.5 Conexionismo _________________________________________________ 79 CONSIDERAÇÕES FINAIS __________________________________________ 88 REFERÊNCIAS ____________________________________________________ 92 9 INTRODUÇÃO O período entre meados do século XIX e começo do XX foi marcado pela proposta de diferentes abordagens explicativas de fenômenos do mundo consideradas revolucionárias. Dentre elas, citamos o evolucionismo de Darwin, a psicanálise de Freud, a teoria da relatividade de Einstein, o Socialismo de Marx. Nos anos de 1940 começou a despontar uma abordagem com o objetivo de tratar, primordialmente, de aspectos cognitivos, que acabou sendo nomeada de ciência cognitiva. Com característica interdisciplinar, seus integrantes eram oriundos de áreas como a matemática, física, biologia, psicologia, antropologia. A Ciência Cognitiva, neste instante, pode ser caracterizada como um esforço contemporâneo, com fundamentação empírica, para investigar questões relacionadas à cognição, tais como raciocínio, memória, percepção, problemas de longa data na agenda do pensamento humano. Diante de tantas novas teorias e áreas de pesquisa, uma das questões centrais tratadas por epistemólogos, especialmente no começo do século XX, dizia respeito a saber quais delas realmente produziam conhecimento, eram capazes de oferecer explicações e previsões aos fenômenos no mundo. A busca por um critério de demarcação científica, distinguindo a ciência da não-ciência tornou-se um dos objetivos centrais na filosofia da ciência. A fim de tratar desse problema da demarcação e de outros, como os do progresso e método científicos, por exemplo, foram propostas perspectivas epistemológicas como o empirismo lógico, o falsificacionismo e o estruturalismo, em suas diferentes versões. No começo do século XX, pesquisadores de diferentes áreas se reuniam em Viena, local de efervescência cultural, científica e filosófica, com o objetivo de discutir questões como as expostas acima, fundando uma perspectiva denominada Empirismo Lógico ou Positivismo Lógico. Dentre esses pensadores figuravam o físico Moritz Schlick, os matemáticos Hans Hahn e Rudolf Carnap e o sociólogo e economista Otto Neurath. De modo geral, para os integrantes do Círculo de Viena, a ciência começa com a observação. A observação é neutra, imparcial, ou seja, genuína, e fornece uma base segura para a ciência. Uma observação é explicitada ou expressa através de um enunciado elementar ou protocolar, também chamado de proposição de observação. Ele descreve experiências empíricas elementares, ou seja, uma observação de um indivíduo, num espaço e tempo específicos. Um número adequado de observações sobre um fenômeno sob uma ampla variedade de condições, todas satisfazendo o referido fenômeno, justificaria a sua generalização para casos gerais, 10 aplicando-o a todos os casos do mesmo tipo. Assim, por exemplo, após observar muitos cisnes, sob uma ampla variedade de condições, tais como em lugares e momentos diferentes, e averiguar que cada um deles possui a cor branca, admite-se generalizar legitimamente que "Todo cisne é branco". Por esse processo indutivo, ocorre a descoberta de leis científicas. Nessa perspectiva, a ciência se desenvolve a partir do acúmulo de dados: quanto maior o número de observações, mais força possui uma lei científica. Muitas críticas foram dirigidas essa perspectiva. Uma delas refere-se à possibilidade de a observação ser genuína. A observação, conforme aponta Hanson (1975), geralmente é guiada por interpretações, valores, expectativas, preconceitos e crenças do observador. A indução, inferência basilar do indutivismo lógico, também sofreu diversas críticas, dada a impossibilidade lógica e empírica da sua validade. Observar, por exemplo, um grande número de cisnes, por maior que seja a amostragem, não garante que todos os cisnes sejam brancos. É possível o surgimento de um cisne não-branco que refute o enunciado geral, ou seja, falsifique a conclusão da inferência, ainda que as premissas se mantenham verdadeiras. Um dos críticos do Círculo de Viena, é o filósofo austríaco Karl Popper. Ele desenvolveu uma perspectiva cujo fundamento e critério científico é a falseabilidade e não a verificabilidade dos enunciados. Na visão popperiana, a ciência começa com problemas, não com a observação. Deparado com o problema, o cientista deve propor hipóteses para a sua resolução. Uma vez propostas, elas devem ser testadas. Caso passem nesses testes empíricos, são corroboradas e provisoriamente mantidas. Caso sejam falseadas, são abandonadas e substituídas. Popper sugere como critério de demarcação científica a ideia de que um enunciado ou sistema de enunciados é científico se, e somente se, for falsificável empiricamente. Quanto mais falseável for um enunciado, mais arriscado e informativo ele será. Assim, por exemplo, o enunciado "chove agora em Marília" é muito mais arriscado que "chove agora", uma vez que a possibilidade daquele enunciado é muito menor, em comparação ao segundo. A proposta de Popper se contrapõe, em grande medida, à perspectiva epistemológica dos pensadores do círculo de Viena. Na postura empirista, o progresso científico ocorre a partir do acumulo de dados. Para Popper, o progresso ocorre no processo de tentativas e erros, de conjecturas e refutações. Abandonar hipóteses incapazes de serem corroboradas significa, em alguma medida, afastar-se do falso, embora não existam garantias lógicas de que a próxima hipótese seja verdadeira e que esteja mais próxima da verdade do que da falsidade. Na proposta do Positivismo Lógico, a atividade científica consiste na prática constante da justificação de enunciados gerais a partir da observação repetida de uma dada classe de 11 fenômenos que se tornam base para a confirmação de leis. Para Popper, ela consiste na atividade de sugestão e teste de hipóteses para a resolução de problemas. Ambas as vertentes se preocupam, de alguma forma, em avaliar e normatizar os parâmetros de demarcação entre a ciência e a não-ciência e da atividade científica. Ademais, a análise do funcionamento científico centra-se principalmente na avaliação de enunciados ou sistemas de enunciados. Alguns pensadores como Lakatos e Kuhn entendem que uma explicação adequada do funcionamento da ciência precisa adotar uma perspectiva historicista e estrutural, contrariando as abordagens acima citadas. O método estruturalista consiste na análise da realidade a partir da construção de modelos capazes de explicar as suas inúmeras relações a partir das estruturas sob as quais baseamos nosso comportamento, costumes, língua e outros fatores. Para Lakatos, a atividade científica se desenvolve a partir de programas de pesquisa. Eles são diretrizes metodológicas que norteiam as decisões referentes à construção e modificação de teorias, que não são considerados elementos isolados, mas pertencentes a um dado programa. Os programas de pesquisa possuem um núcleo rígido composto por um conjunto de hipóteses e princípios convencionalmente aceitos sistematicamente. Eles são considerados "irrefutáveis" e necessários à atividade científica no programa. Assim, por exemplo, parte do núcleo rígido do programa de pesquisa de Copérnico, destaca Lakatos (1989, p. 234), é a "[...] proposição de que as estrelas constituem o sistema de referência fundamental para a física. " Os cientistas que adotam um programa de pesquisa não descartam o elemento que compõem o núcleo rígido do programa, mesmo quando fatos problemáticos são constatados contra eles, como, por exemplo, refutações de teorias, através de fenômenos que os contrariem ou de previsões que não se cumprem. Lakatos afirma que a heurística negativa do programa nos diz que certos caminhos devem ser evitados por um programa de pesquisa, proibindo que, frente a qualquer caso problemático, seja declarado falso o núcleo rígido. Desse modo, tal núcleo é preservado das refutações, em razão da existência de algumas hipóteses auxiliares, chamadas de cinturão protetor. No programa de Newton, havia alguns modelos do sistema solar, por exemplo, a teoria sobre a refração da luz na atmosfera, a forma e distribuição da massa dos planetas. Existem momentos em que os cientistas se deparam com anomalias e refutações que levam a modificações no cinturão protetor; a denominada heurística positiva orienta, parcialmente, as modificações que devem ser feitas no cinturão protetor do programa. Lakatos, discordando dos Positivistas Lógicos e de Popper, também defende que não são teorias que estão na berlinda. A história mostra que os adeptos de uma corrente não costumam abandonar seu programa, ou seu núcleo duro diante do primeiro contraexemplo. De 12 início, diante de um obstáculo, as desconfianças costumam ser, por exemplo, em relação a experimentos, à precisão dos instrumentos utilizados, aos cuidados dos experimentadores. Na maioria das vezes, a história mostra que tal procedimento foi adequado. Kuhn, também como Lakatos, adota uma postura estruturalista. A noção de paradigma aparece como um elemento central da abordagem do progresso científico deste pensador. Um paradigma estabelece e norteia a atividade de uma comunidade científica. A fase inicial de boa parte das áreas de pesquisa é marcada por um momento de luta paradigmática, que se caracteriza pela existência de diversos paradigmas rivais, chamada pré-ciência. Quando um deles passa a ser dominante, a área de pesquisa entra num período denominado de ciência normal. O paradigma pode apresentar, ao longo do tempo, anomalias sérias, que podem originar uma crise científica. Ocasionalmente ocorre a emergência de novos candidatos a paradigma dominante capazes de, em tese, responder a questões e problemas que o seu paradigma rival era incapaz. Nesse momento, a área passa por um período de ciência extraordinária, de luta paradigmática. O abandono do antigo paradigma e a transição para um novo paradigma dominante marcam um momento de revolução científica na área. A abordagem de Kuhn apresenta algumas vantagens, em relação às outras propostas elencadas acima, em especial, pelo seu aspecto historicista e estruturalista. Na visão de Kuhn, a atividade científica envolve muito mais do que teorias e conjuntos de enunciados passíveis de refutação. O funcionamento e o desenvolvimento das ciências envolvem elementos psicológicos, pressupostos metafísicos e metodológicos. Na visão de Kuhn, ambas propostas, Positivismo Lógico e Popper, possuem uma concepção de progresso científico equivocado, dado o seu normativismo e falta de um estruturalismo. Entendemos que estes dois aspectos são elementos favoráveis a Kuhn. No tocante a Lakatos, pensamos que ele é menos adequado do que Kuhn para os nossos propósitos, por entender que o processo de passagem de um programa de pesquisa para outro ou o momento de adesão de um cientista a um programa de pesquisa é um processo racional. Ademais, Lakatos parece não ser um historicista stricto senso, uma vez que prescreve uma forma ideal de se fazer ciência. Dado estes elementos, nesta Dissertação, buscamos investigar o estatuto científico da ciência cognitiva em sua fase inicial, tomando como base a proposta de Kuhn. Buscamos analisar, em particular se a ciência cognitiva já começa como uma ciência normal ou se começa como pré-ciência. A proposta de Kuhn prontifica-se, fundamentalmente, em tratar das grandes revoluções científicas. Neste trabalho, abordamos o estatuto científico de uma área de pesquisa em particular. Entendemos que tal adaptação é possível e justificada. Por um lado, 13 porque nos apropriamos do arcabouço conceitual kuhniano para tratar do estatuto científico desta área. Por outro lado, o próprio Kuhn (2011a) menciona que as características das revoluções científicas podem ser igualmente examinadas através do estudo de outros episódios que não foram tão obviamente revolucionários. As equações de Maxwell, por exemplo, afetaram um grupo bem menor do que a teoria de Einstein, todavia, as equações de Maxwell não foram consideradas menos revolucionárias. Kuhn (2011a, p. 74) sugere que "[...] a existência de revoluções grandes e pequenas, algumas afetando apenas os estudiosos de uma subdivisão de um campo de estudos. Para tais grupos, até mesmo a descoberta de um fenômeno novo e inesperado pode ser revolucionária." Para alcançar nossos objetivos, dividimos este trabalho em três capítulos. No primeiro capítulo, expomos a proposta de Thomas Kuhn referente à estrutura das revoluções científicas. Mais especificamente, tratamos do conceito de paradigma, que envolve, dentre outras coisas, uma série de comprometimentos, regras, padrões, pressupostos, princípios metodológicos e teorias, na comunidade científica. Na sequência, destacamos a importância dos valores cognitivos e extra-cognitivos na escolha e aceitação de um paradigma. Ainda, abordamos a noção de progresso científico, seja através do desenvolvimento interno do paradigma, seja, através das revoluções científicas. Por fim, verificamos as diferentes fases pelas quais uma área de pesquisa pode passar ao longo de sua história, sendo elas: pré-ciência, ciência normal, crise, ciência extraordinária e revolução científica. No segundo capítulo, expomos uma definição de ciência cognitiva direcionada ao momento de seu surgimento. Comentamos as cinco principais características da ciência cognitiva apresentadas por Gardner (1996): uso de representações mentais, a crença de que os computadores eletrônicos podem ser bons modelos explicativos de processos cognitivos, a decisão deliberada em não enfatizar certos fatores demasiadamente complicados, a interdisciplinaridade e a consolidação de uma comunidade científica. Focalizamos, ainda, os elementos históricos fundadores da ciência cognitiva, como, por exemplo, os primeiros textos que fazem referência à área, e a formação dos primeiros pesquisadores e contextualizamos as suas primeiras questões levantadas nas Conferências Macy que serviram como base para a constituição desta área de pesquisa. No terceiro capítulo, tratamos da passagem do movimento intelectual da cibernética para a ciência cognitiva. Começamos pela exposição histórica dos primeiros anos da ciência cognitiva, tomando como referência o Relatório do Estado de Arte solicitado pela Fundação Sloan. Em seguida, expomos uma definição geral sobre as noções de modelo e representação, 14 com fim de refletir sobre o estatuto científico em sua fase inicial, assumindo como aparato conceitual a proposta de Kuhn. Por fim, aludimos às primeiras perspectivas que se sobressaíram como candidatas a paradigma da ciência cognitiva: o cognitivismo e o conexionismo. Concluímos nossa Dissertação expondo que, ao menos no período em que baseamos nossa análise, não havia na ciência cognitiva uma comunidade coesa. Tendemos a acreditar que o cognitivismo e o conexionismo fazem parte de um mesmo grande paradigma que encontrava dificuldades em se estabelecer em sua fase inicial. Por estes motivos, apontamos que esta área se encontrava naquele período, segundo a perspectiva de Kuhn, em momento de pré-ciência. Elencamos as semelhanças e diferenças entre os modelos do cognitivismo e o conexionismo. Ainda, buscamos evidenciar alguns dos possíveis empecilhos que levaram a difícil consolidação de sua comunidade científica. 15 CAPÍTULO 1 A ESTRUTURA DAS REVOLUÇÕES CIENTÍFICAS SEGUNDO KUHN 1.1 Apresentação Neste capítulo, expomos a proposta epistemológica de Thomas Kuhn. Na seção 1.2, tratamos da concepção de paradigma, um dos principais conceitos sugeridos na Estrutura das Revoluções Científicas. Na seção 1.3, apresentamos a noção de pré-ciência, via de regra, o momento inicial e fundamental para o surgimento e desenvolvimento de uma área de pesquisa. Nesse estágio há uma competição entre diversos paradigmas rivais, os quais são pretendentes a explicar uma gama de fenômenos naturais. Na seção 1.4, explicitamos a concepção de ciência normal, momento este em que a prática científica se normaliza em torno de um paradigma. Ele serve de guia para comunidade científica que busca solucionar os quebra-cabeças elencados na agenda científica. Na seção 1.5, destacamos certos problemas gerados ocasionalmente pelo surgimento de fenômenos que fogem da explicação paradigmática vigente, denominadas anomalias. As chamadas "crises" são períodos marcados pela desconfiança no paradigma vigente e fortalecidos com surgimento de paradigmas rivais, os quais podem ter maior capacidade explicativa do que o anterior. Na seção 1.6, apresentamos os impactos causados pelo surgimento e aceitação de novos paradigmas. 1.2 Os Paradigmas A aquisição de um paradigma dominante é um dos sinais, dentro de uma área de pesquisa, de sua maturidade. Os paradigmas correspondem a modelos ou padrões bem aceitos pela comunidade de cientistas. Um paradigma envolve, dentre outras coisas, uma visão de mundo, princípios metodológicos, regras, teorias, comunidade científica e uma agenda de problemas a serem tratados pela comunidade. De acordo com Kuhn (2011a, p. 220), [...] o termo "paradigma" é usado em dois sentidos diferentes. De um lado, indica toda a constelação de crenças, valores, técnicas etc., partilhadas pelos membros de uma comunidade determinada. De outro, denota um tipo de elemento dessa constelação: as soluções concretas de quebra-cabeças que, empregadas como modelos ou exemplos, podem substituir regras explícitas como base para a solução dos restantes quebra-cabeças da ciência normal. Um paradigma se fortalece quando possui a capacidade de atrair um grupo duradouro de partidários, afastando-os de outros paradigmas pretendentes, e a capacidade de ser fecundo. Ele deve possibilitar, em potência, que todo e qualquer problema científico possa ser resolvido pelos participantes do grupo adepto aos seus pressupostos. Assim, por exemplo, na 16 física, podemos citar dois principais paradigmas sucedidos ao longo da história da modernidade: a física aristotélica e a newtoniana. Contemporaneamente, temos nessa área de pesquisa a teoria da relatividade, ainda dominante, e a física quântica, que se apresenta como um paradigma alternativo. Os praticantes de uma mesma área de pesquisa, sob o viés de um mesmo paradigma, estão comprometidos com as mesmas regras, padrões e pressupostos, para a prática científica. Uma comunidade científica é formada por praticantes de uma área específica da atividade científica. Esses membros são submetidos a uma educação com uma grande extensão de literatura técnica retirada de manuais, os quais marcam um limite entre o objeto de estudo da área, os pressupostos, métodos e metodologias científicas. Cada comunidade possui o próprio objeto de estudo; há casos em que algumas comunidades coexistem e abordam o mesmo objeto científico, a partir de pontos de vista incompatíveis. Os membros da comunidade acreditam que são os responsáveis pela busca e estudo de um conjunto de objetivos em comum, que incluem o treino de seus sucessores. As comunidades, em seu interior, apresentam uma ampla comunicação coesa entre seus praticantes e um julgamento profissional acerca dos avanços internos, os quais tendem a ser relativamente unânimes. Kuhn (2011a, p. 223) sugere níveis de comunidades: Nesse sentido as comunidades podem certamente existir em muitos níveis. A comunidade mais global é composta por todos os cientistas ligados às ciências naturais. Em um nível imediatamente inferior, os principais grupos científicos profissionais são comunidade: físicos, químicos, astrônomos, zoólogos e outros similares. Para esses agrupamentos maiores, o pertencente a uma comunidade é rapidamente estabelecido, exceto nos casos limites. Possuir a mais alta titulação, participar de sociedades profissionais, ler periódicos especializados, são geralmente condições mais do que suficientes. Seguindo o exemplo de Kuhn (2011a), ainda existem subgrupos, como os biólogos adeptos da cronobiologia, que estudam a relação entre os seres vivos e o tempo, os físicos que estudam os astros e os grandes corpos, os engenheiros que apoiam o conexionismo e assim por diante. Esses tipos de comunidades são as produtoras e legitimadoras do conhecimento científico. Em seu posfácio, Kuhn (2011a) menciona que o conceito de paradigma foi examinado por uma de suas leitoras simpatizantes, que preparou um índice analítico, no qual o termo havia sido utilizado, na primeira versão de A Estrutura das Revoluções Científicas, em pelo menos vinte e duas maneiras diferentes. Após uma revisão, o autor optou por dois usos distintos do termo, que poderiam englobar as demais maneiras: o emprego mais global do conceito relacionado à noção de "matriz disciplinar" e a abordagem do conceito de 17 paradigma, em função de exemplos compartilhados. Kuhn (2011a, p.228) alinhava o seguinte conceito: [...] o termo "teoria", tal como é empregado presentemente na filosofia da ciência, conota uma estrutura bem mais limitada em natureza e alcance do que a exigida aqui. Até que o termo possa ser liberado de suas implicações atuais, evitaremos confusão adotando um outro. Para os nossos propósitos atuais, sugiro "matriz disciplinar": "disciplinar" porque se refere a uma posse comum aos praticantes de uma disciplina particular; "matriz" porque é composta de elementos ordenados de várias espécies, cada um deles exigindo uma determinação mais pormenorizada. Dentro da matriz disciplinar estão as "generalizações simbólicas", que são aquelas expressões clássicas, usadas sem nenhum problema de compreensão pelos membros do grupo, como exemplo, as formas lógicas e matemáticas. Tais componentes são formais, e boa parte das áreas da atividade científica evidenciam símbolos ou palavras, como " os elementos combinam-se em uma proporção constante às suas massas". Na visão de Kuhn (2011a), essas expressões geralmente são aceitas pela grande maioria da comunidade. Sem elas, o grupo não teria ponto de apoio para a aplicação de técnicas de manipulação lógica e matemática e, em geral, o poder de uma ciência parece aumentar com o número de generalizações lógicas ao seu dispor. As generalizações simbólicas funcionam em parte como leis e em parte como definições dos símbolos que elas empregam. Por exemplo, na expressão correspondente à noção de trabalho na física, onde t é utilizado para expressar trabalho, F representa a força obtida a partir da multiplicação entre a massa e a aceleração e ∆s expressa o deslocamento, podemos obter a seguinte expressão: t = F. ∆s. As generalizações aparecem no contexto das definições que são tautológicas e no ambiente das leis que podem, com o tempo, ser desenvolvidas e gradualmente corrigidas. O abandono de generalizações cujas forças eram parcialmente tautológicas são fatores que favorecem o surgimento das crises e revoluções científicas. Outro componente da matriz disciplinar, são os assim denominados "paradigmas metafísicos" ou "partes metafísicas dos paradigmas". Na física e em outras áreas como a química, eles correspondem aos compromissos coletivos, por exemplo como as crenças de que o calor corresponde à energia cinética das partes constituintes dos corpos e que todos os fenômenos perceptivos são decorrentes da interação dos átomos. Essas crenças representam modelos que incluem uma variedade de elementos ontológicos, no que tange à realidade. Tais modelos ajudam a estabelecer os problemas e as soluções que guiam a comunidade. Kuhn (2011a, p. 64) enfatiza: 18 Por exemplo, depois de 1630 e especialmente após o aparecimento dos trabalhos imensamente influentes de Descartes, a maioria dos físicos começou a partir do pressuposto de que o Universo era composto por corpúsculos microscópicos e que todos os fenômenos naturais poderiam ser explicados em termos da forma, do tamanho do movimento e da interação corpusculares. Esse conjunto de compromissos revelou possuir tanto dimensões metafísicas como metodológicas. No plano metafísico, indicava aos cientistas que espécie de entidades o Universo continha ou não continha – não havia nada além da matéria dotada de forma e em movimento. No plano metodológico, indicava como deveriam ser as leis definitivas e as explicações fundamentais: leis devem especificar o movimento e as interação corpusculares; a explicação deve reduzir qualquer fenômeno natural a uma ação corpuscular regida por essas leis. Outro grupo de elementos da matriz disciplinar é constituído pelos valores. Eles são mais amplos que os elementos anteriores, por serem compartilhados por diferentes comunidades e áreas de pesquisa. Segundo Kuhn (2011a, p. 231), Provavelmente os valores aos quais os cientistas aderem com mais intensidade são aqueles que dizem respeito a predições: devem ser acuradas; predições quantitativas são preferíveis às qualitativas; qualquer que seja a margem de erro permissível, deve ser respeitada regularmente numa área dada; e assim por diante. Os valores cognitivos são indicativos de qualidade das teorias que os satisfazem. Segundo Laudan (1984, p. xii, tradução nossa 1): "[...] representam uma propriedade de teorias que supomos serem constitutivas de uma 'boa ciência'". São exemplos de valores cognitivos adequação empírica, consistência, poder explicativo, simplicidade, fecundidade. Os valores são importantes para averiguar a possibilidade de uma crise ou quando é necessária uma reformulação na prática da disciplina. Também existem valores usados para analisar as teorias em sua completude. Estas, de acordo com Kuhn (2011a), implicam a fertilidade, ao propor soluções e problemas a serem estudados; quando possível, devem ser simples, englobando também a presença de coerência interna e externa com as demais estruturas que compõem o momento da ciência global. Nota-se que os valores, do ponto de vista da matriz disciplinar, podem ser compartilhados pela comunidade de pesquisadores, todavia, com uma aplicação relativa. Algumas vezes, a aplicação dos valores pode ser afetada pelos traços de cada indivíduo. Assim, aquilo que, para Einstein, era considerado demasiado complexo ou incongruente, no que tange à teoria dos quanta, na qual se declara que a emissão e a absorção de energia eletromagnética dos corpos ocorre através de "pacotes", ao contrário 1 No original: "[...] represents a property of theories which deem to be constitutive of 'good science'". 19 do que é sustentado pela teoria ondulatória clássica, poderia ser para Bohr apenas uma dificuldade da época, a ser superada (KUHN, 2011a). Outro elemento fundamental dos paradigmas são os exemplares. Com essa expressão, são indicadas as soluções concretas dos inúmeros problemas que os estudantes encontram, desde o início de sua formação profissional, seja nos laboratórios, seja nos manuais científicos, seja ainda nos periódicos de seus pares. Essas soluções indicam, através de exemplos, as maneiras como devem proceder com seus trabalhos. Conforme Kuhn (2011a, p. 234), Por exemplo, todos os físicos começam aprendendo os mesmos exemplares: problemas como o do plano inclinado, do pêndulo cônico, das órbitas de Kepler; e o uso de instrumentos como o vernier, o calorímetro e a ponte de Wheatstone. Em geral, afirma-se que o estudante de qualquer área da ciência só é capaz de resolver problemas após ter aprendido sobre as teorias e algumas regras que indicam a sua aplicabilidade. Os paradigmas funcionam como um mapa conceitual que permite maior profundidade e alcance explicativo da natureza. Nesse sentido, eles funcionam como um microscópio, possibilitando uma análise de um universo inacessível à visão comum. Sem a presença dos paradigmas, muitos fenômenos jamais poderiam ser explicados. Isso ocorre porque, muitas vezes, eles só são possíveis de serem formulados a partir do escopo de um paradigma. Como exemplo, mencionamos a relação entre as situações-problema comuns no tratamento contemporâneo de doenças e as concepções aceitas pela comunidade científica de organismos microscópicos, as concepções éticas e profissionais sobre as células e os organismos vivos. Kuhn (2011a, 46) remete à presença de três diferentes enfoques que a atividade científica pode ter sobre os fatos: Em primeiro lugar, temos aquela classe de fatos que o paradigma mostrou ser particularmente reveladora da natureza das coisas. Ao empregá-los na resolução de problemas, o paradigma tornou-os merecedores de uma determinação mais parecida, numa variedade maior de situações. Parte dos exemplos atrelados a essa primeira análise dos fatos implica o aperfeiçoamento e a construção de aparelhos especiais para experimentação e comprovação das teorias. Esse primeiro foco não faz menção apenas à novidade da descoberta, mas também à precisão e segurança explicativa que o paradigma acaba por receber. Kuhn (2011a, p.46) alude igualmente a um segundo tipo comum de fatos a serem analisados, com base na ótica dos paradigmas: 20 Uma segunda classe usual, porém mais restrita, de fatos a serem determinados diz respeito àqueles fenômenos que, embora frequentemente sem muito interesse intrínseco, podem ser diretamente comparados com as predições da teoria do paradigma. Essa segunda classe de fatos faz referência à relação intrínseca entre os problemas teóricos dos paradigmas e os fenômenos da natureza. A aproximação teórica com o natural requer um aperfeiçoamento técnico que coloca em desafio tanto a capacidade teórica do observador quanto o treinamento e a sua imaginação. Exemplos clássicos referem-se às primeiras observações dirigidas por Galileu com seu telescópio especial. Imagina-se que, na época, foi extremamente dificultoso convencer a comunidade de pensadores contemporâneos, na medida em que esse e outros aparelhos representam um esforço engenhoso de estreitar a relação entre teoria e natureza, mas que, sem o treinamento ou aprofundamento ideal, resultam em apenas informações desconexas ou ruídos. Esse segundo tipo de trabalho com os fatos existe de uma maneira tão fundamental como o primeiro, acarretando o desenvolvimento de toda uma tecnologia e aparelhagem capazes de resolver razoavelmente o problema de comunicação entre o mundo e a teoria. A última e terceira classe de fatos e observações sugeridas por Kuhn (2011a, p. 48): Consiste no trabalho empírico empreendido para articular a teoria do paradigma, resolvendo algumas de suas ambiguidades residuais e permitindo a solução de problemas para os quais ela anteriormente só tinha chamado a atenção. Os esforços para articular um paradigma implicam a busca de ferramentas e valores numéricos mais precisos e constantes, capazes de apresentar maior poder explicativo para maior gama de fenômenos com maior simplicidade teórica. Esse terceiro tipo de fenômenos é causado e é causador do estreitamento entre teorias e explicações dentro de um mesmo paradigma ou, pelo efeito contrário, da desvinculação de constantes, que, embora muito semelhantes por se tratarem de problemas próximos, causam apenas ambiguidade. Um dos exemplos de Kuhn (2011a) concerne ao paradigma da teoria calorífica, o qual sugere o processo de aquecimento e resfriamento por meio de misturas e mudanças de estados. Segundo Kuhn (2011a), a temperatura também poderia sofrer alterações, por meio de muitos outros métodos, como por combinações químicas, por fricção ou por compressão. Uma vez estabelecidos esses fenômenos sobre o aquecimento, foi necessário reformular as bases do paradigma e as suas experiências posteriores, com o intuito de elucidar os problemas até então não respondidos pelo paradigma. 21 Tais aspectos mostram o desenvolvimento técnico, imaginativo e interno do paradigma. Embora esses aspectos sejam importantes, destaca-se que boa parte deles reflete apenas a sofisticação do paradigma. Por fim, o cientista que aderiu a algum paradigma deve ter em mente a necessidade de buscar compreender os fenômenos do mundo e ampliar o alcance explicativo do paradigma. Quando o paradigma não se encontra capaz de responder a alguma questão, o cientista procura um refinamento das suas teorias, métodos, procedimentos metodológicos, instrumentos e técnicas de observação a fim de manter o paradigma sustentável. Os paradigmas possuem um momento de origem atrelado à fundação de uma comunidade, razoavelmente, coesa. A fase inicial de boa parte das áreas de pesquisa é marcada por um momento em que não há um paradigma dominante. Na próxima seção, apresentamos esse primeiro período, denominado "pré-ciência". 1.3 Pré-ciência O momento das estruturas das revoluções científicas intitulado por Kuhn (2011a) de "pré-ciência" se caracteriza pela falta de um paradigma dominante e pela existência de vários paradigmas rivais em competição. Segundo Borradori (2003), um período pré-paradigmático é conotado pela acumulação caótica de dados, além da pouca consolidação de uma comunidade de pesquisa, a qual pense ter adquirido respostas seguras acerca das entidades fundamentais que compõem o universo, das possibilidades de interação dessas entidades, além das questões que podem ser legitimamente feitas a respeito de tais entidades e que técnicas podem ser empregadas na busca da solução desses problemas. Nesse momento, não há a aceitação coletiva de qualquer conjunto de regras, métodos ou padrões científicos. Na medida em que não existe um paradigma dominante, todos os fatos parecem ser importantes para o desenvolvimento de uma área da ciência. Assim, nesse período, é fundamental que o cientista ou qualquer grupo de cientistas gaste algum tempo criando e justificando os seus conceitos, métodos, técnicas e pressupostos, visando se fazer entendido pelos demais indivíduos ou grupos que não fazem parte de seu ambiente restrito e ainda desestruturados. Carência de uma comunidade científica coesa é uma das características desse período. Uma vez que não existe um paradigma dominante, cada pesquisador ou grupo é forçado a construir ou explicar o seu próprio corpo de fundamentos, no que chamamos na seção anterior de matriz disciplinar, desde o princípio, especificando as suas bases, noções e definições adotadas em suas pesquisas. 22 Na ausência de um paradigma bem estabelecido ou um candidato a paradigma, todos os fatos que se apresentam ao desenvolvimento de alguma área da atividade científica parecem ser igualmente relevantes. Kuhn (2011a, p. 37) menciona que, somente em poucos casos, fatos com tão pouca orientação por parte de teorias preestabelecidas falam com tamanha clareza e simplicidade, para permitir o surgimento de paradigmas fundadores de uma área: As escolas características dos primeiros estágios do desenvolvimento de uma ciência criam essa situação. Nenhuma história natural pode ser interpretada na ausência de pelo menos algum corpo implícito de crenças metodológicas e teóricas interligadas que permita seleção, avaliação e crítica. Se esse corpo de crenças já não está implícito na coleção de fatos – quando então temos à disposição mais do que "meros fatos" – precisa ser suprido externamente, talvez por uma metafísica em voga, por outra ciência ou por um acidente pessoal e histórico. Não é de admirar que nos primeiros estágios do desenvolvimento de qualquer ciência, homens diferentes confrontados com a mesma gama de fenômenos – mas em geral não com os mesmos fenômenos particulares – os descrevem e interpretem de maneiras diversas. Devido às suas crenças e metodologias características, é necessário que ocorra a ênfase de apenas alguns dos elementos ou conjuntos de informações, porque existem características demasiadamente numerosas oferecidas pelos fenômenos. A fim de ser escolhido, um paradigma deve parecer ser melhor que os seus rivais. É necessário que ela possa, ao menos em tese, possuir um maior poder explicativo que os demais. Kuhn (2011a) explicita dois tipos de valor que podem servir de base para a escolha entre paradigmas: cognitivos e extra-cognitivos. Ademais, os valores extra-cognitivos possuem um papel de importância durante os momentos de aceitação dos paradigmas e de escolha se suas regras metodológicas. Segundo Lacey (1998) os valores extra-cognitivos 2 dizem respeito às crenças, deliberações, fins, desejos e outros estados intencionais. Eles estão intrinsicamente relacionados com instituições, ecossistemas e situações sócio-históricas. No caso das teorias que tratamos aqui, como exemplo, Kuhn (2011b, p. 341) explicita cinco características indicadoras de qualidade extraídas de suas investigações ao longo da história do desenvolvimento da ciência: Primeiro, uma teoria deve se conformar com precisão à experiência: em seu domínio, as consequências dedutíveis da teoria devem estar em clara concordância com os resultados da experimentação e da observação existente. Segundo, uma teoria deve ser consistente, não apenas internamente ou auto consistente, mas também com outras teorias correntes aplicáveis a aspectos da natureza que são afins. Terceiro, ela deve ter uma 2 O pensador Hugh Lacey não utiliza o conceito "extra-cognitivo". Para designar estes tipos de valores em seu arcabouço conceitual ele faz uso dos termos "valores" ou "valores sociais". 23 extensa abrangência; em particular, as consequências da teoria devem ir muito além das observações, leis ou subteorias particulares cuja explicação motivou sua formulação. Quarto, e fortemente relacionado, ela deve ser simples, levando ordem a fenômenos que, em sua ausência, permaneceriam individualmente isolados e coletivamente confusos. Quinto um item um pouco incomum, mas de importância crucial para as decisões científicas efetivas -, uma teoria deve ser fértil em novos achados de pesquisa, deve abrir portas para novos fenômenos ou a relações antes ignoradas entre fenômenos já conhecidos. De modo mais específico, para o caso das teorias, os valores cognitivos apresentados por Kuhn (2011a) denotam: adequação empírica, consistência, poder explicativo, simplicidade, fecundidade. Adequação empírica supõe que a teoria se ajuste aos dados disponíveis, mostrando-se capaz de ter poder preditivos sobre os mesmos, sendo necessário que a teoria relate algo a respeito do fenômeno. As teorias devem ter como base o mundo físico. Uma teoria que não apresente nada a respeito da empiria ou do possível de se experimentar, necessariamente não cuida das faculdades da natureza e, por sua vez, trabalha apenas com o duvidoso ou com aquilo impossível de se comprovar. Visto que a ciência encontra suas justificativas apenas no âmbito do físico e biológico, é necessário que toda e qualquer teoria trate de problemas do mundo empírico. A tese da consistência pressupõe que uma teoria não pode firmar-se através de pressupostos que afirmem e neguem, ao mesmo tempo, características sobre os fenômenos. Uma boa teoria necessita da capacidade de inserir-se nos meandros da comunidade científica, tanto quanto na própria linguagem, facilitando que os demais membros da comunidade científica a compreendam; independentemente de suas propostas, as terminologias devem ser aceitas e compreendidas pela comunidade como um todo. As teorias que não são capazes de corresponder a esses critérios são inconsistentes ou contraditórias e, assim, não seriam informativas a respeito do mundo. O poder explicativo pressupõe que as teorias sejam destinadas a analisar os principais fenômenos do mundo. É necessário que as teorias possam definir na mais ampla extensão e profundidade as leis que regem os processos e as estruturas da natureza. A simplicidade, por sua vez, acrescenta que uma boa teoria deve ser simples e clara, precisando ser conceitualmente capaz de ser formalizada e inteligível, de tal modo que a ciência possui como objetivo transformar o confuso no simples. Nas concepções mais antiquadas, o mundo se encontra em completo devir. Porém, a ciência é capaz de desvelar leis que garantem e regem os aspectos mais gerais acerca do mundo. Caso uma teoria não seja 24 capaz de apresentar alguma previsibilidade a propósito do mundo, devido à aparição de inúmeras anomalias que contradigam a teoria, é necessário sua reformulação ou surgimento de uma nova teoria, capaz de explicar os eventos que as demais teorias passadas não eram capazes. Segundo Kuhn (2011a), a fecundidade é o mais importante dos valores cognitivos. É necessário que toda teoria seja fecunda para o conhecimento do mundo, sendo capaz de exibir novos fenômenos ou novas implicações que garantam a possibilidade de se observar um mesmo fenômeno de maneira diferente. Em suma, uma teoria que não apresente nenhuma contribuição para as questões acerca do mundo nada oferece ao desenvolvimento da comunidade científica. Por outro lado, pressupõe-se que toda boa teoria seja fecunda a novos problemas, fornecendo quebra-cabeças aos pesquisadores da área e motivando que estes consigam conhecer o mundo conforme as aspirações do paradigma. Kuhn (2011a) aborda a composição dos valores cognitivos para a formulação de boas teorias; se os valores cognitivos, conforme expressos, não se garantem, eles são, contudo, idealizações que aparentemente se apresentam na grande maioria das teorias científicas. As cinco características acima são indicativos de boas teorias. Por um lado, elas podem servir de base para a escolha entre teorias rivais dentro de um paradigma. Por outro lado, também podem servir de base para a escolha entre paradigmas, quando elas pertencem ou se adequam aos outros elementos paradigmáticos. Embora estes valores cognitivos tenham certo rigor, eles não podem servir como um critério objetivo e rigoroso para a escolha entre teorias ou paradigmas. Pois, há certa imprecisão e conflito entre essas características. Há situações, por exemplo, nas quais a simplicidade pode ditar a escolha de um paradigma, já a consistência, a de outro. Conforme Kuhn (2011b, p. 343): A Astronomia heliocêntrica, que exigia o movimento da Terra, era inconsistente com as explicações científicas disponíveis desses e de outros fenômenos terrestres. Assim, tomado de maneira isolada, o critério da consistência fala de maneira inequívoca a favor da tradição geocêntrica. A simplicidade, no entanto, favorecia Copérnico, mas somente quando avaliada de modo específico. [...] se examinássemos a quantidade de expediente matemático exigido para explicar não os movimentos quantitativos detalhados dos planetas, mas seus aspectos qualitativos gerais (elongação limitada, movimento retrógado e afins), veríamos, como bem sabe qualquer criança de escola, que Copérnico requer apenas uma circunferência por planeta e Ptolomeu, duas. Dois cientistas, conforme a perspectiva exposta, podem chegar a conclusões e escolhas diferentes referente ao melhor paradigma, pois esses critérios podem ser interpretados de 25 maneira diversa: talvez os cientistas concordem nos critérios, mas discordem em suas valorações. Frisa Kuhn (2011b, p. 344): [...] nenhuma lista de critérios já proposta é de fato útil. [...] devemos levar em conta características que variam de cientista a cientista, sem comprometer com isso sua adesão aos cânones que tornaram a ciência científica. Embora existam e possam ser descobertos (sem dúvida, os critérios de escolha com que comecei este artigo estão entre eles), esses cânones não são, por si só, suficientes para determinar as decisões de cada cientista. Para isso, os cânones compartilhados teriam de ser elaborados de modo que variem de um indivíduo a outro. Na perspectiva de Kuhn (2011b), os critérios de escolha levam em consideração os elementos resultantes das experiências anteriores de um cientista até o momento em que foi necessário efetuar uma escolha. Dentro das experiências está o campo em que o indivíduo atuou, quão bem-sucedido ele foi, quanto tempo ele trabalhou na área, a quantidade de conceitos e técnicas contestados pelo novo paradigma. Para Kuhn (2011a), existem também valores extra-cognitivos, que interferem no progresso e consolidação da ação científica. Alves (2013, p. 196) observa: Fatores psicológicos, como a crença, sentimento ou esperança no poder explicativo de uma teoria, a intuição de pesquisadores a respeito de uma matriz disciplinar, a possibilidade de adequação do paradigma com possíveis valores ou princípios morais, sociais, podem auxiliar na escolha de um determinado paradigma em detrimento de outro. No entanto, apesar da influência de valores extra-cognitivos como estes serem relevantes, a escolha de um paradigma está amparada em valores cognitivos, os desideratos das teorias científicas que o constituem. Esse contexto pressupõe que as relações extra-cognitivas possuam a capacidade de interferir na ação de escolha entre valores cognitivos. A comunidade científica, em geral, acredita nos pretensos valores cognitivos. A elaboração dos valores cognitivos ocorre por meio de algoritmos constituídos a partir da comunidade científica, que são em grau elevado garantidos pela existência de valores pessoais e sociais, os quais interferem para que a comunidade continue coesa. A forma como paradigma é escolhido, ao invés de outro, depende não só necessariamente dos valores cognitivos, mas também da ação valorativa pessoal e social. Visões de mundo, concepções religiosas, políticas, econômicas e sociais influenciam a composição e escolha de paradigma. Imaginemos o caso em que haveria duas teorias, ambas inconsistentes entre si, mas que se fundamentassem nos mesmos dados empíricos, de tal modo que os dados não forneceriam uma base para decidir entre ambas as teorias. O único critério para escolher entre 26 a primeira e a segunda teorias é constituído pelos valores sociais ou morais, que, por sua vez, possuiriam o poder de escolher a quais pesquisas deve ser dada prioridade. Críticos de Kuhn, tais como Lakatos (1979, p. 178), asseveram que os seus critérios de escolha são basicamente subjetivos e uma "[...] questão psicológica de massas". Kuhn (2011b) rebate a crítica, ao argumentar que a escolha de paradigma depende de uma mescla de fatores objetivos, como a precisão, e fatores subjetivos, ou critérios compartilhados e individuais. Comumente, a luta entre paradigmas, embora possa levar um grande tempo e esforço, tende a chegar a um vencedor. É natural que um paradigma acabe sendo mais aceito pela maioria dos pesquisadores de uma área. Nesse ponto, a área entra em um novo momento chamado de "ciência normal". Na próxima seção, apresentamos o momento em que um paradigma se destaca de seus rivais. 1.4 Ciência Normal O comprometimento de uma comunidade com um único paradigma é pré-requisito para o que Kuhn (2011a) chama de "ciência normal". Borradori (2003, p. 210) descreve a passagem do período de pré-ciência para ciência normal como: [...] a prática científica se normaliza em torno da instituição de um "paradigma", que representa uma mescla normativa de teoria e de método. Uma amálgama, no qual se juntam um espectro de postulados teóricos, uma determinada visão de mundo, dos modos de transmissão dos conteúdos da ciência, além de uma série de técnicas de pesquisa. O novo paradigma implica uma definição mais rígida e mais fecunda para o campo de estudos. Com o seu surgimento, ocorre a criação de publicações especializadas, a fundação de sociedades de especialistas e a reivindicação de valorização desses elementos nos currículos. Ressalta Kuhn (2011a, p. 40): Quando um cientista pode considerar um paradigma como certo, não tem mais necessidade, nos seus trabalhos mais importantes, de tentar construir seu campo de estudos começando pelos primeiros princípios e justificando o uso de cada conceito introduzido. Em princípio, durante o período de pré-ciência, um paradigma não passa de uma promessa de explicação para os fenômenos do mundo. Na ciência normal, tem-se a atualização dessas promessas para a comunidade, aplicando-se as predições do paradigma aos conhecimentos e fatos que o paradigma julga como sendo relevantes, aumentando a sua 27 capacidade explicativa e refinando o próprio paradigma, através do que Kuhn (2011a, p. 44) identifica como progresso interno: A maioria dos cientistas, durante toda a sua carreira, ocupa-se com operações de acabamento. Elas constituem o que chamo de ciência normal. Examinado de perto, seja historicamente, seja no laboratório contemporâneo, esse empreendimento parece ser uma tentativa de forçar a natureza a encaixar-se dentro dos limites preestabelecidos e relativamente inflexíveis fornecidos pelo paradigma. A ciência normal não tem como objetivo trazer à tona novas espécies de fenômenos; na verdade, aqueles que não se ajustam aos limites do paradigma frequentemente nem são vistos. Os cientistas também não estão constantemente procurando inventar novas teorias; frequentemente mostram-se intolerantes com aquelas inventadas por outro. Faz parte da atividade científica da ciência normal trabalhar apenas com as teorias e fenômenos fornecidos e explicados pelo paradigma vigente. Essas características remetem ao conceito de especialização. Alves (2013, p. 199) sublinha que os adeptos de seus respectivos paradigmas costumam agir da seguinte maneira: Os participantes de um paradigma costumam defendê-lo com todo vigor possível. Existe uma crença quase que incontestável no poder explicativo e preditivo das teorias que constituem um paradigma, na sua adequação e correção, ou na possibilidade de seu aprimoramento. Durante o período de ciência normal, há um quadro típico de problemas e expectativas a serem resolvidos pelos praticantes e adeptos do paradigma. Os chamados "quebra-cabeças" são problemas estipulados pelo poder explicativo do paradigma, embora, em geral, seus resultados não visem a uma novidade inesperada, segundo Kuhn (2011a, p. 59): Os termos "quebra-cabeça" e "solucionador de quebra-cabeças" colocam em evidência vários dos temas que adquiriram uma importância crescente nas páginas precedentes. Quebra-cabeça indica, no sentido corriqueiro em que empregamos o termo, aquela categoria particular de problemas que servem para testar nossa engenhosidade ou habilidade na resolução de problemas. Ao adotar um paradigma, uma comunidade científica também adquire uma série de quebra-cabeças a serem trabalhados. Em certa medida, a comunidade tende a aceitar apenas esses quebra-cabeças como problemas genuínos a serem resolvidos pelos seus membros. É comum que outros quebra-cabeças, os aceitos anteriormente, passem a ser rejeitados pela comunidade, por se tratarem, pela perspectiva do paradigma vigente, de metafísica ou pertinente às especialidades de outra área. Eles também podem ser rejeitados por serem demasiadamente problemáticos para se gastar tamanha quantidade de tempo. Kuhn (2011a) destaca que a ciência contemporânea tende a desenvolver-se tão rapidamente, devido à natureza de seus problemas, dado que seus praticantes, na concepção do paradigma, procuram 28 se concentrar em questões que podem ser resolvidas apenas com os pressupostos fornecidos e a sua engenhosidade. O empreendimento científico da ciência normal, sugere Kuhn (2011a), em seu conjunto, motiva os seus adeptos a encaixar as peças de seus quebra-cabeças. Não obstante, um quebra-cabeças não consiste apenas em um problema com uma solução assegurada pelo paradigma. É necessário que o quebra-cabeças obedeça a certas regras que limitam tanto as possibilidades de sua solução aceitável quanto os possíveis métodos necessários e instrumentos preferíveis para encontrá-la. Tais regras valem para os problemas teóricos e para os problemas práticos. Tais regras criam uma relação de compromisso do pesquisador para com o paradigma, sendo preciso respeitar os seus pressupostos adotados. Enquanto os pressupostos do paradigma são reconhecidos como vigentes, eles auxiliam nas resoluções dos quebra-cabeças e permitem que os demais membros da comunidade aceitem as soluções e possam passar para outros problemas. Após sua consolidação, um paradigma pode apresentar muitas limitações, quer naquilo que tange à sua precisão, quer no seu aprimoramento interno. Os paradigmas podem demonstrar, ao longo do tempo, anomalias sérias, o que emergencialmente resulta em uma crise científica. A aparente solidez do paradigma começa a se desmanchar, e o período de ciência normal se transforma em um momento de rupturas. Nesse estágio, são questionados os métodos, as técnicas e os fundamentos do paradigma. A história da ciência é marcada por vários exemplos: a passagem do sistema aristotélico para o de Galileu, na astronomia, é um deles. Investigamos, na próxima seção, os elementos que levam um paradigma a entrar em crise e quais as possíveis soluções para essa questão. 1.5 Crise A atividade da ciência normal implica um empreendimento coletivo voltado para a resolução de quebra-cabeças estabelecidos na agenda do paradigma. Entretanto, é comum, no período de ciência normal, que fenômenos sejam apreendidos e problemas sejam encontrados. Por vezes, é necessária uma capacidade explicativa para além do paradigma dominante para tais fenômenos. Kuhn (2011a, p. 77) assinala que a "[...] ciência normal não se propõe descobrir novidades no terreno dos fatos ou teorias; quando é bem sucedida, não as encontra". As chamadas "anomalias" são reconhecidas a partir do momento em que as expectativas do paradigma vigente são suplantadas por fenômenos que ou são extremamente difíceis de se explicar ou são tão anômalos que são impossíveis de se explicar. No primeiro caso, é comum 29 que a teoria tente se ajustar, a fim de assimilar o novo fenômeno ao seu escopo explicativo, transformando o inesperado em esperado. O segundo caso é caracterizado pela necessidade da criação de novos conceitos e de um novo vocabulário, para analisar o fenômeno, uma vez que a observação e a assimilação do novo fato a uma teoria estão muitas vezes associados à descoberta do fenômeno. Ocasionalmente, o surgimento de anomalias resulta na descoberta de algum elemento natural novo, como, por exemplo, algum elemento químico novo ou comportamento de algum elemento. A descoberta de uma anomalia significa a reformulação conceitual em algum nível que, por sua vez, pode exigir alguma modificação no paradigma vigente. Kuhn (2011a, p. 82) alude ao exemplo de Lavoisier, para explicar a relação entre o surgimento de anomalias, a descoberta de novos elementos e a criação de novos paradigmas com maior poder explicativo: O que Lavoisier anunciou em seus trabalhos posteriormente a 1777 não foi tanto a descoberta do oxigênio como a teoria da combustão pelo oxigênio. Essa teoria foi a pedra angular de uma reformulação tão ampla da química que veio a ser chamada de revolução química. [...] Muito antes de desempenhar qualquer papel na descoberta de um novo gás, Lavoisier convenceu-se de que havia algo errado com a teoria flogística. [...] O trabalho sobre o oxigênio deu forma e estrutura mais precisas à impressão anterior de Lavoisier de que havia algo errado na teoria química corrente. A experiência prévia de se observar a dificuldade de analisar o fenômeno, a partir do paradigma anterior, é um indicativo importante da necessidade de uma revisão dele. Muitas vezes, a percepção de uma anomalia, ou seja, de um fenômeno que o paradigma não está preparado para explicar, desempenha um papel importante para o ambiente das descobertas científicas. Entretanto, não são apenas as descobertas os únicos indicativos da necessidade da criação de novos paradigmas. As descobertas incluem uma série de elementos que impactam essa mudança: por exemplo, a consciência prévia da existência de anomalias, o reconhecimento do plano conceitual e metodológico do fenômeno e, consequentemente, mudanças no paradigma, muitas vezes, estão relacionados com uma forte resistência oriunda da comunidade de pesquisadores mais ortodoxos. Habitualmente, as descobertas emergem com muita dificuldade, seguindo um caminho extremamente contraintuitivo ou aparadigmático. Em princípio, as nossas observações estão atreladas à previsibilidade do paradigma, mesmo em situações que mais tarde podem ser entendidas como anomalias. Enfatiza Kuhn (2011a, p. 91): Contudo, uma maior familiaridade dá origem à consciência de uma anomalia ou permite relacionar o fato a algo que anteriormente não ocorreu conforme o previsto. Essa consciência da anomalia inaugura um período no qual as categorias conceituais são adaptadas até que o que inicialmente era 30 considerado anômalo se converta no previsto. Nesse momento completa-se a descoberta. Imagina-se que os primeiros paradigmas conseguem, com alguma eficiência, explicar boa parte dos fenômenos e objetos pretendidos pela sua área de atuação. Com o passar do tempo, quando o paradigma se consolida e a área de pesquisa passa ao estatuto de ciência normal, pode ocorrer o desenvolvimento interno do paradigma, com um refinamento metodológico e conceitual que leva a comunidade científica à especialização de sua visão de mundo e a um aumento na precisão entre os fenômenos e as teorias. Kuhn (2011a, p. 91) salienta: "A ciência torna-se sempre mais rígida". Quanto maior for a precisão e o alcance de um paradigma, maior a possibilidade de haver anomalias sérias e algum indicativo da necessidade de mudança de paradigma. A comunidade adepta ao paradigma dificilmente o abandonará, sem a existência de grandes provas, em vários laboratórios, de sua insuficiência e das impossibilidades de reformulá-lo. Quando a existência de anomalias atinge um certo nível, a comunidade científica se encontra em uma situação na qual é necessária a assimilação desses fenômenos, seja a partir da reformulação do paradigma, seja através da criação de um novo paradigma, capaz de explicar os fenômenos novos e os fenômenos previamente conhecidos. Ao longo desse avanço, é preciso que algumas crenças aceitas no paradigma vigente sejam descartadas e substituídas por outras. Em boa parte dos casos, a presença de anomalias persistentes ocasiona, na comunidade científica, um período de crise crescente. As chamadas "crises" são decorrentes da insegurança gerada em face do fracasso constante da ciência normal em produzir previsões e explicações adequadas às situações futuras da natureza. Frisa Kuhn (2011a, p. 95): "O fracasso das regras existentes é o prelúdio para uma busca de novas regras". Os cientistas, mesmo já com pouquíssima confiança nas previsões e explicações do paradigma dominante, com frequência não são capazes de se desvencilhar do veículo de sua crise, sem uma opção razoavelmente segura e com poder explicativo potencialmente superior ao seu anterior. Baseando-se em fatos históricos, como a Revolução Copernicana, uma crise é apenas superada e um paradigma é abandonado quando existe alguma alternativa disponível que seja potencialmente capaz de substituir o vigente. Na visão de Kuhn (2011b), os motivos que levam um cientista a abandonar um paradigma são muito mais complexos que somente a comparação entre teorias, envolvendo a comparação mútua entre os paradigmas com a natureza, juntamente com a aceitação da 31 comunidade científica. A resistência dos membros da comunidade, às vezes, é tão grande em tentar salvar o paradigma das crises que é comum observarmos uma constante tentativa de modificações e propostas ad hoc. Enfatiza Kuhn (2011a, p.109): Tal como artistas, os cientistas criadores precisam, em determinadas ocasiões, ser capazes de viver em um mundo desordenado – descrevi em outro trabalho essa necessidade como "a tensão essencial" implícita na pesquisa científica. O momento de crise não é demarcado pelo abandono absoluto de todo e qualquer paradigma. Diferentemente da pré-ciência, a crise é caracterizada pelo momento de perda de credibilidade do paradigma e surgimento de novos paradigmas, completamente diferentes e contraditórios com o anterior, os quais competem pela aceitação da comunidade científica. Kuhn (2011b) aborda a relação tênue entre os quebra-cabeças da ciência normal e as anomalias constantes nos momentos de crise. Cada quebra-cabeças também pode ser visto como uma anomalia e um indicativo de crise (KUHN, 2011a). Embora não exista uma linha divisória precisa entre a relação das anomalias e os quebra-cabeças, a crise tende a fomentar o enfraquecimento das resoluções dos quebra-cabeças, possibilitando o surgimento de novos paradigmas capazes de resolvê-los. Nesse sentido, as teorias vigentes podem ter duas estratégias de atuação, em relação às anomalias: ou elas partem de um eterno confronto com as anomalias ou jamais as confrontam diretamente. Contudo, em ambos os casos, parece sempre existir algum indicativo de problema no paradigma. As anomalias possuem forte impacto na geração de uma crise. Provavelmente, não há uma resposta direta para os processos que levam anomalias a criar uma crise, em uma área de pesquisa, dada a existência de muitos fatores externos e internos extremamente impactantes. Kuhn (2011a, p.113) descreve alguns exemplos de anomalias que resultaram no desenvolvimento de crises: Algumas vezes uma anomalia colocará claramente em questão as generalizações explícitas e fundamentais do paradigma – tal como o problema da resistência do éter com relação aos que aceitaram a teoria de Maxwell. Ou, como no caso da revolução copernicana, uma anomalia sem importância fundamental aparente pode provocar uma crise, caso as aplicações que ela inibe possuam uma importância prática especial – neste exemplo para a elaboração do calendário e para a astrologia. Devido a inúmeras razões, anomalias surgem com certa frequência. Algumas parecem ser algo muito mais além do que um possível novo quebra-cabeças da ciência normal. Embora os cientistas e investigadores tentem resolver os problemas que são cada vez mais constantes, ao passo que mais adaptações são inseridas, para esses investigadores, a disciplina jamais será 32 a mesma. Durante o período de crise, mesmo com um paradigma dominante, a comunidade não o adota com segurança, e mesmo as soluções, que anteriormente eram bem aceitas, passam a ser alvo de questionamentos. Esse período de confusão é demarcado pela falta de coesão entre o corpo do paradigma e a constante assimilação de hipóteses ad hoc. As crises iniciam-se com a falta de credibilidade do paradigma dominante e, consequentemente, com o esvaziamento das regras que orientam a pesquisa, ao longo do período de ciência normal. Na próxima seção, desenvolvemos as implicações das revoluções científicas. Explicitamos o impacto que causam nas comunidades científicas, incluindo as mudanças das visões de mundo e o caráter necessário das revoluções. 1.6 Revolução Científica As crises podem terminar de três maneiras diferentes. A primeira possibilidade consiste na revelação de que o próprio paradigma dominante seja capaz de resolver os motivos da crise. A segunda opção decorre da resistência do problema. Nesse caso, tanto as abordagens novas quanto as clássicas se revelam insuficientes. O problema é considerado insolúvel e é posto de lado, para que possa ser resolvido por futuras gerações, as quais podem dispor de métodos e instrumentos mais sofisticados. A terceira opção acaba com o surgimento de um novo candidato a paradigma dominante e com o confronto entre ele e o vigente. Este último modo de resolução propicia a entrada da área de pesquisa num período denominado "ciência extraordinária". Na transição de um paradigma para o outro, em períodos de crise, tem-se o surgimento de uma nova tradição de ciência normal: a despeito de ter que ser capaz de responder a todas as questões que o paradigma anterior era capaz de responder e mais as novas questões, a nova área jamais será proveniente da acumulação de dados obtidos através de seu antecessor. O novo paradigma é, antes de tudo, uma reformulação da área, a partir de novos princípios e pressupostos, muitas vezes, implicando mudanças drásticas nos métodos e práticas anteriormente aceitas, que acarretam, frequentemente, elementos contraditórios à perspectiva anterior. Completada a transição, os cientistas deverão modificar, dentre outras coisas, as suas concepções de mundo e terão de tomar os mesmos dados e observações realizadas anteriormente, em função de um novo sistema de relações, averiguando-os a partir de um novo quadro de conceitos. Habitualmente, os novos paradigmas surgem, ainda que em fases iniciais, antes que a crise tenha encontrado o seu apogeu. Esclarece Kuhn (2011a, p. 118): 33 Confrontado com uma anomalia reconhecidamente fundamental, o primeiro esforço teórico do cientista será, com frequência, isolá-la com maior precisão e dar-lhe uma estrutura. Embora consciente de que as regras da ciência normal não podem estar totalmente certas, procurará aplicá-las mais vigorosamente do que nunca, buscando descobrir precisamente onde e até que ponto elas podem ser empregadas eficazmente na área de dificuldade, de torná-la mais nítida e talvez mais sugestiva do que era ao ser apresentada em experiências cujo resultado pensava-se conhecer de antemão. [...] dado que nenhuma experiência pode ser concebida sem o apoio de alguma espécie de teoria, o cientista em crise tentará constantemente gerar teorias especulativas que, se bem sucedidas, possam abrir o caminho para um novo paradigma e, se mal sucedidas, possam ser abandonadas com relativa facilidade. Com o desenvolvimento desses procedimentos, os quais exigem uma força criativa extraordinária, ocorre, por vezes, ao concentrar o enfoque científico em determinada área para o reconhecimento de anomalias. Essas observações, em momentos de crise, são fundamentais para o desenvolvimento da atividade científica. Não raro, a forma do novo paradigma é decorrente desse movimento extraordinário, sendo necessário, após a superação da crise, migrar para um novo momento de ciência normal, o qual exige uma refinação conceitual. Em linhas gerais, quando um grupo de pesquisadores desenvolve um novo paradigma que atrai a maior parte dos praticantes da área de pesquisa contemporânea e as novas gerações, é comum que as escolas mais antigas comecem a desaparecer gradualmente. Kuhn (2011a) sugere que é comum o desaparecimento dessas escolas, com o surgimento de novos paradigmas, mas sempre existem alguns indivíduos com forte elo com as concepções mais antigas. Esses indivíduos são habitualmente excluídos ou forçados a unir-se a um novo grupo. A transição para um novo paradigma caracteriza, do ponto de vista histórico, uma revolução científica. O termo ciência extraordinária faz referência a um momento de grandes transições, as quais são fundamentais para o desenvolvimento da atividade científica, gerando novos conhecimentos sobre a realidade. As revoluções científicas e as transições da pré-ciência para a ciência normal constituem aqueles momentos de mudança paradigmática. Assim, um paradigma que não mais apresenta um poder explicativo tão grande é substituído por um novo, com maior poder explicativo e incompatível, em algum aspecto, com o anterior. A mudança de paradigma é marcada pela subdivisão dos membros da comunidade científica e a crescente perda de credibilidade do paradigma vigente. O sentimento de funcionamento falho ou defeituoso é uma constante que permeia o ambiente dos pesquisadores, os quais deixam de acreditar que o paradigma existente é capaz de explorar 34 adequadamente o funcionamento do universo dos fenômenos. Kuhn (2011a, p.126) faz um paralelismo entre as revoluções políticas e as revoluções científicas: As revoluções políticas visam realizar mudanças nas instituições políticas, mudanças essas proibidas por essas mesmas instituições que se quer mudar. Consequentemente, seu êxito requer o abandono parcial de um conjunto de instituições em favor de outro. E, nesse ínterim, a sociedade não é integralmente governada por nenhuma instituição. De início, é somente a crise que atenua o papel das instituições políticas, do mesmo modo que atenua o papel dos paradigmas. [...] A essa altura, a sociedade está dividida em campos ou partidos em competição, um deles procurando defender a velha constelação institucional, o outro tentando estabelecer uma nova. Quando ocorre essa polarização, os recursos de natureza política fracassam. Por discordarem quando à matriz institucional a partir da qual a mudança política deverá ser atingida e avaliada, por não reconhecerem nenhuma estrutura supra-institucional competente para julgar diferenças revolucionárias, os partidos envolvidos em um conflito revolucionário devem recorrer finalmente às técnicas de persuasão em massa, que seguidamente incluem a força. Com o decorrer da história da humanidade, as mudanças de paradigma na ciência mostraram ter muitas semelhanças com as revoluções políticas. Semelhantes aos estilos de governo, muitas vezes as posições políticas revelam a existência de modos de vida extremamente incompatíveis. Segundo essa comparação, os momentos de revolução não podem ser avaliados pelos processos comuns da ciência normal, porque eles dependem de um paradigma para a sua avaliação, e o mesmo se encontra sendo questionado a respeito da sua validade enquanto um paradigma aceito pela comunidade científica. O mesmo pode ser indicado, quando nos questionamos sobre a validade de documentos que apregoam a inocência de governos que passaram por períodos de barbárie. No próximo capítulo, apresentamos uma visão histórica acerca da ciência cognitiva. Investigamos o seu surgimento, com as conferências Macy e a sua relação com a primeira fase da cibernética. Pretendemos, com esse capítulo, apurar as questões científicas dessa área, tendo como base a perspectiva epistemológica de Thomas Kuhn. 35 CAPÍTULO 2 O ESTATUTO CIENTÍFICO DA CIÊNCIA COGNITIVA EM SUA FASE INICIAL: CONTEXTO HISTÓRICO 2.1 Apresentação Neste capítulo, esboçamos uma visão geral sobre o ambiente dessa nova área do saber denominada ciência cognitiva em sua fase inicial, qual seja, as décadas entre 1940 e 1960. Na seção 2.2, expomos uma definição geral dessa área de pesquisa e suas principais características. Na seção 2.3, expomos os seus aspectos históricos, como, por exemplo, os primeiros textos que fazem referência à área e à formação dos primeiros membros. Na seção 2.4, buscamos focalizar as conferências e temas que serviram como base para o surgimento oficial da ciência cognitiva. Para fechar o capítulo, na seção 2.5, traçamos a relação entre as conferências Macy, o contexto da cibernética e o surgimento da ciência cognitiva. 2.2 O Conceito e as principais características da Ciência Cognitiva Desde os primórdios da filosofia, muitos pensadores, cada um à sua forma, já se debruçaram sobre o tema do conhecimento e da cognição afim de investigar a sua origem, seus fundamentos, sua extensão e valor. Na contemporaneidade a ciência cognitiva obteve um papel de grande destaque ao abordar o tema da cognição atrelado à possibilidade de sua simulação a partir de aparatos eletrônicos. Gardner (1996, p. 19) estabelece: Defino a ciência cognitiva como um esforço contemporâneo, com fundamentação empírica, para responder questões epistemológicas de longa data – principalmente aquelas relativas à natureza do conhecimento, seus componentes, suas origens, seu desenvolvimento e seu emprego. Gardner (1996) sugere a presença de cinco características de maior importância, as quais podem ser consideradas sintomáticas da atividade concernente à ciência cognitiva. Quando todos ou boa parte estão presentes, pode-se assumir que se trata do tema da ciência cognitiva. Ainda que essas características possam ser consideradas sintomáticas, ressaltamos que elas fazem referência à fase inicial desta área de pesquisa. Em primeiro lugar, existe a crença, ao discutir a atividade cognitiva, de que é fundamental fazer o uso de representações mentais e criar níveis de análise capazes de separar o biológico do cultural. 36 Várias noções de representação mental foram propostas ao longo da história desta área, buscamos, no terceiro capítulo, abordá-los de maneira mais detalhada. Ressalta Thagard (1998, p. 17): "A ciência cognitiva propõe que as pessoas têm procedimentos mentais que operam nas representações mentais para produzir pensamentos e ações". Tipos diferentes de representações mentais, como conceitos e regras, promovem e necessitam de tipos diferentes de procedimentos mentais. Assim, por exemplo, considerando pessoas familiarizadas com as representações da língua portuguesa e com os procedimentos para a formulação de sentenças, supõe-se que elas serão capazes de produzir orações com algum grau de satisfação. Já as pessoas familiarizadas com as representações da língua inglesa também serão capazes de formular orações, mas em outra língua, com suas as regras próprias. Em segundo lugar, é fundamental, para essa área no momento de seu surgimento, a crença de que uso dos computadores eletrônicos é indispensável na realização de estudos cognitivos. Mas, além disso, os computadores são a melhor forma para criar modelos viáveis, eticamente e funcionalmente, de como são processos cognitivos. Uma das melhores formas de desenvolver estruturas teóricas é formando e testando modelos computacionais que pretendem ser semelhantes às operações mentais. Em sua forma ideal e forte, na ciência cognitiva, os modelos computacionais e a experimentação psicológica andam lado a lado, possuindo uma equivalência entre o que é representado digitalmente, através das máquinas, e o que acontece durante os processos cognitivos. Diante das dificuldades materiais e éticas para a manipulação da mente e do cérebro, alguns pesquisadores, como Herbert Simon (1969), adotam a hipótese de que certos processos cognitivos podem ser simulados ou explicados a partir de modelos computacionais. De acordo com Dupuy (1996), modelos tratam de uma idealidade formalizada e matematizada, a qual tem a função de sintetizar um sistema de relações entre elementos que podem ser substituídos por outros elementos análogos ou diferentes, sem que o modelo seja alterado. Essa forma de abordagem norteou grande parte dos programas de pesquisa em Inteligência Artificial. Segundo Boden (1990, p. 01, tradução nossa 3) o uso dos computadores e as definições de Inteligência Artificial e de Ciência Cognitiva estão intimamente relacionadas: Inteligência Artificial (IA) é algumas vezes definida como o estudo de como construir e/ou programar computadores para permiti-los fazer os tipos de 3 No original: "Artificial Intelligence (AI) is sometimes defined as the study of how to build and / or program computers to allow them to do the kinds of things minds can do [...] But many others prefer a more controversial definition, seeing AI as the science of intelligence in general or, more precisely, as the intellectual nucleus of cognitive science. As such, its purpose is to provide a systematic theory that explains (and perhaps enables us to replicate) not only the general categories of intentionality and the diverse psychology of terrestrial creatures, but the whole set of possible minds". 37 coisas que mentes podem fazer [...] Mas muitos outros preferem uma definição mais controversa, vendo a IA como a ciência da inteligência em geral – ou, mais precisamente, como o núcleo intelectual da ciência cognitiva. Como tal, seu objetivo é prover uma teoria sistemática que explique (e talvez nos habilite replicar) não só as categorias gerais da intencionalidade e a diversa psicologia das criaturas terrestres, mas o conjunto inteiro das possíveis mentes. Assim, os estudos da Ciência Cognitiva estão intrinsecamente relacionados ao desenvolvimento da Inteligência Artificial, envolvendo o processamento de informação, a manipulação de símbolos e a noção de representação. Interpretação semelhante também pode ser verificada a partir da definição de Ciência Cognitiva oferecida por Dawson (2002, p. 13): Ciência Cognitiva é um estudo intensamente interdisciplinar da cognição, percepção e ação. Ela está baseada na hipótese de que cognição é processamento de informação, onde processamento de informação é geralmente interpretado como manipulação baseada em regras de estruturas de dados que estão armazenadas numa memória. Como resultado dessa hipótese, um objetivo básico da ciência cognitiva é identificar a arquitetura funcional da cognição – o conjunto primitivo de regras e representações que mediam o pensamento. (Tradução nossa) 4 O terceiro aspecto da ciência, em sua fase inicial, menciona a decisão deliberada por grande parte dos cientistas em não enfatizar alguns fatores que possuem certo grau de relevância, todavia, cuja inserção complicaria demasiadamente o trabalho dos cientistas cognitivos. Incluem, entre esses fatores, a influência das emoções, o contexto histórico e cultural, além do plano de fundo onde ocorrem as ações ou a cognição. O quarto aspecto surge da crença de que há muito a se ganhar com estudos e trabalhos interdisciplinares. Por um lado, a complexidade do tema exige a participação de diversas áreas de pesquisa. Por outro lado, a maioria dos cientistas cognitivos era advinda de disciplinas distintas. Imaginava-se então que haveria um estreitamento entre os limites das disciplinas até a consolidação de uma só ciência cognitiva unificada, com um paradigma próprio. Existem diversas perspectivas e métodos que os pesquisadores de diferentes áreas trazem para os estudos da ciência cognitiva. Os neurocientistas, por exemplo, efetuam experimentos controlados e suas observações estão preocupadas, habitualmente, com processos e relações cerebrais. Com o desenvolvimento das tecnologias recentes, tornou-se 4 No original: "Cognitive science is an intensely interdisciplinary study of cognition, perception, and action. It is based on the assumption that cognition is information processing, where information processing is generally construed as the rule-governed manipulation of data structures that are stored in a memory. As a result of this assumption, a basic aim of cognitive science is identifying the functional architecture of cognition – the primitive set of rules and representations that mediate thought". 38 possível o uso de aparelhos para observar o que acontece nas mais diversas partes do cérebro, enquanto se está executando várias tarefas cognitivas. A antropologia cognitiva, por sua vez, expande o exame do pensamento humano para considerar o impacto dos diferentes ambientes culturais na cognição. Os antropólogos investigam, por exemplo, as semelhanças e diferenças entre as culturas, nas palavras que representam cores. Por sua vez, os filósofos geralmente não fazem observações empíricas ou trabalham com modelos computacionais: cabe à filosofia, dentre outras coisas, lidar com tópicos fundamentais subjacentes às abordagens experimentais e computacionais da cognição. Temas abstratos, como a natureza das representações, as relações entre a mente e corpo e os critérios de cientificidade da ciência cognitiva, dentre outros, são temas importantes para o filósofo que se preocupa com a ciência cognitiva ou com os estudos dos processos cognitivos. Embora não tenhamos exemplificado todas as áreas específicas, destaca-se a importância que a convergência teórico-experimental dessas áreas tem sobre os avanços científicos em relação à cognição, conforme explica Thagard (1998). O quinto aspecto afirma que outro ingrediente fundamental, semelhante à proposta de Kuhn (2011a), é a consolidação de uma comunidade científica. Neste bojo também é importante a construção de uma agenda de questões e conjuntos de preocupações, os quais são capazes de nortear as pesquisas científicas, e que há muito tempo inquietam os pensadores ocidentais que se debruçaram sobre o problema da cognição. Estes cinco aspectos servem de fundamento para a consolidação do paradigma da ciência cognitiva em sua fase inicial. Assim, são os três primeiros aspectos, princípios metodológicos do paradigma que asseveram o uso de representações mentais, a crença de que é fundamental o uso de computadores eletrônicos e a decisão deliberada em não enfatizar certos fatores. Os outros dois últimos aspectos indicam a formação desejada aos cientistas cognitivos e o papel fundamental que a comunidade científica exerce no período da inauguração e vida de uma área de pesquisa. Na próxima seção, abordamos o contexto histórico da ciência cognitiva, juntamente com os seus primeiros textos e principais pensadores, os quais guiaram o espírito desse momento inicial. 2.3 Contexto Histórico para o surgimento da Ciência Cognitiva Existe certa variedade de datas importantes sugeridas por historiadores para o surgimento da ciência cognitiva. Dupuy (1996) destaca os anos entre 1946 e 1953, quando ocorreram dez conferências que reuniram inúmeros pensadores da época, sendo as nove primeiras realizadas no Hotel Beekman, 575 Park Avenue, em Nova York, e a última, no 39 Hotel Nassau de Princeton, New Jersey. Essas conferências entraram para a história com o nome de Conferências Macy, graças à organização efetuada pela fundação filantrópica Josiah Macy Jr. Tais reuniões eram compostas por matemáticos, lógicos, engenheiros, fisiologistas e neurofisiologistas, psicólogos, antropólogos e economistas. Eles tinham como objetivo fundamentar uma ciência geral capaz de tratar de aspectos cognitivos. Em princípio, esse grupo adotou o nome de cibernética. Com o passar dos anos, novos nomes foram utilizados, até estabelecer-se com a expressão ciência cognitiva para nomear a área de pesquisa. Os eventos históricos a que fazemos menção estão relacionados a um movimento histórico e intelectual de sua época. Embora as primeiras conferências tenham tido início apenas em 1946, algumas outras datas e eventos são importantes, para que possamos compreender as ideias da época. Em 1942, período em que ocorria a Segunda Guerra Mundial, foi promovida em Nova York uma conferência, sob a tutela da anteriormente citada fundação Josiah Macy Jr., cujo objetivo era discutir os problemas atrelados à inibição no sistema nervoso central. Essa reunião fez com que grandes pensadores da época entrassem em contato, possibilitando os futuros encontros que dariam origem às Conferências Macy. Segundo Dupuy (1996), esse evento de 1942 contou com a presença dos fisiologistas Arturo Rosenblueth e Warren McCulloch, com o casal de antropólogos Gregory Bateson e Margaret Mead, além do diretor médico da fundação, Frank Fremont-Smith. McCulloch, ao notar certa relação entre as ideias sugeridas no evento e aquelas que ele desenvolvia com Pitts, propôs a Fremont-Smith que organizasse uma série de conferências, no modelo das que a fundação promovia, para tratar de temas médico-sociais muito variados, os quais deveriam ser realizadas apenas depois da Segunda Guerra Mundial. Conforme Dupuy (1996), após esse encontro, aconteceram inúmeros intercâmbios entre o grupo de McCulloch, em Chicago, e o de Wiener, no MIT (Massachusetts Institute of Technology). Em 1943, eram publicados independentemente dois dos artigos que acabariam compondo a base dos pressupostos do que mais tarde seria conhecido como movimento cibernético. O primeiro foi assinado por Arturo Rosenblueth, Norbert Wiener e Julian Bigelow, intitulado Behavior, Purpose and Teleology. Wiener e Bigelow trabalhavam, durante a guerra, nos problemas teóricos levantados pela defesa antiaérea. O problema central da defesa antiaérea é que, como o alvo é móvel, é preciso prever a sua posição final com base em uma informação parcial da trajetória. Os problemas da defesa antiaérea ajudaram a fundamentar um dos ingredientes básicos da futura cibernética, o conceito de retroalimentação (feedback), inerente às noções entre a ação efetiva 40 (output), a entrada de informação (input) e os resultados projetados. Graças a essa noção, os objetos seriam capazes de mudar as suas relações, conforme ocorresse a presença de novos estímulos e respostas. Dupuy (1996) sugere que, com o texto fundador de Rosenblueth, Wiener e Bigelow, tem-se uma concepção metodológica que recomenda que se deixe de lado a natureza física dos constituintes e de suas relações, a fim de abstrair a sua forma. Por exemplo, um empreendimento fundamental da cibernética trataria de descobrir um mesmo dispositivo formal de feedback de um animal e de uma máquina, embora o primeiro seja materialmente composto por proteínas e o segundo, por sistemas eletrônicos. Esse procedimento pretendia propor uma teoria unificada entre os seres vivos e as máquinas. O segundo artigo fundador foi publicado em 1943, pelo neuropsiquiatra McCulloch e pelo matemático Walter Pitts. Esses dois pesquisadores preconizavam investigar os mecanismos materiais e lógicos que compõem a mente. Ressalta Dupuy (1996, p. 53): McCulloch, na verdade, introduz o "estudo comportamental dos fenômenos naturais", caro a Wiener, Rosenblueth e Bigelow, no interior do cérebro. Sem dúvida, o "conteúdo" daquilo mesmo que é capaz de comportamento é agora considerado pertencente à esfera de um procedimento científico, mas esse conteúdo se descreve a si próprio em termos de comportamento de unidades menores, no "interior" das quais não se pode pensar em penetrar e que só são consideradas em suas relações com seu ambiente, ou seja, como operadores que transformam inputs em outputs: os neurônios. A posição de McCulloch reflete alguns dos pensamentos desse primeiro momento da cibernética, que pode ser resumido através da equivalência lógica entre os artefatos e as máquinas artificiais com todo e qualquer ser lógico-matemático instanciado na matéria de algum organismo. Nas palavras de McCulloch (1955, p. 38, tradução nossa 5): "Quanto mais aprendemos sobre os organismos, mais somos levados a concluir que eles não são simplesmente análogos às máquinas, mas são máquinas". Segundo a perspectiva epistemológica de Kuhn (2011a), embora a comunidade científica da ciência cognitiva ainda estivesse sendo consolidada, além dos centros de pesquisa, havia aspectos metodológicos que buscavam agrupar e nortear os seus primeiros partidários. Dentre os inúmeros aspectos, Rosenblueth, Wiener e Bigelow sugeriam um enfoque metodológico, enquanto McCulloch e Pitts apresentavam uma metáfora sobre o funcionamento da mente, que se unia às noções gerais sobre as máquinas digitais da época. 5 No original: "Everything we learn of organisms leads us to conclude not merely that they are analogous tom achines but that they are machines". 41 Ainda durante 1943, a aproximação dos grupos fundadores concretizou-se pela vinda de Pitts ao MIT, junto a Wiener. Pitts e Wiener deveriam, a partir desse momento, percorrer com frequência o triângulo entre Cambridge, Cidade do México e Chicago. Paralelamente, Wiener mantinha uma forte relação de intercâmbios com von Neumann, para tratar questões que envolviam as analogias entre organismos e máquinas. Eles chegaram à conclusão de que as coisas já estavam maduras para uma institucionalização das pesquisas, nessa área, sob a forma de revista, de uma sociedade científica e até de um centro de pesquisa. Conforme Dupuy (1996), em 1945, no Institute of Advanced Studies de Princeton, onde von Neumann trabalhava, foi organizado um encontro que contou com a participação de von Neumann, Wiener, Pitts, Goldstine, McCulloch e Lorente de Nó, para tratar da concepção do ENIAC (em português, computador integrado numérico eletrônico), o primeiro computador digital eletrônico de grande escala. Após sair desse encontro, Wiener estava convencido de que a engenharia e a neurologia estavam intimamente relacionadas e de que havia uma necessidade de se organizar um programa permanente de pesquisa, para tratar desse assunto. Nessa ocasião, seguindo as elucidações de Kuhn (2011a), desenvolviam-se os primeiros exemplares e periódicos destinados à nova comunidade científica. Entretanto, devido à forma como o Instituto de von Neumann estava reticente a deixá-lo sair da sua instituição, permitiu que ele construísse ali o seu computador ultrarrápido, impossibilitando que von Neumann se dirigisse ao MIT com Wiener, para construção do tão sonhado centro. Assim, a primeira cibernética nunca conseguiu dispor de um centro de pesquisa apenas seu, encontrando fortes empecilhos, durante a consolidação de seu paradigma. As Conferências Macy deveriam, de algum modo, suprir essa falta de um centro de pesquisa. Terminada a guerra, a Fundação Macy retomou a sugestão feita por McCulloch, em 1942, e o encarregou de montar uma série de conferências sobre essas ideias nascentes. Na próxima seção, comentaremos as dez conferências Macy e os adventos que ocorreram, após essa primeira tentativa de consolidação de uma comunidade científica. 2.4 As Conferências Macy O primeiro encontro organizado pela Fundação Macy aconteceu em março de 1946, em Nova York. Seu título era Feedback Mechanisms and Circular Causal Systems in Biological and Social Systems. Segundo Dupuy (1996, p. 85): Segundo os princípios da fundação, tratava-se de reunir em intervalos regulares (em geral, a cada seis meses) um pequeno grupo de cerca de vinte 42 pesquisadores, membros oficiais do ciclo em questão, os quais podiam acrescentar até cinco "convidados". A ênfase era dada muito mais aos intercâmbios e às discussões do que às exposições formais. O título da primeira conferência fazia referência aos trabalhos de Wiener e de McCulloch, dada a importância que os neurônios tinham, na sua abordagem. Houve também a inclusão dos "sistemas sociais" resultante da iniciativa de Bateson. A maior parte dos participantes era composta por psicólogos, sociólogos, matemáticos e antropólogos. A segunda Conferência Macy, com o novo título de Teleological Mechanisms and Circular Causal Systems, aconteceu em outubro do mesmo ano da primeira. Imediatamente após essa conferência, foi realizado, pelo mesmo grupo, um simpósio para a Academia de Ciências de Nova York, sobre o tema Teleological Mechanisms. As ideias do grupo foram apresentadas nessas duas ocasiões, afirmando-se que seu objetivo era de consolidar um quadro de conceitos para as pesquisas científicas nas ciências da vida. Segundo Dupuy (1996), foi nesse encontro que Wiener expôs a um grupo de cientistas, pela primeira vez, as noções de mensagem, comunicação, informação, feedback e autômato. Em 1947, foi realizada a Terceira Conferência Macy, com o mesmo título da segunda. Foi nessa ocasião que Wiener sugeriu o termo "cibernética", para consolidar uma unidade ao grupo e às suas ideias. No ano seguinte, 1948, Wiener publicou o seu famoso livro de mesmo nome, Cybernetics: or the control and communication in the animal and the machine (WIENER, 1948). No mesmo ano de sua publicação, são promovidas as duas últimas conferências do primeiro ciclo, intituladas Circular Causal and Feedback Mechanisms in Biological and Social Systems. O primeiro ciclo de conferências Macy, aos olhos da proposta de Kuhn (2011a), não se consolida enquanto fazendo parte de um estado de ciência normal. Embora a interdisciplinaridade seja considerada um elemento fundamental dessa área de pesquisa, acaba por dificultar a criação de exemplares e princípios metodológicos bem esclarecidos. A cibernética, nesse primeiro momento, ainda buscava atrair um número de partidários, caracterizando um processo de formação de um paradigma. O segundo ciclo de Conferências Macy ocorreu entre 1949 e 1953. Estas foram as últimas cinco conferências sobre o tema da cibernética. Dupuy (1996) destaca que as Atas dessas últimas conferências são marcadas, em 1951, pela ausência de Wiener e de von Neumann, e, no ano seguinte, pelo desaparecimento de seus nomes da lista de membros do ciclo. A história desse período encerra-se com o rompimento de todas as relações de Wiener com o grupo. 43 A sexta Conferência Macy (24 e 25 de março de 1949) iniciou-se com uma discussão conjunta, cujo objetivo era investigar os mecanismos cerebrais responsáveis pela memória, especialmente a humana. O respectivo problema havia sido colocado a partir das considerações anteriores de von Neumann, conforme consta em Macy 6 (1950, p. 12, tradução nossa 6): "[...] os atuais 101° neurônios [estimados num cérebro], usados como relés simples, são totalmente insuficientes para responder pelas habilidades humanas". Nesse momento da história da cibernética, entendeu-se que os pesquisadores deveriam procurar por estruturas menores no interior dos neurônios, as quais funcionassem de maneira "digital": Observamos a seguinte citação relatada pelo editor das conferências, Heinz von Förster em Macy 6 (1950, p. 12): McCulloch: [...] von Neumann é muito insistente de que, sejam quais forem os itens subjacentes à propriedade dos neurônios de serem dispositivos de tipo tudo ou nada, eles ainda devem ser quantizados ou digitais ou lógicos em sua estrutura. Você simplesmente não pode, numa coisa com a dimensão de nossos cérebros, se safar com dispositivos de analogia de nenhum tipo. (Tradução nossa) 7 Nesse momento, era colocado em discussão o que deveria ser procurado nas dimensões dos neurônios e qual o seu grau de complexidade (MACY 6, 1950). Os pensadores da época chegaram a algumas possíveis respostas. Inicialmente, McCulloch excluiu dessas possíveis respostas um modelo químico-mecânico elaborado por Ward e Katz. De acordo com McCulloch (MACY 6, 1950), esses dois cientistas haviam proposto um modelo para a memória, no qual ela seria fruto de alterações temporárias na estrutura proteica da membrana das células neuronais, porque seria possível pensar o disparo dos neurônios como um tipo de reação físico-química e não apenas elétrica, como os impulsos nervosos que utilizam a mesma fonte de energia que as contrações musculares. Os disparos dos neurônios poderiam ser concebidos, pois, como uma alteração mecânica similar à dos músculos, literalmente, um ato de esticar da região da sinapse até o ponto de tocar um neurônio vizinho. Nesse processo, haveria uma alteração na estrutura química das células neuronais em questão, o qual, segundo os relatos de Heinz von Förster em Macy 6 (1950, p. 13), formaria: [...] uma espécie de rede na membrana [das células neuronais, e] esta rede, no momento do impulso nervoso, seria temporariamente alterada [...] poderia 6 No original: "[...] that at the present time 101° neurons used as simple relays are utterly inadequate to account for human abilities". 7 No original: "McCulloch: [...] Von Neumann is very insistent that whatever the items are, lying beyond the property of neurons as mere all or none devices, they must still be quantized, or digital or logical in their structure. You simply cannot in an affair of the size of our brains get away with any analogy devices". 44 conduzir a especificidades na resposta de uma membrana proteica em relação a uma membrana proteica adjacente na sinapse. (Tradução nossa) 8 Entretanto, esse modelo é considerado, por McCulloch, em Macy 6 (1950), insuficiente, uma vez que ele conduz a uma soldagem de um neurônio ao próximo, causando uma continuidade que contradiz a ideia, desse período, de digitalidade dos processos cerebrais. Wiener também argumenta que a memória poderia ser resultante das alterações químicas nos neurônios, mas de maneira diferente das especulações de Ward e Katz. Para Wiener e os reducionistas, há uma ideia de que a memória estaria corporificada no nível celular, relata Heinz von Förster em Macy 6 (1950, p. 16, tradução nossa 9): "O que precisamos é de um processo muito mais complexo, onde os elementos são muito mais complexos para o que acontece na sinapse e no corpo celular". Essa complexidade não poderia ser alcançada a partir de alterações limitadas a um local específico, mas apenas através da alteração em conjunto de um grande número de ligações sinápticas. Wiener, ao longo da conferência Macy 6 (1950), partiu da hipótese de que a memória seria fruto de uma alteração no limiar de ativação de um grupo de sinapses. Uma vez que certos processos químicos poderiam influenciar a quantidade de energia recebida necessária para o disparo de um neurônio ou de um grupo deles, seria possível imaginar que a memória poderia ser pensada com base em sua incorporação em uma rede neural, "separada" de outras redes cerebrais por diferenciações, quimicamente controladas, do limiar de ativação daquela rede, garantindo a integridade da memória e explicando possivelmente os mecanismos que permitem o acesso a ela. A variabilidade dos limiares de ativação poderia explicar os processos de aprendizagem, na medida em que as suas mudanças poderiam representar uma alteração na quantidade ou nos "dados" armazenados naquela rede neural. Wiener, em Macy 6 (1950, p. 17), acrescenta: O mecanismo de limiar variável me parece estar em forte conexão com o problema da memória. Eu acredito que possuímos todas as indicações de que várias coisas no corpo, químicas ou não, alteram-no: que, em outras palavras, temos uma evidência da existência da memória, pela existência de aprendizado, isto é, de uma fina estrutura celular de alterabilidade de limiares de acordo com padrões específicos. [...] não precisa ser uma 8 No original: "[...] that they formed some kind of a lattice in the membrane, that this lattice at the time of the nervous impulse is temporarily altered [...] might lead to specificities in the response o fone protein membrane to an adjacent protein membrane at the synapse". 9 No original: "What we do need is a process much more complex where the elements are much more complex for what happens at the synapse and in the cell body". 45 variabilidade fixa no espaço, mas pode com efeito ser uma variabilidade no tempo. (Tradução nossa) 10 Pitts, partindo de um pensamento lógico-matemático, durante a sexta conferência Macy (MACY 6, 1950), examinou minuciosamente as respostas possíveis para o problema dos neurônios propostos por seus colegas. Segundo Pitts, em Macy 6 (1950, p. 22, tradução nossa 11), podem-se distinguir "[...] três estágios da complicação da relação entre a entrada e a saída [de informação] da célula". A primeira possibilidade, a mais simples, é aquela na qual as sinapses agem juntas. Esse primeiro cenário é considerado pelo seu autor tão pouco realista. A segunda possibilidade sináptica é aquela na qual o requisito para o disparo das células é que um grupo de sinapses próximas disparem em conjunto. Nesse cenário, ao invés de se ter em vista uma célula, considera-se um grupo de células como agente do disparo. A terceira possibilidade para a estruturação das sinapses parte da ideia de combinações nãoaditivas; tal tipo de combinação conduz a uma estrutura sináptica muito rígida e específica: "[...] uma célula na qual alguma combinação arbitrária fixa de sinapses aferentes – e somente aquela combinação – irá disparar". (MACY 6, 1950, p. 22, tradução nossa 12). Pitts classifica as possibilidades em graus de eficiência no processamento de informações. Assim, a segunda possibilidade de organização é tomada como mais eficiente que a primeira, pois nela há a possibilidade de discriminação maior, uma vez que cada grupo de células determina de antemão certos padrões de organização dos impulsos nervosos, enquanto exclui outros. O terceiro caso representa uma maior eficiência, pois consiste em uma única forma de organização. Pitts (MACY 6, 1950) chega a especular sobre uma quarta possibilidade de organização sináptica, levando em conta a organização temporal, na qual os impulsos poderiam ser resultantes de tempos diferentes e combinações diferentes. O fisiologista Gerald, por sua vez, durante a sexta conferência Macy, chamará a atenção para o problema da estrutura das redes neurais. Segundo Gerald, em Macy 6 (1950, p. 18), há problemas em se atribuir alguma fixidez às organizações dos neurônios: 10 No original: "The mechanism of variable threshold is one that has appealed to me very strongly in connection with the problem of memory. I believe we have every indication that various things, chemical and otherwise, in the body do change that: that in other words, we have an evidence from the existence of memory, for the existence of learning of a fine structure in the cell of changeability of thresholds according to specific patterns [...] need not be a fixed variability in space but may actually be a variability in time". 11 No original: "[...] three stages of the complication of the relation between the input and output of the cell". 12 No original: "[...] a cell which some fixed arbitrary combination of afferent synapses – and only that combination – will fire". 46 [...]. Uma coisa arrebatadoramente impressionante neste trabalho é a completa fluidez – e eu estou falando de fluidez estrutural – de um neurônio adulto sob condições normais e sua extensa disrupção e reconstrução sob leves condições patológicas. Neste momento, em cada um de nossos cérebros um neurônio não está lá sentado como uma figura na lousa, tal como ordinariamente pensamos nele. Cada um está projetando pseudópodes, retraindo suas fibras, movendo-se para frente e para trás, esticando e encolhendo e movendo-se de um lado para o outro. Todas as vezes que se vê filmes destas coisas, não importa quão frequentemente, fica-se impressionado com o fato de que dificilmente há algo mais do que um fino gel. (Tradução nossa) 13 Essa primeira discussão terminou de maneira inconclusiva, mas tratou de estimular o ambiente para as discussões que ainda estavam por vir, ao longo do encontro. Essa discussão inicial levantou uma problemática acerca do processamento de informação realizado pelo cérebro e seu armazenamento. Toda a discussão girou em torno de qual seria a unidade de processamento da informação, se são neurônios inteiros, parte de seus corpos, se são diversos neurônios, se são sinapses ou um grupo de sinapses, além da sua estrutura, se são fixas ou mutáveis, aditivas ou não aditivas. Nessa discussão, a noção de troca de informação serve como um elemento fundamental para a modelização do funcionamento neuronal e da memória. Ainda durante a sexta conferência Macy, foi apresentado pelo psicólogo e pesquisador do Laboratório de Eletrônica Naval de San Diego, John Stroud, um modelo da percepção humana. Essa conferência foi intitulada The Psychological Moment in Perception. Stroud começou sua argumentação, comentando o trabalho do pesquisador britânico Kenneth Craik. Craik buscou pensar, em termos cibernéticos (isto é, com base na noção de feedback), o funcionamento de uma arma antiaérea. Craik se perguntava sobre como pensar a ação do operador humano de tal arma. Em teoria, uma arma antiaérea é um dispositivo que, ao receber informações sobre seu alvo, como velocidade e direção, as utiliza para prever sua posição, num momento futuro, e mira no ponto que, calculado a partir das informações recebidas, dispara o projétil afim de encontrar o alvo. Todavia, como nem sempre esse cálculo é preciso, porque a arma erra o tiro, as informações relativas a esse erro realimentam a própria arma, a qual passa a levar em conta sua margem de erro, a quantidade pela qual ela errou o tiro e a 13 No original: "[...]. One thing overwhelmingly impressive in that work is the complete fluidity – and I am talking about structural fluidity – of an adult neuron under normal conditions and its extensive disruption and reconstruction under very slight pathological conditions. In each of our brains at this moment, a neuron is not sitting there like a figure on a cardboard diagram, as we ordinarily think of it. Each is giving out pseudopods, retracting its fibers, moving forward and back swelling and shrinking and moving from side to side. Every time one sees moving pictures of these things, no matter how often, one is impressed by the fact that here is hardly anything more than a thin gel". 47 margem com que ela deve compensar nos tiros futuros. O feedback se dá, portanto, em função do erro. A ação da arma deve ser corrigida automaticamente, a partir da percepção dos erros cometidos. A arma pensada nesse experimento é reflexo da tecnologia da época, ou seja, esse tipo de arma até então não era completamente automática, sendo necessário que um operador humano decidisse quando e contra o que atirar: [...] temos o operador humano cercado por todos os lados por mecanismos conhecidos muito precisamente, e a questão que surge é "Que tipo de máquina colocamos no meio? " Craik chegou à conclusão de que o operador humano é um servomecanismo intermitente. (MACY 6, 1950, p. 28, Tradução nossa) 14 Isso pode significar duas coisas: em primeiro lugar, ao contrário de um servomecanismo tradicional, que funciona sozinho recebendo sua informação continuamente e dando sua informação e ação de saída continuamente, o operador humano funciona de forma intermitente, isto é, ele toma suas decisões somente após um certo intervalo de tempo, algo em torno de poucos milésimos, durante o qual permanece inativo ou em estado de processamento de informação. Em segundo lugar, o operador humano, ao invés de basear-se no erro, isto é, de orientar sua ação sempre em razão de quanto falta para atingir sua meta, ele o faz com base na predição da movimentação do alvo (MACY 6, 1950). Curioso em decifrar as razões das observações de Craik, Stroud, em Macy 6 (1950), montou o seguinte experimento: tem-se um instrumento, um painel com um ponteiro e uma linha vertical, um botão que gira e controla o deslocamento horizontal do ponteiro. É tarefa de um operador humano corrigir o ponteiro, o qual se desloca por conta própria, de sorte que ele se mantenha sobre uma linha vertical. Notemos que esse tipo de controle exercido sobre o ponteiro, através do botão, pode ser regulado para controlar o deslocamento do ponteiro, ou sua velocidade, ou sua aceleração, ou ainda uma combinação dos três parâmetros. Quer dizer, a quantidade de deslocamento efetuada sobre o botão corresponderá diretamente ao deslocamento sofrido pelo ponteiro, ou a uma mudança em sua velocidade de deslocamento, ou à alteração da taxa de aceleração do movimento do ponteiro. Stroud (MACY 6, 1950) chegou a alguns resultados, a partir deste experimento: o sucesso em manter o ponteiro sobre a linha vertical, mesmo em casos demasiadamente complicados, está relacionado com uma diferença na capacidade de feedback humana em 14 No original: "[...] we have the human operator surrounded on both sides by very precisely known mechanisms and the question comes up 'What kind of a machine have we placed in the middle'. Craik came to the conclusion that the human operator was an intermittent servo". 48 relação à dos servomecanismos tradicionais, que, por possuírem "um curso de ação fixo", são incapazes de passar no teste desse experimento. Mas, se o feedback realizado pelo operador humano que passa por tal experimento não funciona tal qual o feedback dos servomecanismos tradicionais, como ele funcionaria? Destaca Stroud em Macy 6 (1950, p. 32): [...] quando se analisa os registros [do experimento, vê-se que o controlador humano] faz seus ajustes primeiro em termos de quanto ele errou na simples escala de deslocamento. Um pouco depois, começa a ser aparente que o operador está agora fazendo seus ajustes parcialmente num sistema simples [deslocamento] e parcialmente sobre a base de quanto a velocidade está envolvida. Um pouco depois ele pode vir a incluir a aceleração. Se então você introduzir alguma mudança brusca, você verá que a solução dele vem abaixo, ele [então] volta para o seu conjunto de ajustes original e passa através das várias ordens de derivativadas [deslocamento, velocidade e aceleração] produzindo soluções sucessivamente melhores para os problemas. [...] Ele faz isto de uma forma muito peculiar. Ele não o faz continuamente. Tipicamente, ele [o operador humano] é um corretor de meio-ciclo, pois ele faz correções a cada meio segundo ou a cada terço de segundo. Suas correções estão pré-determinadas. (Tradução nossa) 15 O controlador humano, ao contrário dos servomecanismos, que agem continuamente a partir do erro de sua ação anterior, segue um padrão pré-determinado, obtido pela observação dos resultados de sua ação, mas a executando em intervalos de tempo intermitentes. Nesse caso, o padrão consiste em aumentar o grau de controle sobre o ponteiro, incorporando sucessivamente o deslocamento, a velocidade e a aceleração, como parâmetros da ação de controle. A eficácia dos resultados desse padrão de controle é checada a cada um terço ou metade de segundo; caso haja sucesso, o controlador persiste em seu padrão de ação; caso haja fracasso, ele inicia todo o processo novamente, desde o início. De acordo com Stroud em Macy 6 (1950, p. 33, tradução nossa 16), "[...] a informação que determina sua próxima ação corretiva não é obtida durante o curso da própria ação corretiva". Portanto, o feedback próprio à ação humana orientada é de tipo preditivo, segundo Stroud em Macy 6 (1950, p. 34, tradução nossa 17): "O que ele [o homem] fará, foi decidido por predição [...] quando ela [a 15 No original: "[...] when you analyze his records, of how much it missed on the simple displacement scale. A little later on it begins to be apparent that the operator is now doing his adjustments partially on the basis of how much the velocity is involved. A little later on he may include acceleration. If then you introduce some sudden change you will see that his solution breaks down, he he then returns to his original set of adjustments and works through the various orders of derivatives producing successively better and better solutions of the problems. [...] He does this in a very peculiar way. He does not do it continually. Typically he is a half-cycle corrector for he does corrections every other half second or every third of a second. His corrections are cut and dried". 16 No original: "[...] that the information which determines his next corrective action is not obtained during the course of the corrective action itself". 17 No original: "What he is to do has been decided by prediction [...] there is nothing he can do about it once it is started. If the information changes in the meantime, he has had it". 49 ação] se inicia, não há nada que ele possa fazer [para corrigi-la]. Se, enquanto isto, a informação muda, ele nada pode fazer". Ao invés de checar continuamente o resultado de sua ação, o homem projeta um padrão de ação até então bem-sucedido, alterando-o apenas em caso de erro, o qual, quando percebido, não serve como informação corretiva da ação em vias de execução, mas somente da próxima ação. Justamente por isso, o homem age de forma preditiva e, não possuindo a instantaneidade das máquinas, sua ação baseia-se na repetição de padrões bem-sucedidos. Essa condição só é possível, porque o homem dispõe de uma memória. Ele não checa a todo instante o resultado de sua ação, porém, antes, "prevê" se um determinado modo de ação será eficaz, quer dizer, repete um padrão que ele sabe, por experiência própria, que pode conduzir a determinados resultados. A partir desse experimento, o qual corrobora, em certa medida, com a proposta de Craik, Stroud tenta derivar uma teoria quântica ou digital da percepção. Para Stroud, a razão para o caráter projetivo da ação humana orientada por fins reside na incapacidade de processar informações de maneira contínua: Suponha que tenhamos uma tarefa em que nosso operador recebe sua informação por meio de seus olhos; números muito grandes de fótons são absorvidos na retina a taxas estatisticamente estáveis, de forma que podemos falar deles como sendo recebidos continuamente. Eis aonde a informação entra no organismo humano, e ela entra, para todos os propósitos, continuamente. Quando analisamos o que sai do organismo, todo conjunto de observações de suficiente sensibilidade que foram até agora analisadas mostraram periodicidades de baixa frequência, frequências da ordem de duas ou três [respostas] por segundo. Há um período da ordem de um décimo de segundo durante o qual a ação corretiva é tomada, durante o qual alguma mudança é feita nas características da resposta (output) manual do homem. Segue-se um período de cerca de dois décimos de segundo no qual nada de novo é feito, e então outro período de cerca de um décimo de segundo no qual novas correções são feitas, e assim por diante. (MACY 6, 1950, p. 33, Tradução nossa) 18 18 No original: "Suppose we have a task where our operator receives his information by way of his eyes, very large numbers of photons are absorbed at the retina at stable statistical rates so that we may speak of them as being received continuously. This is where the information goes into the human organism, and it goes in, to all intents and purposes, continuously. When we analyze what comes out of the organism, every set of records of sufficient sensitivity, which have thus far been analyzed, has shown low frequency periodicities, frequencies of the order of two or three per second. There is a period of the order o fone-tenth of a second during which a corrective action is taken, during which some change is made in the characteristics of the manual output of the man. There follows a period of about two-tenths of a second in which nothing new is done and then another period of about a tenth of a second in which new corrections are made, and so on". 50 Como na primeira conferência, os demais membros também apresentaram suas considerações sobre a teoria da percepção de Stroud, que destacava o papel importante da descontinuidade, durante o processamento de informação. Alguns participantes desse debate buscaram explicar essa descontinuidade do processo perceptivo, a partir do funcionamento bioinformático do organismo. Assim, para Gerard, o caráter projetivo da ação humana seria não apenas psicológico, mas também fisiológico, enquanto, para Wiener, a descontinuidade observada na percepção é consequência direta do processamento digital de informações pelo cérebro, isto é, do fato de os neurônios operarem como interruptores, conforme destacam Gerald e Wiener, em Macy 6 (1950, p. 33-34): Gerard: Sobre esse assunto, imagino se não é o mesmo fenômeno que se encontra em muitos estudos do sistema nervoso. Se você pegar um sujeito completamente destreinado, sentá-lo numa cadeira, provocar o movimento espasmódico do joelho a intervalos regulares e então parar de martelar [o joelho] sem avisar, a perna provavelmente continuará a chutar por várias vezes, nos intervalos de tempo "esperados". [...] Wiener: Posso dizer por que deve ser este o caso? A transmissão [de informações no organismo] é essencialmente descontínua. Seus neurônios individuais ligam ou desligam. É apenas por meio de amostragem que se obtém algo próximo de uma entrada contínua. Se pegarmos um tempo muito breve sua amostragem será decididamente ruim. A média de informações de entrada chegando não será atingida de nenhuma forma precisa. Portanto, para ter uma correção realmente significativa a ser feita, você deve esperar. Penso que esta é uma das principais razões de por que você tem essa performance discreta [da percepção]. (Tradução nossa) 19 Ainda durante a sexta conferência Macy, ocorreram outras discussões, fruto desse mesmo espírito do movimento cibernético. A terceira discussão do dia foi feita pelo psicanalista Lawrence Kubie, acerca das dificuldades postas pelas neuroses à adaptação da vida em sociedade. Intitulada Neurotic Potencial and Human Adaptation, Kubie, em Macy 6 (1950), abordou a seguinte questão: é verdade que o princípio biológico de adaptação ao meio é uma "lei natural"? Ou seja, seria o comportamento socialmente valorizado um demonstrativo de uma bem-sucedida adaptação ao meio? Imaginando que essa característica o fosse, como pensar os frequentes casos de indivíduos plenamente adaptados, os quais sofrem, 19 No original: "Gerald: on this last point, I wonder if it is the same phenomenon that one runs into in many studies of the nervous system. If you take a completely untrained subject, sit him in a chair, elicit the knee jerk at regular intervals and then stop the hammer without warning, the leg is very likely to kick for several responses at the 'expected' time intervals. [...] Wiener: May I say why this must be the case? The transmission is essentially discontinuous. Your individual neurons go all or none. It is only by means of sampling that you get anything approaching a continuous input. If you take to short a time your sampling is going to be decidedly bad. Your average of the inputs coming in won't be reached in any precise way. Therefore, in order to get a really significant correction to correct by, you must wait. That I think is one of the chief reasons why you get this discrete performance". 51 devido a profundas neuroses? Ou os casos de indivíduos totalmente adaptados a um certo tipo de ambiente, contudo, completamente inadaptados a outros? Seria a neurose sinônimo de comportamento inadaptado? Ou o preço da adaptação seria o desenvolvimento de uma neurose? Kubie, em Macy 6 (1950), tratou desse problema em termos cibernéticos de feedback e de análises clínicas. Durante a última conferência do dia, o físico alemão Heinz von Förster efetuou uma discussão envolvendo um modelo para a memória. Nessa apresentação, intitulada Quantum Mechanical Theory of Memory, "todos" os aspectos da memória foram modelados em elementos discretos, como a sua dimensão fenomenológica, psicológica e mesmo biofísica. Von Förster, em Macy 6 (1950), divide sua exposição conforme esses três aspectos, abordados sucessivamente. Inicia pela questão da relação entre o tempo físico e o tempo psicológico. Conforme von Förster, em Macy 6 (1950, p. 112, tradução nossa 20), "[...] nossa memória funcionaria como um gravador: qualquer informação recebida seria armazenada indefinidamente" e sua recordação traria o evento percebido de volta, em sua integridade, inclusive de sua duração temporal. Como não é isso que se verifica fenomenologicamente, ao se estudar ou experienciar a memória, é certo que, enquanto o tempo passa, perdemos uma certa quantidade de informação por esquecimento. Enfatiza von Förster, em Macy 6 (1950, p. 112): A ideia principal é que todo evento observado deixa uma impressão que pode ser dividida em várias impressões elementares. Penso que é justificado assumir isto porque os órgãos dos sentidos também estão divididos em vários receptores sensórios elementares. (Tradução nossa) 21 O conteúdo da memória estaria dividido em diversas impressões elementares, oriundas dos discretos receptores sensórios do corpo. Com o tempo e a ação do esquecimento, esse número de impressões elementares armazenadas na memória se modifica. Von Förster procurou, por conseguinte, uma função matemática capaz de relacionar essas duas quantidades de elementos. Por analogia com os fenômenos físicos e químicos de decaimento, von Förster, em Macy 6 (1950, p. 112, tradução nossa 22), assumiu que "[...] a taxa de 20 No original: "[...] our memory would work like a tape-recorder: any incoming information would be stored indefinitely". 21 No original: "The principle idea is that any observed event leaves an impression which can be divided into a lot of elementary impressions. I think one is justified in assuming this because the sense organs too are divided into a lot of elementary sensory receptors". 22 No original: "the rate of change per time unit of the number of existing elementary impressions should be proportional to the number of existing elementary impressions". 52 variação do número de impressões elementares existentes por unidade de tempo deve ser proporcional ao número de impressões elementares existentes", o que conduz a uma certa função determinada por uma constante, um coeficiente de esquecimento. Quanto maior o coeficiente de esquecimento, mais rápido o esquecimento de um certo conteúdo de memória, e vice-versa. Tal função reside não somente na analogia com fenômenos físicos de decaimento e desorganização já conhecidos, mas sobretudo na proximidade existente entre o que ela prevê e os resultados obtidos em experimentos sobre a memória. O segundo dia da sexta conferência Macy teve início com uma discussão conjunta sobre os mecanismos de recordação e reconhecimento de informações armazenadas na memória. Intitulada Possible Mechanisms of Recall and Recognition, a discussão começou com considerações de diversos participantes sobre a necessidade da comunicação interdisciplinar, especialmente entre as ciências duras e as ciências humanas. Pode-se constatar, relata Heinz von Förster em Macy 6 (1950, p. 148): Temos que aprender a falar em algum nível de ciência comum [...] começar de algo sobre o qual o cientista social e o físico possam dizer 'Sim, concordamos sobre isto. Estamos falando a mesma linguagem. Como podemos progredir a partir daqui? ' (Tradução nossa) 23 Irritados com a abordagem feita pelos demais conceitos mecanicistas de certos participantes e com o que lhes pareceu falta de disposição ou capacidade de escutar, alguns psicólogos e cientistas sociais apelaram a seus colegas, para que se preocupassem com seus próprios pontos cegos num grupo que realmente tinha como seu foco a comunicação entre pessoas. Esse pequeno "puxão de orelhas", de fato, surtiu efeito, pois a discussão propriamente científica que se seguia atentará, bem mais que no dia anterior, para a lógica própria das dimensões sociais e psicológicas dos fenômenos abordados (memória, percepção, neurose). Nenhuma conceituação realmente nova foi feita, de modo que a discussão toda consistiu num refinamento dos tópicos abordados no dia anterior, buscando delinear melhor o funcionamento dos mecanismos da memória, visando a identificar os processos específicos de recordação e reconhecimento de informações/conteúdos. Diversas conceituações, experimentos e hipóteses explicativas foram levantadas, numa dinâmica nem sempre linear de discussões; alguns assuntos foram retomados diversas vezes, outros atropelados por novos 23 No original: "We have to learn to talk at some level of common Science [...] going to start from something about which the social scientists and physicists can say, 'Yes, we agree on this. We are talking the same language. How can we build up from there?'". 53 temas. Entretanto, pode-se dividir essa discussão em dois grandes blocos temáticos: o dos mecanismos analógicos de acesso à memória e o dos mecanismos digitais. Segundo os relatos de Heinz von Förster em Macy 6 (1950), o debate revelou duas características principais a propósito dos mecanismos de acesso à memória, discutidos por meio de categorias cibernéticas, em especial o analógico e o digital. A memória, por exemplo, foi entendida como corporificada sobretudo por circuitos digitais reverberantes, isto é, circuitos sujeitos a uma causalidade circular, em que a informação de saída reentra e refaz o mesmo caminho, reiteradamente. O acesso a esses circuitos lacrados aparentemente só pode ser feito por mecanismos analógicos, os quais consistam de mensagens buscadoras, que se difundem de modo contínuo pelo organismo até encontrar alguma rede que tenha interesse por elas, ou de alterações analógicas dos níveis de limiar sináptico, os quais possibilitam a captura dos nós de redes sinápticas lacradas em circuitos reverberantes por outras redes. Nenhum mecanismo propriamente digital de acesso a essas memórias parece poder ser desfeito. Em segundo lugar, tal discussão explicitou um pressuposto que já vinha operando nas discussões anteriores, a unidade entre físico e psíquico, baseada na analogia de mecanismo entre os processos de cada domínio. Mecanismos de feedback foram atribuídos a interações biofísicas e psicológicas; dentre as várias ocorrências, a mais interessante é a teoria de Frank, para a qual um organismo humano aprende padrões de comportamento novos, ao selecionar, dentre as várias mensagens internas e externas, a que está continuamente exposto, aquelas que lhe interessam, e as utiliza como dados de entrada nos diversos circuitos de retroalimentação que o compõem. De fato, funcionando segundo o mesmo mecanismo de feedback, os níveis psicológico e biofísico se comunicam, o que permite vê-los como unos, no que tange à ação de causas. Dessa forma, um evento propriamente psicológico, como a atribuição de significado a uma situação, pode causar alterações que são simultaneamente de personalidade (mudanças no significado atribuído a mensagens externas e padrões de resposta apreendidos) e fisiológicas (alterações na seletividade e sensitividade de determinados sistemas de órgãos). A conceptualização cibernética funciona, ao mesmo tempo, como veículo de conceituação e garantia de unidade (por analogia de mecanismo) entre os níveis biofísico e psicológicosocial. Exposto brevemente por Wiener, o último assunto abordado na sexta conferência, intitulada Sensory Prosthesises, diz respeito à substituição de receptores sensórios humanos por máquinas protéticas. Wiener relatou a construção de uma máquina para substituir a audição dos completamente surdos. Trata-se de uma máquina transdutora, a qual converte as vibrações sonoras em vibrações mecânicas sentidas pelos dedos. O padrão vibratório do som é 54 um pouco alterado, para garantir maior discernimento e inteligibilidade. Segundo Wiener em Macy 6 (1950, p. 204): (a) palavras distinguíveis são reconhecidas como diferentes; [...] em vários casos aprendemos a fazer pessoas reconhecerem um pequeno vocabulário [...]; (b) as mesmas palavras ditas por pessoas diferentes são reconhecíveis como possuindo o mesmo padrão. (Tradução nossa) 24 Wiener, em Macy 6 (1950), alude também a uma máquina para auxiliar a locomoção de cegos, projetada para dar-lhes indicações sobre os contornos dos objetos presentes no ambiente. Trata-se de duas células fotossensíveis conectadas ao ouvido e programadas para identificar o deslocamento espacial. As células funcionam ao serem apertadas pela mão, quando cada uma emite um som diferente. Porém, quando próximas de algum objeto, os dois sons coincidem. Assim, o cego é capaz de saber a que distância se encontra dos objetos do ambiente pelo grau de similaridade entre os sons emitidos pelas duas células fotossensíveis. Supõe-se que houve, nesses dois pares homem-máquina, duas operações cibernéticas atuantes. Uma, a tradução de informações sensórias em informações de outro tipo – conversão de som em movimento táctil, conversão de deslocamento da distribuição luminosa ambiente em vibração sonora. A informação transformada serve de substituto para a informação captada; esta muda de meio, no entanto, conserva uma forma equivalente, mantendo, em outro suporte, a referência ao mundo exterior. Outra operação cibernética é a existente entre o homem acoplado à máquina e o ambiente externo: as informações colhidas pela máquina possibilitam ao homem estar em contínuo feedback com o mundo à sua volta, orientando suas ações pelas informações substitutas fornecidas pela máquina. A sétima conferência Macy (MACY 7, 1951), ocorrida em 23 e 24 de março de 1950, foi dedicada à questão da linguagem. Esta foi pensada como um código submetido a processos de codificação e transmissão de informações (fala, escrita), recodificação (tradução) e transcodificação (processos sociais de mudança linguística). Esses processos atuam simultaneamente em vários níveis: no nível biofísico (cérebro é computador com código lógico-digital), no nível psicoperceptivo (produção, recepção e compreensão da língua são operações de codificação, tradução e decifração), no nível comportamental (comportamento neurótico é déficit de simbolização pela linguagem) e no nível "ideal" ou estrutural (língua enquanto estrutura abstrata de relação entre elementos discretos). 24 No original: " (a) distinguishable words are recognized as different, [...] in various cases and we have actually learned to get people to recognize a small vocabulary [...] (b) the same words spoken by different people are recognizable as having the same pattern". 55 Conforme os relatos de Heinz von Förster em Macy 7 (1951), a sétima conferência Macy se iniciou com a apresentação do fisiologista Ralph Gerald, tratando da natureza dos mecanismos do sistema nervoso, levando em consideração se eles são analógicos ou digitais. A segunda sessão do primeiro dia contou com a exposição do psicólogo experimental J. R. Licklider, que abordou a capacidade humana de reconhecimento de falas distorcidas ou alteradas. A quarta apresentação foi do engenheiro Claude Shannon, que teve como objetivo discutir a redundância da escrita em inglês. O segundo dia da sétima conferência Macy começou com um especial interesse na relação entre a noção de código e sentido. A primeira apresentação do dia foi feita por Margareth Mead, sobre como aprender línguas "primitivas", usualmente dotadas de estruturas gramaticais muito exóticas para os padrões ocidentais. Em seguida, os psicólogos Heinz Werner e John Stroud falaram sobre o problema do desenvolvimento ontogenético da linguagem, em especial, os processos de tomada de consciência semântica e sintática durante a infância. O ciclo de discussões se encerrou com a apresentação de Lawrence Kubie, o qual propôs teorizar as diferenças fundamentais entre a neurose e a normalidade. O objetivo dessa última apresentação consistia em saber até que ponto certos comportamentos não-linguísticos poderiam ser compreendidos sob o ponto de vista da linguagem pensada como código. A oitava conferência Macy (MACY 8, 1952), realizada nos dias 15 e 16 de março de 1951, teve como tema a comunicação entre os seres humanos. Principiou com a fala do psicólogo Alex Bavelas, sobre suas experimentações com a dinâmica entre pessoas organizadas em grupo. O objetivo desse estudo era averiguar as implicações do formato dos canais de comunicação interpessoais, classificando, assim, a eficácia na realização de tarefas. A segunda sessão foi aberta pela fala do pedagogo Ivo Richards, na qual se dedicou a saber até que ponto é válido ou mesmo possível pensar a linguagem, sendo que o único instrumento disponível para tal tarefa é a própria linguagem. A terceira apresentação ficou a cargo do psicanalista Lawrence Kubie, com o tema da comunicação simbólica humana em diferentes estados de consciência, bem como da distinção entre a comunicação consciente e a comunicação inconsciente. O segundo dia teve início com a apresentação do estudioso de psicologia animal Herbert G. Birch, em que se levantou a questão da existência da comunicação complexa entre animais. A nona conferência Macy (MACY 9, 1953), promovida nos dias 21 e 22 de março de 1952, teve dois temas principais. O primeiro são as emoções humanas: código particular, que permite a presença de emoções no processo de comunicação humana. O segundo diz respeito aos processos orgânicos de homeostase e o de aprendizado de novos padrões 56 comportamentais. A nona conferência se inicia com a fala de Bateson sobre as dinâmicas comunicativas responsáveis pelo riso e emoções similares na comunicação humana. A segunda discussão foi conduzida por Kubie, acerca dos tipos de relação causal existentes entre as emoções e o comportamento. A terceira foi a propósito da obra de Ross Ashby, em que foram expostos os princípios de uma máquina criada por ele, o homeostato, desenhada para ser um modelo de dinâmica de solução para problemas adaptativos dos organismos e descobrir, nesse sentido, como os organismos aprendem e conseguem reorganizar seu equipamento neurológico cerebral para que, por mais incomum que seja um meio ambiente, ele possa aprender e tomar uma ação apropriada. A décima e última conferência Macy (MACY 10, 1955) aconteceu nos dias 22, 23 e 24 de abril de 1953, em Princeton. Essa conferência contou com três comunicações: uma do neurologista britânico Grey Walter, sobre o cérebro; outra, do filósofo israelense Yehoshua Bar-Hilel, a respeito da possibilidade de se medir a informação semântica; e a última, do linguista sino-americano Yuen Ren Chao, sobre os mecanismos responsáveis pelo sentido, na língua. A décima conferencia Macy representava o fim de um ciclo de conferências e do grupo dos cibernéticos. Quanto aos participantes das Conferências Macy, conforme podemos notar, a partir dos temas e problemas levantados anteriormente e mais detalhadamente abordados na sexta conferência Macy, destaca-se uma grande interdisciplinaridade, um vocabulário calcado em conceitos cibernéticos e uma diversidade de temas. Nesse primeiro momento da cibernética, foi estabelecida uma ciência fisicalista, centrada em uma nova concepção de máquina, que introduziu a conceituação lógico-matemática de processamento de informação que serviu como fundamento para a Inteligência Artificial. Seguindo o aparato conceitual de Kuhn (2011a), observamos que as conferências Macy serviram como base para a consolidação da comunidade científica. Buscamos apresentar, resumidamente, as questões e discussões travadas pela comunidade científica, juntamente com alguns elementos paradigmáticos desenvolvidas naquele momento, como, por exemplo, as generalizações simbólicas e as noções de rede, feedback, memória, entrada e saída. Na próxima seção, para finalizar este capítulo, abordamos as relações entre as conferências Macy, o contexto da cibernética e o surgimento da ciência cognitiva. 2.5 As conferências Macy, o contexto da cibernética e o surgimento da ciência cognitiva De acordo com Varela (1991), durante a fase da cibernética, assistiram-se a inúmeros resultados, os quais influenciaram o desenvolvimento posterior da ciência cognitiva, em 57 especial, o surgimento da teoria da informação, apresentada como uma teoria estatística dos sinais e canais de comunicação; os primeiros exemplos de robôs parcialmente autônomos, capazes de incorporar uma auto-organização parcial; a escolha da analise lógico-matemática para descrição do funcionamento do sistema nervoso; e a instauração da teoria dos sistemas, como uma disciplina capaz de formular as regras e princípios gerais de qualquer sistema complexo. Parte destes inúmeros avanços estão interligados ao fato de que a cibernética tem surgimento atrelado à proposta de um agrupamento de diversos estudos pertencentes a outros campos, como, por exemplo, segundo Salles (2007), a matemática dos fenômenos aleatórios, a análise e correções de desvios e ruídos em redes de transmissão de sinais, os tópicos em engenharia de dispositivos automáticos e semiautomáticos, os tópicos em engenharia elétrica e de instrumentos de comunicação, a teoria formal dos autônomos, os estudos das bases neurofisiológicas do comportamento humano e animal, os estudos sobre a tomada de decisões dos agentes sociais, com base na informação disponível, os estudos sobre o equilíbrio em organismos e em comunidades, inclusive humanas, e o projeto de máquinas de calcular ultrarrápidas (computadores). Embora cada tema possua uma evidente complexidade própria, esses estudos possuem um ponto convergente em comum, em especial o tratamento dos diversos problemas de controle, quer em sistemas artificiais, quer em processos naturais. Os problemas de controle estão ligados a uma certa relação de causalidade circular. Em geral, os sistemas variam os seus estados, levando em conta parte dos resultados de suas ações anteriores, oferecendo dados que "realimentam" (feedback) o sistema. Wiener (1961) teve algum contato com praticamente todos os campos acima citados; por sua vez, ele notou que as mesmas reflexões sobre o controle e a causalidade circular também apareciam, tanto nos problemas ligados as áreas da engenharia quanto em biologia, e que essa coincidência estava relacionada a importantes questões metodológicas da área. Ademais, Wiener (1961) e seus colaboradores, na tentativa de desenvolver os princípios de sua área, propuseram uma perspectiva e uma taxonomia amparada no comportamento observável dos sistemas. Quando esse comportamento revela algum tipo de relação de feedback, utiliza-se o termo teleológico, no sentido de representar o controle por meio de feedback, em vista de um objetivo. O termo teleológico aparece na cibernética com uma definição diferente da habitualmente usada na filosofia. Imagina-se que sistemas observados pelo prisma teleológico da cibernética podem ser seres vivos ou máquinas, os quais, sob essa perspectiva, podem ser estudados sem que seja necessário considerar as suas diferenças estruturais. O conceito de teleologia surge, conforme a perspectiva de Kuhn 58 (2011a), como um princípio metodológico capaz de oferecer subsídios à manipulação e à compreensão da natureza, a partir de um escopo teórico específico. O conceito de teleologia oferecido por Wiener, Rosemblueth e Bigelow toca em um tema consagrado e polêmico da filosofia. Após algumas revisões, os autores insistiram em classificar o termo teleologia como sinônimo de "propósito controlado por feedback", acrescentando: No passado, a teleologia foi interpretada como implicando propósito, acrescentando-se muitas vezes o vago conceito de uma "causa final". Esta ideia de causas finais levou à oposição entre teleologia e determinismo. Uma discussão sobre causalidade, determinismo e causas finais está além do escopo deste ensaio. Pode-se ressaltar, no entanto, que o caráter de ser proposital (purposefulness), tal como definido aqui, independe bastante da causalidade inicial ou final. A teleologia foi desacreditada principalmente por ter sido definida como implicando uma causa subsequente no tempo a um efeito dado. Ao se rejeitar esse aspecto da teleologia, contudo, rejeitou-se também, infelizmente, o reconhecimento, que lhe é associado, da importância do propósito. Restringimos a conotação de comportamento teleológico aplicando essa designação apenas a reações propositadas que são controladas pelo erro da reação - isto é, pela diferença entre o estado, num dado momento, do objeto que se comporta, e o estado final, interpretado como propósito. Comportamento teleológico torna-se assim sinônimo de comportamento controlado por realimentação negativa; ganhando, portanto, em precisão, por ser uma conotação suficientemente restrita. De acordo com esta definição limitada, a teleologia não se opõe ao determinismo, mas à não-teleologia. Tanto os sistemas teleológicos como os não teleológicos são determinísticos quando o comportamento considerado pertence ao domínio ao qual o determinismo se aplica. O conceito de teleologia tem apenas uma coisa em comum com o conceito de causalidade: um eixo temporal. A causalidade, contudo, implica uma relação funcional unidirecional e relativamente irreversível, enquanto o que concerne à teleologia é o comportamento e não as relações funcionais. (WIENER, ROSEMBLUETH e BIGELOW, 1943, p. 49-50. Tradução nossa) 25 25 No original: "Teleology has been interpreted in the past to imply purpose and the vague concept of a "final cause" has been often added. This concept of final causes has led to the opposition of teleology to determinism. A discussion of causality, determinism and final causes is beyond the scope of this essay. It may be pointed out, however, that purposefulness, as defined here, is quite independent of causality, initial or final. Teleology has been discredited chiefly because it was defined to imply a cause subsequent in time to a given effect. When this aspect of teleology was dismissed, however, the associated recognition of the importance of purpose was also unfortunately discarded. Since we consider purposefulness a concept necessary for the understanding of certain modes of behavior we suggest that a teleological study is useful if it avoids problems of causality and concerns itself merely with an investigation of purpose. We have restricted the connotation of teleological behavior by applying this designation only to purposeful reactions which are controlled by the error of the reaction-i.e., by the difference between the state of the behaving object at any time and the final state interpreted as the purpose. Teleological behavior thus becomes synonymous with behavior controlled by negative feed-back, and gains therefore in precision by a sufficiently restricted connotation. According to this limited definition, teleology is not opposed to determinism, but to non-teleology. Both teleological and non-teleological systems are deterministic when the behavior considered belongs to the realm where determinism applies. The concept of teleology shares only one thing with 59 O caráter dinâmico da definição dos sistemas estudados pela cibernética enseja uma certa comparação entre os organismos biológicos e os artefatos construídos pelo homem. Wiener (1961) faz um uso forte e sistemático da analogia entre máquinas e animais, empregando o termo autônomo como referente a ambos. Importante destacar que, em nossa abordagem e para Kuhn (2011a), a linguagem e a criação de conceitos aparecem como elementos fundamentais para a consolidação de uma comunidade científica, uma vez que esses elementos implicam uma descrição do mundo e uma série de pressupostos teóricos que auxiliam na atividade científica dos membros da comunidade. Faz parte do conceito de paradigma toda uma constelação de técnicas e visões de mundo. O conceito de autômatos não surge como um simples recurso retórico: acima de tudo, é um método de abordagem, capaz de evidenciar a natureza do assunto, como mostra a seguinte passagem de Wiener (1961, p. 70) sobre os autômatos: O estudo mais recente dos autômatos, sejam de metal ou de carne e osso, é um ramo da tecnologia da comunicação: suas noções cardeais são as de mensagem, quantidade de distúrbio ou "ruído" - termo tomado da tecnologia telefônica -, quantidade de informação, técnica de codificação, e assim por diante. Numa teoria desse tipo, lidamos com autômatos efetivamente ligados ao mundo exterior, não apenas por seu fluxo de energia, seu metabolismo, mas também por um fluxo de impressões, de mensagens que chegam, e das ações e mensagens que saem. Os órgãos pelos quais as impressões são recebidas são os equivalentes dos órgãos sensoriais animais e humanos. Compreendem as células fotoelétricas e outros receptores de luz; sistemas de radares, que recebem suas próprias ondas curtas hertzianas; registros de potencial de hidrogênio, que podem ser chamados provadores; termômetros; medidores de pressão de vários tipos; microfones; e assim por diante. Os efetuadores podem ser motores elétricos ou solenóides ou serpentinas de calefação ou outros instrumentos de espécies muito diversas. O método implicado na proposta de Wiener (1961), o qual, por ora, chamaremos de "método cibernético", é uma variante ou parte do chamado "método sistêmico": ambos admitem que a determinação do real não deriva apenas dos seus elementos constitutivos, mas também de sua estrutura relacional e funcional. O "método sistêmico" é um esforço por conseguir a visão mais completa possível do objeto estudado, mediante a inclusão de um número cada vez maior de elementos, partes ou relações. Cada parte do todo é considerada, em princípio, como sendo relevante, assim como as relações entre as partes e as relações entre o objeto e seu meio circundante. Essa inclusão the concept of causality: a time axis. But causality implies a one-way, relatively irreversible functional relationship, whereas teleology is concerned with behavior, not with functional relationships". 60 se dá sob a forma de uma integração: um tipo de descrição estrutural-relacional-funcional que torna visíveis os vínculos que formam o objeto. O método sistêmico se contrapõe ao chamado "método analítico". Se o método analítico visa a identificar fatores causais relevantes isolados, para depois montar uma "causalidade composta", o método sistêmico, pelo contrário, aponta para uma "causalidade coordenada", a qual emerge da própria convergência dos elementos considerados. A peculiaridade do método cibernético, nesse contexto, é a sua preferência por enfocar a evolução temporal dos objetos estudados, que são vistos como processos dotados de uma certa persistência ou direcionamento. Mais do que a "causa do objeto", o que se procura identificar e descrever são as "causas da estabilidade" – tanto do objeto em suas transformações, como do seu comportamento. À primeira vista, a descrição dos fenômenos físicos consiste em mostrar como eles se enquadram nas chamadas "leis do movimento", que, por sua vez, só podem ser compreendidas no marco de um certo número de "leis de conservação". Quando o movimento de um sistema não pode ser descrito em função de certos parâmetros constantes, diz-se que há "instabilidade". A descrição de sistemas "instáveis" só é possível quando as "fontes" dessa instabilidade obedecem igualmente a certos requisitos, podendo ser tratadas como introdutoras de alterações "suaves" ou "previsíveis" nos parâmetros conservativos do sistema original. Mesmo assim, a instabilidade costuma introduzir imperfeições na descrição. Em função da sua "capacidade de previsão": quando o estado futuro de um sistema não é de alguma forma "calculável" (ou pelo menos fixada a sua probabilidade), tendo em vista o seu passado, a descrição falha, e será preciso reformular a abordagem. No caso de sistemas onde a complexidade é muito grande, como em fenômenos biológicos, certas abordagens são tidas como impossíveis ou são tratadas em termos de probabilidade. Segundo Dupuy (1996), o pensamento cibernético é oriundo de toda uma evolução no modo de pensar a representação do conhecimento, possibilitando que o modelo de representação científica fosse estendido ao domínio dos problemas da mente. A ciência ocidental é marcada, nas palavras de Dupuy (1996, p. 21), pela ideia de que "[...] só podemos conhecer aquilo de que somos causa, o que fabricamos", ou seja, só podemos conhecer a partir da imitação da natureza e pela representação, através da produção de experimentos. Dessa maneira, graças ao recurso da analogia e ao processo de conhecimento, por intermédio da representação científica, poderiam ser reproduzidos aparatos mecanicamente técnicos capazes de representar o próprio processo do conhecimento, tal como a máquina de Turing, a qual pretendemos abordar, nas próximas seções. Assim, para Dupuy (1996, p. 36), as 61 descobertas lógicas de Gödel e Turing (1950), teriam ajudado a conduzir a esta ideia: "O pensamento, essa atividade psíquica, essa faculdade do espírito que tem o conhecimento como objeto, nada mais é, afinal, do que um processo mecânico ordenado, um automatismo "cego"". O pensamento cibernético teria sido composto com base em uma evolução no pensamento científico. Suposta a ideia de Turing (1950) de que pensar é calcular, através da produção de um modelo do objeto conhecido, também seria possível imaginar um modelo capaz de produzir e representar um modelo de funcionamento de um sistema que conhece, ou seja, uma representação da faculdade de representação. Nessa perspectiva, segundo Dupuy (1996), o pensamento cibernético compreendia o ato de conhecer, a partir da simulação, isto é, como a capacidade de modelagem que consiste em reproduzir o funcionamento de um sistema. O pensamento contemporâneo ao movimento cibernético previa-lhe um futuro promissor. A cibernética estimulava a imaginação de toda uma época, ela havia nascido como um sucesso midiático, amplamente divulgada pelos meios de comunicação dos Estados Unidos e das demais localidades, anunciando uma vasta quantidade de previsões e transformações sociais e tecnológicas. As mesmas revistas que em 1948 apregoavam que a cibernética crescia de maneira descontrolada e de maneira problemática, em poucos anos depois afirmavam: Três anos atrás Norbert Wiener, professor de matemática no M.I.T., era um "cabeludo" que havia cunhado a palavra "cibernética" para envolver os muitos lados da ciência dos dispositivos de comunicação e controle. Agora o livro de Wiener, Cibernética, é um clássico, e Wiener é um profeta que é ouvido por sisudos homens de negócio de cabelo curto. Muitos deles concordam sinceramente que a "revolução cibernética" que ele predisse já está em progresso. (TIME MAGAZINE, 1950, apud MASSARO, 2010, p. 19). O movimento cibernético, com a sua estreia espetacular, logo deu início a um processo de institucionalização. Com o avançar da década de 50, cursos universitários de cibernética começaram a surgir ao redor do mundo, especialmente na Europa. Embora, em sua terra natal, a cibernética jamais tivesse alcançado o título de disciplina científica, pouco a pouco, após os anos 1950 e até o início da década de 70, começaram a aparecer manuais de cibernética, o que, para a abordagem de Kuhn (2011a), seria um indício dos primeiros exemplares para a passagem da pré-ciência para a ciência normal. Massaro (2010, p. 21) arrola alguns exemplos: 1956 – An Introduction to Cybernetics – W. Ross Ashby 1958 – Cibernética Técnica (em russo) – L. P. Kraizmer 1959 – Cybernetics and Management – Stafford Beer 62 1960 Cybernetics Without Mathematics – Henryk Greniewski 1961 – An Approach to Cybernetics – Gordon Pask 1964 – Vvedeniye v Kibernetiku (Introdução à cibernética) – Viktor Glushkov 1965 – Cybernetics and Biology – F. H. George 1967 – Cybernétique et Biologie – Andrée Goudot-Perrot Todos esses manuais tinham em comum a ideia de que a cibernética seria uma nova ciência, com objetivos próprios, modos de quantificação e conceitos próprios. Esses manuais possuem a intenção de apresentar os fundamentos de uma ciência específica e resumir o estágio atual de seus conhecimentos, oferecendo, assim, tudo de que um cientista precisaria para começar a trabalhar. Para um observador da época, tudo indicava que o futuro pertencia à cibernética. Entretanto, pouco a pouco, passou-se a falar cada vez menos desse movimento: talvez estivessem todos preocupados com os movimentos sociais e históricos da época ou talvez a revolução cibernética tivesse demorado demais; o fato é que, no final da década de 70, a nova ciência evocava um ar antiquado. Nesse período de 1970-80, surgiam inúmeras novas estrelas no céu da ciência: teoria dos sistemas, Inteligência Artificial, teoria da complexidade, ciência cognitiva, auto-organização, autopoiésis, dentre outras. Somos tentados a pensar que a história desse período pré-paradigmatico é marcada por revoluções a cada minuto. Em meio a tantas estrelas, talvez a cibernética tenha caído no esquecimento e tenha sido apenas uma estrela ofuscada pelo brilho de tantas outras. Parte de nossa hipótese sugere que o que chamamos de ciência cognitiva é proveniente do movimento da cibernética. No entanto, o suposto parentesco que propomos sofre de uma resistência, por parte dos descendentes, em admiti-lo. A ciência cognitiva parece possuir certa aversão à cibernética. A fase da cibernética seguiu majoritariamente uma tendência marcada pelo fascínio às modelagens algorítmicas. Este encanto pressupôs que os processos cognitivos poderiam ser reproduzidos, desconsiderando aspectos como o biológico ou o corpóreo. Nos anos seguintes ao evento da cibernética, a ciência cognitiva passou a compreender a simulação dos processos cognitivos em termos de meios e fins, conforme a manipulação de regras e símbolos digitais. Segundo Pinto (2007, p. 14): Em clara oposição às ideias relacionais da cibernética, a abordagem simbólica foca-se num produto final (resolução de um problema), ignorando por completo o processo. O processo cognitivo resume-se, portanto, ao processamento sequencial da informação de entrada e a consequente transformação desta informação numa saída, que é a resposta do sistema ou resolução do problema 63 A partir da perspectiva de Kuhn (2011a), podemos observar que os temas acima citados estão relacionados com um esforço de consolidação de um paradigma, em especial, o paradigma cibernético, e que o mesmo oferece uma série de princípios metodológicos e conceituais, os quais necessitam de uma coesão interna, como, por exemplo, os modelos sobre a percepção humana, a maneira como ocorre o armazenamento e processamento de informação pelo cérebro. Além dos princípios metodológicos, a cibernética contou igualmente com exemplares, como por exemplo, o servomecanismo do atirador que abordamos anteriormente, para guiar os futuros cientistas que dispunham de noções sobre as unidades de processamento de informação, memória, percepção e um vocabulário próprio fecundo, que envolvia os conceitos de feedback, predição e processamento. Entretanto, graças a desavenças internas e a um momento histórico de grande efervescência, observamos que o sonhado paradigma cibernético jamais chegou a se concretizar, nesse primeiro momento, de sorte parece não ter passado da fase de pré-ciência. No próximo capítulo, nos debruçaremos sobre os anos seguintes a esse momento da história da ciência cognitiva, buscando avaliar em que medida a ciência cognitiva conseguiu se desvencilhar da cibernética e constituir o seu próprio paradigma científico. 64 CAPÍTULO 3 O ESTATUTO CIENTÍFICO DA CIÊNCIA COGNITIVA EM SUA FASE INICIAL: CONTEXTO EPISTÊMICO 3.1 Apresentação Neste capítulo, expomos o momento de passagem da cibernética para a ciência cognitiva e investigamos os novos elementos que caracterizam a sua comunidade científica. Ao longo da seção 3.2, apresentamos uma visão histórica sobre os primeiros anos da ciência cognitiva, após o fim da cibernética. Na seção 3.3, a fim de evidenciar as bases metodológicas da comunidade científica da ciência cognitiva, realizamos uma definição geral das noções de modelo e representação. Na seção 3.4, explicitamos as noções-base do que consideramos como sendo a primeira grande concepção candidata a ser o paradigma da ciência cognitiva, o cognitivismo. Na seção 3.5, examinamos as bases de outra grande concepção, o conexionismo. 3.2 A Ciência Cognitiva após a Cibernética Existe um consenso, acerca da história da ciência cognitiva, de que a mesma foi reconhecida oficialmente em 1956. De acordo com Miller (1979), a comunidade científica da ciência cognitiva ganhou vida durante o Simpósio sobre Teoria da Informação realizado no MIT, de 10 a 12 de setembro de 1956. O segundo dia desse encontro se destaca, para Miller (1979), graças à exposição de alguns trabalhos de grande impacto. O primeiro, apresentado por Allen Newell e Herbert Simon, intitulado Logic Theory Machine, focalizava a primeira prova completa de um teorema executado em uma máquina computadora. O segundo trabalho de grande impacto foi apresentado pelo linguista Noam Chomsky, intitulado Three Models of Language. Neste texto, Chomsky mostra que um modelo de linguagem derivado da teoria da informação, proposto por Shannon e Weaver (1949), não poderia, de forma alguma, ser aplicado com êxito à "linguagem natural". Assinala Gardner (1996, p. 44) sobre as considerações de Miller: Saí do simpósio com uma forte convicção, mais intuitiva que racional, de que a psicologia experimental humana, a linguística teórica e a simulação computacional de processos cognitivos eram todas partes de um todo maior, e de que o futuro veria uma crescente elaboração e coordenação de seus interesses comuns [...] Eu venho trabalhando por uma ciência cognitiva há aproximadamente vinte anos, tendo começado antes de saber como chamála. 65 Para Gardner (1996), em meados da década de 1950, os neurocientistas estavam começando a registrar impulsos de neurônios individuais do sistema nervoso. No MIT, a equipe de pesquisa de McCulloch, dirigida pelos neurofisiologistas Jerome Lettvin e Humberto Maturana, havia feito um registro do funcionamento da retina de uma rã. Eles haviam conseguido mostrar que os neurônios são sensíveis a formas extremamente específicas de informação, como, por exemplo, pequenos pontos escuros semelhantes a insetos, os quais se moviam através de seu campo perceptivo. Dentre outras descobertas nos ramos da antropologia e da neurociência, ainda em 1956, um grupo de cientistas, com formação em matemática e lógica e interessados nos problemas dos computadores, reuniu-se no Dartmouth College. Nessa reunião, estava concentrada a maior parte dos cientistas que trabalhavam com o que veio a ser denominado "Inteligência Artificial", inclusive os que geralmente são considerados os seus pais fundadores: John McCarthy, Marvin Minsky, Allen Newell, Noam Chomsky e Herbert Simon. Durante o encontro, foram examinadas ideias para programas que iriam solucionar problemas, reconhecer padrões, raciocinar logicamente, tendo sido determinadas as principais questões a serem debatidas nos anos seguintes. A despeito de não ter emergido nenhuma síntese dessas discussões, os participantes pareciam ter estabelecido uma espécie de grupo permanente ou comunidade científica, centrada nos campi do MIT, de Stanford e de CarnegieMellon (GARDNER, 1996). Ressalta Varela (1991, p. 29): A principal ideia que viria a impor-se no decorrer desta conferência foi o fato de a inteligência (inclusive a inteligência humana) se aproximar de tal forma daquilo que, intrinsecamente, é um computador e que a cognição pode ser definida pela computação de representações simbólicas. A década de 1960 foi caracterizada pelo afloramento das sementes plantadas nos anos de 1950. Fontes governamentais e privadas forneceram apoio financeiro significativo para o desenvolvimento da ciência cognitiva. Duas das figuras principais para a consolidação dessa nova área, Jerome Bruner e George Miller, fundaram, em Harvard, o Centro de Estudos Cognitivos. Embora os projetos e produtos reais desse centro provavelmente não tenham sido indispensáveis para a vida da área, durante aquele período, praticamente não havia nenhuma pessoa jovem que trabalhasse na área que não tivesse sido influenciada pela presença do Centro, pelas ideias que eram debatidas por lá e pela forma como elas eram implementadas em pesquisas subsequentes. De acordo com Gardner (1996), George Miller, seu colega neurocientista Karl Pribram e Eugene Galanter abriram a década com um livro de grande impacto na psicologia e áreas relacionadas, intitulado Plans and the Structure of Behavior. 66 Nele, os autores apresentam um enfoque cibernético do comportamento, em termos de ações, feedback e reajustes das ações conforme o feedback. Em linhas gerais, esses três cientistas propunham legitimar, na prática, o abandono da discussão de estímulos e respostas, em favor de modelos mais abertos, capazes de interações. No decorrer da mesma década, surgiam inúmeros "exemplares" (KUHN, 2011a) decorrentes dos últimos desenvolvimentos. Estes recentes livros e outras publicações serviram como base para a formação dos novos cientistas cognitivos que, por sua vez, consolidavam a nova comunidade científica. Segundo Gardner (1996), no final de 1969, já era possível pensar em uma abordagem de ciência cognitiva como um todo. Quando o nível de atividade em um campo chega a esse ponto, com uma comunidade aparentemente entusiasmada em torno dos avanços iminentes, geralmente se tem a consolidação de algum tipo de organização. Em 1970, ocorreram uma série de eventos que, para a ciência cognitiva, ocasionaram grandes avanços, através de uma fundação privada sediada em Nova York – a Fundação Alfred P. Sloan. A Fundação Sloan, segundo Gardner (1996), financiava o que ela denominava "Programas Particulares", nos quais investia um montante considerável de dinheiro, em uma área, por um período de alguns anos, esperando com isso estimular algum progresso significativo no desenvolvimento da área de pesquisa. No início de 1970, um Programa Particular havia sido implementado nas neurociências. Após esse evento, a Fundação Sloan estava à procura de um campo análogo, de preferência dentro das ciências, no qual pudesse investir uma quantidade semelhante recursos. No ano de 1975, a fundação estava estudando o apoio a programas de vários campos e o Programa Particular na ciência cognitiva era o principal deles. No ano seguinte, foram promovidas algumas reuniões, nas quais os maiores cientistas cognitivos expuseram suas ideias. Embora a ciência cognitiva não estivesse tão madura quanto os neurocientistas da época acreditavam, apontavam os dirigentes da Fundação Sloan: [...] ainda assim, há muitas indicações, confirmadas pelas autoridades envolvidas nas investigações iniciais, de que muitas áreas das ciências cognitivas estão convergindo, e, além disto, há uma necessidade igualmente importante de desenvolver linhas de comunicação de uma área a outra, a fim de que instrumentos e técnicas de pesquisa possam ser compartilhados na construção de um corpo de conhecimento teórico [...] (GARDNER, 1996, p. 50). Existe uma semelhança entre os estímulos fornecidos pela Fundação Macy à geração da cibernética e a iniciativa que a Fundação Sloan teve, com a ciência cognitiva. Depois de deliberado, a Fundação Sloan decidiu dar início a um programa de cinco a sete anos, 67 envolvendo o investimento de até quinze milhões de dólares, o qual acabou sendo elevado para vinte milhões de dólares. Na opinião de Gardner (1996), dentro de pouco tempo, o periódico Cognitive Science foi fundado e seu primeiro número, publicado em janeiro de 1977; logo em seguida, em 1979, uma sociedade de mesmo nome foi criada. A sociedade promoveu o seu primeiro encontro anual, em La Jolla, Califórnia, em agosto de 1979. Com o passar do tempo, programas, cursos e boletins informativos estavam espalhados por todo o mundo. No entanto, havia discordâncias acerca do que tratava o campo da ciência cognitiva, quem a atendia, quem a ameaçava e em que direção ela deveria seguir. Com base nessas controvérsias, a fundação solicitou um relatório, em 1978, com o objetivo de explicitar tais questões. Esse Relatório do Estado de Arte [State of the Art Report] foi redigido pelos principais estudiosos do campo, com a colaboração de vários conselheiros. Os autores elaboraram uma figura com as inter-relações entre os seis campos constituintes, chamada de hexágono cognitivo: Figura 1 – Hexágono Cognitivo Fonte: GARDNER, 1996, p. 52. Através do uso de linhas cheias e pontilhadas, foi realizado um esforço para indicar as conexões entre os campos que atuavam na ciência cognitiva e as possíveis conexões. A imagem e o relatório pretendiam disponibilizar um exame das principais linhas de pesquisa da ciência cognitiva. No entanto, a comunidade, de modo geral, teve uma recepção extremamente negativa ao relatório. Segundo Gardner (1996), a reação negativa foi resultado 68 do fato de que cada leitor teve uma interpretação do documento sob o prisma de suas próprias disciplinas. Naquele período, aparentemente não havia um paradigma de pesquisa estabelecido, de maneira que os cientistas cognitivos tendiam às suas próprias inspirações. Em virtude desses fatores, provavelmente, não era possível, em 1978, escrever um documento que obtivesse total apoio de uma comunidade científica. Em primeira análise, parece que, no princípio da história dessa área, muitas disciplinas compunham a base teórica daquilo que até o momento era chamado de ciência cognitiva. Nossa hipótese é de que aquilo que chamamos de ciência cognitiva é decorrente do movimento da cibernética e que, conforme aponta Gardner (1996), a ciência cognitiva não dispunha de um paradigma bem estabelecido, em seus momentos iniciais. Concluímos que as disciplinas que constituem o momento de transição entre a cibernética e a ciência cognitiva não refletem necessariamente um modelo bem fixado de uma comunidade científica e, por sua vez, esse primeiro momento revela o ambiente das ciências cognitivas que era um conjunto de disciplinas unidas, com suas especialidades e com o objetivo de investigar as questões atreladas à cognição. Essa comunidade talvez não fosse muito integrada, como ocorre tipicamente em sub-áreas das ciências naturais. A partir da perspectiva epistemológica de Kuhn (2011a), observamos que, nestes primeiros momentos, a ciência cognitiva dispunha de uma dinâmica própria que visava as aspirações de cada pesquisador ou grupo de pesquisadores. Havia certa discordância entre os primeiros membros oriunda da própria metodologia presente desde o período das conferências Macy. Boa parte dos cientistas cognitivos visava o progresso da comunidade científica a partir das especificidades de suas áreas de pesquisas. Assim, por exemplo, os neurocientistas estavam muito mais preocupados com as estruturas dos neurônios e com os processos e relações neuronais do que com os aspectos fundamentalmente abstratos, subjacentes ao exame da cognição. O desenvolvimento disforme da pretensa comunidade científica suscitou a produção de exemplares que careciam de coerência com as demais estruturas desenvolvidas simultaneamente. Por sua vez, haviam exemplares que diziam tratar da ciência cognitiva, mas que não abarcavam as elucidações propostas pela antropologia, os estudos desenvolvidos pela linguística ou mesmo compartilhavam dos mesmos pressupostos, sejam eles metafísicos, filosóficos. Nem todos, por exemplo, concordavam com a perspectiva funcionalista no tratamento dos processos cognitivos. Nesta seção, abordamos os aspectos históricos fundadores da ciência cognitiva, após o movimento da cibernética. Sugerimos que, em seus primeiros momentos, a ciência cognitiva 69 não dispunha de um paradigma dominante. Pois, havia uma carência de uma comunidade científica coesa. Assim, os diversos campos da ciência cognitiva se preocupavam com a construção do seu próprio corpo de fundamentos. Na próxima seção, investigamos alguns conceitos da ciência cognitiva, a fim de, nas seções seguintes, averiguar se realmente não havia nenhum paradigma ou se existiam vários, de sorte que a pluralidade ocasionava essa dificuldade, durante a consolidação de sua comunidade científica. 3.3 Modelos e Representações na Ciência Cognitiva Uma das características centrais da ciência cognitiva, em seu início, é o uso de modelos explicativos do processo cognitivo e a ideia de que os processos cognitivos pressupõem representações mentais. Apesar de algumas dissidências, estes dois pontos são seguidos pela grande maioria dos primeiros cientistas cognitivos. As concepções dos modelos aparecem com certa constância, na atividade científica. Muitos campos, como, por exemplo, a física, a biologia e a astronomia, representam seus objetos a partir de esquemas capazes de instaurar uma relação de equivalência com os seus objetos de estudo. Assinala Dupuy (1996, p. 23): "O modelo científico é uma imitação humana da natureza que o cientista logo toma como "modelo" – no sentido comum desta". Os modelos permitem, até certo ponto, a partir das ferramentas matemáticas, um controle explicativo e preditivo capaz de sugerir novas experiências e formular hipóteses inéditas sobre um dado problema. Os modelos apresentam uma vida própria com uma dinâmica "desligada" e baseada na realidade. Em geral, os modelos são mais controláveis e mais fáceis de se trabalhar do que os fenômenos do mundo real, sendo um risco constante que o modelo se torne o objeto exclusivo de análise dos cientistas. Continua Dupuy (1996, p. 27): "Conhecer é produzir um modelo do fenômeno e efetuar sobre ele manipulações ordenadas. Todo conhecimento é reprodução, representação, repetição e simulação". Embora sejam utilizados com frequência, resta a questão de se saber quando efetivamente os modelos são realmente explicativos. Segundo Pessoa Junior (2016, p. 102): Pode-se dizer que um modelo matemático ou computacional "captura" a realidade? Tomemos como exemplo a simulação computacional de um furacão. O que está sendo capturado são as relações entre as partes da atmosfera, ou seja, a estrutura dinâmica da realidade. Com a informação armazenada no computador, podem-se prever aproximadamente os efeitos causais de situações reais e também de situações contrafactuais, como por exemplo, o que aconteceria com um avião que entrasse em um furacão. [...] 70 O modelo captura apenas a organização ou estrutura do sistema, e não os elementos em si, não a materialidade do sistema representado. Todo modelo tem sua materialidade própria, sejam os dispositivos e circuitos elétricos de um computador, sejam as estruturas celulares em um encéfalo (segundo a concepção materialista do problema mente-corpo). Mas se a materialidade do sistema que representa for distinta da do objeto que é representado, esta distinção estabelece um limite "qualitativo" para a modelagem Os modelos também apresentam problemas associados ao significado, os quais dizem respeito à forma como poderiam surgir e em que consistiriam os conteúdos ou significados de sistemas representacionais. Enfim, como tais sistemas poderiam referir-se às coisas do mundo, ou melhor, como sistemas poderiam exibir intencionalidade intrínseca (SEARLE, 1980). Os dois modelos mais utilizados na ciência cognitiva para simular e explicar os processos cognitivos são as máquinas do tipo Turing e as Redes Neurais Artificiais. Deles tratamos nas próximas seções, ao falarmos do cognitivismo e conexionismo. Na ciência cognitiva, a noção de representação está relacionada com os conceitos de internalista e externalista. De modo geral, segundo o internalismo, a mente estaria, de alguma forma, dentro do indivíduo, enquanto, no externalismo, a mente se encontraria, de algum modo, fora dele. Para os internalistas mais radicais, a mente interna existe independente do mundo externo e a mesma pode ser compreendida sem qualquer necessidade de recorrermos ao mundo externo. Na visão dos internalistas radicais, os estados mentais, como a dor, os sentimentos e as crenças seriam independentes do corpo. Nesse sentido, a mente seria capaz de instanciar estados como uma dor no braço, sem necessariamente ter um braço, tal como ocorre em alguns casos documentados pela medicina de "membros fantasmas". Putnam (1975) fornece um exemplo contrário aos internalistas radicais, pretendendo mostrar, com um exemplo fictício, chamado "Terra Gêmea", que os estados mentais não determinam, por exemplo, a referência ou os conteúdos do pensamento. O conteúdo é externo à mente. Na Terra Gêmea, existe uma cópia idêntica a todos os indivíduos de nosso planeta. Nossos clones agem, falam, pensam, acreditam e fazem tudo da mesma maneira que nós. Todas as nossas propriedades internas são idênticas. Nesse exemplo, a palavra "água" é usada para fazer referência à substância idêntica, em todos os sentidos, com aquela que possuímos na Terra original. Entretanto, existe uma particularidade da Terra Gêmea, no sentido de que o líquido chamado "água" não é descrito pela fórmula H2O, mas por um aglomerado de elementos que o autor descreve como XYZ. 71 Putnam (1975) procura mostrar, com esse exemplo, que os conceitos não são suficientes para determinar a referência do conteúdo e, embora nossos estados mentais sejam iguais, nós nos referimos a coisas distintas. Podemos notar que, quando eu e minha cópia falamos sobre "água", cada um de nós faz referência a um composto químico diferente. Boa parte dos internalistas acredita na existência de um elemento mediador entre o sujeito e o objeto de conhecimento, chamado representação mental. Para outros, que tendem a ser externalistas, a relação com o mundo ocorre de maneira direta. Essas duas vertentes são denominadas, respectivamente, representacionistas e não-representacionistas. Para os representacionistas, a representação funciona como uma ponte entre a mente e o mundo. A principal característica definidora da ciência cognitiva seria, por conseguinte, a ideia de simuladores, para que isso se efetive, as noções de representação e computação são fundamentais, durante o processo de modelagem computacional, como salienta Fodor (1975, p. 31, tradução nossa 26): "Sem representação, não há computação; sem computação, não há modelagem". O que caracteriza uma representação é sua propriedade de ser algo que pode se colocar no lugar de "outra coisa" (como um mapa, por exemplo). No contexto da ciência cognitiva, aos sistemas a que se atribuem representações (os quais podem ser artefatos tanto da Inteligência Artificial quanto conexionistas), pode-se enfatizar que as representações seriam dotadas de conteúdo que pode variar, dependendo da abordagem, e visa, sobretudo, a guiar o comportamento. Haselager (2004, 106) assevera: As duas características mais importantes das representações são que elas se colocam no lugar de algo e que o sistema usa as representações com o objetivo de guiar seu comportamento. De acordo com a ciência cognitiva tradicional, então, as representações desempenham um duplo papel: carregam um conteúdo e causam o comportamento. Mesmo se a ciência cognitiva clássica e o conexionismo discordam a respeito do formato das representações, eles têm esse pressuposto em comum. Segundo a abordagem de Kuhn (2011a), o uso das representações implica um compromisso coletivo da comunidade científica da ciência cognitiva. Do ponto de vista da matriz disciplinar, o uso das representações é compartilhado pela comunidade de pesquisadores, todavia, a sua aplicação pode ser relativa a cada perspectiva presente no paradigma geral. 26 No original: "Without representation, there is no computation; without computing, there is no modeling". 72 As representações são concebidas como um modo abstrato de reter conhecimentos sobre o mundo, por meio de símbolos, esquemas, imagens, ideias. A representação mental é uma espécie de imagem mental de algum objeto ou fenômeno do mundo. Os representacionistas afirmam que podemos reconhecer os objetos do mundo, porque deles possuímos algumas representações, em nossa mente. A natureza das representações também é cercada de problemas. Seriam estas baseadas em símbolos bem estruturados ligados a uma rígida articulação sintática e semântica (cognitivismo)? Ou seriam elas representações distribuídas, fundadas em pesos ajustados mediante treinamento (conexionismo)? Seriam ambas? De mais algum tipo além dessas? Sem pretendermos dar conta desse problema da ciência cognitiva, podemos sublinhar, segundo Thagard (1998), apenas que as estruturas representacionais da Inteligência Artificial, bem como das redes conexionistas, são complementares, ao invés de competitivas. A operacionalidade, por sua vez, sofre da dificuldade em operacionalização do próprio conceito de representação, na ciência cognitiva. Ou seja, em qualquer ciência os conceitos devem ser aplicáveis, e em ciência cognitiva, não parece ser claro a quais sistemas deveria se aplicar a noção de representação. Além da circunstância de que o próprio observador pode gerar problemas, esse problema é ilustrado, segundo Haselager (2004), pelo seguinte exemplo: ao observar a complexidade do caminho de uma formiga, na areia da praia, um cientista cognitivo poderia ser tentado a considerar a complexidade da trilha como efeito de representações mentais "na cabeça" da formiga. Imagina-se que o cientista observa representações, quando possivelmente isso é desnecessário. Pois há algo no sistema nervoso da formiga que podemos chamar de representação do ambiente, mas que provavelmente não é uma imagem espacial. A relação entre mediação e local de ação da mente cria uma série de possibilidades que nos vão ser úteis, nas próximas seções. Ao tratarmos do cognitivismo e conexionismo, fazemos referência a uma tendência de seus adeptos em serem representacionistas, ou seja, eles acreditam na existência de algo mediador entre o programa e seu ambiente externo. Para eles, a representação consiste em um conjunto de símbolos adquiridos, a partir de alguma mediação, como sensores, os quais são capazes de expressar algo que está acontecendo com eles mesmos ou com o ambiente externo. 3.4 Cognitivismo No decorrer de 1956 ocorreu o afloramento da primeira grande corrente da ciência cognitiva: o cognitivismo. O cognitivismo, durante os primeiros momentos da ciência 73 cognitiva, contou com o apoio de instituições de prestígio, revistas científicas e com a aplicação do programa em tecnologias. Varela, Thompson e Rosch (1991) assinalam que, nesse momento, o cognitivismo podia ser considerado como o centro ou núcleo da ciência cognitiva. Na visão de Varela, Thompson e Rosch (1991, p. 30) a ferramenta mais importante do cognitivismo é a metáfora do computador digital: [...] cognitivismo consiste na hipótese de que a cognição – incluindo a cognição humana – é a manipulação de símbolos nos moldes daquilo que é executado pelos computadores digitais. Por outras palavras, a cognição é uma representação mental: a mente é definida como operando em termos de manipulação de símbolos que representam características do mundo ou representam o mundo como sendo de um determinado modo. A noção do funcionamento mental comparado ao funcionamento computacional forneceu um meio muito poderoso para se abordar a cognição. Segundo Varela (1991), o argumento cognitivista concebe que o comportamento inteligente pressupõe a capacidade de representar o mundo de alguma forma. Dessa maneira, o comportamento cognitivo só pode ser explicitado partindo-se do princípio de que os sistemas atuam representando as mais diversas situações do mundo. Os cognitivistas não defendem que, se tivéssemos de abrir a cabeça de alguém e olhar o cérebro, encontraríamos símbolos sendo manipulados. Embora o nível simbólico seja fisicamente realizado, o mesmo não é redutível ao nível físico. Desse modo, os mesmos símbolos podem ser implementados em numerosas formas físicas capazes de instanciá-los. O cognitivismo defende, de acordo com Varela, Thompson e Rosch (1991), um nível simbólico irredutível e distinto na explicação da cognição. Uma vez que os símbolos são elementos semânticos, os cognitivistas supõem um terceiro nível que assinala o semântico e o representacional. Desse modo, um dos problemas principais do cognitivismo está na correlação entre os estados intencionais, como as crenças e os desejos, com as mudanças físicas do agente. Em linhas gerais, se os estados intencionais possuem propriedades causais sobre os estados físicos, é importante mostrar em que medidas tais estados são capazes de determinar o comportamento. A noção de computação simbólica, na perspectiva cognitivista, pressupõe que os símbolos têm uma realidade simultaneamente física e semântica. O cognitivismo manifestou-se de maneira bem efetiva, no ambiente da Inteligência Artificial, causando grande impacto teórico nas aplicações tecnológicas, tal como na robótica. Essa vertente tende a ser representacionista, visto que seus adeptos pressupõem a existência de algum elemento mediador entre o programa e o ambiente externo. Seja por 74 intermédio de sensores, seja por outros mecanismos, quando a máquina recebe algum símbolo, quer através do meio ambiente, quer por ela mesma, é capaz de o reconhecer e fazer referência à sua representação. Os modelos do cognitivismo para a explicação dos processos cognitivos são as máquinas do tipo Turing. Tais máquinas são sistemas capazes de seguir instruções, uma de cada vez, computando funções. As máquinas de Turing são geralmente distinguidas entre dois tipos, as máquinas finitas e infinitas. Ambas possuem as mesmas especificações técnicas, diferenciando basicamente apenas entre suas capacidades de armazenamento de dados. Assim, as máquinas finitas são aquelas que apresentam memória limitada. As infinitas, por sua vez, possuem memória potencialmente infinita, sendo capazes de computar funções mais complexas, tais como operações aritméticas. Turing (1936, p. 231) assim apresenta a máquina: Podemos comparar um homem no processo de computação de um número real [uma função] com uma máquina que é apenas capaz de um número finito de condições q1, q2, ... , qR chamadas 'm–configurações' [estados internos]. À máquina pertence uma 'fita' (análoga a um papel) que a percorre, e é dividida em seções (chamadas quadrados) cada uma capaz de armazenar um 'símbolo'. Em cada momento há apenas um quadrado, o r– ésimo, guardando o símbolo Ø(r) que está 'na máquina', chamado 'quadrado lido'. O símbolo sobre ele é denominado o 'símbolo lido', o único com o qual a máquina está, por assim dizer, 'diretamente ligada'. Contudo, ao alterar uma m– configuração, a máquina pode efetivamente relembrar algum dos símbolos que ela 'viu' (escaneou) anteriormente. Seu comportamento possível em qualquer momento é determinado pela m–configuração qn e o símbolo lido 124 Ø(r). Este par será chamado de 'configuração', que determina o possível comportamento da máquina. Em algumas das configurações nas quais o quadrado lido está vazio (não carrega nenhum símbolo), a máquina escreve sobre ele um novo símbolo: em outras configurações ela apaga o símbolo lido. Pode ainda mudar o quadrado que está sendo lido, mas somente deslocando-se um lugar a direita ou a esquerda. Em adição a qualquer uma destas operações, a m–configuração pode ser mudada [...] Se para cada estágio o movimento da máquina (no sentido acima explicitado) é completamente determinado pela configuração, podemos chamá-la de uma máquina automática [...] Se uma máquina automática imprime dois tipos de símbolos, dos quais o primeiro tipo (chamado figuras) consiste inteiramente de 0 e 1, (os outros sendo chamados símbolos do segundo tipo), então ela é uma máquina computadora. (Tradução nossa) 27 27 No original: "We may compare a man in the process of computing a real number to ;i machine which is only capable of a finite number of conditions q1: q2. .... qI; which will be called " mconfigurations ". The machine is supplied with a "tape " (the analogue of paper) running through it, and divided into sections (called "squares") each capable of bearing a "symbol". At any moment there is just one square, say the r-th, bearing the symbol (r) which is "in the machine". We may call this square the "scanned square ". The symbol on the scanned square may be called the " scanned symbol". The "scanned symbol" is the only one of which the machine is, so to speak, "directly aware". However, by altering its m-configuration the machine can effectively remember some of the symbols 75 A máquina de Turing é constituída basicamente, por um conjunto finito S de símbolos, um conjunto finito Q de estados internos, uma fita de memória potencialmente infinita, um conjunto P finito de instruções e um agente que realiza as instruções. Desta maneira, o funcionamento da máquina é determinado conforme as instruções compostas no seu interior, visando realizar alguma função computável. A estrutura das instruções é a seguinte: "q1 − Sj − Sk − D − q2".' q1' representa o estado atual da máquina, 'Sj' representa o símbolo lido da máquina 'Sk ' representa o novo símbolo da máquina ,'D','E' e 'I' representam a direção da cabeça de leitura da máquina (direita, esquerda ou imóvel),'q2' representa o novo estado da máquina. Como descreve Turing (1950), para cada estado da máquina existem instruções fundamentais para iniciar a computação das funções. Desta maneira, é fundamental que a memória da máquina seja potencialmente infinita. A figura abaixo ilustra a estrutura da máquina de Turing. Figura 2 – Estrutura geral da Máquina de Turing Fonte: ALVES, 1999, p. 61. which it has "seen" (scanned) previously. The possible behaviour of the machine at any moment is determined by the ra-configuration qn and the scanned symbol. The machine may also change the square which is being scanned, but only by shifting it one place to right or left. In addition to any of these operations the m-configuration may be changed. [...] If at each stage the motion of a machine (in the sense of § 1) is completely determined by the configuration, we shall call the machine an "automatic machine" [...]If an a-machine prints two kinds of symbols, of which the first kind (called figures) consists entirely of 0 and 1 (the others being called symbols of the second kind), then the machine will be called a computing machine". 76 A máquina possui uma fita dividida em quadrados, cada um capaz de armazenar um símbolo. Em cada momento a máquina manipula apenas um único quadrado, podendo apagalo, inserir um novo símbolo ou deixa-lo inalterado. Conforme as configurações da máquina, ela pode se "recordar" de um símbolo anteriormente lido. O seu movimento é determinado pelas configurações expressas pelos estados internos qn e o símbolo lido. O par constituído do símbolo e do estado interno é nomeado configuração. Abaixo, apresentamos um exemplo particular de uma máquina de Turing, denominada somadora unária. Ela soma dois números M e N na notação unária, ou seja, com base 1, no qual 0 = 0, 1 = 1, 2 = 11, 3 = 111, etc.. Figura 3 Soma entre M + N, conforme o modelo da máquina de Turing Fonte: ALVES, 1999, p. 64. Conforme Alves (1999), a computação da soma inicia-se a partir do estado 0, lendo o primeiro símbolo à esquerda de M. Caso M seja 0, a máquina move o leitor para a direita e vai ao estado 2, como indicado pela primeira instrução da esquerda para a direita do programa acima. Após isso, substitui A por 0, move o leitor para a direita, como dito na quinta instrução. O leitor irá ficar no estado dois lendo 1 ou 0 e nenhuma das instruções de seu programa possui 2–0 ou 2–1 como configuração. A resposta, neste caso, será o próprio N. Caso M não seja 0, a máquina substitui o primeiro símbolo de M por 0 e vai à direita, indo ao estado 1, como manda a segunda instrução. Assim, o leitor busca a letra A, seguindo a terceira instrução. Substitui-se esta letra pelo número 1. Isso é o que manda a quarta instrução. A resposta será a sequência de números 1's que restou na fita. A máquina de Turing (1950) tem o objetivo de computar funções. Conforme estas são cada vez mais complexas, também são necessárias configurações mais complexas. Turing (1950) formula as primeiras discussões envolvendo as aplicações da informação a uma teoria adequada que pretende analisar a inteligência e o pensamento, 77 segundo uma concepção mecanicista formal. A sua proposta consiste na defesa do pressuposto de que "[...] pensar é calcular" (TURING, 1950, p. 436). Essa tese parte do pressuposto de que, se aceitarmos que a atividade de pensar é, preponderantemente, constituída pela manipulação eficiente de informação/dados, por meio de regras lógicas, poderíamos sustentar que computadores também seriam capazes de pensar, se fossem capazes de tal manipulação. A tese de que "pensar é calcular" está pautada em um famoso jogo proposto por ele, chamado "jogo de imitação", ou teste de Turing. O jogo, assevera Turing (1950, p. 433): É jogado por três pessoas: um homem (A), uma mulher (B), e um interrogador (C), que pode ser de qualquer dos sexos. O interrogador permanece num quarto, separado dos outros dois. O objetivo do jogo, para o interrogador, é determinar, em relação aos outros dois, qual o homem e qual a mulher. Ele os conhece por rótulos X e Y e no fim do jogo dirá ou "X é A e Y é B", ou "X é B e Y é A". (Tradução nossa) 28 O objetivo do homem é, justamente, tentar induzir o interrogador a fazer uma identificação errada. Já o objetivo da mulher é ajudar o interrogador a fazer a escolha certa. Sua melhor estratégia é possivelmente responder a todas as perguntas de maneira correta. Como ressalta Turing (1950, p. 433, tradução nossa 29), ela poderia dizer coisas como: "Eu sou a mulher, não escute ele!". Mas isso seria inútil, porque o homem também poderia dar uma resposta semelhante. O objetivo do jogo é avaliar em que medida, através de perguntas e respostas, ao substituir um dos interlocutores por uma máquina, ela seria capaz de enganar um interrogador. Ao final, se a máquina fosse capaz de responder às perguntas do interrogador e conseguisse confundi-lo, de sorte que ele julgue que as respostas foram dadas por um ser humano, então ela passaria no teste, ou seja, ela teria capacidade de pensar. Turing (1950) destaca que poderíamos substituir a pergunta "Podem as máquinas pensar? " por "Existem computadores digitais imagináveis com bom desempenho no jogo de imitação? " Segundo sua concepção, ambas as perguntas equivalem à ideia de que um computador digital, programado de forma adequada, pode ser preparado para desempenhar satisfatoriamente o papel do jogador A, no jogo de imitação. 28 No original: "It is played with three people, a man (A), a woman (B), and an interrogator (C) who may be of either sex. The interrogator stays in a room apart front the other two. The object of the game for the interrogator is to determine which of the other two is the man and which is the woman. He knows them by labels X and Y, and at the end of the game he says either "X is A and Y is B" or "X is B and Y is A"". 29 No original: "I am the woman, don't listen to him!" 78 A máquina de Turing é um modelo mecânico capaz de manipular símbolos segundo regras especificas. Em cada instante há apenas um símbolo sendo manipulado. A máquina, a partir da sua configuração algorítmica, pode recuperar símbolos lidos anteriormente. Seus procedimentos possíveis são resultantes da relação entre os símbolos lidos e suas configurações. A máquina computa funções, de modo que, fornecidos os elementos do domínio de uma função desejada, ela encontrará uma resposta adequada, se bem construída, de acordo com os padrões preestabelecidos no momento de sua configuração. Para Putnam (1960), o desenvolvimento das noções da máquina de Turing e a invenção do computador ajudaram a resolver ou a dissolver o clássico problema da relação entre mente e corpo. O respectivo problema clássico faz referência ao fato de que os fenômenos mentais parecem ser qualitativamente e substancialmente diferentes dos corpos que parecem instanciá-los. Na concepção funcionalista, os diferentes programas, em computadores iguais ou diferentes, poderiam ser executados em inúmeras estruturas. De acordo com Leclerc (2018), Existem também várias outras posturas que afirmam a irredutibilidade do mental ao físico, mas sem voltar para o dualismo das substâncias: é o caso do funcionalismo ou teoria computacional da mente, a tese de que a mente é algo como um programada complexo de computador enquanto o cérebro seria o hardware processando a informação de acordo com o programa que ele implementa. O que importa, para os funcionalistas, não é do que são feitos os estados mentais, e sim o que eles fazem, quais as funções que eles desempenham na vida mental do sujeito. [Negrito e itálicos no original] Conforme lembra Vicentini (2001, p. 227) os funcionalistas abordam os estados mentais como funcionais, em termos das entradas informacionais ou inputs e da atividade funcional que os converte em informações de saída ou output. Assim, as operações lógicas (software) poderiam ser descritas independentemente do hardware específico no qual ocasionalmente houvessem sido instanciadas. A analogia dos computadores com o sistema humano sugere que o cérebro humano corresponde ao hardware, enquanto os padrões de pensamento fazem referência ao software. Além disso, os seres humanos, não menos que os computadores, armazenam programas, e as mesmas linguagens simbólicas podem ser invocadas para descrever programas de ambas as entidades. Na próxima seção, focalizamos outra perspectiva concorrente ao cognitivismo. Também com uma comunidade de seguidores, o conexionismo é uma resposta às atividades desenvolvidas pelo cognitivismo. 79 3.5 Conexionismo Os modelos conexionistas, habitualmente chamados de Redes Neurais Artificiais, distribuem o processamento da informação por operações que se estendem por uma rede completa de componentes, possibilitando a emergência de propriedades globais, diferentemente do processamento localizado, próprio do programa cognitivista exposto anteriormente. Os conexionistas propuseram essa nova ideia sobre a representação e a computação, inspirados na analogia da estimulação dos neurônios e da ativação difusa. Ao passo que a proposta cognitivista tem como base um processamento de informação em série, a proposta conexionista trabalha com um processamento de informação em paralelo e distribuído, possibilitando fazer mais de uma operação ao mesmo tempo. Os modelos conexionistas têm como objetivo funcionar de maneira semelhante aos processos cognitivos e psicológicos, tendo como base a arquitetura do cérebro. Para os propositores desses modelos, há esperança de que seja possível oferecer descrições mecanicistas suficientemente acuradas para certos fenômenos da cognição humana, especialmente associados à percepção e reconhecimento de padrões. A perspectiva conexionista consiste na ideia de que a cognição resulta do processamento coletivo feito pelas várias unidades simples que compõem uma rede neural. Destacam Rumelhart e McClelland (1986, p. 10): Esses modelos [conexionistas] assumem que o processamento de informação ocorre pela interação de um grande número de elementos processadores simples chamados de unidades, cada um enviando sinais excitatórios e inibitórios para os outros. (Tradução nossa) 30 Como a máquina de Turing, o modelo conexionista, com algumas ressalvas, também é um sistema processador de informações. Diferentemente do modelo da máquina de Turing apresentada anteriormente, o objetivo não é construir um programa capaz de simular a cognição de um modo algorítmico, seguindo regras lógicas durante a manipulação de símbolos. O objetivo do modelo conexionista é fundamentar uma simulação a partir da base de conexões entre nódulos. Como os cognitivistas, grande parte dos conexionistas tendem a ser representacionistas e internalistas. Diferentemente dos cognitivistas, porém, os conexionistas 30 No original: "These models assume that information processing takes place through the interactions of a large n umber of simple processing elements called units, each sending excitatory and inhibitory signals to other units". 80 não entendem a representação como um conjunto de símbolos, mas como um padrão de conectividade, ou seja, a partir da relação entre as partes básicas da rede. Assinala Gardner (1996, p. 414): Em vez de operações seriais ou computações sobre símbolos ou cadeias de símbolos, em vez de "executivos", "intérpretes" e "unidades centrais de controle", a abordagem PDP [processamento distribuído em paralelo, ou conexionismo] tipicamente postula milhares de conexões entre centenas de unidades (em princípio, a abordagem pode ser estendida a milhões ou mesmo bilhões de conexões). As redes resultantes apresentam a sinalização de excitações e inibições de uma unidade para outra. "Percepção", "ação" ou "pensamento" ocorrem em consequência da alteração das forças (ou pesos) das conexões entre estas unidades. Uma tarefa é concluída ou um input processado quando o sistema finalmente se "acomoda" ou "relaxa" (pelo menos provisoriamente) em um conjunto satisfatório de valores ou "estados estáveis" – em suma, em uma "solução". Segundo O'Reilly e Munakata (2000), o conexionismo consiste na ideia de que, para explicar a cognição, não basta apenas reduzi-la a elementos mais simples, como neurônios ou interconexões decorrentes de parâmetros excitatórios e inibitórios. É preciso explicar como a combinação destes elementos é capaz de produzir os processos cognitivos. Tal qual as engrenagens que interagem no interior de uma máquina, para se compreender o seu funcionamento é importante especificar como elas interagem para produzir fenômenos mais gerais. Assim, para se explicar processamento cognitivo, por exemplo, existe uma necessidade de se entender a forma como ocorre a interação entre o grande número de "elementos simples", chamados de neurônios, com a sua imensa quantidade de conexões, chamadas de conexões sinápticas. As Redes Neurais Artificiais são marcadas como uma das primeiras vertentes a produzir modelos do sistema nervoso com grau de precisão suficiente para poder se observar o comportamento emergente dos neurônios trabalhando em paralelo. Segundo Kovács (2006), a origem da teoria das Redes Neurais Artificiais está atrelada aos modelos matemáticos e aos modelos da engenharia, os quais tomam como base os neurônios biológicos. Ao longo da história de pesquisa dessa base biológica, observou-se a existência de manifestação elétrica entre os chamados neurônios biológicos. Nas últimas décadas, em decorrência do trabalho de vários pesquisadores, passou-se a compreender os neurônios biológicos como sendo os elementos processadores fundamentais do sistema nervoso, compostos de um grande número de entradas, chamadas de conexões sinápticas. Grosso modo, nos sistemas biológicos de neurônios, os sinais que chegam são pulsos elétricos, denominados impulsos nervosos, cujas sinapses correspondem a regiões eletroquímicas entre neurônios, por onde existe a troca de estímulos através de substâncias 81 conhecidas como neurotransmissores. O resultado dessa transferência de estímulos, dependendo do tipo de neurotransmissor, é classificado como uma conexão sináptica excitatória ou inibitória. Segundo McCulloch e Pitts (1965), o sistema nervoso é composto por uma rede de neurônios formados, dentre outras coisas, por um soma e um axônio. O soma do neurônio consiste no seu corpo celular e o axônio é o cilindro-eixo. As denominadas sinapses, são as conexões entre um axônio e a soma de outro neurônio. Cada neurônio pode receber inúmeros inputs de outros neurônios ou do ambiente externo. Entretanto, eles podem produzir apenas uma resposta que é transmitida a outros neurônios ou para o ambiente externo. A resposta do neurônio é enviada pelo axônio através das terminações axonais. As sinapses podem ser divididas entre inibitórias e excitatórias. As sinapses excitatórias auxiliam no disparo, enquanto que as inibitórias buscam diminuir a possibilidade do disparo ou mesmo inibi-los totalmente. As conexões entre neurônios no cérebro são feitas a partir da transmissão de substâncias químicas. Os neurônios sempre possuem uma espécie de limiar, cujo estimulo precisa ultrapassar para dar início a um impulso. Figura 4 – Ilustração do neurônio biológico Fonte: Adaptação de ARBIB, 2002, p. 4 A expressão Redes Neurais Artificiais parte da motivação de criar modelos capazes de simular as capacidades do cérebro humano de reconhecer, processar e generalizar dados e padrões. Em geral, esses modelos são utilizados em ambientes nos quais o fluxo de informação muda constantemente. Uma rede neural é um sistema computacional constituído a partir de centenas de unidades básicas que simulam as funções dos neurônios. Esses 82 elementos são interligados, trabalhando em paralelo, para desempenhar uma determinada tarefa. Essas redes de neurônios são responsáveis pelo que chamamos de pensamento, emoção e cognição. Dentre os principais pensadores do conexionismo, destacam-se McCulloch e Pitts (1965); para eles, os eventos mentais não deveriam ser compreendidos como subservientes a entidades abstratas. Haveria uma identificação entre mente e cérebro, cujas explicações dos fenômenos mentais seriam dadas em termos de sinapses e, estas, em termos lógicos. Dentre os primeiros modelos, McCulloch e Pitts (1943) conhecendo o potencial inibitório e excitatório dos neurônios, interpretaram que o seu funcionamento ocorria de maneira semelhante a um circuito binário. Neste modelo as conexões entre os neurônios, também chamados de nódulos, são realizadas através da transmissão de substâncias eletroquímicas que disparam informações para outros nódulos com base em seu limiar. Estes estímulos, na forma de sinapses, podem ser inibitórios ou excitatórios. Nas Redes Neurais Artificiais, o limiar e as sinapses são representados a partir de valores numéricos ao invés de substâncias eletroquímicas. Para McCulloch e Pitts (1943), o disparo dos nódulos pode ocorrer conforme apenas dois estados possíveis, ativado ou desativa. Nas Redes Neurais Artificiais, o disparo ocorre quando um certo valor numérico é atingido pelo nódulo e este valor é determinado por uma fórmula lógica, cujo disparo ocorre apenas se sua fórmula correspondente for verdadeira. O modelo geral dos nódulos parte de algumas pressuposições: Ni(t) significa que um nódulo ci dispara no tempo t. Ni é a ação de um neurônio ci – O tempo é discreto, pode ser representado por números naturais. Ele é determinado pelas sinapses entre os nódulos: cada sinapse representa um tempo. A solução de uma rede Ñ é um conjunto de sentenças que regulam o disparo dos nódulos dessa rede. Apresentadas essas pressuposições, podemos ter as seguintes relações: 83 Figura 5 Modelos de redes neurais básicas do sistema apresentado por McCulloch e Pitts Fonte: ALVES, 1999, p. 98. O número no interior de cada nódulo representa a ordem de sua execução, enquanto que seu limiar é sempre considerado como sendo 1. Na rede (b) ocorre o que chamamos de demora sináptica. Estas demoras ocorrem, pois, a velocidade do impulso produzido pelo disparo dos neurônios pode variar de acordo com o número de sinapses. Assim, expressões com n demoras sinápticas, expressas por 't n', exigem n nódulos à esquerda do respectivo para tornar o seu disparo equivalente ao valor de verdade de sua proposição lógica. A ideia principal defendida pelos pensadores conexionistas, em especial McCulloch, é a de que as Redes Neurais Artificias são capazes de simular atividades mentais e nervosas, como por exemplo, a sensação de frio ou calor. Nos sistemas formais, as Redes Neurais Artificias utilizam-se de receptores capazes de medir a temperatura. Sejam estes receptores adequados e capazes de transmitir a informação para outros nódulos com a capacidade de implicar a sensação de calor ou frio a partir de seu limiar, estipula-se que estas sensações podem ser simuladas por estas redes. Embora o modelo de McCulloch-Pitts tenha uma construção diferente da máquina de Turing, podemos notar algumas semelhanças entre ambos modelos. Para computar uma função, a rede deve ser construída de tal maneira que, apresentada alguma entrada, a resposta deve ser correta, caso contrário, deve-se produzir uma rede nova. A máquina de Turing e o modelo McCulloch-Pitts não apresentam regras de aprendizagem e, de certa forma, funcionam de maneira algorítmica. 84 Na década de 1950 surgiram novas Redes Neurais Artificiais mais sofisticadas. Uma das grandes vantagens destas redes é que elas podem reconhecer padrões, mesmo aqueles defeituosos com algum elemento faltando. Como os nódulos estão interligados com inúmeras camadas de outros nódulos, considera-se que cada um destes também recebe parte do padrão total de ativação. Essencialmente o reconhecimento de padrões para os conexionistas consiste em colocar valor de conexões sinápticas seja através da memorização, pela inserção de informações, por exemplos, por analogia ou por exploração e descoberta. Entretanto, não existe uma definição formal de Rede Neural Artificial como existe para a máquina de Turing. Cada rede tem sua particularidade e cada definição geral pode variar de modelo para modelo. Um dos objetivos fundamentais dos conexionistas posteriores ao modelo de McCulloch-Pitts era o de fazer com que as Redes Neurais Artificiais reconhecessem padrões. Existem dois tipos de padrão: o primeiro é caracterizado, segundo Caudill e Butler (1992) como uma propriedade emergente da dinâmica da interação entre os nódulos de uma rede. Os do segundo tipo, são aqueles que as redes são capazes de reconhecer, que são um conjunto de elementos que representam algum objeto. Na simulação de uma rede, um padrão é considerado como um conjunto de valores distribuídos metricamente. Desta forma, caso desejemos apresentar para uma rede uma letra do alfabeto, a respectiva letra seria representada como um conjunto de valores numéricos e cada nódulo trataria de representar um destes valores do padrão de entrada. Nem sempre a rede reconhece os padrões na primeira tentativa. A aprendizagem geralmente ocorre a partir presença ou ausência de um elemento capaz de testar o reconhecimento de padrões da rede. Uma realimentação explícita significa que em certos intervalos de tempo um sistema assinala os erros e acertos. No caso em que a realimentação não é explícita é o caso em que a aprendizagem ocorre sem a presença de um sistema externo. Costuma-se chamar estes dois casos de ensino supervisionado e não supervisionado. No caso da aprendizagem supervisionada, o sistema externo indica explicitamente o que é considerado como um comportamento bom ou ruim. Por exemplo, imaginemos um caso em que seja desejado o reconhecimento entre os números 1 e 2. Apresentam-se eles letras sucessivamente aos nódulos de entrada. Observa-se qual dos nódulos saída parece estar mais excitado. Se for o que convencionou a representar o número que foi apresentado, nada deve ser corrigido, caso contrário deve-se mudar os valores das conexões sinápticas a fim de se chegar ao resultado desejado. No caso da aprendizagem não supervisionada, ao invés de informar se a resposta dos nódulos foi correta ou não, usa-se um esquema capaz de induzir a rede a responder de maneira semelhante à regularidades apresentadas. A aprendizagem não 85 supervisionada é marcada pela presença de redes auto-organizadas, ou seja, elas possuem a capacidade de criar padrões de comportamento não previsíveis e decentralizados. Em alguns casos, em constante adaptação. Segundo Debrun (2009, p. 54): "[...] uma organização ou 'forma' é auto-organizada quando se produz a si própria". Entre os componentes gerais das Redes Neurais Artificiais podemos elencar a presença das unidades de processamento (nódulos ou neurônios artificiais), presença de estados de ativação destas unidades (limiar), funções de saída que determinam a resposta de cada nódulo, padrões de conectividade que definem a conexão entre os nódulos, regras de propagação, a presença de algum dispositivo capaz de representar o meio e os objetos, por fim, regras que permitam a aprendizagem. Embora apresentemos estas sete características gerais, destacamos que não há uma definição precisa sobre as Redes Neurais Artificiais, cada um possui as suas próprias particularidades, podendo ou não apresentar grande parte destas características. Dentre as redes posteriores ao modelo de McCulloch-Pitts, destacamos o modelo conexionista perceptron. Criado na década de 1950 por Rosenblatt (1962), seu criador afirmava que o perceptron não devia ser comparado ao modelo de McCulloch-Pitts, pois, esse modelo apresentava um funcionamento quase algorítmico. Além disso, não apresentavam uma regra de treinamento para a aprendizagem da rede. O perceptron foi criado fundamentalmente com objetivo de modelar a percepção visual. O objetivo para esta rede consiste em classificar padrões em duas classes distintas, A ou B. Os nódulos do perceptron funcionam de maneira semelhante ao modelo proposto por McCulloch-Pitts. Se o padrão pertence à classe A, o perceptron deve disparar. Se o padrão pertence à classe B, ele não deve disparar A. Segundo Caudill e Butler (1992) a função transferência do perceptron é formada por dois passos: o primeiro consiste no cálculo de entrada total encontrado pela função: I = ∑ wixi n i=1 Onde wi xi são vetores peso e input. Ou seja, o input total da rede é a somatória da multiplicação de cada valor de entrada pelo seu valor peso. O segundo passo da função transferência do perceptron, segundo Caudill e Butler (1992), é o cálculo da resposta do nódulo, encontrada pela seguinte função: y = { +1, se I ≥ T −1, se I < T 86 Ou seja, o nódulo dispara quando a sua entrada total é maior ou igual ao seu limiar. Caso contrário, não dispara. O seu treinamento também segue uma respectiva regra: wnovo = wvelho + βyx β= { +1, se a resposta do perceptron está correta −1, caso contrário Podemos notar, na função acima, que a mudança de peso necessita da resposta desejada do nódulo. Dizemos, assim, que a sua aprendizagem é supervisionada. O treinamento deve ser feito de maneira organizada e ordenada para que uma rede aprenda a reconhecer um determinado grupo de padrões, sendo necessário um algoritmo de treinamento. Segundo Caudill e Butler (1992, p. 29) no caso do perceptron ele é o seguinte: 1. Para cada padrão no conjunto de treinamento 1.1 aplicar o próximo padrão para o perceptron 1.2 gravar a resposta do perceptron 1.3 se a resposta do perceptron está correta, e a resposta foi +1, então o novo vetor peso = velho vetor peso + o vetor do padrão de input e a resposta foi -1, então o novo vetor peso = velho vetor peso o vetor do padrão de input 1.4 se a resposta do perceptron está incorreta. e a resposta foi +1, então o novo vetor peso = velho vetor peso o vetor do padrão de input e a resposta foi -1, então o novo vetor peso = velho vetor peso + o vetor do padrão de input 2. finalize para cada padrão no conjunto de treinamento. (Tradução nossa)31 Após efetuar os cálculos para todos os padrões, deve-se analisar se a rede foi capaz de classificar corretamente cada um deles. Se ela foi capaz de classificar, ela aprende, caso contrário, deve-se recomeçar a fazer os cálculos até que a rede seja capaz de reconhecê-los. Podemos observar que o conexionismo, semelhante ao cognitivismo, adota como base uma perspectiva funcionalista sobre o estudo da cognição, ou seja, ambas vertentes defendem que a análise do comportamento e dos fenômenos mentais pode ser realizada segundo as funções que eles desempenham. Dentre seus pressupostos, consta a relevância do uso de modelos, mas, diferentemente do cognitivismo, o conexionismo julga ser importante a 31 No original: "For each pattern in the training set 1.1 apply the next pattern to the perceptron 1.2 record the perceptron response 1.3 If the perceptron response is correct, and the answer was +1, then the new vector weight = old weight vector + vector of the input pattern and the answer was -1, so the new vector weight = old weight vector the vector of the input pattern 1.4 if the perceptron response is incorrect. and the answer was +1, then the new vector weight = old weight vector the vector of the input pattern and the answer was -1, so the new vector weight = old weight vector + vector of the input pattern 2. Finish for each pattern in the training set". 87 construção de modelos análogos à arquitetura dos neurônios biológicos e que a cognição é resultado do processamento em paralelo e distribuído efetuado por vários nódulos. Entre seus quebra-cabeças está a pretensão em criar modelos capazes de simular a cognição, como por exemplo, as capacidades de reconhecer, processar e generalizar dados e padrões. Neste sentido, em termos kuhnianos, podemos dizer que a perspectiva conexionista, embora possua as suas diferenças em relação ao cognitivismo, parece não possuir uma diferença propriamente paradigmática. Em síntese, no presente capítulo, procuramos contextualizar as grandes perspectivas que foram candidatas ao paradigma da ciência cognitiva, de forma a ilustrar seus métodos e princípios. 88 CONSIDERAÇÕES FINAIS Nesta Dissertação, buscamos desenvolver uma análise sobre o estatuto científico da ciência cognitiva, durante os seus primeiros anos, utilizamos o arcabouço conceitual de Thomas Kuhn. Para tanto, no primeiro capítulo, tratamos da proposta de Kuhn (2011a), que fundamenta sua perspectiva historicista para análise do progresso da ciência, isto é, uma compreensão baseada nos eventos da história da ciência. Assim, diferentemente de outras abordagens contemporâneas à sua época, Kuhn (2011a) não almejou normatizar a atividade científica, mas procurou investigar a maneira como as comunidades científicas se estabeleceram, ao longo da história, em torno do que ele chama de paradigma. A existência de paradigmas é, segundo Kuhn (2011a), um dos sinais dentro de uma área de pesquisa de que há maturidade no desenvolvimento. Os paradigmas englobam toda uma capacidade de atrair um grupo duradouro de adeptos e a capacidade de, em potência, explicar todo e qualquer fenômeno de sua área. Eles funcionam como mapas conceituais os quais permitem uma maior profundidade e alcance explicativo da natureza. Dentre outros elementos, eles englobam toda uma série de métodos, princípios, valores, problemas a serem pesquisados, experiências e teorias empiricamente testáveis. A fase inicial de boa parte das áreas de pesquisa é marcada por um período de competição entre vários paradigmas, momento que é denominado pré-ciência. Naturalmente, um dos paradigmas pretendentes acaba se sobressaindo e uma comunidade começa a se cristalizar em torno do mesmo. Nesse momento, há um quadro típico de problemas e expectativas a serem resolvidos pelos praticantes e adeptos do paradigma, os chamados quebra-cabeças, implicando uma série de objetivos e problemas a serem "montados" pelos praticantes e adeptos à área. Entretanto, após a sua consolidação, um paradigma pode apresentar muitas limitações. Eles podem exibir, ao longo do tempo, anomalias sérias, o que pode resultar em uma crise científica. As crises são caracterizadas por períodos de perda de credibilidade do paradigma dominante e o surgimento de novos paradigmas completamente diferentes dos anteriores, os quais competem pela aceitação da comunidade científica. As crises podem terminar de maneiras diferentes. Uma das possibilidades consiste na revelação de que o próprio paradigma dominante seja capaz de resolver os motivos da crise. Entretanto, uma vez que o problema é considerado insolúvel, pode ocorrer o surgimento de um novo candidato a paradigma 89 dominante, que vem a confrontar as explicações e princípios de seu antecessor. A transição para um novo paradigma caracteriza, do ponto de vista histórico, uma revolução científica. Após a sua revolução, a tendência é que a ciência passe para um novo momento de ciência normal, e esse ciclo venha a se repetir pela história da humanidade e do desenvolvimento da ciência. No segundo capítulo, apresentamos um panorama geral do surgimento da ciência cognitiva com o objetivo de, mais adiante, mostrar que a sua comunidade científica possuía uma forte relação com os eventos históricos do movimento da cibernética. Embora esse parentesco não seja visto com bons olhos, destacamos que, ao longo do período da cibernética, eram germinadas algumas noções e conceitos valiosos à ciência cognitiva, como, por exemplo, as noções de feedback, de processamento de informação, o uso de modelos e outros tantos conceitos. Nesse sentido, não seria possível pensarmos na presença de agência de fomento para a área, na consolidação de um paradigma e muito menos em uma comunidade científica, sem antes ter existido o movimento cibernético. Por fim, no terceiro capítulo, buscamos apresentar os primeiros anos da ciência cognitiva após o movimento da cibernética. Ainda nesse capítulo, esboçamos as noções de modelo e representação, a fim de comentarmos sobre as grandes perceptivas que, naquele período, se destacavam como candidatos a paradigma dominante, isto é, o cognitivismo e o conexionismo. Nosso objetivo inicial neste trabalho consistiu em averiguar em que momento do ciclo das revoluções científicas de Kuhn a ciência cognitiva se encontrava, avaliando, assim, o seu estatuto científico. No segundo capítulo, partimos de duas hipóteses: a primeira, sugerida por Dupuy (1996), de que parece ter havido uma forte relação entre a ciência cognitiva e a cibernética em seus primeiros momentos. Nossa segunda hipótese é de que a ciência cognitiva, embora tenha sido criada a partir das elucidações desenvolvidas pela cibernética, notamos, ao longo da Dissertação, que a ciência cognitiva, em sua fase inicial, não conseguiu se estabelecer como uma comunidade científica coesa, vide o exemplo do Relatório do Estado de Arte, redigido em 1978. Nesse sentido, ela passava por um momento de pré-ciência. Contudo, quais seriam as causas? Seria esse momento de pré-ciência decorrente da luta paradigmática entre o cognitivismo e o conexionismo? Seria um problema oriundo da própria metodologia plural? Ao comentar sobre existência desse embate entre o cognitivismo e o conexionismo, pudemos ter uma melhor compreensão do espírito que circundava a ciência cognitiva daquele momento. Com efeito, percebemos, que não parece existir propriamente uma diferença 90 paradigmática entre essas duas linhas. Nosso julgamento ganha credibilidade, quando levamos em consideração os seus pressupostos. Ambas abordagens partem de uma perspectiva funcionalista de que a mente que deve ser estudada, em função do uso de modelos, com metodologias próprias para o tratamento da informação. O cognitivismo e o conexionismo, ambas vertentes, nesse período, partilhavam a crença internalista de que as representações são fundamentais para os avanços na área. Ressaltamos que as nossas considerações não implicam que o conexionismo e o cognitivismo não possuam as suas próprias peculiaridades. Por exemplo, o cognitivismo adota como modelo máquinas do tipo Turing, cujo funcionamento é algorítmico, determinístico, com um processamento centralizado e sequencial. Já o conexionismo assume como modelo as Redes Neurais Artificiais, cujo funcionamento envolve aprendizagem e auto-organização, processando informações de modo paralelo e distribuído. Como o processamento dos modelos do conexionismo se encontra nos padrões de conexões estabelecido no processo de aprendizagem, e não tão somente nas unidades, Smolensky (1988) considera que os modelos do conexionismo trabalham de maneira subsimbólica. Somos levados a crer, em relação ao estado dessas duas linhas de pesquisa, que ambas não são paradigmas distintos, porém, são linhas constituintes de um mesmo grande paradigma da ciência cognitiva, o qual tentava se estabelecer, naquele período. Dessa forma, embora os quebra-cabeças de ambas as linhas estivessem atrelados à tentativa de compreender os processos cognitivos, cada linha, a sua forma, levava em conta a sua própria maneira de conduzir a pesquisa, seja através da tentativa de simular a aprendizagem, seja por intermédio da simulação da relação entre os estados intencionais e as mudanças físicas. Embora os modelos conexionistas não possam ser classificados como pertencentes ao cognitivismo, para alguns autores, como Boden (1990), é comum classificar o conexionismo como parte da Inteligência Artificial, distinguido as abordagens apenas entre vertentes de uma mesma linha, como por exemplo, "Inteligência Artificial Simbólica", e "Inteligência Artificial Conexionista". Podemos supor que um dos motivos da dificuldade da ciência cognitiva em constituir um paradigma dominante seja decorrente de sua própria natureza interdisciplinar. Ainda assim, levamos em consideração que a empreitada para se investigar as questões atreladas à cognição é demasiadamente complexa para ser investigada apenas sob o viés de uma única disciplina. Contudo, mesmo que exista uma convergência sobre os quebra-cabeças a serem montados e uma forte força de vontade, a fim de que ocorra o diálogo entre as diversas 91 disciplinas, observa-se que o sonho da consolidação de um paradigma não é impossível de ser alcançado, apenas muito difícil. A despeito de algumas das reflexões levantadas ao longo desta Dissertação fazemos referência a um momento do passado, cremos que a investigação do estatuto científico da ciência cognitiva, em sua fase inicial, é importante para se avaliar o próprio movimento atual da ciência cognitiva. Em uma sociedade conectada e com um avanço desenfreado das tecnologias oriundas da ciência cognitiva, parece-nos ser de suma importância investigar o passado dessa área, para, assim, buscar uma melhor compreensão das novas tecnologias e os possíveis eventos que podemos aguardar para o nosso futuro tecnológico. Gostaríamos, também, de chamar a atenção para o estatuto científico da ciência cognitiva, nos dias atuais. Com base nos avanços da indústria e das revoluções informacionais após o advento da internet, finalizamos a nossa Dissertação, questionando: qual o estatuto científico da ciência cognitiva atual? Será que ela dispõe de um paradigma dominante? Quais os seus princípios metodológicos? Como a sua comunidade científica conseguiu estabelecer e conciliar a sua natureza plural? Estas questões podem ser tópicos para pesquisas futuras. 92 REFERÊNCIAS ALVES, M. A. Mecanismo e Inteligência: Um estudo sobre o conceito de Inteligência na Ciência Cognitiva. 1999. 201 f. Dissertação (Mestrado em Filosofia) – Universidade Estadual Paulista, Faculdade de Filosofia e Ciências; Marília 1999. ______. Informação e conteúdo informacional: notas para um estudo da ação. In: GONZALEZ, M. E. Q.; BROENS, M. C.; MARTINS, C. A. (Org.). Informação, conhecimento e ação ética. Marília: Oficina Universitária. São Paulo: Cultura Acadêmica, 2012a. ______. Lógica e Informação: uma análise da consequência lógica a partir de uma perspectiva quantitativa da informação. 2012. 211 f. Tese (Doutorado em Filosofia) – Universidade Estadual de Campinas, Instituto de Filosofia e Ciências Humanas, Campinas, 2012b. ______. Reflexões acerca da natureza da ciência: comparações entre Kuhn, Popper e Empirismo Lógico. Kínesis, Marília, v. 5, p. 193-211, 2013. ANGIONI, L. Aristóteles e o progresso da investigação científica: o caso do De caelo. Sci. stud., v. 8, n. 3, p. 319-338, set. 2010. ARBIB, M. A. The Handbook Of Brain Theory and Neural Networks. London, England: The MIT Press, 2002. BODEN, M. The Philosophy of Artificial Intelligence. New York: Oxford University Press, 1990. BORRADORI, G. A filosofia americana: Conversações com Quine, Davidson, Putnam, Nozick, Danto, Rorty, Cavell, MacIntyre e Kuhn. Tradução de Álvaro Lorencini. São Paulo: Editora UNESP, 2003. CAUDIL, M., BUTLER, C. Understanding neural networks: computer explorations. Massachusetts: MIT Press, 1992. CHOMSKY, N. The Logical Structure of Linguistic Theory. 1955. Tese (Doutorado) – University of Pennsylvania, Philadelphia-PA, 1955. Publicado como monografia: Nova York: Plenum Press, 1975. DAWSON, M. From Embodied Cognitive Science to Synthetic Psychology. Proceedings of the first IEEE International Conference on Cognitive Informatics, 2002. DEBRUN, M. Identidade Nacional Brasileira e Auto-organização. In: D'OTTAVIANO, I. M. L.; GONZALEZ, M. E. Q. (Org.). Auto-organização nas Ciências Exatas e Naturais. Campinas: UNICAMP, 2009. DESCARTES, R. Meditações. In: DESCARTES, R. Obras Escolhidas. Rio de Janeiro: Bertrand Brasil, 1973. DUPUY, J. P. Nas origens das ciências cognitivas. Tradução de Roberto Leal Ferreira. São Paulo: Editora UNESP, 1996. FODOR, J.A. The Language of Thought. Nova York: Crowell, 1975 ______. What psychological states are not. In: BLOCK, N. (Org.). Readings in philosophy of psychology. v. 1. Cambridge: Harvard University Press, 1980. p. 237-250. FRAWLEY, W. Vygotsky e a ciência cognitiva: linguagem e integração das mentes social e computacional. Tradução de M. A. G. Domingues. Porto Alegre: Artes Médicas Sul, 2000. 93 GARDNER, H. A Nova Ciência da Mente: Uma História da Revolução Cognitiva. Tradução de Claúdia Malbergier Caon; prefácio de Marcos Barbosa de Oliveira. São Paulo: Editora da Universidade de São Paulo, 1996. HANSON, N. Observação e Interpretação. In: Filosofia da Ciência. Trad. Leonidas Hegenberg, Octany Silveira da Mota. São Paulo: Cultrix, 1975. HASELAGER, W. F. G. O mal estar do representacionismo: sete dores de cabeça da Ciência Cognitiva. In: FERREIRA, A.; Gonzalez, E. Q.; COELHO, J. G. (Ed.). Encontros com as Ciências Cognitivas, v. 4. São Paulo: Coleção Estudos Cognitivos, 2004. p. 105-120. HUME, D. Investigações sobre o entendimento humano e sobre os princípios da moral. Tradução de José Oscar de Almeida Marques. São Paulo: Editora UNESP, 2004. KOVÁCS, Z. L. Redes neurais artificiais: fundamentos e aplicações. São Paulo: Editora Livraria da Física, 2006. KUHN, T. A estrutura das revoluções científicas. Tradução de Beatriz Vianna Boeira e Nelson Boeira. São Paulo: Perspectiva, 2011a. ______. A tensão essencial: estudos selecionados sobre tradição e mudanças científicas. Tradução de Marcelo Amaral Penna-Forte. São Paulo: Editora UNESP, 2011b. LAKATOS, I. O falseamento e a metodologia dos programas de pesquisa científica. In: ______; MUSGRAVE, A. (Org.). A crítica e o desenvolvimento do conhecimento. São Paulo: Cultrix, 1979. ______. La metodología de los programas de investigación científica. Madrid: Alianza, 1989. LAUDAN, L. Science and values: the aims of science and their role in scientific debate. Berkeley: University of California Press, 1984. LACEY, H. Valores e atividade científica. São Paulo: Discurso Editorial, 1998. LECLERC, A. Uma introdução à filosofia da mente. Curitiba: Appris, 2018. LURIA, A.R. Desenvolvimento cognitivo: seus fundamentos culturais e sociais. Tradução de L. M. Barreto, M. K. Oliveira, M. M. M. de Andrade, e R. H. Maciel. São Paulo: Ícone, 1990. MACY 6. Cybernetics: circular causal and feedback mechanisms in biological and social systems. Transactions of the sixth conference, March 24-25, 1949, New York, N. Y. Editado por Heinz von Förster. Josiah Macy Jr. Foundation, New York, 1950, 209p. MACY 7. Cybernetics: circular causal and feedback mechanisms in biological and social systems. Transactions of the seventh conference, March 23-24, 1950, New York, N. Y. Editado por Heinz von Förster. Editores Assistentes: Margareth Mead e Hans Lukas Teuber. Josiah Macy Jr. Foundation, New York, 1951, 251p. MACY 8. Cybernetics: circular causal and feedback mechanisms in biological and social systems. Transactions of the eighth conference, March 15-16, 1951, New York, N. Y. Editado por Heinz von Förster. Editores Assistentes: Margareth Mead e Hans Lukas Teuber. Josiah Macy Jr. Foundation, New York, 1952, 240p. MACY 9. Cybernetics: circular causal and feedback mechanisms in biological and social systems. Transactions of the ninth conference, March 20-21, 1952, New York, N. Y. Editado por Heinz von Förster. Editores Assistentes: Margareth Mead e Hans Lukas Teuber. Josiah Macy Jr. Foundation, New York, 1953, 184p. MACY 10. Cybernetics: circular causal and feedback mechanisms in biological and social systems. Transactions of the tenth conference, April 22, 23 and 24, 1953, Princeton N. J. 94 Editado por Heinz von Förster. Editores Assistentes: Margareth Mead e Hans Lukas Teuber. Josiah Macy Jr. Foundation, New York, 1955, 100p. MASSARO, L. Cibernética: ciência e técnica. 2010. 213p. Dissertação (Mestrado em Sociologia) – Universidade Estadual de Campinas, Instituto de Filosofia e Ciências Humanas, Campinas, 2010. MCCARTHY, J.; HAYES, P. J. Some philosophical problems from the standpoint of artificial intelligence. In: MELTZER, B.; MICHIE, D. (Ed.). Machine intelligence 4. Edinburg: Edinburg University Press, 1969. p. 463-502. MCCULLOCH, W. Mysterium Iniquitatis of Sinful Man Aspiring into the Place of God. American Association for the Advancement of Science, v. 80, n 1. p. 35-39, 1955. ______. Embodiments of mind (collected papers). Cambridge: MIT Press, 1965. ______; PITTS, W. A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biophysics, v. 5, p. 115-133, 1943. MESQUITA, A. P. Introdução Geral. Lisboa: Imprensa Nacional-Casa da Moeda, 2005. MILLER, G.A. A Very Personal History. Conferência para o Cognitive Science Workshop, Massachusetts Institute of Technology, Cambridge , Mass., 1o jun. 1979. NEWELL, A. Intellectual Issues in the History of Artificial Intelligence. In: MACHLUP, F.; MANSFIELD, U. (Ed.). The Study of Information: Interdisciplinary Messages. New York, John Wiley, 1983. O'REILLY, R.C.; MUNAKATA, Y. Computational explorations in cognitive neuroscience: Understanding the mind by simulating the brain. MIT Press, 2000. PESSOA JUNIOR, O. F. O limite Qualitativo de Modelos Quantitativos. Complexitas – Revista de Filosofia Temática, v. 1, p. 101-117, 2016. PINTO, S.M.C.R. A Natureza Histórica da Cognição: Debates filosóficos na Teoria dos Sistemas Dinâmicos na Ciência Cognitiva. Dissertação de Mestrado. Universidade do Porto. Portugal, 2007. PLATÃO. Fédon. In: Os pensadores. Tradução de Jorge Paleikat e João Cruz Costa. São Paulo: Victor Civita, 1972. POPPER, K. R. A Lógica da Pesquisa Científica. São Paulo: Cultrix, 1972. PUTNAM, H. Minds and Machines. In: HOOK, S. (Ed.). Dimensions of Mind. New York: New York University Press, 1960. ______. The meaning of the "meaning". In: PESSIN, A.; GOLDBERG, S. (Org.). Twin earth chronicles. New York: M. E. Sharpe, (1996), 1975. ROSENBLATT, F. Principles of neurodinamics. Spartan Books, 1962. RUMELHART, D. E.; MCCLELLAND, J. L. Parallel Distributed Processing: explorations in the microstructure of cognition. Cambridge: MIT Press, 1986. SALLES, F. R. A relevância da cibernética: aspectos da constribuição filosófica de Norbert Wiener. 2007. Dissertação (Mestrado) – FFLCH-USP, São Paulo, 2007. SEARLE, J. R. Minds, brains and programs. Behav. Brain Sci., v. 3, p. 417-424, 1980. SHANNON, C.; WEAVER, W. A mathematical theory of communication. Urbana: University of Illinois Press, 1998. (primeira edição: 1949). 95 SILVEIRA, F. L. A metodologia dos programas de pesquisa: a epistemologia de Imre Lakatos. Caderno Catarinense de Ensino de Física, Florianópolis, v.13, n.3: 219-230, dez. 1996. SIMON, H. A. Sciences of the Artificial. Cambridge, Mass.: MIT Press. 1969. SMOLENSKY, P. On the Proper Treatment of Connectionism. Behavioral and Brain Science, 11, p. 1-74, 1998. THAGARD, P. Mente: introdução à ciência cognitiva. Tradução de Maria Rita Hofmesister. Porto Alegre: ArtMed, 1998. TURING, A. M. On the computable numbers with an application to the Entscheidungs. In: DAVIS, M. The undecidable. New York: Raven Press, 1936. ______. Computing machinery and intelligence. Mind, v. 59, p. 433-460, 1950. VARELA, F. J. Conhecer: as Ciências Cognitivas Tendências e Perspectivas. Tradução de Maria Teresa Guerreiro. Lisboa: Instituto Piaget, 1991. ______; THOMPSON, E.; ROSCH, E. A mente corpórea: ciência cognitiva e experiência humana. Tradução de Joaquim Nogueira Gil e Jorge de Sousa. Cambridge: Massachusetts Institute of Technology, 1991. VICENTINI, M. R. O critério de desempenho: do behaviorismo ao funcionalismo. Acta Scientiarum (UEM), Maringá, v. 23, p. 223-230, 2001. WIENER, N. Cibernética: ou o controle e comunicação no animal e na máquina. Tradução de Gita K. Guinsburg. São Paulo: Polígono e Universidade de São Paulo, 1961. ______. O conceito de informação na ciência contemporânea. Rio de Janeiro: Paz e Terra, 1970. (Ciência e informação, v. 2) ______; ROSEMBLUETH, A., BIGELOW, J. Behavior, Purpose and Teleology. Philosophy of Science v. 10, n. 1, p. 18-24. Reproduzido (cópia fac-símile) em Masani (1985). Tradução publicada em Cadernos de História e Filosofia da Ciência, v. 2, p. 43-50, 1943.