Esta é uma reprodução (sem notas de rodapé) de uma comunicação inédita, apresentada no VI Encontro da Sociedade Brasileira de História e Computação (SBHC), em novembro de 1996


 

Bases de dados sobre história da ciência e da técnica em Portugal e Brasil, do Renascimento até 1900

ROBERTO DE ANDRADE MARTINS
Universidade Estadual de Campinas (UNICAMP)
 

1  INTRODUÇÃO

Este trabalho apresenta um projeto que está sendo desenvolvido na Universidade Estadual de Campinas, com o objetivo geral de contribuir para o conhecimento do pensamento científico e técnico português e brasileiro, desde o Renascimento até 1900. O trabalho desenvolvido consiste na construção de um instrumento de pesquisa – um conjunto de bases de dados sobre o assunto. Esse instrumento, além de permitir a fácil e rápida obtenção de informações sobre fontes para a pesquisa da história da ciência, possibilita também a realização de análises bibliométricas sobre a ciência e técnica luso-brasileira.
1.1 Antecedentes
Tanto em Portugal quanto no Brasil, muitos pesquisadores já estudaram diferentes aspectos do desenvolvimento científico e técnico dessas nações, no período considerado. No caso do Brasil, há os antigos estudos globais sobre as ciências e técnicas no Brasil (como os livros editados por Fernando de Azevedo e por Mário Guimarães Ferri & Shozo Motoyama); estudos mais recentes sobre o desenvolvimento de algumas instituições importantes no século XIX (principalmente os estudos realizados pelos grupos da História da USP e Geociências da UNICAMP); sobre a medicina brasileira do século XIX (principalmente pelo grupo da FIOCRUZ); alguns estudos sobre a química nos séculos XVIII e XIX (Carlos Alberto Filgueiras, Ana Maria Goldfarb e Márcia Helena Mendes Ferraz); estudos sobre a história das técnicas no Brasil (Ruy Gama, Ewaldo Mello de Carvalho); sobre a história da matemática (Ubiratan d'Ambrosio), etc. – apenas para citar alguns exemplos.

Cada um desses grupos ou pesquisadores procurou coletar informações para seus estudos específicos, sem tentar fazer um levantamento sistemático de fontes de pesquisa disponíveis. A Casa de Oswaldo Cruz tem realizado um trabalho de estudo de fontes de Medicina; e o Museu de Astronomia e Ciências Afins realizou um levantamento de arquivos no Rio de Janeiro. No entanto, não havia sido planejado nem realizado antes, no Brasil, um trabalho tão abrangente quanto o do presente projeto.

Em Portugal, a situação não é muito diferente, embora exista uma tradição mais longa de estudos sobre a história das ciências e das técnicas. Apesar de bons estudos sobre temas específicos ou sobre personalidades mais conhecidas, nunca foi possível ter uma visão global da produção científica e técnica daquela nação, não sendo conhecidos projetos sistemáticos de levantamento de fontes para a pesquisa na área. Antes do presente projeto, nem no Brasil nem em Portugal havia sido iniciado qualquer trabalho semelhante de coleta sistemática de informações. Por outro lado, como a análise bibliométrica só é possível após tal tipo de trabalho, jamais se fez também qualquer pesquisa bibliométrica sobre a ciência portuguesa e brasileira antiga (anterior ao século XX) .

 1.2 Motivação
O motivo básico da presente pesquisa foi a vontade de estudar as raízes científicas e técnicas de nosso país – o que obriga, necessariamente, a incluir também a história da ciência e técnica de Portugal.

Todos os que estão acostumados à pesquisa da história da ciência internacional, percebem o enorme contraste existente entre os recursos para pesquisa sobre a história das ciências e das técnicas de "primeiro mundo" e os disponíveis para a pesquisa da história das ciências e das técnicas do Brasil ou Portugal. É relativamente fácil, por exemplo, descobrir o que se publicou nas revistas dos países mais desenvolvidos do mundo, no século XIX, sobre qualquer tema de física, utilizando os instrumentos bibliográficos existentes referentes a esse período. Mas tais instrumentos, a não ser excepcionalmente, deixam de lado as publicações portuguesas ou brasileiras. Há projetos, em muitos países, de levantamento de fontes para a pesquisa de história das ciências e das técnicas (incluindo fontes impressas e inéditas) , mas não havia nada semelhante aqui. Essa foi a motivação inicial do presente trabalho.

Em 1987 e 1988, a comunidade brasileira de História da Ciência se reuniu e organizou um projeto para um Programa Nacional de História das Ciências e da Tecnologia. Nessa ocasião identificou-se que um dos pontos prioritários para possibilitar o desenvolvimento da área era a criação de bases de dados com informações sobre documentos relevantes para a pesquisa em História da Ciência e da Tecnologia . Todos os que participantes concordaram que sem bons instrumentos não se faz boa pesquisa. Assim, deve-se (entre outras coisas) desenvolver esses instrumentos . Houve alguns projetos anteriores (como o do MAST/CNPq, relativo a arquivos do Rio de Janeiro , ou o da FIOCRUZ, relativo à história da Medicina), porém nada do porte do trabalho aqui descrito.

2  HISTÓRICO E ABRANGÊNCIA DO PROJETO

O trabalho que vai ser descrito aqui não está sendo iniciado agora. Em 1988, O responsável pelo projeto (Roberto de Andrade Martins) começou a planejá-lo e a discuti-lo com outras pessoas. Ele se iniciou de fato em 1989, com o auxílio de uma bolsista de Aperfeiçoamento do CNPq.

A primeira etapa do trabalho consistiu em uma pesquisa bibliográfica tentando localizar referências sobre livros (e, posteriormente, artigos) científicos e técnicos, de autores portugueses, escritos até 1822. Por "autores portugueses" queremos indicar qualquer pessoa nascida em Portugal ou suas colônias, ou que, embora estrangeiro, tenha fixado residência em terras portuguesas nesse período. Foram incluídas também traduções portuguesas de obras estrangeiras.

Os assuntos abrangidos na busca foram: medicina, farmácia, química (incluindo metalurgia, etc.), mineralogia, física, astronomia, geografia, matemática, história natural, agricultura, veterinária, navegação, engenharia e arquitetura, artes militares, filosofia, filologia, filosofia. Foram excluídas obras sobre religião, literatura de ficção (poesia, teatro, romances, etc.), obras jurídicas e história política. Foram incluídas descrições de viagens e descrições históricas gerais do período, que são fontes essenciais para o estudo do desenvolvimento do conhecimento português nos campos científico e técnico. Obras sobre artes (música, desenho, artesanato, culinária, etc.) foram incluídas por causa de sua eventual conexão com temas científicos e técnicos. Algumas obras religiosas foram incluídas por sua relevância lingüística (por exemplo: textos religiosos em idiomas indígenas ou asiáticos); e obras jurídicas diretamente relacionadas com ciência e técnica também foram incluídas.

Inicialmente, a pesquisa incluiu apenas livros impressos, até 1822, no levantamento realizado. No entanto, com o prosseguimento da pesquisa, foi possível a partir de 1993 ampliar a abrangência do levantamento, de modo a incluir também:

A partir de 1994, iniciou-se a produção de uma nova base de dados, contendo informações históricas e uma cronologia sobre o período. Essa base de dados tem o objetivo de permitir a compreensão dos fatores econômicos, sociais, políticos e outros que influenciaram o desenvolvimento científico e técnico. Por fim, no segundo semestre de 1994, o projeto foi ampliado para incluir também obras publicadas no período de 1822 até 1900.

3  METODOLOGIA DE COLETA DE DADOS

 O trabalho de busca de informações utiliza tanto obras de referência impressas (bibliografias, catálogos, estudos históricos) quanto consulta direta a bibliotecas e arquivos. Como ponto de partida são utilizadas sempre obras de referência impressas (pois o trabalho, nesse caso, é muito mais rápido). Essas obras de referência, por sua vez, são encontradas ou através de bibliografias de bibliografias, pela consulta a fichários de bibliotecas, ou através de citações em outras obras. Toma-se, por exemplo, a cópia de uma bibliografia ou um catálogo de manuscritos e examina-se com cuidado item por item, avaliando-se sua pertinência ao projeto e marcando-o. Esse trabalho é feito pelo coordenador ou pelos bolsistas mais experientes. Depois, procura-se cada um dos itens selecionados no banco de dados, para verificar se o item já estava registrado. Se ele já existia, as informações são conferidas, sendo acrescentadas observações referentes a quaisquer discrepâncias notadas e adicionando-se a referência da nova obra pesquisada. Se o item não existia ainda, é criado um novo registro e as informações são digitadas.

No caso de consulta direta a bibliotecas e arquivos, às vezes são levadas listagens das bases de dados, para evitar o trabalho de copiar informações que já foram digitadas; ou então, é levado um notebook com as bases de dados, de tal modo a poder conferir e digitar as informações no próprio local .

Foram inicialmente consultadas as bibliografias portuguesas e brasileiras gerais mais conhecidas, como as obras de Diogo Barbosa Machado, Innocencio Francisco da Silva, Sacramento Blake, António Anselmo, Rubens Borba de Moraes, José Carlos Rodrigues, etc. (ver "referências bibliográficas" no final deste artigo). Essas e outras obras foram examinadas sistematicamente, página por página, em busca de informações relevantes. Posteriormente foram utilizados catálogos de bibliotecas, catálogos de leilões, livros e artigos bibliográficos sobre temas específicos, etc.

Para a localização de bibliografias relevantes, foram utilizadas as bibliografias das bibliografias portuguesas e brasileiras de António Joaquim Anselmo, Antonio Simões dos Reis, Bruno Basseches e Jorge Peixoto. Até 1996, foram utilizadas cerca de 300 fontes bibliográficas para a pesquisa .

Está sendo utilizada a consulta a algumas bases de dados do exterior (como a da Library of Congress). A Biblioteca Nacional de Lisboa forneceu ao projeto uma cópia em disquete de todas as informações existentes em sua base de dados, cobrindo o período até 1800. Foram utilizados também dados de bases informatizadas da British Library (Londres) e da Bodleian Library (Oxford).

A supervisão de todo o trabalho e o gerenciamento das bases de dados são feitos pelo coordenador.

4  CONSTITUIÇÃO DAS BASES DE DADOS

Inicialmente, as informações localizadas eram registradas em cartões manuscritos. Após se atingir um número de cerca de 2.000 fichas (grande parte delas repetidas), foram obtidos recursos para a criação da base de dados informatizada, através do apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP). A base de dados foi estruturada, em 1991, utilizando-se o programa CDS-ISIS desenvolvido pela UNESCO .

Além das informações bibliográficas básicas (autor, título, local, editora ou gráfica, ano, número de páginas), a base de dados inclui informações sobre idioma, assunto, bibliotecas em que as obras já foram localizadas (no Brasil e Portugal), fontes de referência que citam a obra (com indicação precisa de página), existência de outras edições, etc. Sempre que possível, é incluída uma descrição detalhada da folha de rosto .

A base de dados permite uma busca extremamente rápida de obras, através de qualquer informação dos registros, como: palavras do título (em qualquer ordem), assunto, partes do nome do autor, cidade de publicação, data, idioma, biblioteca onde a obra foi encontrada, fonte de referência que cita a obra, e qualquer associação desses dados. É muito fácil, por exemplo, procurar as obras sobre medicina publicadas em Coimbra, em latim, em 1674.

Além de utilizar os recursos próprios do programa CDS-ISIS, foram feitas algumas adaptações que aumentaram o seu poder. Foi utilizado um programa auxiliar que permite a digitação e exibição em tela de caracteres especiais utilizados no português antigo, como por exemplo a letra “u” com til (que significava “um”). Foi feita uma adaptação para tornar mais rápida a busca de termos truncados, já que com os recursos do próprio programa CDS-ISIS é extremamente lento procurar, por exemplo, todas as obras de um século, truncando-se a data. Com essa adaptação, é possível a busca direta utilizando-se palavras truncadas (por exemplo: fazendo-se a busca por "astro-", localiza-se as obras em que aparece astronomia, astros, astrônomo, etc.), décadas ou séculos (por exemplo, usando-se na busca 176- , obtém-se todas as obras da década de 1760 a 1769), etc.

Outro problema encontrado foi a grande variedade de grafias de palavras que aparecem nos títulos das obras, e até mesmo nos nomes de autores. Inicialmente, tentou-se implantar um processo de busca fonética, mas os resultados não foram satisfatórios. Foi então desenvolvido um dicionário auxiliar que, no processo de indexação, transforma os termos de ortografia antiga em ortografia moderna, de tal modo que, ao se procurar uma palavra atual, como "química", sejam também encontradas obras onde aparece a palavra "chymica". Da mesma forma, procurando-se "José", encontra-se também as obras onde aparece "Joseph". Esse sistema facilita muito as buscas.

5  ESTADO ATUAL DO PROJETO

A parte mais antiga do trabalho é, evidentemente, a que está mais completa. Para obras impressas antes de 1822, a base de dados possui cerca de 6.000 registros e esse número não deve aumentar muito no futuro (pode haver um aumento de, no máximo, 10%). As outras bases de dados ainda não estão em um estágio tão avançado, mas crescem rapidamente e logo estarão também bastante completas . Para efeito de comparação, a maior bibliografia portuguesa já escrita (o Dicionario bio-bibliographico portugues, de Innocencio Francisco Silva e Brito Aranha) apresenta uma cobertura de apenas 40% das obras do período até 1822 e de menos de 30%, para o período posterior a 1823 até 1900.

Atualmente (este artigo foi escrito em meados de 1996), o conjunto das bases de dados do projeto já atingiu um total de aproximadamente 50.000 registros . A coleta de informações sobre o período 1823-1900 é, como se poderia esperar, a que proporciona agora o maior número de dados.
 
 
Base: 
Descrição: 
Número de registros: 
Tamanho previsto:
HTC Publicações até 1822  10.200  11.000
MAP Mapas até 1822 3.100  4.000
PES Dados biográficos até 1822 1.900 3.000
MAN Manuscritos até 1822 5.700 7.000
IMP Livros de 1823 até 1900 20.200  40.000
ART Artigos de 1823 até 1900 8.500 15.000
PER Periódicos 700 900
TOTAL 50.300 80.900
 

6  DESENVOLVIMENTO PREVISTO

Nos próximos anos, além de uma gradativa complementação das bases de dados já existentes, planeja-se estender até 1900 as bases de dados relativas a cartografia, manuscritos, e dados biográficos. Também será desenvolvida uma base de dados auxiliar, contendo dados sobre a história de Portugal e Brasil, até 1900, para complementar as bases de dados já existentes, de tal forma a permitir a rápida correlação entre a situação histórica em cada fase e a produção científica e técnica da mesma época.

Sob o ponto de vista de busca de informações nas bases de dados, será implantado um “thesaurus”, utilizando recursos do próprio programa CDS/ISIS, de modo a facilitar a pesquisa de assuntos e de sub-assuntos de uma forma lógica.

Atualmente, a consulta a esse conjunto de bases de dados só pode ser feito ou indiretamente, por solicitação (carta, correio eletrônico), ou pessoalmente na própria UNICAMP. Logo que seja possível, as bases de dados começarão a ser colocadas à disposição dos interessados através da Internet, começando pelas bases que estão mais completas (HTC, MAN, MAP). Isso exigirá, no entanto, uma revisão cuidadosa e sistemática dos registros, para reduzir os inevitáveis erros das informações. Pela própria natureza do trabalho, não existe intenção de fazer publicação do conteúdo das bases de dados sob forma impressa. Futuramente poderá haver divulgação do trabalho sob a forma de CD-ROM.

7  UTILIDADES DAS BASES DE DADOS

Além do seu uso como fonte de informações sobre documentos, as bases de dados aqui descritas permitem um estudo bibliométrico do desenvolvimento da ciência e da técnica em Portugal e Brasil, no período considerado.

A partir da formação das bases de dados, é possível fazer interessantes análises bibliométricas. Pode-se acompanhar o início, crescimento e flutuações de desenvolvimento de cada área científica, bem como suas proporções relativas . Pode-se acompanhar o surgimento e eventual desaparecimento de temas de estudo. Pode-se comparar o crescimento do número de publicações com as curvas teóricas exponenciais, de modo a detectar momentos em que se deram perturbações no desenvolvimento científico – e, a partir da detecção desses momentos, procurar suas causas nos fatores históricos da mesma época . Pode-se estudar a variação geográfica de produção dos vários campos de conhecimento – cidade por cidade. Pode-se estudar a gradual substituição do latim pelo português, nas obras científicas. Pode-se – embora pareça estranho – fazer boas estimativas sobre o volume de documentos que não se conhece de cada período. Pode-se comparar a produção dos autores de cada época a fim de verificar a validade da lei de Lotka, no caso portugues e brasileiro . Enfim: há uma série de estudos bibliométricos que têm sido feitos para a ciência moderna de "primeiro mundo"  e que vale à pena desenvolver para o caso de Portugal e Brasil.

Mesmo sem o estudo do conteúdo das obras científicas e técnicas, tal base de dados permite, portanto, análises e estudos estatísticos e bibliométricos de grande interesse e importância.

8  EQUIPE E INFRA-ESTRUTURA

Esse trabalho já tem se desenvolvido há vários anos, com apoio do CNPq e da FAPESP. Além da equipe que se dedica de modo mais direto ao projeto, o trabalho conta com auxílio eventual de outras pessoas (da UNICAMP e de outras instituições) . O trabalho já contou com muitos bolsistas de Iniciação Científica e de Aperfeiçoamento do CNPq. No período entre 1993 e início de 1995, havia 4 bolsistas de Iniciação e 4 de Aperfeiçoamento. Cada bolsista estava diretamente envolvido com um dos sub-projetos, colaborando no estudo, por exemplo, da cartografia colonial, ou de manuscritos coloniais, etc. No entanto, as quotas de bolsas não foram renovadas no início de 1995. Por isso, desde essa época, a colaboração do CNPq foi nula. Nesse período mais recente, contamos com a participação de pessoal pago pela FAPESP.

Graças ao apoio proporcionado pela FAPESP, esse trabalho conta atualmente com uma boa infra-estrutura: uma rede local de computadores pessoais, periféricos (“scanner”, impressora, etc.), leitora de microfilmes e demais materiais necessários. O projeto está sendo desenvolvido junto ao Instituto de Física da UNICAMP.

9  REFERÊNCIAS BIBLIOGRÁFICAS

É impossível indicar, aqui, a bibliografia que já foi utilizada ou a que pretendemos usar. Vamos apenas dar exemplos de obras relevantes. Em primeiro lugar, as quatro bibliografias de bibliografias mais importantes: As maiores bibliografias gerais que cobrem o período até fins do século XIX, para Portugal e Brasil, são: Uma obra essencial, que complementa as anteriores e que se dedica a obras portuguesas em outros idiomas, é: Essas obras contêm informações biográficas e dados sobre livros, além de menor quantidade de informações sobre artigos de periódicos e poucas informações sobre manuscritos. Para o período mais antigo, são muito importantes: Há estudos sobre obras antigas publicadas na Índia e na China pelos portugueses, como: O projeto utiliza muitos catálogos de bibliotecas, arquivos e mapotecas, como: Há catálogos e bibliografias sobre temas específicos, como por exemplo: Essa curta amostra permite ter uma idéia do tipo de obras utilizadas na busca de informações para as bases de dados.