Como ler · Cadernos Waldisa Rússio

Ponto de partida

O que é o banco

O banco reúne, em uma tabela, as informações das fichas de catalogação que a pesquisadora preencheu à mão para cada um dos 115 cadernos de anotação de Waldisa Rússio. Cada ficha tem duas faces: uma frente, com a identificação do caderno (número, código, caixa, tipo, páginas, observações), e um verso, com uma grade de 24 caixinhas “Sim/Não” distribuídas em 8 categorias temáticas.

A partir dessas fichas, montamos o banco: uma linha por caderno, uma coluna por informação. O banco não descreve o conteúdo íntimo dos cadernos — só o que a pesquisadora anotou sobre cada um deles.

O que este banco NÃO é

Não é uma leitura do conteúdo dos cadernos. É uma leitura das fichas que os catalogam. Toda vez que o banco diz “este caderno tem X”, quer dizer “a ficha diz que este caderno tem X” — não que alguém abriu o caderno e leu.

Princípio estrutural

Uma ficha = uma linha

Cada caderno tem uma única linha no banco. A frente e o verso da ficha são combinados nessa mesma linha, casados pelo código WR-CAD-NNN (por exemplo, WR-CAD-097). Isso permite filtrar, ordenar e contar cadernos sem ter que juntar dois lados.

As colunas seguem a ordem natural de leitura da ficha: primeiro os campos de identificação (frente), depois as 24 caixinhas de categoria (verso), depois os campos de análise que a IA propôs (datação estimada, predominância) e por último os campos de controle (arquivos de origem, status de revisão).

Símbolos

Convenções de preenchimento

Cada célula pode conter um valor comum (número, data, texto, Sim, Não) ou um dos três marcadores especiais abaixo. Eles são cruciais e nunca devem ser confundidos:

Marcador	O que significa	Quando aparece
`[em branco]`	O campo estava vazio na ficha original — vazio de propósito.	Sala em branco, uma observação sem texto, etc.
`[ilegível]`	A IA não conseguiu ler o que está escrito na ficha (foto ruim, letra apagada).	Um número cortado pela foto, uma palavra manchada.
`[incerto]`	A IA não conseguiu decidir se uma caixinha está marcada ou não.	Uma caixinha com rasura, um X ambíguo.

Vazio intencional (o campo não devia ter nada mesmo) é diferente de falha de leitura (existe algo, mas a IA não conseguiu ler) — e ambos são diferentes de indecisão em caixinha (existe uma marca, mas ela é ambígua). Todo [ilegível] e [incerto] vai automaticamente para a revisão da pesquisadora.

Frente da ficha

Identificação do caderno

Cinco colunas descrevem “quem é” o caderno:

Coluna	Explicação
`ficha_n`	O número da ficha, que a pesquisadora preencheu à mão. Geralmente vai de 1 a 115, na ordem em que ela catalogou os cadernos.
`codigo`	O código único do caderno, no formato `WR-CAD-NNN` (WR = Waldisa Rússio, CAD = Caderno, NNN = três dígitos com zero à esquerda). É a chave que casa a frente e o verso da ficha.
`caixa`	Ver a seção sobre caixa.
`sala`	Sala de guarda dentro do acervo. Quase sempre `[em branco]`, pois só uma parte dos cadernos tem sala anotada.
`tipo_caderno`	O que a pesquisadora escreveu no campo “Tipo”: “Agenda Itaú”, “Caderno espiral”, “Bloco de rascunho”, etc. Vocabulário aberto — pode virar controlado depois de olharmos todos.

Frente da ficha

Caixa

Os 115 cadernos estão fisicamente guardados em 20 caixas numeradas de 01 a 20. A coluna caixa indica em qual delas cada caderno está.

Essa informação é dupla no projeto: além da caixa que a pesquisadora anotou na ficha, o próprio arquivo da foto vem numa subpasta que também identifica a caixa. Quando as duas discordam (o que é raro), o item vai para revisão.

Frente da ficha

Data da consulta

A “data da consulta” (coluna data_consulta) é o dia em que a pesquisadora preencheu a ficha, sentada em frente ao caderno físico no acervo. É a data da catalogação, não do caderno. Formato: DD/MM/AAAA.

Cuidado: esse campo não deve ser confundido com datação estimada, que tenta responder quando o caderno foi escrito. Uma ficha preenchida em 2026 pode falar de um caderno de 1968.

Frente da ficha

Páginas: total e escritas

Cada caderno tem duas contagens no banco:

Páginas total (paginas_total): quantas páginas o caderno tem, escritas ou não. Costuma bater com o número impresso no caderno (ex.: “caderno de 200 páginas”).
Páginas escritas: quantas páginas foram efetivamente usadas pela Waldisa.

A pegadinha é que a pesquisadora nem sempre anotou um número. Às vezes escreveu “quase todas”, “até a pág. 25”, “por volta de 10”. Como a pesquisa é sobre intensidade de escrita, o banco não inventa número: guarda o texto e deixa o número vazio.

Exemplo

Ficha diz “Quase todas” no campo de páginas escritas. No banco: paginas_escritas = [em branco], paginas_escritas_obs = "Quase todas". O item entra na aba Páginas escritas vagas da trilha da pesquisadora para a Renata decidir se recupera um número ou mantém como texto.

Uma exceção importante: quando a ficha diz “Nenhuma”, o banco grava paginas_escritas = 0 — é um número válido.

Frente da ficha

Observações

O campo observacoes guarda o texto livre que a pesquisadora escreveu no rodapé da frente da ficha: impressões, pistas de datação, contexto (“caderno da fase de doutorado”), nomes de pessoas mencionadas, etc.

É um dos campos mais ricos do banco — e o mais frágil, porque depende da leitura de letra manuscrita. Todo texto de observações entra na revisão da pesquisadora com nível de confiança médio, para que ela confirme a transcrição.

Verso da ficha

As 24 caixinhas do verso

O verso da ficha tem uma grade impressa com 8 categorias temáticas, cada uma com alguns subitens (as caixinhas propriamente ditas). Quando a pesquisadora marca uma caixinha, ela está dizendo “este caderno contém esse tipo de conteúdo”.

Total: 24 caixinhas, que viram 24 colunas Sim/Não no banco. Aqui estão elas, agrupadas pela categoria:

1. Profissional / institucional

Produção intelectual e atuação profissional.

Reflexões sobre museologia · Planos de aula · Perguntas para alunos · Organização de trabalho

2. Organizacional / pragmática

Gestão do cotidiano.

Listas de tarefas · Lembretes · Agendas · Compromissos

3. Relacional / social

Manutenção de vínculos sociais.

Nomes e telefones · Contatos · Redes de relação

4. Econômica

Controle material da vida.

Valores monetários · Contas · Registros financeiros

5. Cultural / repertório

Formação intelectual e sensível.

Poemas · Citações · Referências culturais · Desenhos

6. Doméstica / cotidiana

Organização da vida privada.

Receitas · Anotações práticas de vida

7. Epistolar

Mediação comunicativa com o outro.

Esboços de cartas

8. Reflexiva

Elaboração da experiência / escrita de si.

Perguntas próprias · Reflexões pessoais · Registros emocionais

Cada subitem vira uma coluna com prefixo por categoria: prof_* (profissional), org_* (organizacional), rel_* (relacional), econ_* (econômica), cult_* (cultural), dom_* (doméstica), epist_* (epistolar), refl_* (reflexiva).

Verso da ficha

Categorias ambíguas

Cinco das 8 categorias — organizacional, relacional, econômica, cultural, epistolar — são ambíguas em relação ao eixo profissional-pessoal. Uma lista de tarefas pode ser sobre trabalho ou sobre casa. Uma citação pode ser de um livro acadêmico ou de um autor íntimo. Um esboço de carta pode ser profissional ou pessoal.

Por isso, ao calcular a predominância, essas categorias não pontuam para nenhum lado — pesam só para “misto” quando aparecem sozinhas. Elas continuam sendo colunas úteis para filtrar e analisar; só não decidem, por si sós, o perfil geral do caderno.

Verso da ficha

Campos “Outros” por categoria

Além das 24 caixinhas impressas, o verso da ficha tem espaços para anotações à mão dentro de cada categoria. São os campos outros_profissional, outros_organizacional, outros_relacional, etc. — um por categoria (8 no total).

Costumam ficar [em branco]. Quando a pesquisadora escreveu alguma coisa neles, é uma captura importante — pode indicar um tipo de conteúdo recorrente que ainda não virou coluna própria. Exemplo: “Desenhos” começou como texto em outros_cultural e foi promovido a coluna própria (cult_desenhos) depois de aparecer em muitas fichas.

Análise proposta pela IA

Datação estimada

A coluna datacao_estimada guarda o ano ou período que a IA deduziu para o caderno, lendo as observações da ficha à procura de pistas. Ex.: “Agenda do ano de 1968”, “final da década de 80”, “1985”.

É sempre uma hipótese, nunca uma certeza. Quando existe, vem acompanhada de datacao_fonte — o trecho literal das observações que sustentou a datação. Se não há pista nenhuma, o valor fica [em branco].

A datação estimada nunca deve ser confundida com a data da consulta, que é a data em que a ficha foi preenchida no acervo. Todos os cadernos passam por revisão da pesquisadora nessa coluna, porque só ela tem contexto biográfico para confirmar ou corrigir.

Análise proposta pela IA

Predominância

A coluna predominancia resume, em uma palavra, o tipo de escrita que pesa mais em cada caderno:

profissional — o caderno tende à produção intelectual e atuação profissional (categoria 1 — museologia, ensino).
pessoal — o caderno tende à vida privada e à reflexão íntima (categorias 6 e 8 — doméstica e reflexiva).
misto — não pesa claramente para nenhum lado, seja por empate, seja porque só as categorias ambíguas estão marcadas.

É uma leitura de topo, útil para filtrar e comparar grupos de cadernos, mas nunca substitui a leitura do caderno em si. Todos os 115 cadernos passam pela revisão da pesquisadora nesta coluna.

Análise proposta pela IA

A regra da predominância

A predominância é calculada por uma regra simples:

Conta quantas caixinhas “Sim” existem no eixo profissional (as 4 colunas de prof_*).
Conta quantas caixinhas “Sim” existem no eixo pessoal (as colunas de dom_* e refl_*).
Ignora as categorias ambíguas nessa disputa.
Se profissional > pessoal, resultado profissional. Se pessoal > profissional, pessoal. Empate ou nada marcado, misto.

A regra é deliberadamente conservadora: prefere dizer “misto” a arriscar um lado quando o dado é ambíguo. Ela pode ser reajustada pela pesquisadora — por exemplo, decidir que “organizacional” (listas, agendas) conta como profissional, ou que “epistolar” (esboços de cartas) conta como pessoal. Se ela pedir esse reajuste na trilha, a regra muda para todos os 115 cadernos de uma vez, não caderno a caderno.

Bastidores

Confiança e revisão

Cada leitura da IA é acompanhada de um nível de confiança (alta / média / baixa) que não aparece na tabela final mas é usado internamente para decidir o que vai à revisão. Tudo o que for baixa, tudo com [ilegível] ou [incerto], tudo com “outros” preenchidos, todas as inferências (datação, predominância) — vai automaticamente para a fila de decisão da pesquisadora.

Duas colunas de controle documentam isso:

status_revisao: pendente, em_revisao, revisado_ok, revisado_corrigido. Diz em que fase de revisão está a linha.
campos_a_revisar: lista dos campos daquela ficha que ainda esperam decisão humana.

Quando essas colunas ficam vazias em todas as 115 linhas, o banco está limpo.

Uso offline

Baixar o banco

Além de navegar por este site, você pode baixar o banco em dois formatos:

banco.xlsx — planilha do Excel, uma linha por caderno, todas as colunas descritas aqui. Bom para filtrar e cruzar dados offline.
banco.json — mesma estrutura em JSON, para quem quiser processar programaticamente.

Os arquivos são atualizados sempre que uma rodada de decisões da pesquisadora é aplicada.

Como ler este banco

O que é o banco

Uma ficha = uma linha

Convenções de preenchimento

Identificação do caderno

Caixa

Data da consulta

Páginas: total e escritas

Observações

As 24 caixinhas do verso

Categorias ambíguas

Campos “Outros” por categoria

Datação estimada

Predominância

A regra da predominância

Confiança e revisão

Baixar o banco