Como ler este banco
Explicação em português comum de tudo o que aparece nas 115 linhas do banco — o que cada coluna significa, o que os símbolos querem dizer, e por que algumas coisas ficam em aberto.
O que é o banco
O banco reúne, em uma tabela, as informações das fichas de catalogação que a pesquisadora preencheu à mão para cada um dos 115 cadernos de anotação de Waldisa Rússio. Cada ficha tem duas faces: uma frente, com a identificação do caderno (número, código, caixa, tipo, páginas, observações), e um verso, com uma grade de 24 caixinhas “Sim/Não” distribuídas em 8 categorias temáticas.
A partir dessas fichas, montamos o banco: uma linha por caderno, uma coluna por informação. O banco não descreve o conteúdo íntimo dos cadernos — só o que a pesquisadora anotou sobre cada um deles.
Não é uma leitura do conteúdo dos cadernos. É uma leitura das fichas que os catalogam. Toda vez que o banco diz “este caderno tem X”, quer dizer “a ficha diz que este caderno tem X” — não que alguém abriu o caderno e leu.
Uma ficha = uma linha
Cada caderno tem uma única linha no banco. A frente e o verso da ficha são combinados nessa mesma linha, casados pelo código WR-CAD-NNN (por exemplo, WR-CAD-097). Isso permite filtrar, ordenar e contar cadernos sem ter que juntar dois lados.
As colunas seguem a ordem natural de leitura da ficha: primeiro os campos de identificação (frente), depois as 24 caixinhas de categoria (verso), depois os campos de análise que a IA propôs (datação estimada, predominância) e por último os campos de controle (arquivos de origem, status de revisão).
Convenções de preenchimento
Cada célula pode conter um valor comum (número, data, texto, Sim, Não) ou um dos três marcadores especiais abaixo. Eles são cruciais e nunca devem ser confundidos:
| Marcador | O que significa | Quando aparece |
|---|---|---|
[em branco] |
O campo estava vazio na ficha original — vazio de propósito. | Sala em branco, uma observação sem texto, etc. |
[ilegível] |
A IA não conseguiu ler o que está escrito na ficha (foto ruim, letra apagada). | Um número cortado pela foto, uma palavra manchada. |
[incerto] |
A IA não conseguiu decidir se uma caixinha está marcada ou não. | Uma caixinha com rasura, um X ambíguo. |
Vazio intencional (o campo não devia ter nada mesmo) é diferente de falha de leitura (existe algo, mas a IA não conseguiu ler) — e ambos são diferentes de indecisão em caixinha (existe uma marca, mas ela é ambígua). Todo [ilegível] e [incerto] vai automaticamente para a revisão da pesquisadora.
Identificação do caderno
Cinco colunas descrevem “quem é” o caderno:
| Coluna | Explicação |
|---|---|
ficha_n | O número da ficha, que a pesquisadora preencheu à mão. Geralmente vai de 1 a 115, na ordem em que ela catalogou os cadernos. |
codigo | O código único do caderno, no formato WR-CAD-NNN (WR = Waldisa Rússio, CAD = Caderno, NNN = três dígitos com zero à esquerda). É a chave que casa a frente e o verso da ficha. |
caixa | Ver a seção sobre caixa. |
sala | Sala de guarda dentro do acervo. Quase sempre [em branco], pois só uma parte dos cadernos tem sala anotada. |
tipo_caderno | O que a pesquisadora escreveu no campo “Tipo”: “Agenda Itaú”, “Caderno espiral”, “Bloco de rascunho”, etc. Vocabulário aberto — pode virar controlado depois de olharmos todos. |
Caixa
Os 115 cadernos estão fisicamente guardados em 20 caixas numeradas de 01 a 20. A coluna caixa indica em qual delas cada caderno está.
Essa informação é dupla no projeto: além da caixa que a pesquisadora anotou na ficha, o próprio arquivo da foto vem numa subpasta que também identifica a caixa. Quando as duas discordam (o que é raro), o item vai para revisão.
Data da consulta
A “data da consulta” (coluna data_consulta) é o dia em que a pesquisadora preencheu a ficha, sentada em frente ao caderno físico no acervo. É a data da catalogação, não do caderno. Formato: DD/MM/AAAA.
Cuidado: esse campo não deve ser confundido com datação estimada, que tenta responder quando o caderno foi escrito. Uma ficha preenchida em 2026 pode falar de um caderno de 1968.
Páginas: total e escritas
Cada caderno tem duas contagens no banco:
- Páginas total (
paginas_total): quantas páginas o caderno tem, escritas ou não. Costuma bater com o número impresso no caderno (ex.: “caderno de 200 páginas”). - Páginas escritas: quantas páginas foram efetivamente usadas pela Waldisa.
A pegadinha é que a pesquisadora nem sempre anotou um número. Às vezes escreveu “quase todas”, “até a pág. 25”, “por volta de 10”. Como a pesquisa é sobre intensidade de escrita, o banco não inventa número: guarda o texto e deixa o número vazio.
Ficha diz “Quase todas” no campo de páginas escritas. No banco: paginas_escritas = [em branco], paginas_escritas_obs = "Quase todas". O item entra na aba Páginas escritas vagas da trilha da pesquisadora para a Renata decidir se recupera um número ou mantém como texto.
Uma exceção importante: quando a ficha diz “Nenhuma”, o banco grava paginas_escritas = 0 — é um número válido.
Observações
O campo observacoes guarda o texto livre que a pesquisadora escreveu no rodapé da frente da ficha: impressões, pistas de datação, contexto (“caderno da fase de doutorado”), nomes de pessoas mencionadas, etc.
É um dos campos mais ricos do banco — e o mais frágil, porque depende da leitura de letra manuscrita. Todo texto de observações entra na revisão da pesquisadora com nível de confiança médio, para que ela confirme a transcrição.
As 24 caixinhas do verso
O verso da ficha tem uma grade impressa com 8 categorias temáticas, cada uma com alguns subitens (as caixinhas propriamente ditas). Quando a pesquisadora marca uma caixinha, ela está dizendo “este caderno contém esse tipo de conteúdo”.
Total: 24 caixinhas, que viram 24 colunas Sim/Não no banco. Aqui estão elas, agrupadas pela categoria:
Cada subitem vira uma coluna com prefixo por categoria: prof_* (profissional), org_* (organizacional), rel_* (relacional), econ_* (econômica), cult_* (cultural), dom_* (doméstica), epist_* (epistolar), refl_* (reflexiva).
Categorias ambíguas
Cinco das 8 categorias — organizacional, relacional, econômica, cultural, epistolar — são ambíguas em relação ao eixo profissional-pessoal. Uma lista de tarefas pode ser sobre trabalho ou sobre casa. Uma citação pode ser de um livro acadêmico ou de um autor íntimo. Um esboço de carta pode ser profissional ou pessoal.
Por isso, ao calcular a predominância, essas categorias não pontuam para nenhum lado — pesam só para “misto” quando aparecem sozinhas. Elas continuam sendo colunas úteis para filtrar e analisar; só não decidem, por si sós, o perfil geral do caderno.
Campos “Outros” por categoria
Além das 24 caixinhas impressas, o verso da ficha tem espaços para anotações à mão dentro de cada categoria. São os campos outros_profissional, outros_organizacional, outros_relacional, etc. — um por categoria (8 no total).
Costumam ficar [em branco]. Quando a pesquisadora escreveu alguma coisa neles, é uma captura importante — pode indicar um tipo de conteúdo recorrente que ainda não virou coluna própria. Exemplo: “Desenhos” começou como texto em outros_cultural e foi promovido a coluna própria (cult_desenhos) depois de aparecer em muitas fichas.
Datação estimada
A coluna datacao_estimada guarda o ano ou período que a IA deduziu para o caderno, lendo as observações da ficha à procura de pistas. Ex.: “Agenda do ano de 1968”, “final da década de 80”, “1985”.
É sempre uma hipótese, nunca uma certeza. Quando existe, vem acompanhada de datacao_fonte — o trecho literal das observações que sustentou a datação. Se não há pista nenhuma, o valor fica [em branco].
A datação estimada nunca deve ser confundida com a data da consulta, que é a data em que a ficha foi preenchida no acervo. Todos os cadernos passam por revisão da pesquisadora nessa coluna, porque só ela tem contexto biográfico para confirmar ou corrigir.
Predominância
A coluna predominancia resume, em uma palavra, o tipo de escrita que pesa mais em cada caderno:
- profissional — o caderno tende à produção intelectual e atuação profissional (categoria 1 — museologia, ensino).
- pessoal — o caderno tende à vida privada e à reflexão íntima (categorias 6 e 8 — doméstica e reflexiva).
- misto — não pesa claramente para nenhum lado, seja por empate, seja porque só as categorias ambíguas estão marcadas.
É uma leitura de topo, útil para filtrar e comparar grupos de cadernos, mas nunca substitui a leitura do caderno em si. Todos os 115 cadernos passam pela revisão da pesquisadora nesta coluna.
A regra da predominância
A predominância é calculada por uma regra simples:
- Conta quantas caixinhas “Sim” existem no eixo profissional (as 4 colunas de
prof_*). - Conta quantas caixinhas “Sim” existem no eixo pessoal (as colunas de
dom_*erefl_*). - Ignora as categorias ambíguas nessa disputa.
- Se profissional > pessoal, resultado profissional. Se pessoal > profissional, pessoal. Empate ou nada marcado, misto.
A regra é deliberadamente conservadora: prefere dizer “misto” a arriscar um lado quando o dado é ambíguo. Ela pode ser reajustada pela pesquisadora — por exemplo, decidir que “organizacional” (listas, agendas) conta como profissional, ou que “epistolar” (esboços de cartas) conta como pessoal. Se ela pedir esse reajuste na trilha, a regra muda para todos os 115 cadernos de uma vez, não caderno a caderno.
Confiança e revisão
Cada leitura da IA é acompanhada de um nível de confiança (alta / média / baixa) que não aparece na tabela final mas é usado internamente para decidir o que vai à revisão. Tudo o que for baixa, tudo com [ilegível] ou [incerto], tudo com “outros” preenchidos, todas as inferências (datação, predominância) — vai automaticamente para a fila de decisão da pesquisadora.
Duas colunas de controle documentam isso:
status_revisao: pendente, em_revisao, revisado_ok, revisado_corrigido. Diz em que fase de revisão está a linha.campos_a_revisar: lista dos campos daquela ficha que ainda esperam decisão humana.
Quando essas colunas ficam vazias em todas as 115 linhas, o banco está limpo.
Baixar o banco
Além de navegar por este site, você pode baixar o banco em dois formatos:
- banco.xlsx — planilha do Excel, uma linha por caderno, todas as colunas descritas aqui. Bom para filtrar e cruzar dados offline.
- banco.json — mesma estrutura em JSON, para quem quiser processar programaticamente.
Os arquivos são atualizados sempre que uma rodada de decisões da pesquisadora é aplicada.