# Análise C-01 — Auditoria da regra de predominância

## Pergunta

A regra atual de predominância (`prof_*` contra `dom_*+refl_*`) faz justiça à escrita da Waldisa Rússio nos 115 cadernos, ou subestima o eixo pessoal ao ignorar categorias que a pesquisadora leria como íntimas (epistolar, relacional, doméstica)?

## Hipótese esperada (antes de rodar)

A regra atual subestima o eixo pessoal. As categorias 6 (`dom_*`, 2 subitens, 11 sims totais no acervo) e 8 (`refl_*`, 3 subitens, 14 sims) têm marcação absoluta muito baixa (ver A-03). Cadernos que a Renata leria como "pessoais" — sobretudo os densamente relacionais-epistolares — ficam como `misto` ou até como `profissional`. Se afrouxarmos a definição de "pessoal" para incluir `epist_*` e `rel_*`, a distribuição vira decisivamente.

## Método

Simulação de quatro regras sobre os 115 cadernos, a partir de `site/data/banco.json`. Para cada regra, conta-se o número de `Sim` no eixo profissional e no eixo pessoal; mais no profissional → `profissional`; mais no pessoal → `pessoal`; empate ou nada marcado → `misto` (idêntico à ESQUEMA.md §4).

- **(a) Regra atual (baseline).** Prof = `prof_*` (4 subitens). Pessoal = `dom_*` + `refl_*` (5 subitens).
- **(b) Ampliada 1 — inclui epistolar.** Prof = `prof_*`. Pessoal = `dom_*` + `refl_*` + `epist_*` (6 subitens).
- **(c) Ampliada 2 — inclui relacional.** Prof = `prof_*`. Pessoal = `dom_*` + `refl_*` + `epist_*` + `rel_*` (9 subitens).
- **(d) Profissional inclusiva.** Prof = `prof_*` + `org_*` (8 subitens). Pessoal = `dom_*` + `refl_*` + `epist_*` + `rel_*` (9 subitens). Justificativa: "listas de tarefas", "compromissos", "agendas" e "lembretes" são o coração da atuação profissional de Waldisa.

Cadernos "estáveis pessoais" = pessoais em pelo menos 3 das 4 regras. "Fronteira móvel" = cadernos com 2+ rótulos distintos entre as 4 regras, priorizando os que oscilam entre `profissional` e `pessoal`.

## Resultado

### Tabela comparativa — 4 regras × 3 rótulos (N=115)

| Regra | Definição de "pessoal" | profissional | pessoal | misto |
|---|---|---:|---:|---:|
| **(a) atual** | dom + refl | **74 (64,3%)** | **10 (8,7%)** | **31 (27,0%)** |
| (b) +epist | dom + refl + epist | 70 (60,9%) | 11 (9,6%) | 34 (29,6%) |
| (c) +epist+rel | dom + refl + epist + rel | **40 (34,8%)** | **49 (42,6%)** | 26 (22,6%) |
| (d) prof=prof+org; pessoal=dom+refl+epist+rel | idem (c) para pessoal | 62 (53,9%) | 33 (28,7%) | 20 (17,4%) |

### Movimento entre regras — matriz de transição da baseline (a)

| a → | profissional | pessoal | misto | Total (a) |
|---|---:|---:|---:|---:|
| → em (b) | 70 | 11 (+1 vindo de misto) | 34 (+4 vindos de prof) | 115 |
| → em (c) | 40 (−34) | 49 (+39: 18 vindos de prof, 21 vindos de misto) | 26 | 115 |
| → em (d) | 62 (−12) | 33 (+23: 8 vindos de prof, 16 vindos de misto) | 20 | 115 |

**Só na regra (c) o eixo pessoal supera o profissional em número absoluto.** Nas regras (a) e (b) o profissional domina com folga (~2/3 do acervo); em (d) — que também move `org_*` para o eixo profissional — o profissional volta a dominar, mas o pessoal já é a segunda categoria (33 > misto 20).

### Distribuição dentro dos 58 cadernos datados nos anos 1980

| Regra | profissional | pessoal | misto |
|---|---:|---:|---:|
| (a) | 42 | 5 | 11 |
| (b) | 39 | 5 | 14 |
| (c) | 24 | 25 | 9 |
| (d) | 39 | 13 | 6 |

A fronteira móvel dos 1980 confirma a hipótese: pela regra (c), quase metade dos cadernos-1980 vira pessoal.

### 20 cadernos que mais mudam de rótulo entre as regras

Prioridade: (i) 3 rótulos distintos em 4 regras; (ii) oscilação entre `profissional` e `pessoal`. Todos os 22 cadernos que oscilam prof↔pessoal aparecem na lista abaixo, encabeçados pelos 10 casos com 3 rótulos distintos.

| # | Código | Datação | (a) | (b) | (c) | (d) |
|---|---|---|---|---|---|---|
| 1 | WR-CAD-002 | 1980 | misto | misto | pessoal | profissional |
| 2 | WR-CAD-010 | 1987 | misto | misto | pessoal | profissional |
| 3 | WR-CAD-024 | 1987 | profissional | misto | pessoal | misto |
| 4 | WR-CAD-028 | 1981 | profissional | profissional | pessoal | misto |
| 5 | WR-CAD-040 | 1985-06 | profissional | misto | pessoal | pessoal |
| 6 | WR-CAD-095 | 1982 | misto | misto | pessoal | profissional |
| 7 | WR-CAD-101 | 1988 | profissional | profissional | pessoal | misto |
| 8 | WR-CAD-102 | [em branco] | profissional | profissional | pessoal | misto |
| 9 | WR-CAD-104 | 1976-1979 | profissional | profissional | pessoal | misto |
| 10 | WR-CAD-112 | 1986 | misto | misto | pessoal | profissional |
| 11 | WR-CAD-022 | 1983 | profissional | profissional | pessoal | pessoal |
| 12 | WR-CAD-048 | 1982 | profissional | profissional | pessoal | profissional |
| 13 | WR-CAD-052 | 1984 | profissional | profissional | pessoal | pessoal |
| 14 | WR-CAD-056 | [em branco] | profissional | profissional | pessoal | pessoal |
| 15 | WR-CAD-060 | [em branco] | profissional | profissional | pessoal | pessoal |
| 16 | WR-CAD-068 | [em branco] | profissional | profissional | pessoal | profissional |
| 17 | WR-CAD-091 | 1987-1988 | profissional | profissional | pessoal | profissional |
| 18 | WR-CAD-094 | 1980 | profissional | profissional | pessoal | pessoal |
| 19 | WR-CAD-096 | 1985 | profissional | profissional | pessoal | profissional |
| 20 | WR-CAD-106 | 1977 | profissional | profissional | pessoal | pessoal |

Também oscilam prof↔pessoal, fora dos 20: WR-CAD-111 (1980) e WR-CAD-113 (sem data).

### Cadernos estáveis pessoais (pessoais em ≥3 das 4 regras): 11

| Código | Datação | (a) | (b) | (c) | (d) |
|---|---|---|---|---|---|
| WR-CAD-063 | [em branco] | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-070 | 1977-1978 | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-077 | 1979-1981 | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-085 | 1980-1981 | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-087 | 1979 | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-097 | 1982 | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-099 | 1988 | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-100 | 1987 | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-115 | 1984 | pessoal | pessoal | pessoal | pessoal |
| WR-CAD-059 | [em branco] | misto | pessoal | pessoal | pessoal |
| WR-CAD-069 | década de 1970 | pessoal | pessoal | pessoal | misto |

Contraponto: **40 cadernos são estáveis profissionais** (profissional em todas as 4 regras) e **7 são estáveis mistos** (nunca profissional, nunca pessoal). Só **56 dos 115 cadernos (49%)** recebem o mesmo rótulo nas quatro regras; **59 (51%) mudam** ao menos uma vez.

## Leitura interpretativa

A hipótese esperada se confirma com força. Sob a regra atual (a), o eixo pessoal captura apenas **10 cadernos (8,7%)**; ao adicionar `epist_*` (regra b), o ganho é marginal (+1 caderno). Basta acrescentar `rel_*` — as três colunas relacionais que A-03 identificou como a categoria de maior densidade média — para o quadro virar de cabeça para baixo: **de 10 para 49 cadernos pessoais**, com 39 deles migrando de `profissional` ou de `misto`. É o efeito descrito em ANALISE.md §5.4: as categorias ambíguas dominam o acervo, e a regra atual as remove do jogo, empurrando o banco para "profissional".

A comparação (a) contra (d) esclarece o que está em disputa. Se aceitarmos que `org_*` é fundamentalmente profissional na Waldisa — o que a leitura de WR-CAD-002, WR-CAD-010, WR-CAD-095 (agendas com listas de tarefas de trabalho) sustenta — o eixo profissional recupera 22 cadernos que a regra (c) havia mandado ao pessoal, e o pessoal fica em 33 (28,7%). Essa é, provavelmente, a regra que mais se aproxima do que a Renata leria: acolhe a escrita relacional-epistolar-doméstica como sinal íntimo, mas mantém a musculatura da agenda profissional intacta.

Os **11 cadernos estáveis pessoais** são o núcleo mais defensável do eixo íntimo do acervo. Merecem destaque: WR-CAD-070 (1977-1978, único caderno com `refl_perguntas_proprias`, "belas anotações"); WR-CAD-087 ("Memória 79"); WR-CAD-097 (1982, o caderno em que Renata escreveu à mão o subitem `cult_desenhos`); WR-CAD-099 (1988, dedicatória: "para Waldisa: com os votos de um ano feliz e uma agenda cheia de belos compromissos"); WR-CAD-115 (1984, folhas secas nas primeiras páginas, escreve em francês). Nenhum deles depende de uma regra frouxa para ser pessoal — todos têm marcação em `dom_*` ou `refl_*` que os sustenta na regra atual.

A **fronteira móvel** é o corpo político desta decisão. Os 20 cadernos listados são justamente aqueles em que uma decisão de vocabulário — se `rel_*` é pessoal, se `org_*` é profissional — reclassifica o caderno. Alguns casos são ilustrativos: **WR-CAD-112** (1986) traz a observação "É a Agenda com MAIS RELATOS PESSOAIS", mas fica `misto` na regra atual porque só tem 1 `refl_*` marcado; a regra (c) captura corretamente. **WR-CAD-024** (1987), com 12 marcações e observação longa sobre a vida cotidiana da Waldisa (endereço em Simões Pinto, junho de 1987), é `profissional` na regra atual e `pessoal` na (c) — o retrato exato do "caderno-arquivo híbrido" que B-04 propõe como reformulação da tese. **WR-CAD-111** (1980, "DIÁRIO DE LIMA") só vira pessoal em uma das quatro regras — sinal de que o rótulo léxico da observação pode não corresponder ao perfil de marcação da ficha.

Recomendação técnica (sem tomar a decisão pela pesquisadora): a regra (d) parece a mais equilibrada — reconhece a densidade relacional-epistolar como marcador de escrita "de si", mas preserva `org_*` no eixo profissional; entrega distribuição plausível (54% prof / 29% pessoal / 17% misto), reduz o "misto" de 27% para 17% (menos cadernos indecidíveis), e mantém consistência com a leitura da tese "arquivo de si" que B-04 sugere reformular como "caderno-arquivo híbrido".

## Limites e cavalos-de-Troia

- **Uma regra é heurística, não verdade sobre o caderno.** Nenhum dos quatro rótulos é uma leitura do conteúdo íntimo dos cadernos (PROJETO.md §4.1). Toda regra pontua a marcação da ficha, não a intensidade do que Waldisa escreveu.
- **A regra (c) satura o eixo pessoal artificialmente.** Ao contar 9 subitens contra 4 no profissional, ela quase garante que qualquer caderno com marcação diversa vira `pessoal`. É útil como diagnóstico da fronteira, mas frouxa demais para uso final.
- **`rel_nomes_telefones` (64 cadernos) e `rel_redes_relacao` (54) são as duas alavancas** que fazem (c) e (d) migrarem tanto caderno. Se a pesquisadora decidir que "agenda de contatos profissionais" não conta como escrita relacional-afetiva, a leitura precisa mudar — talvez segmentar `rel_*` em relacional-afetivo vs. relacional-profissional (uma discussão de vocabulário, não deste relatório).
- **`epist_*` tem só 1 subitem (19 cadernos).** Isoladamente (regra b) não move quase nada; sua contribuição real aparece quando combinado.
- **Uma inconsistência foi detectada** entre o cálculo e o campo `predominancia` gravado no banco: WR-CAD-070 tem 1 sim em `prof_*` e 2 em `dom_*+refl_*` — pela regra (a) deveria ser `pessoal`, mas o banco marca `misto`. Sinalizar para revisão.
- **11 dos 20 cadernos-fronteira estão nos 1980, 3 sem datação, 1 nos 1970**. Isso reforça que a decisão de regra afeta desproporcionalmente a leitura da década central da tese.

## Evidência primária

- **Estáveis pessoais (11):** WR-CAD-063, WR-CAD-070, WR-CAD-077, WR-CAD-085, WR-CAD-087, WR-CAD-097, WR-CAD-099, WR-CAD-100, WR-CAD-115, WR-CAD-059, WR-CAD-069.
- **Fronteira móvel top-10 (3 rótulos distintos):** WR-CAD-002, WR-CAD-010, WR-CAD-024, WR-CAD-028, WR-CAD-040, WR-CAD-095, WR-CAD-101, WR-CAD-102, WR-CAD-104, WR-CAD-112.
- **Oscilam prof↔pessoal (22):** todos os 20 do quadro acima + WR-CAD-111, WR-CAD-113.
- **Contradição banco vs. regra atual:** WR-CAD-070 (banco = `misto`, cálculo = `pessoal`; verificar).

## Sugestões de aprofundamento

1. **Levar as quatro regras à trilha de decisões da pesquisadora** com este relatório como anexo. A recomendação técnica é a regra (d), mas a decisão é dela.
2. **Ler qualitativamente os 20 cadernos-fronteira** contra a foto — a única forma de decidir, caso a caso, se são pessoais ou profissionais é olhar as páginas (D-02 e F-01 já apontam para isso).
3. **Verificar WR-CAD-070**: cálculo da regra atual não bate com o campo `predominancia` do banco.
4. **Considerar segmentar `rel_*`** em relacional-afetivo (redes de relação) e relacional-profissional (contatos institucionais). Talvez o subitem `rel_redes_relacao` mereça peso pessoal, `rel_contatos` peso profissional. Essa granularidade sairia de uma releitura das fichas.
5. **Refazer B-04 sob a regra adotada**: os deltas 1970 → 1980 mudam de leitura conforme o rótulo. Fechar C-01 antes de fechar a leitura cronológica.
