# Análise A-03 — Frequência dos 24 subitens de categoria

## Pergunta

Quais tipos de conteúdo aparecem mais no acervo dos 115 cadernos de Waldisa Rússio, segundo as marcações das fichas de catalogação preenchidas pela pesquisadora?

## Hipótese esperada (antes de rodar)

Liderança absoluta de `prof_organizacao_trabalho`, `rel_nomes_telefones`, `cult_desenhos` e `rel_redes_relacao`; subitens raros esperados: `refl_perguntas_proprias`, `dom_receitas`, `cult_poemas`.

## Método

Contagem direta em `site/data/banco.json` (N=115), coluna a coluna, dos 24 subitens definidos em ESQUEMA.md §3.3, distribuídos entre 8 categorias. Para cada subitem apuram-se `Sim`, `Não`, `[incerto]` e `[em branco]`; a frequência relativa é `Sim / 115`. Em seguida, agregam-se os subitens por categoria e calcula-se a **densidade média** (percentual médio de marcações "Sim" por subitem da categoria), o que corrige o fato de categorias terem número diferente de subitens (a Categoria 7 tem 1 subitem, a Categoria 1 tem 4). Cálculo em Node, sem heurísticas nem inferência: só contagem.

## Resultado

### Tabela — 24 subitens ordenados por frequência de "Sim" (N=115)

| # | Subitem (nome técnico) | Rótulo | Categoria | Sim | Não | [incerto] | [em branco] | Freq. Sim |
|---|---|---|---|---:|---:|---:|---:|---:|
| 1 | `prof_organizacao_trabalho` | Organização de trabalho | 1 Profissional | 71 | 44 | 0 | 0 | 61,7% |
| 2 | `rel_nomes_telefones` | Nomes e telefones | 3 Relacional | 64 | 51 | 0 | 0 | 55,7% |
| 3 | `cult_desenhos` | Desenhos | 5 Cultural | 59 | 56 | 0 | 0 | 51,3% |
| 4 | `rel_redes_relacao` | Redes de relação | 3 Relacional | 54 | 61 | 0 | 0 | 47,0% |
| 5 | `prof_reflexoes_museologia` | Reflexões sobre museologia | 1 Profissional | 47 | 68 | 0 | 0 | 40,9% |
| 6 | `org_lembretes` | Lembretes | 2 Organizacional | 46 | 69 | 0 | 0 | 40,0% |
| 7 | `rel_contatos` | Contatos | 3 Relacional | 25 | 90 | 0 | 0 | 21,7% |
| 8 | `org_listas_tarefas` | Listas de tarefas | 2 Organizacional | 24 | 91 | 0 | 0 | 20,9% |
| 9 | `econ_valores_monetarios` | Valores monetários | 4 Econômica | 24 | 91 | 0 | 0 | 20,9% |
| 10 | `prof_planos_aula` | Planos de aula | 1 Profissional | 22 | 93 | 0 | 0 | 19,1% |
| 11 | `cult_citacoes` | Citações | 5 Cultural | 22 | 93 | 0 | 0 | 19,1% |
| 12 | `org_compromissos` | Compromissos | 2 Organizacional | 19 | 96 | 0 | 0 | 16,5% |
| 13 | `epist_esbocos_cartas` | Esboços de cartas | 7 Epistolar | 19 | 96 | 0 | 0 | 16,5% |
| 14 | `org_agendas` | Agendas | 2 Organizacional | 14 | 100 | 1 | 0 | 12,2% |
| 15 | `prof_perguntas_alunos` | Perguntas para alunos | 1 Profissional | 12 | 102 | 1 | 0 | 10,4% |
| 16 | `econ_registros_financeiros` | Registros financeiros | 4 Econômica | 9 | 106 | 0 | 0 | 7,8% |
| 17 | `dom_anotacoes_praticas` | Anotações práticas | 6 Doméstica | 8 | 107 | 0 | 0 | 7,0% |
| 18 | `refl_reflexoes_pessoais` | Reflexões pessoais | 8 Reflexiva | 8 | 107 | 0 | 0 | 7,0% |
| 19 | `econ_contas` | Contas | 4 Econômica | 5 | 110 | 0 | 0 | 4,3% |
| 20 | `refl_registros_emocionais` | Registros emocionais | 8 Reflexiva | 5 | 110 | 0 | 0 | 4,3% |
| 21 | `cult_poemas` | Poemas | 5 Cultural | 4 | 111 | 0 | 0 | 3,5% |
| 22 | `cult_referencias_culturais` | Referências culturais | 5 Cultural | 4 | 111 | 0 | 0 | 3,5% |
| 23 | `dom_receitas` | Receitas | 6 Doméstica | 3 | 112 | 0 | 0 | 2,6% |
| 24 | `refl_perguntas_proprias` | Perguntas que ela se faz | 8 Reflexiva | 1 | 114 | 0 | 0 | 0,9% |

Total de marcações "Sim" somadas nos 24 subitens: **569**. Média de "Sim" por caderno: **4,95** (o retrato do §2 de ANALISE.md indicava moda 3–7). Nenhum valor `[em branco]` foi encontrado; apenas **2 marcações [incerto]** em todo o banco (`org_agendas` e `prof_perguntas_alunos`, um caso cada) — o verso das fichas está, portanto, quase totalmente decidido.

### Ranking por categoria — densidade média (Sim médio por subitem sobre N=115)

| Categoria | Subitens | Total Sim | Média Sim/subitem | Densidade média |
|---|---:|---:|---:|---:|
| 3 — Relacional/social | 3 | 143 | 47,7 | **41,4%** |
| 1 — Profissional/institucional | 4 | 152 | 38,0 | 33,0% |
| 2 — Organizacional/pragmática | 4 | 103 | 25,8 | 22,4% |
| 5 — Cultural/repertório | 4 | 89 | 22,3 | 19,3% |
| 7 — Epistolar | 1 | 19 | 19,0 | 16,5% |
| 4 — Econômica | 3 | 38 | 12,7 | 11,0% |
| 6 — Doméstica/cotidiana | 2 | 11 | 5,5 | 4,8% |
| 8 — Reflexiva | 3 | 14 | 4,7 | 4,1% |

Sete cadernos apresentam **zero** marcações "Sim" em todo o verso: WR-CAD-001, WR-CAD-044, WR-CAD-047, WR-CAD-066, WR-CAD-084, WR-CAD-086, WR-CAD-088 (matéria da análise C-04).

## Leitura interpretativa

A hipótese se confirma quase integralmente. Os quatro subitens previstos como líderes — `prof_organizacao_trabalho` (61,7%), `rel_nomes_telefones` (55,7%), `cult_desenhos` (51,3%) e `rel_redes_relacao` (47,0%) — ocupam exatamente as quatro primeiras posições, com uma sequência colada logo abaixo (`prof_reflexoes_museologia` 40,9%; `org_lembretes` 40,0%). Os três subitens apontados como raros também se confirmam no fundo do ranking: `refl_perguntas_proprias` é o menor de todos (1 caderno, WR-CAD-070), `dom_receitas` aparece em 3 (WR-CAD-024, WR-CAD-074, WR-CAD-099) e `cult_poemas` em 4 (WR-CAD-024, WR-CAD-045, WR-CAD-080, WR-CAD-089).

Reagrupando por categoria, o pódio muda: a **Categoria 3 (Relacional/social)** lidera em densidade média (41,4%), à frente da **Categoria 1 (Profissional)** — inversão que a leitura por subitem não deixa ver, porque a Cat. 3 tem só 3 subitens, todos com marcação alta. Isso reforça o alerta de ANALISE.md §5.4: as categorias ditas "ambíguas" (2, 3, 5, 7) somam a maior parte das marcações, e a regra atual de predominância (que só pontua Cat. 1 contra Cat. 6+8) as ignora — puxando o banco para "profissional".

Do ponto de vista da hipótese central (proto-diarístico, arquivo de si), a leitura mais desconfortável está no rodapé da tabela. As **categorias mais explicitamente pessoais** — 6 (doméstica) com 4,8% de densidade média e 8 (reflexiva) com 4,1% — são justamente as menos marcadas. Ou a escrita reflexiva-doméstica é de fato marginal nos cadernos, ou (mais provavelmente) ela **se disfarça** dentro das categorias ambíguas: `rel_nomes_telefones`, `cult_desenhos`, `org_lembretes` e `epist_esbocos_cartas` podem estar carregando o "pessoal" sem que a taxonomia atual saiba nomeá-lo. O contraste entre 71 cadernos com "organização de trabalho" e 1 caderno com "perguntas que ela se faz" é o mapa exato do que a Cat. 8 subrepresenta.

Vale destacar `cult_desenhos` (59 cadernos, 51,3%) como marcador visual persistente ao longo do acervo — um subitem que a própria pesquisadora acrescentou à mão em WR-CAD-097 e que se mostrou tão recorrente quanto os grandes subitens verbais. Merece leitura material dedicada (análises E-01/E-02).

## Limites e cavalos-de-Troia

- **Marca ≠ intensidade.** Um "Sim" em `cult_desenhos` pode ser um caderno inteiro de desenhos ou dois rabiscos numa margem — as fichas só registram presença. Toda leitura de peso deste ranking precisa lembrar disso (ANALISE.md §5.5). Um "Sim" em `refl_reflexoes_pessoais` também não diz *quanto* de reflexão.
- **Fichas ≠ conteúdo íntimo dos cadernos.** Este ranking mede o que Renata catalogou, não o que Waldisa escreveu. É plausível que categorias como "reflexões pessoais" estejam subcatalogadas porque a leitura da ficha é rápida e o subitem exige inferência interpretativa; a escrita íntima pode estar diluída em outros subitens (ver PROJETO.md §4).
- **Só 2 [incerto] em 2.760 checkboxes possíveis (24×115).** A decisão do verso está robusta — mas isso também significa que qualquer viés sistemático de preenchimento (por exemplo, tendência a marcar "Não" em categorias delicadas como refl_*) não é sinalizado.
- **A regra atual de predominância favorece a Categoria 1** e ignora Categoria 3, que aqui aparece como a mais densa. Este resultado é insumo direto para C-01 (auditoria da regra).
- **7 cadernos com verso em branco** puxam ligeiramente todas as frequências para baixo; se forem fichas incompletas (não cadernos vazios), o denominador efetivo é 108 e não 115 — mas mantemos N=115 para consistência com o banco.

## Evidência primária

- `prof_organizacao_trabalho` (líder, 71 cadernos): WR-CAD-002, WR-CAD-003, WR-CAD-006, WR-CAD-007, WR-CAD-008.
- `rel_nomes_telefones` (64): WR-CAD-002, WR-CAD-003, WR-CAD-004, WR-CAD-005, WR-CAD-006.
- `cult_desenhos` (59, marcador visual): WR-CAD-006, WR-CAD-007, WR-CAD-008, WR-CAD-013, WR-CAD-016.
- `rel_redes_relacao` (54): WR-CAD-007, WR-CAD-008, WR-CAD-013, WR-CAD-015, WR-CAD-020.
- `refl_perguntas_proprias` (1, o mais raro): WR-CAD-070.
- `dom_receitas` (3): WR-CAD-024, WR-CAD-074, WR-CAD-099.
- `cult_poemas` (4): WR-CAD-024, WR-CAD-045, WR-CAD-080, WR-CAD-089.
- Verso vazio (0 marcações): WR-CAD-001, WR-CAD-044, WR-CAD-047, WR-CAD-066, WR-CAD-084, WR-CAD-086, WR-CAD-088.

## Sugestões de aprofundamento

1. **Cruzar cada subitem com `datacao_estimada`** (base para B-04): ver se `refl_*` e `dom_*`, apesar de raros no total, se concentram nos anos 1980 — se sim, sustentam a leitura proto-diarística mesmo sendo minoritários em contagem absoluta.
2. **Reinserir Categoria 3 e Categoria 7 no eixo pessoal** ao rodar C-01 (auditoria da regra de predominância): esta análise mostra que elas concentram a massa da escrita relacional/afetiva e podem estar carregando o "pessoal" invisível.
3. **Inspecionar qualitativamente WR-CAD-070** (único caderno com `refl_perguntas_proprias`) e os 3 casos de `dom_receitas`: podem ser cadernos-chave para a leitura íntima e fornecer evidência singular para F-01.
4. **Investigar `cult_desenhos` como marcador transversal** — seus 59 casos merecem cruzamento com `paginas_escritas` e com tipo de caderno (E-02), para separar "caderno de desenho" de "desenho ocasional".
5. **Recontar os 7 cadernos com verso em branco** contra suas fotos: distinguir ficha incompleta (revisar) de caderno realmente vazio de conteúdo classificável (input para C-04).
