# Análise D-01 — Matriz de coocorrência das 24 categorias

## Pergunta

Que pares de subitens do verso da ficha aparecem juntos mais do que o esperado por acaso, e que "clusters interpretativos" emergem quando lemos essas coocorrências em conjunto?

## Hipótese esperada (antes de rodar)

Três clusters densos: (1) "agenda profissional" — `prof_organizacao_trabalho` × `rel_nomes_telefones` × `org_lembretes`; (2) "museologia teórica" — `prof_reflexoes_museologia` × `cult_citacoes` × `cult_referencias_culturais`; (3) "escrita íntima" — `refl_reflexoes_pessoais` × `dom_anotacoes_praticas` × `epist_esbocos_cartas`.

## Método

Sobre as 115 fichas de `banco.json`, cada uma vetorizada em 24 subitens Sim/Não. Para cada par (i,j) com i≠j calculou-se: observado (número de fichas com ambos marcados "Sim"); esperado sob independência E(i,j) = P(i)·P(j)/N, com N=115; e lift = observado/esperado. Foram excluídos pares com observado < 5 do ranking de maior lift, e pares com esperado < 5 do ranking de menor lift, para filtrar ruído de células pequenas. Para identificar clusters, procurou-se todos os trios (i,j,k) com lift ≥ 1,3 e observado ≥ 5 em cada um dos três pares — ranqueados por lift médio. Nenhum código do banco foi modificado.

## Resultado

### Frequências marginais (contexto)

Seis subitens dominam o acervo: `prof_organizacao_trabalho` (71/115), `rel_nomes_telefones` (64), `cult_desenhos` (59), `rel_redes_relacao` (54), `prof_reflexoes_museologia` (47), `org_lembretes` (46). Os demais têm frequência ≤ 25. Isso é decisivo para ler lift: pares entre subitens raros podem ter lift alto com muito pouco poder estatístico.

### Heatmap 24×24 (lift, símbolos + observado)

Legenda: `.` lift<0,5 · `-` 0,5–0,9 · `=` 0,9–1,1 · `+` 1,1–1,5 · `#` 1,5–2,5 · `@` >2,5 · `***` diagonal (auto). O número junto ao símbolo é o observado.

```
        p_museo  p_aula p_pergA p_orgTr  o_tare  o_lemb  o_agen  o_comp   r_tel  r_cont  r_rede   e_val  e_cont   e_fin  c_poem  c_cita   c_ref  c_dese   d_rec  d_prat ep_cart rf_perg rf_refl rf_emoc
p_museo     ***     #18     #10     +34     +14     =18      =6      =7     =27     =11     +27     +12      .0      -2      +2     +13      #3     +29      #2      .1     +10      .0      -2      .1
 p_aula     #18     ***      #4     +15      #8     +11      +3      +5     +14      +6     =11      +6      .0      -1      .0      +5      @4     =11      #1      .0      +5      .0      -1      =1
p_pergA     #10      #4     ***      +9      #5      #8      +2      #3      =7      #4      +7      +3      .0      #2      .0      +3      .0     #11      .0      .0      #3      .0      .0      #1
p_orgTr     +34     +15      +9     ***     +19     =30     +12     +17     =42     -12     =35     +17      +4      +8      -2     +16      #4     +47      =2      =5     +16      #1      =5      +4
 o_tare     +14      #8      #5     +19     ***     +14      +4      #9     +15      +6     +14      +7      =1      =2      +1     #10      #2     +17      .0      #3      +5      .0      @5      =1
 o_lemb     =18     +11      #8     =30     +14     ***     #13     #12     +35     #15     +31     #15      #3      #6      +2     +11      #3     +30      #2      #7     +10      @1      #7      #3
 o_agen      =6      +3      +2     +12      +4     #13     ***      @8     #13      =3      +9      #6      @2      @3      #1      +3      #1     +10      @1      #2      #4      .0      #2      @3
 o_comp      =7      +5      #3     +17      #9     #12      @8     ***     #16      =4     +11      #8      +1      @4      .0      #6      #1     +11      .0      @4      #5      .0      .0      @3
  r_tel     =27     +14      =7     =42     +15     +35     #13     #16     ***     +18     +41     +19      =3      #8      +3     =13      +3     +37      +2      #7     +12      #1      +5      +4
 r_cont     =11      +6      #4     -12      +6     #15      =3      =4     +18     ***     +17      +7      =1      #3      .0      -4      #2     +18      .0      #3      -3      .0      #4      #2
 r_rede     +27     =11      +7     =35     +14     +31      +9     +11     +41     +17     ***     +15      -2      #7      #3     +12      -1     +35      +2      #6     #14      #1      =4      .1
  e_val     +12      +6      +3     +17      +7     #15      #6      #8     +19      +7     +15     ***      =1      #4      +1      +6      #2     +16      #1      +2      +5      .0      +2      .0
 e_cont      .0      .0      .0      +4      =1      #3      @2      +1      =3      =1      -2      =1     ***      @2      .0      =1      .0      #4      .0      .0      +1      @1      @2      @1
  e_fin      -2      -1      #2      +8      =2      #6      @3      @4      #8      #3      #7      #4      @2     ***      .0      #4      .0      +6      .0      #1      #3      @1      @3      @1
 c_poem      +2      .0      .0      -2      +1      +2      #1      .0      +3      .0      #3      +1      .0      .0     ***      @3      .0      =2      @1      .0      #1      .0      .0      .0
 c_cita     +13      +5      +3     +16     #10     +11      +3      #6     =13      -4     +12      +6      =1      #4      @3     ***      @3     +13      @2      +2      #6      @1      @4      .0
  c_ref      #3      @4      .0      #4      #2      #3      #1      #1      +3      #2      -1      #2      .0      .0      .0      @3     ***      +3      .0      .0      #1      .0      @1      .0
 c_dese     +29     =11     #11     +47     +17     +30     +10     +11     +37     +18     +35     +16      #4      +6      =2     +13      +3     ***      +2      =4     +12      .0      #7      #4
  d_rec      #2      #1      .0      =2      .0      #2      @1      .0      +2      .0      +2      #1      .0      .0      @1      @2      .0      +2     ***      @1      @2      .0      .0      .0
 d_prat      .1      .0      .0      =5      #3      #7      #2      @4      #7      #3      #6      +2      .0      #1      .0      +2      .0      =4      @1     ***      #3      .0      @2      .0
ep_cart     +10      +5      #3     +16      +5     +10      #4      #5     +12      -3     #14      +5      +1      #3      #1      #6      #1     +12      @2      #3     ***      @1      #2      .0
rf_perg      .0      .0      .0      #1      .0      @1      .0      .0      #1      .0      #1      .0      @1      @1      .0      @1      .0      .0      .0      .0      @1     ***      @1      .0
rf_refl      -2      -1      .0      =5      @5      #7      #2      .0      +5      #4      =4      +2      @2      @3      .0      @4      @1      #7      .0      @2      #2      @1     ***      @1
rf_emoc      .1      =1      #1      +4      =1      #3      @3      @3      +4      #2      .1      .0      @1      @1      .0      .0      .0      #4      .0      .0      .0      .0      @1     ***
```

Rótulos curtos: `p_museo`=prof_reflexoes_museologia · `p_aula`=prof_planos_aula · `p_pergA`=prof_perguntas_alunos · `p_orgTr`=prof_organizacao_trabalho · `o_tare`=org_listas_tarefas · `o_lemb`=org_lembretes · `o_agen`=org_agendas · `o_comp`=org_compromissos · `r_tel`=rel_nomes_telefones · `r_cont`=rel_contatos · `r_rede`=rel_redes_relacao · `e_val`=econ_valores_monetarios · `e_cont`=econ_contas · `e_fin`=econ_registros_financeiros · `c_poem`=cult_poemas · `c_cita`=cult_citacoes · `c_ref`=cult_referencias_culturais · `c_dese`=cult_desenhos · `d_rec`=dom_receitas · `d_prat`=dom_anotacoes_praticas · `ep_cart`=epist_esbocos_cartas · `rf_perg`=refl_perguntas_proprias · `rf_refl`=refl_reflexoes_pessoais · `rf_emoc`=refl_registros_emocionais.

### Top 20 pares — MAIOR lift (obs ≥ 5)

| # | par | obs | esp | lift |
|---|---|---:|---:|---:|
| 1 | org_agendas × org_compromissos | 8 | 2,31 | 3,46 |
| 2 | org_listas_tarefas × refl_reflexoes_pessoais | 5 | 1,67 | 2,99 |
| 3 | org_lembretes × org_agendas | 13 | 5,60 | 2,32 |
| 4 | org_listas_tarefas × org_compromissos | 9 | 3,97 | 2,27 |
| 5 | org_lembretes × dom_anotacoes_praticas | 7 | 3,20 | 2,19 |
| 6 | org_lembretes × refl_reflexoes_pessoais | 7 | 3,20 | 2,19 |
| 7 | org_listas_tarefas × cult_citacoes | 10 | 4,59 | 2,18 |
| 8 | org_agendas × econ_valores_monetarios | 6 | 2,92 | 2,05 |
| 9 | prof_reflexoes_museologia × prof_perguntas_alunos | 10 | 4,90 | 2,04 |
| 10 | org_compromissos × econ_valores_monetarios | 8 | 3,97 | 2,02 |
| 11 | prof_reflexoes_museologia × prof_planos_aula | 18 | 8,99 | 2,00 |
| 12 | prof_perguntas_alunos × org_listas_tarefas | 5 | 2,50 | 2,00 |
| 13 | prof_perguntas_alunos × cult_desenhos | 11 | 6,16 | 1,79 |
| 14 | prof_planos_aula × org_listas_tarefas | 8 | 4,59 | 1,74 |
| 15 | cult_desenhos × refl_reflexoes_pessoais | 7 | 4,10 | 1,71 |
| 16 | org_agendas × rel_nomes_telefones | 13 | 7,79 | 1,67 |
| 17 | prof_perguntas_alunos × org_lembretes | 8 | 4,80 | 1,67 |
| 18 | org_lembretes × econ_registros_financeiros | 6 | 3,60 | 1,67 |
| 19 | rel_redes_relacao × econ_registros_financeiros | 7 | 4,23 | 1,66 |
| 20 | org_compromissos × cult_citacoes | 6 | 3,63 | 1,65 |

### Top 20 pares — MENOR lift (esp ≥ 5, "pares que se evitam")

Observação central: entre pares com esperado ≥ 5, **nenhum** cai abaixo de lift 0,5. O par mais evitado é `prof_organizacao_trabalho × rel_contatos` (12 obs, 15,4 esp, lift 0,78). Os 20 menores lifts oscilam entre 0,78 e 1,15 — ou seja, o corpus **quase não tem pares mutuamente exclusivos** entre subitens frequentes. A anticorrelação é discreta.

| # | par | obs | esp | lift |
|---|---|---:|---:|---:|
| 1 | prof_organizacao_trabalho × rel_contatos | 12 | 15,43 | 0,78 |
| 2 | prof_reflexoes_museologia × org_compromissos | 7 | 7,77 | 0,90 |
| 3 | prof_reflexoes_museologia × org_lembretes | 18 | 18,80 | 0,96 |
| 4 | prof_planos_aula × cult_desenhos | 11 | 11,29 | 0,97 |
| 5 | prof_reflexoes_museologia × rel_nomes_telefones | 27 | 26,16 | 1,03 |
| 6 | prof_perguntas_alunos × rel_nomes_telefones | 7 | 6,68 | 1,05 |
| 7 | prof_reflexoes_museologia × org_agendas | 6 | 5,72 | 1,05 |
| 8 | prof_organizacao_trabalho × rel_redes_relacao | 35 | 33,34 | 1,05 |
| 9 | prof_organizacao_trabalho × org_lembretes | 30 | 28,40 | 1,06 |
| 10 | rel_nomes_telefones × cult_citacoes | 13 | 12,24 | 1,06 |
| 11 | prof_organizacao_trabalho × rel_nomes_telefones | 42 | 39,51 | 1,06 |
| 12 | prof_planos_aula × rel_redes_relacao | 11 | 10,33 | 1,06 |
| 13 | prof_reflexoes_museologia × rel_contatos | 11 | 10,22 | 1,08 |
| 14 | prof_planos_aula × prof_organizacao_trabalho | 15 | 13,58 | 1,10 |
| 15 | org_listas_tarefas × rel_nomes_telefones | 15 | 13,36 | 1,12 |
| 16 | rel_nomes_telefones × cult_desenhos | 37 | 32,83 | 1,13 |
| 17 | org_compromissos × cult_desenhos | 11 | 9,75 | 1,13 |
| 18 | rel_nomes_telefones × epist_esbocos_cartas | 12 | 10,57 | 1,13 |
| 19 | prof_planos_aula × rel_nomes_telefones | 14 | 12,24 | 1,14 |
| 20 | prof_organizacao_trabalho × econ_valores_monetarios | 17 | 14,82 | 1,15 |

### Clusters interpretativos identificados

Partindo dos trios densos (todos os três pares com lift ≥ 1,3 e obs ≥ 5) e agregando por vizinhança, emergem **quatro** conjuntos:

- **Cluster I — "Agenda pragmática" (organizacional-relacional-econômica).** Núcleo: `org_agendas` + `org_compromissos` + `org_lembretes` + `org_listas_tarefas` + `econ_valores_monetarios` + `rel_nomes_telefones`. É o cluster mais denso do corpus: os cinco pares internos entre `org_*` estão todos entre os 10 maiores lifts. Trio-topo `org_agendas × org_compromissos × org_lembretes` reúne 8 cadernos (lift médio 2,45). Evidência: WR-CAD-002, 029, 031, 033, 083, 087, 095, 112.

- **Cluster II — "Docência e museologia" (produção intelectual).** Núcleo: `prof_reflexoes_museologia` + `prof_planos_aula` + `prof_perguntas_alunos` + `cult_citacoes` + `org_listas_tarefas`. O par `prof_reflexoes_museologia × prof_planos_aula` tem lift 2,00 (18 obs); acrescentar `cult_citacoes` reúne 4 cadernos (WR-CAD-029, 033, 036, 074). Evidência ampliada: WR-CAD-004, 017, 027, 029, 031, 033, 035, 036, 041, 046, 048, 050, 065, 067, 073, 074.

- **Cluster III — "Escrita reflexivo-doméstica".** Núcleo: `refl_reflexoes_pessoais` + `dom_anotacoes_praticas` + `org_lembretes` + `org_listas_tarefas` + `cult_desenhos` + `epist_esbocos_cartas`. É o cluster **mais interessante para a tese** — e o mais frágil em números absolutos (`refl_reflexoes_pessoais` só aparece 8 vezes). Contudo, o par `dom_anotacoes_praticas × refl_reflexoes_pessoais` tem obs=2 (abaixo do corte), enquanto `refl_reflexoes_pessoais × org_listas_tarefas` (lift 2,99, 5 obs) e `refl_reflexoes_pessoais × org_lembretes` (lift 2,19, 7 obs) sustentam a densidade. O trio `refl_reflexoes_pessoais + dom_anotacoes_praticas + epist_esbocos_cartas` coocorre em **apenas 1 caderno** (WR-CAD-077, 1979-1981). Outros representantes: WR-CAD-030, 036, 069, 070, 097, 115.

- **Cluster IV — "Economia doméstica" (satélite).** Núcleo: `econ_contas` + `econ_registros_financeiros` + `econ_valores_monetarios`, com pontes para `org_agendas` e `refl_reflexoes_pessoais` via cadernos como WR-CAD-070 e 097. Pequeno (5–9 obs) mas com lifts altos internos.

## Leitura interpretativa

O achado central é que **a hipótese dos três clusters se sustenta parcialmente, e assimetricamente**. O "cluster agenda profissional" existe e é o mais robusto do banco — mas ele é maior do que a hipótese previa: as três categorias `org_*` densificam-se **entre si** com lift 2,3–3,5 (agendas × compromissos × lembretes), e a coocorrência com `prof_organizacao_trabalho` e `rel_nomes_telefones`, embora frequente em números absolutos (42 e 30 pares), acontece **em torno do esperado** (lift 1,06). Ou seja: a "agenda profissional" é sobretudo um cluster **organizacional interno**, ao qual o eixo profissional se acopla porque quase todo caderno tem `prof_organizacao_trabalho` marcado (62%). A leitura pragmática deve considerar isso: o eixo profissional funciona como pano de fundo, não como diferenciador.

O "cluster museologia teórica" também se confirma, com uma correção: a segunda espinha é `prof_planos_aula`, não `cult_referencias_culturais`. Este último subitem só tem 4 fichas marcadas — o lift do par `prof_reflexoes_museologia × cult_referencias_culturais` (não listado no top 20 por baixa contagem) é alto mas ruidoso. O que realmente sustenta o cluster museológico é o eixo **teoria-docência** (`prof_reflexoes_museologia × prof_planos_aula`, lift 2,00, 18 obs) com `cult_citacoes` como ancoragem intelectual.

O "cluster escrita íntima" é a hipótese que **mais precisa de cautela**. Só existem 8 fichas com `refl_reflexoes_pessoais`, 8 com `dom_anotacoes_praticas`, 1 com `refl_perguntas_proprias` e 19 com `epist_esbocos_cartas`. A tríade completa aparece em **um único caderno** (WR-CAD-077). O que se observa, porém, é significativo: os cadernos com marcação reflexivo-pessoal quase sempre também têm `org_lembretes`, `org_listas_tarefas` e `cult_desenhos` — sugerindo que a escrita íntima da Waldisa, quando aparece, **não vem em cadernos temáticos separados**, mas incrustada em cadernos-agenda-diário híbridos. Isso é forte para a leitura "proto-diarística": a escrita de si se dá dentro do fluxo pragmático, não fora dele. Os cadernos mais densos do acervo (WR-CAD-033, 029, 032, 024, 077, 031, 036, 070, 097, 035, 085, 112, 115) — todos datados nos 1980, exceto os dois de fronteira 1977-1978 e 1979-1981 — concentram justamente essa mistura.

A "matriz de evitações" praticamente não existe. O menor lift entre pares com esperado ≥ 5 é 0,78. Isso significa que, no vocabulário atual das fichas, **os subitens não competem**: a marca de uma categoria não afasta a de outra. É consistente com cadernos-de-tudo em que o suporte material carrega funções heterogêneas em paralelo.

## Limites e cavalos-de-Troia

Correlação não é causa: um par com lift alto não implica que Waldisa "combinasse" essas categorias — só que a pesquisadora marcou as duas ao ler o caderno. Fichas ≠ conteúdo íntimo: cada `Sim` é presença, não intensidade (um caderno com `cult_desenhos = Sim` pode ter 200 rabiscos ou 2). Com N=115 e subitens raros (`refl_perguntas_proprias`=1, `dom_receitas`=3, `cult_poemas`=4, `cult_referencias_culturais`=4), pares raros têm lift instável e foram deliberadamente cortados. O corte obs≥5 preserva sinal mas oculta possíveis assinaturas de nicho (ex.: `cult_poemas × cult_citacoes` tem lift ≈ 3,9 com apenas 3 obs — sugestivo, não conclusivo). Por fim, a matriz não considera datação — pares podem ser mais fortes em subperíodos (ver B-04).

## Evidência primária

- Cluster I (agenda pragmática) — WR-CAD-002, WR-CAD-029, WR-CAD-031, WR-CAD-033, WR-CAD-083, WR-CAD-087, WR-CAD-095, WR-CAD-112.
- Cluster II (docência/museologia) — WR-CAD-004, WR-CAD-017, WR-CAD-029, WR-CAD-033, WR-CAD-036, WR-CAD-074.
- Cluster III (reflexivo-doméstico híbrido) — WR-CAD-030, WR-CAD-036, WR-CAD-069, WR-CAD-070, WR-CAD-077, WR-CAD-097, WR-CAD-115.
- Cadernos densos (≥ 9 subitens marcados), candidatos a proto-diários — WR-CAD-033 (n=16, 1987), WR-CAD-029 (n=13, 1983), WR-CAD-032 (n=13, 1987), WR-CAD-024 (n=12, 1987), WR-CAD-077 (n=11, 1979-1981), WR-CAD-031 (n=10, 1984), WR-CAD-036 (n=10, s/d), WR-CAD-070 (n=10, 1977-1978), WR-CAD-097 (n=10, 1982).

## Sugestões de aprofundamento

Antecipa D-02 (termos recorrentes nas observações): os quatro clusters identificados sugerem quatro famílias de tags — pragmática/agenda, docência-museologia, reflexivo-doméstica, economia. Complementa D-03 (rede por similaridade): os cadernos densos listados devem formar o núcleo denso do grafo. Interessa a C-01 (predominância): a regra atual ignora `org_*` e `rel_*`, mas o cluster I mostra que `org_*` é o motor coocorrencial do acervo — vale simular uma predominância que trate `org_*` como profissional e o cluster III como pessoal. Interessa também a C-03 (cadernos híbridos): a lista de cadernos densos deve ser cruzada com datação — a impressão é que se concentram em 1982-1988.
