# Análise E-03 — As caixas como camadas temáticas ou temporais

## Pergunta
Cada uma das 20 caixas do acervo tem um perfil próprio? A organização física reflete alguma lógica — cronológica, temática, ou aleatória?

## Hipótese esperada (antes de rodar)
Algumas caixas seriam cronológicas (concentrando cadernos de um período curto), outras temáticas (concentrando um tipo de conteúdo — museologia, contatos, agendas), e a caixa 20, por ser explicitamente remontada (D-04, WR-CAD-101), funcionaria como "cesto" heterogêneo, sem lógica interna forte.

## Método
Para cada uma das 20 caixas, computei sobre `site/data/banco.json`: (a) N cadernos e códigos; (b) faixa mínima–máxima de ano a partir de `datacao_estimada` e proporção de cadernos catalogados como sendo dos anos 1980 entre os datados; (c) contagem por `predominancia`; (d) densidade categórica média — número médio de subitens com "Sim" nas 24 categorias; (e) tipo dominante, normalizado como em A-04 (Agenda, Bloco, Caderno A5, Caderno grande, Bloco de desenho, etc.); (f) categorias "marcantes", definidas como subitens cuja frequência relativa na caixa é ≥ 2× a frequência relativa global no acervo, com pelo menos 2 marcações internas — o que sinaliza sobre-representação em relação ao esperado. Usei `caixa` como campo primário; para o único caso com `caixa=[incerto]` (WR-CAD-070), apliquei `caixa_subpasta=9` como fallback, sinalizando a incerteza. WR-CAD-101 registra em observações que a caixa 20 é composta de cadernos retirados de outras caixas (D-04): esta ficha metodologicamente pesada estrutura toda a leitura das caixas grandes.

## Resultado

**Ficha-perfil das 20 caixas.** Categorias marcantes são as sobre-representadas em relação ao acervo (frequência local ≥ 2× frequência global; mínimo 2 marcações).

| Cx | N | Códigos (WR-CAD-…) | Faixa anos | % 1980 (datados) | Predominância | Dens. cat. média | Tipo dominante | Categorias marcantes |
|--:|--:|---|---|--:|---|--:|---|---|
| 1 | 11 | 001–011 | 1968–1990 | 75% (8/11) | prof 6, misto 5 | 4,2 | Agenda (6); Bloco (2) | org_compromissos (6/11, 3,3×); dom_anotacoes_praticas (2/11, 2,6×) |
| 2 | 7 | 012–018 | 1984–1985 | 100% (2/7) | prof 5, misto 2 | 3,1 | Caderno A5 (6) | — |
| 3 | 11 | 019–029 | 1980–1988 | 100% (9/11) | prof 10, misto 1 | 5,9 | Caderno A5 (10) | org_listas_tarefas (2,2×); cult_citacoes (2,4×); cult_referencias_culturais (5,2×) |
| 4 | 5 | 030–034 | 1984–1987 | 100% (4/5) | prof 3, misto 2 | **9,6** | Agenda (3); Caderno A5 (2) | prof_planos_aula (2,1×); prof_perguntas_alunos (3,8×); org_listas_tarefas (3,8×) |
| 5 | 11 | 035–045 | 1979–1988 | 86% (7/11) | prof 9, misto 2 | 5,0 | Caderno A5 (11) | prof_perguntas_alunos (2,6×) |
| 6 | 6 | 046–051 | 1980–1985 | 100% (4/6) | prof 4, misto 2 | 5,0 | Caderno A5 (4) | prof_planos_aula (2,6×); rel_contatos (2,3×) |
| 7 | 14 | 052–065 | 1979–1986 | 67% (6/14) | prof 10, misto 3, pess 1 | 4,2 | Bloco (7); Caderno A5 (4) | prof_perguntas_alunos (2,1×); epist_esbocos_cartas (2,6×) |
| 8 | 3 | 066–068 | 1973–1974 | 0% (1/3) | prof 2, misto 1 | 4,7 | Caderno grande (3) | rel_contatos (3,1×) |
| 9 | 2 | 069, 070* | 1970–1978 | 0% (2/2) | pess 1, misto 1 | **8,0** | Caderno grande (2) | org_lembretes (2,5×); cult_citacoes (5,2×); **refl_reflexoes_pessoais (14,4×)** |
| 10 | 3 | 071–073 | 1981–1991 | 50% (2/3) | misto 2, prof 1 | 2,3 | Caderno grande (2); Bloco (1) | — |
| 11 | 3 | 074–076 | 1982–1986 | 100% (3/3) | prof 2, misto 1 | 4,3 | Caderno grande (2); Bloco (1) | prof_planos_aula (3,5×) |
| 12 | 3 | 077–079 | 1979–1981 | 100% (3/3) | prof 2, pess 1 | **8,0** | Caderno grande (3) | prof_reflexoes_museologia (2,4×); prof_perguntas_alunos (6,4×); rel_contatos (4,6×) |
| 13 | 4 | 080–083 | 1973–1983 | 50% (2/4) | prof 3, misto 1 | 4,8 | Caderno grande (3); Caderno A5 (1) | prof_perguntas_alunos (4,8×); cult_citacoes (2,6×) |
| 14 | 3 | 084–086 | 1980–1981 | 100% (2/3) | misto 2, pess 1 | 3,0 | Caderno grande (3) | — |
| 15 | 2 | 087, 088 | 1979 | 0% (1/2) | pess 1, misto 1 | 3,5 | Agenda (1); Caderno grande (1) | — |
| 16 | 2 | 089, 090 | sem | — | misto 2 | 3,0 | Agenda (1); Caderno grande (1) | rel_redes_relacao (2,1×) |
| 17 | 4 | 091–094 | 1970–1988 | 75% (4/4) | prof 4 | 5,3 | Caderno grande (3); Caderno A5 (1) | rel_contatos (2,3×); econ_registros_financeiros (6,4×) |
| 18 | 2 | 095, 096 | 1982–1985 | 100% (2/2) | misto 1, prof 1 | **8,0** | Agenda (2) | org_lembretes (2,5×); **org_agendas (8,2×)**; rel_redes_relacao (2,1×) |
| 19 | 4 | 097–100 | 1982–1988 | 100% (3/4) | **pess 3**, misto 1 | 5,5 | Agenda (3) | dom_anotacoes_praticas (7,2×) |
| 20 | 15 | 101–115 | 1967–1988 | 67% (9/15) | prof 12, misto 2, pess 1 | 4,7 | Caderno A5 (6); Bloco (5) | econ_contas (4,6×) |

\* WR-CAD-070 tem `caixa=[incerto]` na sua ficha; entra aqui pelo `caixa_subpasta=9` e pela pista de D-04 (a observação de WR-CAD-069 registra que a caixa 9 tem dois cadernos grandes dos anos 1970 — evidência convergente).

## Leitura interpretativa

**A hipótese de "algumas cronológicas, outras temáticas" se sustenta parcialmente, mas o retrato é mais matizado.** Nenhuma caixa é rigorosamente monodecadal: mesmo as mais estreitas (caixa 2, com faixa 1984–1985 nos dois cadernos datados; caixa 4, com 1984–1987; caixa 6, com 1980–1985) têm cadernos sem data que podem alargar a janela. Mas há um gradiente claro: caixas 2, 4, 6, 11, 12, 14, 18, 19 têm faixas estreitas (≤ 5 anos entre datados) e 100% dos datados nos anos 1980 ou fronteira; caixas 1, 5, 7, 13, 17 e 20 têm faixas largas (10 a 21 anos) e misturam décadas. A leitura sugere **eixos organizadores mistos** — cronologia frouxa nas caixas médias, tema/forma dominante nas grandes, e resíduo material na caixa 20.

**As caixas mais notáveis:**

- **Caixa 4 (WR-CAD-030 a 034) — a caixa didática mais densa.** Com apenas 5 cadernos, exibe a maior densidade categórica do acervo (9,6 marcações médias — o dobro da média global de ~4,7). Todos entre 1984 e 1987. WR-CAD-033 marca 16 categorias (a marca mais alta que aparece na varredura); WR-CAD-032 marca 13. Predominância de agendas grossas e cadernos A5, sobre-representação de `prof_planos_aula` e `prof_perguntas_alunos`. Perfil coerente: uma caixa de cadernos de docência intensa no meio dos anos 1980, funcionando como candidata canônica à leitura "proto-diarística" de C-03 (híbridos-densos concentrados nos 1980).

- **Caixa 9 (WR-CAD-069 e 070) — a caixa pessoal-reflexiva dos anos 1970.** Ilha temática mais nítida do acervo. Dois cadernos grandes, ambos dos anos 1970, ambos com `refl_reflexoes_pessoais` marcado — sobre-representação absurda de 14,4× em relação ao esperado. Ainda que WR-CAD-070 conste com `caixa=[incerto]` na sua própria ficha, D-04 mostra que WR-CAD-069 descreve a caixa 9 como contendo dois cadernos grandes dos anos 1970 — pista externa que fecha o par. Se a decisão da pesquisadora confirmar a alocação, a caixa 9 será o exemplo mais nítido de **caixa temática** (escrita reflexiva pré-1980) do acervo.

- **Caixa 18 (WR-CAD-095, 096) — a caixa de agendas puras.** Duas agendas datadas (1982, 1985), tipo dominante Agenda, com sobre-representação extrema de `org_agendas` (8,2×). Perfil funcional: caixa-agenda profissional dos anos 1980. Caixa pequena, mas internamente muito coerente.

- **Caixa 19 (WR-CAD-097 a 100) — a caixa "pessoal" dos anos 1980.** Já sinalizada em A-01 como a única caixa pequena com maioria "pessoal" (3/4). Todas datadas 1982–1988. Concentra `dom_anotacoes_praticas` (7,2×). Combina com a caixa 9 (pessoal-1970) para sugerir um princípio de organização: cadernos mais íntimos foram destinados a caixas pequenas próprias, não misturados com o grosso profissional. Hipótese a testar com a decisão da pesquisadora.

- **Caixa 20 (WR-CAD-101 a 115) — a caixa remontada.** É a maior caixa do acervo (15 cadernos) mas seu perfil precisa ser lido à luz de D-04: a observação de WR-CAD-101 diz que a caixa 20 é composta de cadernos retirados de outras caixas, envoltos em plástico. **Não é uma caixa original.** Coerentemente com isso, apresenta a maior amplitude cronológica do acervo (1967 a 1988, 21 anos), o maior número de tipos materiais misturados (Caderno A5, Bloco, Bloco de desenho, Agenda, folhas soltas — pelo menos 5 formatos), e nenhum eixo temático forte (só `econ_contas` aparece marginalmente sobre-representado). O perfil da caixa 20 não deve ser lido como "camada" original do acervo, mas como **residual editorial** — o traço de uma reorganização posterior. Isto tem implicação metodológica: qualquer análise que usar "caixa" como proxy de coerência interna deve excluir a caixa 20, ou tratá-la à parte.

**Uma leitura mais especulativa sobre a lógica geral.** A numeração sequencial dos códigos WR-CAD-NNN segue a das caixas (A-01), então a caixa reflete a ordem de catalogação, não necessariamente a de escrita. Ainda assim, o padrão empírico sugere três camadas convivendo: (1) caixas grandes 1, 3, 5, 7 como blocos temático-cronológicos amplos, dominados por Caderno A5 e agendas dos anos 1980 profissionais; (2) caixas pequenas 9 a 19 como agrupamentos mais específicos, algumas coerentes (9 pessoal-1970, 18 agendas, 19 pessoal-1980) e outras com apenas 2–3 cadernos que ainda não permitem inferir critério; (3) caixa 20 como remontagem posterior. Se essa leitura for correta, o acervo mistura **arqueologias de mão diferente** — provavelmente parte veio arranjada da Waldisa ou dos herdeiros e parte foi reorganizada pelo IEB. Confirmar isso pede consulta arquivística externa, não análise interna do banco.

## Limites e cavalos-de-Troia

- N por caixa é pequeno na maior parte dos casos (12 das 20 caixas têm ≤ 4 cadernos). Sobre-representações computadas em base tão pequena — mesmo com o filtro ≥ 2 marcações — são exploratórias, não estatísticas.
- Cerca de 36% dos cadernos são sem `datacao_estimada`; a "faixa de anos" por caixa reflete apenas os datados. Uma caixa com "100% nos 1980" de dois cadernos datados pode ter três cadernos sem datação que puxariam a janela.
- **A caixa 20 é remontada** (D-04, WR-CAD-101). Seu perfil não é uma "camada" do acervo original — é o traço de uma decisão editorial posterior. Não sabemos, a partir das fichas, se outras caixas também foram remontadas parcialmente. É possível; ninguém disse que não.
- **WR-CAD-070** entra como caixa 9 por convergência (D-04 + `caixa_subpasta`), mas sua ficha diz `caixa=[incerto]`. Depende de decisão da pesquisadora.
- As categorias marcantes contam **presença**, não intensidade — um caderno com `cult_desenhos = Sim` pode ter dois rabiscos (ANALISE §5.5).
- "Caixas cronológicas" e "caixas temáticas" são categorias analíticas nossas, não critérios documentados de arranjo. O IEB pode ter arranjo declarado próprio; consulta externa resolveria.

## Evidência primária

WR-CAD-101 (caixa 20 remontada); WR-CAD-033, WR-CAD-032, WR-CAD-030–034 (caixa 4 densa didática); WR-CAD-069, WR-CAD-070 (caixa 9 pessoal-1970); WR-CAD-095, WR-CAD-096 (caixa 18 agendas puras); WR-CAD-097, WR-CAD-099, WR-CAD-100 (caixa 19 pessoal-1980); WR-CAD-103 (o 1967 dentro da caixa 20 — o mais antigo do acervo, precisamente na caixa remontada).

## Sugestões de aprofundamento

1. **Consultar o IEB-USP** sobre a lógica declarada de arranjo das 20 caixas — informação externa que resolveria boa parte da leitura especulativa.
2. **Tratar a caixa 20 à parte** em toda análise que use "caixa" como proxy de coerência (E-01, E-02, análises futuras de rede/similaridade).
3. **Investigar se outras caixas grandes também foram remontadas** — a hipótese de "reorganização editorial" pode se estender além da caixa 20; a observação de WR-CAD-101 é a única pista textual, mas a heterogeneidade da caixa 1 (1968–1990, 22 anos, tipos mistos) merece um segundo olhar.
4. **Confirmar WR-CAD-070 na caixa 9** com a pesquisadora — a evidência convergente já é forte (D-04 + subpasta + perfil pessoal-1970 casando com WR-CAD-069).
5. **Cruzar caixas 4, 9, 18, 19 com F-01 (cadernos-assinatura)** — as três primeiras concentram assinaturas de proto-diarístico e a caixa 9 é o candidato natural a contra-exemplo dos 1980 (dois cadernos pessoal-reflexivos dos 1970).
