# Análise A-04 — Distribuição de tipo de caderno

## Pergunta

Que suportes materiais dominam no acervo de 115 cadernos? E como consolidar os 44 tipos únicos observados nas fichas num vocabulário controlado utilizável na planilha final?

## Hipótese esperada (antes de rodar)

"Caderno A5" e "caderno grande" concentram mais de 60% do acervo; agendas específicas por ano ou por marca são minoria; muitos dos 44 tipos únicos são variações de grafia — maiúsculas, hífen, aspas — do mesmo suporte material.

## Método

Três passos, deliberadamente separados:

1. **Contagem bruta:** agrupamento de `tipo_caderno` como texto literal, sem tocar caixa alta/baixa ou acentos.
2. **Normalização:** consolidação por família material — reunindo "Caderno A5", "caderno A5", "A5", "caderno A-5", "Caderno 'Record' parece A5" e "Caderno 'caderflex' A5" sob a mesma etiqueta, e assim por diante. Regra geral: só normaliza-se quando a ficha descreve inequivocamente o mesmo suporte. Onde há dupla natureza ("Agenda e Bloco"), suporte hesitante ("caderno ou agenda?") ou termo curto demais ("caderno"), o caso vai para `[dúvida]`, não para chute.
3. **Vocabulário controlado:** proposta de 10 termos-mestre, cada um com definição de uma linha e mapa dos termos-filhos observados.

Casos-fronteira tratados assim:
- **"caderno Tilibra"** (WR-CAD-047): Tilibra fabricava vários formatos — mantido em `[dúvida]` até checagem visual, apesar da tentação de assimilar a A5.
- **"caderno grande de 'matérias'"** e **"caderno grande de disciplinas"** (WR-CAD-066, 067, 077): a ficha descreve caderno escolar dividido por disciplinas, tamanho grande — assimilados a "Caderno grande" com uma subcategoria funcional na definição.
- **"Grande caderno com as letras do alfabeto nas laterais"** (WR-CAD-049): as observações da pesquisadora o descrevem como "uma grande agenda de nomes e telefones" — porém o suporte material é caderno grande indexado; a decisão foi normalizar por suporte, não por uso, e assimilar a "Caderno grande".
- **"Agenda grande capa dura"** (WR-CAD-087): capa dura aparece só nesta e nos três "caderno grande capa dura"; agrupou-se em "Agenda datada/nomeada" pelo rótulo agenda + "Memória 79" nas observações.
- **"caderno"** solto (WR-CAD-019) e **"caderno ou agenda?"** (WR-CAD-065): `[dúvida]` explícita.

## Resultado

### (a) Contagem bruta — 44 tipos únicos

| n | tipo_caderno (literal) | exemplos |
|---:|---|---|
| 22 | Caderno A5 | WR-CAD-013, 014, 016, 017 |
| 17 | caderno grande | WR-CAD-068, 069, 070, 071 |
| 11 | caderno A5 | WR-CAD-021, 023, 024, 025 |
| 8 | Bloco | WR-CAD-054, 055, 056, 057 |
| 6 | Agenda | WR-CAD-001, 010, 031, 033 |
| 5 | A5 | WR-CAD-091, 101, 102, 104 |
| 3 | caderno grande capa dura | WR-CAD-084, 085, 086 |
| 2 | Agenda de telefones | WR-CAD-005, 089 |
| 2 | Caderno A6 | WR-CAD-006, 008 |
| 2 | caderno grande de 'matérias' | WR-CAD-066, 067 |
| 2 | A5 - Folhas soltas | WR-CAD-103, 108 |
| 2 | Bloco de desenho | WR-CAD-106, 114 |
| 2 | Agenda NOVA | WR-CAD-112, 115 |
| 1 | Agenda NOVA 1980 | WR-CAD-002 |
| 1 | Bloco de notas | WR-CAD-003 |
| 1 | Bloco de Anotações | WR-CAD-004 |
| 1 | Caderneta de anotações 1990 | WR-CAD-007 |
| 1 | Agenda 1983 | WR-CAD-009 |
| 1 | Agenda de telefone | WR-CAD-011 |
| 1 | Caderno de Anotações NOVA | WR-CAD-012 |
| 1 | caderno A-5 | WR-CAD-015 |
| 1 | caderno | WR-CAD-019 |
| 1 | Caderno "Record" parece A5 | WR-CAD-046 |
| 1 | caderno Tilibra | WR-CAD-047 |
| 1 | Caderno "caderflex" A5 | WR-CAD-048 |
| 1 | Grande caderno com as letras do alfabeto nas laterais | WR-CAD-049 |
| 1 | Parece que foi um A5 | WR-CAD-052 |
| 1 | caderno c/ espiral parece A5 | WR-CAD-053 |
| 1 | Agenda e Bloco | WR-CAD-061 |
| 1 | Bloco ou caderno sem capa tamanho pequeno | WR-CAD-063 |
| 1 | Agenda telefones | WR-CAD-064 |
| 1 | caderno ou agenda? | WR-CAD-065 |
| 1 | "Monobloco ofício" | WR-CAD-072 |
| 1 | Bloco de anotações grande | WR-CAD-076 |
| 1 | caderno grande de disciplinas | WR-CAD-077 |
| 1 | Agenda grande capa dura | WR-CAD-087 |
| 1 | Agenda Olivetti capa dura | WR-CAD-095 |
| 1 | Agenda Alitalia | WR-CAD-096 |
| 1 | Agenda Itaú | WR-CAD-097 |
| 1 | Caderno com plásticos p/ cartões de visita | WR-CAD-098 |
| 1 | Agenda "Círculo do Livro" | WR-CAD-100 |
| 1 | caderno grande folhas soltas | WR-CAD-105 |
| 1 | caderno de desenho | WR-CAD-107 |
| 1 | Bloco pequeno | WR-CAD-113 |

### (b) Contagem normalizada — 10 famílias + 1 dúvida

| n | família normalizada | % do acervo |
|---:|---|---:|
| 44 | Caderno A5 | 38,3% |
| 21 | Caderno grande | 18,3% |
| 14 | Bloco | 12,2% |
| 11 | Agenda datada/nomeada | 9,6% |
| 7 | Agenda | 6,1% |
| 4 | Agenda de telefones | 3,5% |
| 3 | Caderno grande capa dura | 2,6% |
| 3 | Bloco/caderno de desenho | 2,6% |
| 2 | Caderno A6 | 1,7% |
| 2 | Folhas soltas (A5 ou grande) | 1,7% |
| 1 | Caderno de cartões de visita | 0,9% |
| 3 | [dúvida] | 2,6% |

A hipótese se confirma no essencial: **Caderno A5 (44) + Caderno grande (21) = 65 cadernos, 56,5% do acervo**; se somarmos "Caderno grande capa dura" (3) e "Caderno A6" (2), a família do "caderno de escrita" chega a **70 cadernos (60,9%)**. Agendas em todas as suas variantes (nomeada, telefônica, genérica) somam 22 cadernos (19,1%). Blocos, 14 cadernos (12,2%).

### (c) Proposta de vocabulário controlado — 10 termos-mestre

Cada termo tem uma definição de uma linha; entre parênteses, as grafias observadas que colapsam nele.

1. **`caderno_a5`** — Caderno costurado/espiralado formato A5, uso corrente, ampla maioria do acervo. Filhos: "Caderno A5", "caderno A5", "A5", "caderno A-5", "Caderno 'Record' parece A5", "Caderno 'caderflex' A5", "Parece que foi um A5", "caderno c/ espiral parece A5".
2. **`caderno_a6`** — Caderno de bolso formato A6 (metade do A5). Filhos: "Caderno A6".
3. **`caderno_grande`** — Caderno de tamanho superior ao A5, muitas vezes escolar (matérias/disciplinas) ou indexado. Filhos: "caderno grande", "caderno grande de 'matérias'", "caderno grande de disciplinas", "Grande caderno com as letras do alfabeto nas laterais".
4. **`caderno_grande_capa_dura`** — Variante do anterior com encadernação rígida, sugerindo uso mais durável/arquivístico. Filhos: "caderno grande capa dura".
5. **`agenda`** — Agenda genérica sem marca ou ano identificados na ficha. Filhos: "Agenda", "Agenda e Bloco".
6. **`agenda_datada_nomeada`** — Agenda com ano impresso, marca ou brinde institucional (Olivetti, Alitalia, Itaú, Círculo do Livro, NOVA). Filhos: "Agenda NOVA", "Agenda NOVA 1980", "Agenda 1983", "Caderneta de anotações 1990", "Caderno de Anotações NOVA", "Agenda grande capa dura", "Agenda Olivetti capa dura", "Agenda Alitalia", "Agenda Itaú", "Agenda 'Círculo do Livro'".
7. **`agenda_telefones`** — Agenda telefônica específica (organizada alfabeticamente para contatos). Filhos: "Agenda de telefones", "Agenda de telefone", "Agenda telefones".
8. **`bloco`** — Bloco de notas destacáveis, sem encadernação de caderno; inclui monobloco ofício e blocos sem capa. Filhos: "Bloco", "Bloco de notas", "Bloco de Anotações", "Bloco de anotações grande", "Bloco pequeno", "Bloco ou caderno sem capa tamanho pequeno", "'Monobloco ofício'".
9. **`bloco_desenho`** — Suporte específico para desenho (papel apropriado, formato bloco ou caderno). Filhos: "Bloco de desenho", "caderno de desenho".
10. **`suporte_especial`** — Suportes atípicos que não se encaixam nos anteriores (folhas soltas, álbuns de cartões). Filhos: "A5 - Folhas soltas", "caderno grande folhas soltas", "Caderno com plásticos p/ cartões de visita".

**Termo-marcador para revisão:** `[duvida]` — usar enquanto a ficha não permitir decisão. Ocorrências atuais: WR-CAD-019 ("caderno"), WR-CAD-047 ("caderno Tilibra"), WR-CAD-065 ("caderno ou agenda?").

## Leitura interpretativa

A materialidade do acervo, tal como as fichas a descrevem, é dominada pelo **caderno A5** — o suporte comum, portátil, de uso corrente, que perfaz mais de um terço do total. O **caderno grande**, com quase um quinto, aparece na sequência: são os cadernos escolares/de disciplinas, ou os indexados pelo alfabeto (WR-CAD-049) — objetos de acumulação, não de trânsito. Somados, esses dois formatos concentram 56% do acervo; incluindo capa dura e A6, a família do "caderno de escrita contínua" alcança 61%. A hipótese material é confirmada com folga.

A distinção que mais importa para a leitura da tese não é, porém, o tamanho — é a **oposição entre três gestos de suporte**: (i) o **caderno** (A5, A6, grande, capa dura — 70 cadernos), onde o texto se acumula em fluxo; (ii) a **agenda** (datada, nomeada, telefônica ou genérica — 22 cadernos), onde a escrita é enquadrada pela grade temporal ou por letras do alfabeto; e (iii) o **bloco** (14 cadernos), suporte de anotação tática, folha destacável, o oposto do arquivo. Ao lado disso, três anomalias produtivas: o bloco/caderno de desenho, o álbum de cartões de visita e as folhas soltas — casos em que o próprio suporte já anuncia um uso particular.

Essa tripartição é insumo direto para C-02 e E-02: a hipótese proto-diarística deveria se materializar mais no caderno grande (fluxo denso, longos) do que no bloco (fragmento tático). As agendas nomeadas — todas datadas ou com ano impresso — são, sozinhas, um índice cronológico independente das observações; 10 das 11 agendas dessa família trazem ano visível no rótulo.

A pesquisadora tinha razão sobre a materialidade: a variedade dos 44 rótulos brutos é sobretudo de escrita, não de suporte. Sob o vocabulário proposto, o acervo se organiza em uma dezena de famílias reconhecíveis, sem violência sobre casos ambíguos.

## Limites e cavalos-de-Troia

A normalização é uma decisão da pesquisadora, não uma verdade material — a proposta acima **assimila por rótulo**, não por inspeção da imagem. Três limites concretos:

1. **"Tilibra" sem A5 explícito** (WR-CAD-047): a marca fabrica vários formatos; mantido em `[duvida]` apesar da probabilidade alta de ser A5.
2. **"Grande caderno com as letras do alfabeto nas laterais"** (WR-CAD-049) foi assimilado a "Caderno grande" pelo suporte, mas as observações descrevem uso como agenda de nomes/telefones — o vocabulário controlado registra suporte, e a função (agenda) fica em `rel_nomes_telefones` no verso.
3. **"caderno grande de matérias/disciplinas"** (WR-CAD-066, 067, 077): a ficha sugere um caderno escolar; se a pesquisadora entender que "caderno escolar" é uma família própria (com implicações interpretativas — Waldisa aluna vs. Waldisa professora), a família 3 pode se subdividir. Para uma dissertação sobre a intensidade cotidiana da escrita, essa subdivisão importa.

Também: as **fichas não são o suporte físico** — quem descreveu foi a pesquisadora, muitas vezes com hesitação ("parece A5", "parece foi um A5"). A normalização foi conservadora nesses casos, mas nada garante que a inspeção direta confirme o rótulo.

## Evidência primária

Casos citáveis para cada família: WR-CAD-013 (Caderno A5, tipo mediano); WR-CAD-049 (caderno grande indexado, 404 páginas, o "livro-agenda"); WR-CAD-066 e WR-CAD-067 (caderno grande de matérias, escolar, 1973–74); WR-CAD-097 (Agenda Itaú, ficha bem preenchida — cf. ANALISE §2); WR-CAD-002 (Agenda NOVA 1980, marcador cronológico dos 1980); WR-CAD-072 (Monobloco ofício, um bloco atípico); WR-CAD-098 (álbum de cartões de visita, suporte especial); WR-CAD-105 (caderno grande folhas soltas); WR-CAD-107 e WR-CAD-114 (bloco/caderno de desenho); WR-CAD-047 e WR-CAD-065 (dúvidas mantidas para decisão da pesquisadora).

## Sugestões de aprofundamento

1. **Cruzar o vocabulário com E-02** (materialidade × predominância) — testar se caderno grande realmente concentra híbridos e se bloco concentra profissionais.
2. **Cruzar com B-01** — as agendas datadas/nomeadas trazem ano no rótulo; usá-las como âncora independente para reforçar o corpus dos 1980.
3. **Decidir com a pesquisadora** o destino dos 3 casos em `[dúvida]` (WR-CAD-019, 047, 065): checagem visual ou aceitação do rótulo como está.
4. **Considerar subfamília "caderno escolar/de disciplinas"** — se a Renata julgar interpretativamente relevante distinguir Waldisa-aluna de Waldisa-professora, WR-CAD-066, 067, 077 formam um pequeno núcleo próprio, quase todo datado dos anos 1970.
5. **Adotar o vocabulário na coluna `tipo_caderno`** conforme decisão em PROJETO.md §7, preservando a grafia original em `tipo_caderno_literal` como coluna paralela para rastreabilidade.
