Internal preview · v1.3 · seed v1·Appito Expansion Intelligence

Expansion Intelligence

Centro de decisão e operação da expansão Appito
SFE uncalibratedn=0/3
ambienteAppito

Corpus · acervo head

Catalog do backup do head Appito (D:\Backup Appito 27.04.26) processado pelo pipeline em 4 camadas (scan → extract → auto-tag → enqueue). 11 arenas auto-detectadas via regex em paths. Numbers reais do scan executado em 16 de mai. de 2026.

Probe v1.2 — mock baseado em scan real: estes números vêm do SQLite local aee_corpus_smoke.db populado pelo pipeline python -m src.corpus scan em 2026-05-16. Quando Postgres docker subir e Sessão 04.X3 expor endpoints /api/corpus/*, este frontend troca a fonte sem mudança de código.

Arquivos catalogados
10.587
10.568 dentro de ZIPs · 50 nested
Tamanho descompactado
73.59 GB
73.6 GB · 19 ZIPs Google Drive Takeout
Auto-tags
15.988
10.587 files cobertos · média 1,5 tag/file
Fila curadoria
10.330
257 auto-pass · manual: Sessão 04.X2

Distribuição por arena

8 auto-detectadas via regex em path
ArenaArquivos% do acervoBarra
barueri2.17220.5%
taquaral-campinas1.94318.4%
play-joao-dias5545.2%
limao5014.7%
vila-leopoldina1071.0%
sbc-golden-square1071.0%
alphaville3< 0,1%
(variantes -engenharia / bug v1)170.2%

Bug detectado: regex captura "ENGENHARIA" como nome de arena (variantes -engenharia). Sessão 04.X2 corrige no auto-tagger v2.

Distribuição por categoria

14 categorias canônicas
CategoriaArquivos% do acervoBarra
obras-projetos5.06647.8%
fotos-obra1.80317.0%
obras-execucao1.42413.4%
financial7467.0%
outros6336.0%
propostas-locacao3343.2%
juridico-contratos2362.2%
comunicacao-visual1421.3%
aprovacoes1031.0%
operacional600.6%
documentacao-tec220.2%
fornecedores120.1%
rh5< 0,1%
brand1< 0,1%

Distribuição por extensão (top 13)

73.59 GB · 13 tipos
ExtensãoArquivosTamanhoCategoria principal
.pdf4.5475.45 GBDocumentos · propostas · projetos
.jpg2.4199.64 GBFotos de obra
.xlsx824244 MBPlanilhas financeiras
.jpeg752174 MBFotos de obra
.dwg7204.31 GBPlantas AutoCAD (nativas)
.docx642455 MBDocumentos editáveis
.png184107 MBImagens · screenshots
.mp41446.49 GBVídeos de obra
.ifc532.55 GBBIM standard (Industry Foundation Classes)
.zip4738.32 GBArchives nested
.rvt435.18 GBRevit BIM
.heic2741 MBFotos iPhone
.pptx241.90 GBApresentações

Próximos passos

  • Sessão 04.X2: curadoria humana dos 10.330 prioritários via skill /g3-corpus-curate (materializa via /g3-desafio na 1ª curadoria). Auto-tagger v2 fix bug "ENGENHARIA"-as-arena + parse de EXPANSÃO/Leads Novas Arenas/<Endereço> como pipeline-captação.
  • Sessão 04.X3: backend endpoints /api/corpus/* + integração com /pontos (mostra docs relacionados ao ponto) + /benchmarks (idem). Switch NEXT_PUBLIC_AEE_DATA_SOURCE=backend.
  • Eventualmente: pgvector (Opção B) se busca semântica solta virar demanda. Hoje SQL puro entrega.