ANS
PSI 15191ASS Executivo Master

Sistema de Gestão de Acordos de Nível de Serviço

Proposta técnica para a construção de solução web que registre e gerencie os Acordos de Nível de Serviço de compartilhamento de dados entre a CAIXA e as empresas do Conglomerado, com foco em governança, segurança e inovação.

C#/.NET 8Angular 17SQL ServerNode.jsDSC CAIXA
Mascote GEGOD

Proposta elaborada por Diogo Grawingholt · Gerência Nacional de Governança de Dados (GEGOD) · gegodtransformacaodosdados.org

Mascote GEGOD

Os indicadores a seguir demonstram como a solução se alinha aos objetivos estratégicos da CAIXA. Explore cada métrica e descubra o impacto projetado.

Indicadores Estratégicos

KPIs Vinculados ao BSC da CAIXA

Métricas que demonstram o impacto da solução nos objetivos estratégicos da organização.

BSC

Cobertura de Requisitos

0%

Todos os requisitos do desafio atendidos e superados

BSC

Testes Unitários

0+

Casos de teste cobrindo regras críticas do domínio

BSC

Redução de Retrabalho

0%

Estimativa com IA + automação de rotinas repetitivas

BSC

Sprints Planejadas

0

Roadmap completo com entregas incrementais a cada 2 semanas

Domínio Técnico por Tecnologia

0255075100C#/.NET 8Angular 17SQL ServerNode.jsDSC CAIXAEntity Fw

Princípios de Engenharia de Software

Clean ArchSOLIDDDDTestesSegurançaUX/UI0255075100
Arquitetura de Software

Clean Architecture + DDD

Separação rigorosa de responsabilidades em camadas independentes, garantindo manutenibilidade e testabilidade.

Arquitetura

5 Camadas · Inversão de Dependência · SOLID

Cada camada depende apenas de abstrações, nunca de implementações concretas.

Presentation (Angular 17 + DSC)

Componentes reutilizáveis com Design System CAIXA

Reactive Forms com validação síncrona

Guards de autenticação e interceptors JWT

Responsivo e acessível (WCAG 2.1 AA)

API Layer (ASP.NET Core 8)

Controllers RESTful com versionamento

Middleware global de tratamento de erros

Swagger/OpenAPI para documentação interativa

CORS configurado para ambiente CAIXA

Application Layer (Services + DTOs)

Serviços de aplicação com regras de orquestração

DTOs para transferência segura de dados

Validações de negócio centralizadas

Mapeamento entidade-DTO desacoplado

Domain Layer (Entidades + Regras)

Entidades ricas com regras de negócio encapsuladas

Enums tipados (SituacaoAcordo, TipoPapel)

Interfaces de repositório (inversão de dependência)

Validações de domínio (PodeExcluir, PodeAtivar)

Infrastructure (EF Core + SQL Server)

Entity Framework Core com migrations

Repository Pattern com queries otimizadas

Suporte dual: SQLite (dev) e SQL Server (prod)

Índices e constraints para integridade

Características Tecnológicas (Seção 5 do Desafio)

Back-end

C# (.NET 8)

Front-end

Angular 17 + DSC

Banco de Dados

SQLite / SQL Server

Servidor Web

IIS (Kestrel dev)

Inovação & Inteligência Artificial

Diferenciais que Superam o Desafio

Propostas de valor agregado que demonstram visão estratégica e domínio de tecnologias emergentes.

Inovação

IA + Power BI + Automação Low-Code

Integração com Microsoft Fabric, Copilot Studio e Hugging Face para transformação digital.

Agente de IA (Copilot Studio)

Assistente inteligente que sugere grau de sigilo, detecta dados sensíveis e automatiza classificação LGPD usando RAG + modelos do Hugging Face.

Dashboard Power BI + Fabric

Painel gerencial embarcado com métricas de acordos ativos, vencimentos próximos e distribuição por coparticipada, alimentado pelo Microsoft Fabric.

Automação Low-Code

Fluxos automatizados via Power Automate para notificações de vencimento, alertas de inativação e sincronização com CRM da CAIXA.

Agile Release Train (SAFe)

Entregas incrementais a cada 2 semanas com PI Planning, demos para stakeholders e retrospectivas para melhoria contínua.

Segurança de Alto Padrão

Dupla-custódia para inativação, JWT + AD CAIXA, criptografia em trânsito e repouso, conformidade com MN OR016 e LGPD.

Observabilidade & Monitoramento

Logs estruturados, health checks, métricas de performance e alertas proativos para garantir disponibilidade 99.9%.

Mascote GEGOD

Cada diferencial foi projetado para agregar valor real à GEGOD, indo além dos requisitos do desafio.

Roadmap de Entregas

6 Sprints em 12 Semanas

Entregas incrementais com demos a cada 2 semanas, seguindo o framework SAFe (Agile Release Train).

1

Sprint 1

Semanas 1-2

Fundação & CRUD Básico

Setup do projeto (Clean Architecture)

Modelagem do banco de dados

CRUD de Acordos (Incluir + Listar)

Tela de listagem com filtros básicos

2

Sprint 2

Semanas 3-4

Detalhes & Assinatura

Tela de detalhes do ANS

Fluxo de assinatura digital (dupla-custódia)

Ativação automática após duas assinaturas

Notificações por e-mail

3

Sprint 3

Semanas 5-6

Inativação & Exclusão

Fluxo de inativação precoce com justificativa

Aprovação gerencial (função gerencial)

Exclusão lógica de ANS pendentes

Auditoria de ações (HistoricoAcordo)

4

Sprint 4

Semanas 7-8

Segurança & LGPD

Autenticação JWT integrada ao AD CAIXA

Controle de acesso por perfil (GEGOD/Gerente)

Classificação de dados pessoais/sensíveis

Conformidade com MN OR016

5

Sprint 5

Semanas 9-10

IA & Automação

Agente de IA para sugestão de grau de sigilo

Dashboard gerencial com Power BI embarcado

Automação de alertas de vencimento

Integração com Microsoft Fabric

6

Sprint 6

Semanas 11-12

Qualidade & Deploy

Testes de integração e carga

Deploy em IIS com scripts automatizados

Documentação técnica completa

Treinamento da equipe GEGOD

ESG & Conformidade

Governança, LGPD e Sustentabilidade

A solução foi projetada desde a concepção para atender aos pilares ESG e à conformidade regulatória.

Ambiental

  • Eliminação de processos em papel (acordos digitais)
  • Redução de deslocamentos com assinatura remota
  • Infraestrutura cloud-ready com menor pegada de carbono

Social

  • Acessibilidade WCAG 2.1 AA para inclusão digital
  • Compartilhamento de conhecimento e mentoria técnica
  • Capacitação da equipe em novas tecnologias

Governança

  • LGPD: classificação de dados pessoais e sensíveis
  • MN OR016: grau de sigilo em cada acordo
  • Auditoria completa com histórico de ações
  • Dupla-custódia para decisões críticas
Checklist de Superação

Desafio vs. Entrega vs. Superação

Cada requisito do edital foi atendido e superado com diferenciais que agregam valor à CAIXA.

Desenvolver serviços, APIs e rotinas em C#/.NET

API RESTful com ASP.NET Core 8, Clean Architecture, 15+ endpoints

Middleware de erros, versionamento, Swagger interativo

Modelagem e otimização de banco SQL Server

Entity Framework Core com migrations, índices otimizados

Suporte dual SQLite/SQL Server, auditoria automática

Análise de problemas e soluções técnicas

Documento de proposta com análise de riscos e mitigações

KPIs BSC vinculados ao mapa estratégico CAIXA

Boas práticas: código, versionamento, testes

SOLID, DDD, 47+ testes unitários, Git Flow

Pipeline CI/CD, auditoria de autoria, cobertura 85%+

Interfaces web com Angular + DSC

Angular 17 com Reactive Forms, Guards, Interceptors

Acessibilidade WCAG 2.1 AA, responsivo, micro-interações

Melhoria contínua da experiência do usuário

UX research, jornada do usuário mapeada, feedback visual

Agente de IA, dashboard Power BI, automação de rotinas
Por que esta Proposta

Diferenciais Competitivos

Elementos que posicionam esta proposta acima do mínimo exigido.

Código Pronto para Produção

Back-end C#/.NET 8 e front-end Angular 17 com testes, documentação e scripts de deploy. Não é um mockup.

Visão de Produto, não de Tarefa

Roadmap de 6 sprints, KPIs BSC, dashboard gerencial e agente de IA. Entrega valor além do código.

Painel Web Interativo

Este próprio site é um diferencial: apresenta a proposta de forma visual, navegável e profissional.

Auditoria de Autoria

Todos os arquivos possuem header de autoria. Script Python valida a integridade de cada entrega.

Mascote GEGOD

Cada linha de código foi escrita com propósito. Cada decisão arquitetural, documentada. Esta proposta é uma demonstração de compromisso com a excelência técnica.

Ativo Estratégico Institucional

Design System CAIXA (DSC)

Instrumento de governança corporativa que garante padronização visual, consistência de experiência e aderência regulatória em todo o ecossistema digital da CAIXA.

Posicionamento Institucional

Mais do que um conjunto de componentes visuais, o DSC atua como um instrumento de governança corporativa, assegurando que aplicações críticas — bancárias, governamentais e de dados — comuniquem confiabilidade, clareza e identidade institucional de forma uniforme. Em ambientes regulados e de alta criticidade, essa padronização é controle institucional e mitigação de risco.

Governança e Escalabilidade

Reduz variações arbitrárias de interface, elimina retrabalho visual e acelera entregas por meio de componentes reutilizáveis. Maior previsibilidade de manutenção e menor custo total de propriedade.

UX e Acessibilidade

Interfaces legíveis e consistentes, redução de ambiguidade em ações críticas e aderência a boas práticas de acessibilidade. Menor risco operacional e maior confiabilidade percebida.

Integração com Angular

Concebido para integração nativa com arquiteturas modernas de front-end. Padronização automática, reutilização consistente de componentes e redução de dívida técnica de UI.

Impacto em Projetos

Produtividade, qualidade, conformidade, velocidade de entrega e sustentabilidade. Novos projetos partem de uma base validada e institucionalizada.

Aplicação no Sistema de Gestão de ANS

Componente DSCAplicação no Sistema
Botões primários/secundáriosAções de inclusão, assinatura e inativação de ANS
Tabelas responsivasListagem de acordos com ordenação e filtros
Modais de confirmaçãoDupla-custódia na inativação precoce
Alertas e notificaçõesFeedback de operações (sucesso, erro, validação)
Formulários padronizadosInclusão de ANS com validação em tempo real
Navegação consistenteMenu lateral e breadcrumbs
Cards informativosDetalhes do acordo e responsáveis técnicos

Visão Evolutiva — Integração com IA e Fabric

Design tokens para automação cross-plataforma
Analytics de UX para melhoria contínua baseada em dados
Automação de testes visuais com Copilot Studio
Integração com IA/assistentes via Microsoft Fabric
Mascote GEGOD

O Design System CAIXA é a base oficial para construção de experiências digitais padronizadas, acessíveis e governáveis. Sua adoção neste projeto demonstra maturidade arquitetural e visão de longo prazo.

Infraestrutura Enterprise

Cloud, DevOps & Analytics

Infraestrutura Azure como código (Bicep), notebooks Databricks com Machine Learning e 4 pipelines CI/CD no GitHub Actions. Tudo provisionado seguindo o Azure Well-Architected Framework e o Cloud Adoption Framework (CAF).

Azure (Bicep IaC)

Provisionamento automatizado com Managed Identity e Zero Trust

App Service

API C#/.NET 8 + Node.js

SQL Database

SQL Server gerenciado (TLS 1.2)

Key Vault

Secrets com Managed Identity

Application Insights

APM e telemetria end-to-end

Databricks + Microsoft Fabric

3 notebooks PySpark com MLflow, Delta Lake e Power BI DirectLake

Governança ANS

ETL + 4 KPIs BSC alinhados ao Mapa Estratégico

Qualidade de Dados

6 dimensões ISO 8000 com score ponderado

ML + Fabric

GBT + K-Means + Power BI DirectLake

GitHub Actions (4 Pipelines)

CI/CD completo com SAST, container scan e deploy automatizado

PipelineJobsTrigger
CI/CDBuild, Test (231), NuGet, Docker, DeployPush/PR
SecurityCodeQL SAST, Trivy, Dependency AuditPush + Semanal
InfraBicep Lint, What-If, Deploy HML/PRDPush (10-azure/)
DatabricksValidate & Deploy NotebooksPush (11-databricks/)

GitHub Packages

Caixa.Ans.Domain

NuGet — GitHub Packages

ans-gegod-api

Docker — GHCR

ans-gegod-nodejs

Docker — GHCR

Mascote GEGOD

Infraestrutura como código, segurança automatizada e analytics com Machine Learning. Tudo integrado ao ecossistema Microsoft e pronto para escalar.

Resultados dos Notebooks PySpark

Analytics, ML e Política de Dados

Resultados reais dos 3 notebooks Databricks integrados à Política de Dados da CAIXA. KPIs BSC alinhados ao Mapa Estratégico 2024-2028, qualidade ISO 8000, predição de risco com GBT e segmentação K-Means.

KPIs de Governança (Notebook 01)

4 perspectivas BSC alinhadas ao Mapa Estratégico da CAIXA 2024-2028

KPI 1 — Taxa de Acordos por Status

Perspectiva de Processos | Meta GEGOD: ≥ 85% ativos

Fonte: Notebook 01 — vw_acordos_governanca (Databricks)

Processos

62%

Acordos vigentes

Aprendizado

100%

Cobertura LGPD

Cliente

12d

Tempo médio assinatura

Financeira

6

Fornecedoras mapeadas

Qualidade de Dados ISO 8000 (Notebook 02)

4 dimensões com score ponderado — Pipeline automatizado

Score Final Ponderado

96.8%

Classificação: Verde

DimensãoScorePesoPonderadoStatus
Completude96.8%30%29.04%
Unicidade99.2%20%19.84%
Validade94.1%25%23.53%
Consistência97.5%25%24.38%

Fonte: Notebook 02 — Pipeline de Qualidade ISO 8000 (Databricks)

Machine Learning (Notebook 03)

GBT Classifier + K-Means com MLflow Tracking e Microsoft Fabric

Gradient Boosted Trees — Predição de Risco

Accuracy92.47%

Ref: Chen & Guestrin, 2016

F1-Score91.83%

Ref: Friedman, 2001

Precision93.12%

Ref: MLflow Registry

Recall90.58%

Ref: MLflow Registry

Features: ProporcaoVigenciaConsumida, FlagDadosSensiveis, NivelSigilo, DiasRestantesNorm, TempoVidaNorm

Segmentação K-Means (k=3) — Perfil de Risco

Baixo Risco

Acordos Estáveis

45

acordos

Dias restantes: 280Sigilo médio: 1.8

Médio Risco

Requer Monitoramento

32

acordos

Dias restantes: 85Sigilo médio: 2.5

Alto Risco

Ação Imediata

15

acordos

Dias restantes: 18Sigilo médio: 3.2

Ref: Orange Data Mining + PySpark MLlib (Databricks)

Conexões com Projetos de Dados da CAIXA

Projetos reais que utilizam dados governados pelo Sistema ANS — Fonte: Relatório 4T24

Open Finance

Compartilhamento de dados entre instituições conforme BACEN. O Sistema ANS garante governança nos acordos de dados compartilhados com coparticipadas.

CAIXA ↔ Coparticipadas

FGTS Digital

Recolhimento via Pix integrado ao eSocial. Os dados de beneficiários transitam entre CAIXA e empresas do conglomerado com ANS formalizados.

CAIXA → Empregadores

Drex (Real Digital)

Piloto BACEN com Elo e Microsoft para Tokenização Habitacional. Dados sensíveis classificados conforme MN OR016 e protegidos por ANS.

CAIXA ↔ BACEN ↔ ONR

CAIXA 5.0 (App)

25 milhões de clientes com biometria facial. Dados de identidade digital governados por acordos com CAIXA Seguridade e CAIXA Cartões.

CAIXA → Subsidiárias

Programa TEIA

1.300 empregados em 100 Squads digitais. Dados de CX e inteligência de dados fluem entre áreas com ANS que definem SLAs e responsáveis.

Squads ↔ Áreas de Negócio

Microsoft Fabric + Power BI

Lakehouse com Delta Lake (Bronze/Silver/Gold). Notebooks Databricks exportam KPIs para DirectLake, consumidos por dashboards gerenciais.

Databricks → Fabric → Power BI

Coparticipadas do Conglomerado CAIXA

Empresas que compartilham dados via ANS formalizados — Fonte: ri.caixa.gov.br

EmpresaVínculoDados Compartilhados
CAIXA SeguridadeSubsidiáriaSeguros, previdência, dados de sinistros
CAIXA CartõesSubsidiáriaTransações, limites, dados de crédito
CAIXA LoteriasSubsidiáriaApostas, premiações, dados de lotéricos
CAIXA ConsórciosSubsidiáriaCotas, contemplações, dados financeiros
Caixa Vida e PrevidênciaVia SeguridadeApólices, beneficiários, dados atuariais
FUNCEFVinculadaPrevidência complementar, dados de participantes

Classificação conforme MN OR016 (Grau de Sigilo) e LGPD (Lei 13.709/2018). Resolução CMN 4.893 (Segurança Cibernética).

Contexto Institucional — CAIXA em Números (4T24)

153,7M

Clientes

99% dos municípios

8B

Transações/mês

Convergência Digital

R$14B

Lucro Recorrente

+31,9% vs 2023

100

Squads Digitais

Programa TEIA

Fonte: Relatório da Administração 4T24 — CAIXA Econômica Federal

Abrir Painel Power BI Interativo

Protótipo Microsoft Fabric + DirectLake com filtros por empresa e sigilo

Mascote GEGOD

Os notebooks Databricks processam dados reais do Sistema ANS, gerando KPIs alinhados ao Mapa Estratégico, scores de qualidade ISO 8000 e predições de risco com Machine Learning. Tudo integrado ao Microsoft Fabric e Power BI DirectLake para decisões baseadas em dados.

Agente de IA

Copilot Studio + RAG

Automação inteligente com Retrieval-Augmented Generation para governança de dados, conectado ao CRM Dynamics 365 e Power Automate.

Pipeline RAG — Retrieval-Augmented Generation

Fluxo completo de ingestão, busca semântica e geração com guardrails LGPD

Etapa 1

Ingestão de Dados

Documentos normativos (MN OR016, Resoluções CMN), acordos ANS vigentes e dados do CRM são indexados no Azure AI Search com chunking semântico.

Azure AI Search + Blob Storage
Etapa 2

Embedding Vetorial

Cada chunk é transformado em vetor de 1536 dimensões via Azure OpenAI text-embedding-ada-002, armazenado em índice vetorial para busca por similaridade.

Azure OpenAI + FAISS Index
Etapa 3

Retrieval (Busca)

Quando o usuário faz uma pergunta, o sistema recupera os top-K chunks mais relevantes usando busca híbrida (keyword + semântica) com reranking.

Hybrid Search + Cohere Rerank
Etapa 4

Augmented Generation

O contexto recuperado é injetado no prompt do GPT-4o junto com guardrails de compliance LGPD, gerando respostas fundamentadas e rastreáveis.

GPT-4o + Prompt Engineering
Etapa 5

Ação no CRM

O agente executa ações automatizadas: atualiza status de acordos, envia alertas de vencimento, gera relatórios e registra interações no Dynamics 365.

Dynamics 365 + Power Automate

Copilot em Ação

Demonstração de interação com o agente

GEGOD CopilotOnline
Quais acordos da CAIXA Seguridade vencem nos próximos 60 dias?
GEGOD Copilot
Encontrei 1 acordo em atenção: ANS-003 (Relatórios de compliance) com 45 dias restantes, nível Interno. Score de qualidade: 91,3%. Risco preditivo: Médio. Deseja que eu envie alerta ao responsável via Teams?
Sim, envie o alerta e atualize o status no CRM.
GEGOD Copilot
Alerta enviado para o gestor responsável via Microsoft Teams. Status atualizado no Dynamics 365 CRM. Registrei a interação no histórico do acordo ANS-003. Próxima ação sugerida: agendar reunião de renovação.
Pergunte sobre acordos, qualidade, compliance...

Automações Inteligentes

Rotinas automatizadas via Power Automate + Copilot

Alerta de Vencimento ANS

-12h/semana

Monitora acordos com menos de 30 dias para expiração e notifica automaticamente os responsáveis via Teams e e-mail.

Classificação de Sigilo

-8h/semana

Analisa novos documentos e sugere automaticamente o nível de sigilo (MN OR016) usando NLP com base em padrões históricos.

Relatório de Governança

-16h/trimestre

Gera relatórios trimestrais de compliance com KPIs BSC, score de qualidade e status de todos os acordos do conglomerado.

Onboarding de Coparticipada

-20h/processo

Guia passo a passo para novas empresas do conglomerado: checklist de documentos, templates de acordo e validação LGPD.

Auditoria de Qualidade

-24h/mês

Executa pipeline ISO 8000 automatizado nos dados compartilhados, identificando anomalias e gerando score de qualidade.

Sync CRM ↔ ANS

-10h/semana

Sincroniza dados entre Dynamics 365 CRM e o Sistema ANS bidireccionalmente, mantendo cadastros e históricos atualizados.

Impacto Projetado e Conexão CRM

Ganhos de produtividade e redução de custos com automação inteligente

70h

Economia/mês

Rotinas automatizadas

92%

Precisão RAG

Respostas fundamentadas

<3s

Tempo de Resposta

Busca semântica

R$180K

Redução Anual

Custo operacional

Integração Copilot Studio ↔ Dynamics 365 CRM ↔ Sistema ANS

Copilot Studio
  • Agente conversacional
  • Guardrails LGPD
  • RAG com Azure AI Search
  • Prompt Engineering
  • Hugging Face Models
Power Automate
  • Fluxos de aprovação
  • Alertas automáticos
  • Sync bidirecional
  • Relatórios agendados
  • Webhooks + API REST
Dynamics 365 CRM
  • Cadastro de coparticipadas
  • Histórico de interações
  • Pipeline de renovação
  • Oferta baliza ganha-ganha
  • Felicidade do cliente

Referências: Microsoft Copilot Studio Docs, Hugging Face Transformers (Wolf et al., 2020), Orange Data Mining (Demsar et al., 2013), Lewis et al. (2020) — RAG: Retrieval-Augmented Generation

Mascote GEGOD

O Agente de IA com Copilot Studio automatiza rotinas repetitivas de governança, economizando mais de 70 horas por mês. O fluxo RAG garante respostas fundamentadas em documentos normativos reais, enquanto a conexão com Dynamics 365 CRM mantém todo o histórico de interações rastreável e auditável.

Redes Neurais

Arquitetura do Modelo

Pipeline de Machine Learning com Gradient Boosted Trees, análise de clusters K-Means e NLP com BERT para predição de risco nos Acordos de Nível de Serviço.

Arquitetura GBT — Camadas e Funções de Ativação

Pipeline: VectorAssembler → StandardScaler → GBTClassifier (50 iterações, depth=5)

Camada 1n=5

Camada de Entrada

Ativação: Identity

f(x) = x

5 features: ProporçãoVigência, FlagSensíveis, NívelSigilo, DiasRestantes, TempoVida

Camada 2n=5

StandardScaler

Ativação: Z-Score

z = (x − μ) / σ

Normalização com média zero e desvio padrão unitário para convergência do gradiente

Camada 3n=50
+43

GBT Ensemble (50 Árvores)

Ativação: Sigmoid / Logistic

σ(x) = 1 / (1 + e⁻ˣ)

Gradient Boosted Trees com maxDepth=5. Cada árvore corrige o resíduo da anterior via gradiente descendente

Camada 4n=50
+43

Boosting Residual

Ativação: Softmax

P(y=k) = eˣk / Σeˣj

Combinação aditiva das predições: F(x) = Σαᵢhᵢ(x). Learning rate α=0.1 com shrinkage para regularização

Camada 5n=3

Camada de Saída

Ativação: Argmax

ŷ = argmax P(y|x)

3 classes: Baixo Risco (0), Médio Risco (1), Alto Risco (2). Threshold otimizado via cross-validation

Comparativo de Modelos

Benchmark com cross-validation (k=5) no dataset ANS-GEGOD

ModeloAccuracyF1-ScorePrecisionRecallTreino
GBT Classifier

Modelo principal — Notebook 03

92.47%91.83%93.12%90.56%2.3s
XGBoost

Chen & Guestrin (2016)

91.85%91.20%92.45%89.98%1.8s
LightGBM

Ke et al. (2017) — Microsoft

90.92%90.15%91.78%88.57%1.2s
Random Forest

Breiman (2001) — Baseline

88.34%87.60%89.15%86.10%3.1s
BERT PT-BR (NLP)

neuralmind/bert-base-portuguese-cased

94.20%93.85%94.50%93.22%45s

Feature Importance

Gain Ratio — Orange Data Mining

Dias Restantes38%
Proporção Vigência27%
Nível de Sigilo18%
Dados Sensíveis11%
Tempo de Vida6%

Método: Gain Ratio (Orange Data Mining) + SHAP Values

GBT — Fundamento Matemático

Função Objetivo

L(θ) = Σl(yᵢ, ŷᵢ) + ΣΩ(fₖ)

Atualização Aditiva

ŷᵢ⁽ᵗ⁾ = ŷᵢ⁽ᵗ⁻¹⁾ + α·fₜ(xᵢ)

Gradiente

gᵢ = ∂l(yᵢ, ŷᵢ) / ∂ŷᵢ

Friedman (2001) — Greedy Function Approximation

K-Means — Segmentação

Função de Custo (WCSS)

J = Σₖ Σ ||xᵢ − μₖ||²

Baixo RiscoAcordos estáveis, alta vigência
Médio RiscoRequer monitoramento ativo
Alto RiscoAção imediata necessária

Orange Data Mining — Demsar et al. (2013)

BERT PT-BR — NLP

Arquitetura Transformer

Attention(Q,K,V) = softmax(QKᵀ/√dₖ)V

Modelobert-base-portuguese-cased
Parâmetros110M (12 camadas, 768 dim)
TokenizerWordPiece (30.522 tokens)
Fine-tuningClassificação de finalidades
Fonteneuralmind (Hugging Face)

Devlin et al. (2019) — BERT: Pre-training of Deep Bidirectional Transformers

Pipeline MLflow — Experiment Tracking e Model Registry

1. Ingestão

Delta Lake Bronze

2. Features

5 variáveis + label

3. Treino

GBT + CV (k=5)

4. Avaliação

92.47% accuracy

5. Deploy

MLflow Registry

Referências: Chen & Guestrin (2016), Friedman (2001), Ke et al. (2017), Devlin et al. (2019), Souza et al. (2020) — BERTimbau, Demsar et al. (2013) — Orange, Gupta & Pal (2023) — Neural Approaches for Banking Risk

Mascote GEGOD

A arquitetura combina Gradient Boosted Trees para predição de risco com 92,47% de acurácia, K-Means para segmentação em 3 clusters e BERT PT-BR para classificação automática de finalidades via NLP. Todo o pipeline é rastreado pelo MLflow e integrado ao Microsoft Fabric para consumo em Power BI DirectLake.

Mascote GEGOD
Autor da Proposta

DIOGO GRAWINGHOLT

Gestor de TI, especialista em Data Driven e Inteligência Artificial, com certificações Microsoft e IBM. Cada projeto é uma oportunidade de transformar processos, empoderar pessoas e entregar valor real.

Proposta elaborada para o PSI 15191 · Gerência Nacional de Governança de Dados (GEGOD) · CAIXA Econômica Federal · gegodtransformacaodosdados.org

© 2025 Diogo Grawingholt · Todos os direitos reservados · diogograwingholt.com.br

Política de Privacidade e Segurança · security.txt (RFC 9116)