Dados sobre indivíduos estão em constante mudança: as pessoas mudam seus nomes, de endereço, o número do telefone, têm filhos, compram carros novos, sofrem acidentes, pedem indenização de seguros, etc. Por isso, precisamos coletar dados continuamente, garantindo que nossos registros estejam sempre atualizados, para que qualquer falha (registros incompletos) e discrepâncias sejam corrigidas o mais rápido possível.

Qualquer empresa que tenha que lidar com dados, mesmo que em pequena quantidade, irá enfrentar essas mesmas questões, sejam informações incorretas ou ausentes. Por exemplo, os dados podem fornecer confirmação do nome, do endereço e da data de nascimento de um indivíduo, mas não um telefone atualizado.

A solução é simples: coletar muito mais dados. Os mais recentes irão confirmar e atualizar as informações existentes, assim como preencher qualquer informação que esteja faltando no registro. Mas é claro que é possível encontrar dados conflitantes e, quando isso acontecer, deve-se decidir em qual fonte confiar.

No geral, essa abordagem resulta em melhor qualidade de conjunto de dados, mas também cria um problema de big data.

A LexisNexis Risk Solutions tem adotado essa abordagem de dados por mais de 15 anos. Estávamos determinados a fornecer informações de qualidade a nossos produtos e soluções analíticas, coletando cada vez mais dados de um número crescente de fontes. Com mais de 10.000 fontes de dados, deparamo-nos com um problema de big data que nós mesmos causamos e cuja solução foi criar uma plataforma de cluster de computação de alto desempenho (HPCC). Para mais detalhes, acesse o site do HPCC.

Ativos de dados entram nos ambientes da nossa plataforma HPCC, que consegue reconhecer sempre que eles não satisfazerem os padrões definidos, e nos alertam para que possamos investigar e, por fim, resolver um problema. Desenvolvemos ferramentas avançadas que chamamos de SALT – Scalable Automated Linking Technology (Tecnologia Escalável de Ligação Automatizada).  Além de permitir a rastreabilidade e limpeza de grandes volumes de dados que passam pela nossa plataforma HPCC, o SALT utiliza algoritmos de aprendizagem de máquinas para conectar os registros.

Para colocar de maneira mais simples, o SALT faz muito mais do que o simples matching de dados, ela identifica a relação entre registros de conjuntos de informações por toda a plataforma, além de conseguir reduzir, de maneira significativa, os casos de falsos positivos e falsos negativos que costumam desfazer sistemas básicos de matching.

Onde um programa de correspondência simples exibiria que dois registros pertencem a duas pessoas diferentes, o SALT consegue mostrar que duas mudanças de casa e de nome resultaram em dois registros que aparentam ser diferentes, mas que, na verdade, fazem referência ao mesmo indivíduo. Da mesma forma, dois registros para o mesmo nome podem ser erroneamente identificados como positivos por um programa de matching básico, mas o SALT analisa mais detalhadamente e é capaz de separá-los, fornecendo detalhes adicionais que claramente mostram registros de pessoas sem conexão nenhuma.

Mesmo uma pequena inconsistência de dados pode produzir resultados falsos durante a básica, mas o SALT é muito mais inteligente e possui uma visão bem mais ampla dos dados disponíveis por toda nossa plataforma HPCC, o que leva a melhores resultados.

Claro que isso é muito importante para as seguradoras analisarem os riscos de um proponente e definirem preços. Elas, agora, podem ter certeza de que possuem uma visão holística do indivíduo e do risco que este apresenta, além de ter todas as informações necessárias para precificar a sua apólice de maneira justa.

Publicar comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *