É quase impossível participar de uma conferência de insurtechs e não ouvir pelo menos uma vez a famosa frase “Dados são o novo petróleo”. De todas as metáforas associadas a Big Data, talvez esta tenha se tornado tão popular porque descreve perfeitamente as características desse novo recurso: é valioso, mas se não for refinado, não serve para muita coisa.

“Os dados precisam ser decompostos e analisados para ter valor”, explica o criador da metáfora, o matemático londrino Clive Humby. Nada mais verdadeiro quando se considera o uso de dados na indústria do seguro. A quantidade e o estado natural do Big Data são tão assustadores quanto inacessíveis. A boa notícia é que, assim como as tecnologias que sistematicamente ampliam as possibilidades de captação de dados, as grandes plataformas capazes de processá-los também estão em constante evolução.

O conceito de Big Data aborda a captura, gerenciamento e processamento de grandes volumes de dados estruturados e não estruturados. Esse trabalho requer um conjunto específico de técnicas, tecnologias e novas formas de integração para extrair informações dos dados, na maioria das vezes diversos, complexos e em quantidades colossais.

Em 2001, o analista de dados Doug Laney, do Gartner Group, introduziu o conceito conhecido como os “3Vs”, em uma pesquisa intitulada 3D data management: Controlling data volume, variety and velocity (Gestão de dados 3D: controlando o volume, a variedade e a velocidade dos dados). Uma década mais tarde o mercado passou a falar de outros dois Vs, em adição ao modelo inicial de Laney: variability (variabilidade) – que se refere às inconsistências típicas de grandes conjuntos de dados – e value (valor) – que se refere à necessidade de agregar valor aos dados para as organizações.

Com o progresso das tecnologias de captura e processamento de dados nos anos que se seguiram, esses conceitos evoluíram. Hoje em dia, eles são amplamente difundidos no mercado por diversas empresas.

Dados estruturados e não estruturados

Proprietária de uma plataforma poderosa de processamento de Big Data, a LexisNexis® Risk Solutions dedica-se a ajudar a indústria de seguros a extrair o máximo de seus dados sem a necessidade de grandes investimentos em infraestrutura.

Um dos pilares da plataforma de Big Data LexisNexis® é a simplificação dos processos de captura, normalização e modelagem de dados. Ela consegue fazer isso porque usa algoritmos proprietários que otimizam o processamento dos dados. Além disso, possui uma interface de serviços que permite às seguradoras se integrarem à plataforma em todas as etapas do ciclo de vida da apólice.

Desenho esquemático da Plataforma de BigData LexisNexis®

A plataforma LexisNexis® permite a ingestão de uma infinidade de tipos de dados, estruturados e não estruturados.

Dados estruturados são aqueles que, em geral, podem ser dispostos em linhas e colunas. Eles são utilizados em bancos de dados, como por exemplo uma lista de segurados contendo número da apólice, CPF, nome e endereço. Os dados não estruturados, por sua vez, não podem ser dispostos em linhas e colunas e possuem informações mais fragmentadas, como por exemplo e-mails de clientes, planilhas eletrônicas, arquivos PDF, imagens, campos de texto e observações etc. Consumir esses dados e processá-los é algo que a LexisNexis® Risk Solutions faz com sucesso há anos nos Estados Unidos, onde atende mais de 350 seguradoras e processa 99% dos dados do mercado.

Limpeza, classificação, organização e segurança

Após ingeridos, os dados precisam ser limpos e classificados para que possam, em seguida, ser padronizados, normalizados e otimizados. Esse tratamento permite o entendimento das relações entre os dados, além de facilitar a descoberta de padrões durante a análise. Terminadas essas etapas, damos início ao processo de modelagem, para extrair scores e outras informações estratégicas que caracterizam nossas soluções.

Esses processos podem parecer triviais, mas na verdade não são. Segundo estimativas, aproximadamente 2,5 quintilhão de bytes são gerados todos os dias, e apenas 20% desses dados são estruturados. Isso aumenta ainda mais a complexidade do trabalho, pois além de serem mais difíceis de organizar, dados não estruturados requerem capacidades de armazenamento muito maiores e são mais complexos para estabelecer relações lógicas. Em contrapartida, depois de organizados eles permitem análises com uma amplitude muito maior em comparação aos métodos de análise tradicionais, que utilizam apenas dados estruturados.

A plataforma possui processos robustos para governança de dados, incluindo processos de anonimização. Também possui controles, como autenticação e autorização, para garantir a segurança das informações que trafegam na plataforma e a conformidade com normas e leis de proteção de dados vigentes.

Relações incomuns entre dados para detectar fraudes

Para relacionar dados, a plataforma LexisNexis® utiliza algoritmos e estatística. Com esses recursos, nossos cientistas de dados conduzem análises para identificar padrões, com o objetivo de estabelecer relacionamentos probabilísticos. Por meio desses relacionamentos é possível, por exemplo, identificar relações entre segurados em uma base de apólices, ou ainda avaliar relações entre segurados e sinistros, buscando padrões de comportamento que identifiquem fraudes ou anomalias. Os relacionamentos probabilísticos são determinantes em cenários onde é necessário relacionar dados estruturados e não estruturados, ou quando há informações incompletas e/ou inexatas.

Existem também recursos adicionais, como o text-mining, que permitem extrair informações de campos não estruturados (como campos de “observação”, por exemplo). Esses campos podem ser usados para criar novas fontes de dados ou ainda, auxiliar nas relações entre eles.

Essas são algumas das capacidades que permitem à plataforma LexisNexis® encontrar relações únicas, aumentando significativamente o número de hipóteses a serem validadas pelos modelos estatísticos e, assim, contribuindo para a assertividade e desempenho das nossas soluções.

Interfaces de Aplicação e Serviços

A LexisNexis® Risk Solutions possui um portfólio abrangente de serviços de scores e informações estratégicas para atender o mercado segurador. Para simplificar o acesso a nosso portfólio, disponibilizamos uma plataforma de serviços unificada, que permite a integração a dados, sistemas e serviços dos clientes independente da tecnologia utilizada por eles. Isso se dá por meio de um conceito chamado Ponto Único de Entrada – Single Point of Entry – que permite ao cliente acessar múltiplos serviços por meio de uma única transação.

Nos nossos próximos artigos, iremos explorar com maiores detalhes algumas de nossas soluções e sua aplicação em cenários reais de seguros. Para recebê-los em primeira mão, faça sua inscrição no nosso blog.

Para saber mais sobre nossa plataforma de dados, por favor preencha este formulário e nossa equipe de Client Engagement entrará em contato.

Publicar comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *