Este projeto trata de uma solução integrada de inteligência e processamento analítico, composta de fornecimento de licenças de software para análise preditiva, ciência de dados e aprendizado de máquina, subscrição de licenças de software de ambiente hadoop para armazenagem e processamento de dados em ambiente big data, bem como serviços de implantação, suporte, treinamento e desenvolvimento de soluções analíticas, visando melhorar as ações de competência da Secretaria de Estado da Saúde - SESA.
A Secretaria de Estado de Saúde do Espírito Santo (SESA/ES) tem como principal atribuição exercer a condução da política do Sistema Estadual de Saúde, gerir o Fundo Estadual de Saúde – FES e exercer o papel de autoridade sanitária no território do Estado do Espírito Santo.
O crescimento do uso das soluções tecnológicas fez com que as instituições passassem a reunir uma grande quantidade de dados, de variados tipos, em uma velocidade muito grande. Melhorar a capacidade de atuação da Secretaria por meio da implementação de novas e disruptivas tecnologias, como Big Data, Machine Learning, Inteligência Artificial e Computação Cognitiva, é a alternativa encontrada para atender os anseios da sociedade em busca de melhor atendimento na área de saúde e no melhor uso dos recursos públicos alocados na assistência à população capixaba.
As soluções de armazenamento e processamento de dados baseados em tecnologia Hadoop também auxiliam na superação desses desafios, com custo inferior e escalabilidade ilimitada, possibilitando armazenar e analisar virtualmente qualquer volume de dados estruturados e não estruturados em conjunto, quando submetidas aos modelos e consultas analíticas avançadas aumentando a capacidade de análise dos órgãos vinculados à SESA.
Dessa forma, as capacidades analíticas avançadas precisam ser projetadas de forma integrada com as capacidades de processamento de Big Data. Portanto, se faz necessário uma solução composta de tecnologia de armazenamento e processamento baseado em computação distribuída (Hadoop), integrada e otimizada para realização do Ciclo de Vida Analítico, em ferramental que inclua capacidades prontas de ingestão, tratamento e qualidade de dados, business Intelligence e data Discovery, mineração textual (PLN) e de dados em fontes estruturadas, semiestruturadas e não estruturadas (web crawling, logs, documentos, áudio e vídeo), Machine learning e outras abordagens de Inteligência Artificial.
Em linhas gerais, é prioritário que a Solução Integrada de Inteligência e Processamento Analítico a ser adquirida, permita à SESA:
A fim de atingir tais objetivos, faz-se necessário a contratação de uma Solução de Análise Estatística e Inteligência Analítica composta por software que combine diversas funcionalidades analíticas, que uma vez integrada a uma grande quantidade de dados, muitas vezes, de modo desordenado, não estruturado e sem qualquer padrão aparente, permita estabelecer regras de negócios automatizados, modelagem preditiva, mineração de dados e texto, análise de eventos ao longo do tempo, relatórios de exceção e identificação de anomalias, montagem de redes de relacionamento, enfim, todas as técnicas utilizadas visando melhorar o acompanhamento e o monitoramento dos processos e informações para o cumprimento da missão institucional da SESA.
Desta forma entendemos ser estratégica a aprovação e encaminhamento desse processo.
O Projeto segue um Clico de Vida Analítico (uma leitura livre, do livro The Analytics Lifecicle Toolkit – A practical guide for an effective analytics capability, Gregory S Nelson, Ed. Wiley, 2018) conforme ilustrado e explicado abaixo:
O Ciclo de Vida Analítico estabelece as fases necessárias ao desenvolvimento de projetos analíticos, sendo estas:
▪ Definição do problema;
▪ Exploração dos dados;
▪ Desenvolvimento analítico;
▪ Operacionalização;
▪ Gestão do ciclo de vida.
A Metodologia Analítica considera a complexidade dos projetos analíticos, estabelecendo critérios, premissas e técnicas, que consolidam o planejamento, o alinhamento de expectativas e a possibilidade de se ampliar a assertividade nas estimativas de projeto.
• Apesar da proposição circular e de continuidade, as fases não são compostas de passos rígidos, fixos e obrigatoriamente sequenciais. É esperado que, à medida que se explorem os dados, que as análises venham a ser refinadas e perguntas de negócios venham a ser realinhadas e respondidas.
• Nem todos os projetos de análise exercerão cada uma das fases da mesma maneira.
• A metodologia foi desenvolvida para proporcionar que os projetos analíticos forneçam os valores e os esforços adequados aos resultados esperados.
• As fases da metodologia analítica estão atreladas a um catálogo de serviços, que possuem atividades a serem executadas e são utilizadas como guia para mensuração de esforços de um serviço/produto.
• Identificação, compreensão e priorização das necessidades de negócios, de forma a assegurar que as soluções propostas resolvam os problemas identificados.
• Visa contemplar as necessidades de planejamento, da análise de viabilidade, do levantamento de informações, da especificação dos casos de negócio e da análise de riscos.
• Esta fase é organizada em cinco etapas – Identificação, Análise de causa raiz, Geração de hipóteses, Design de questionamentos e Priorização de casos de negócios.
Identificação e categorização do problema de negócio.
• Exploração preliminar de dados (qual a ordem de grandeza do problema e disponibilidade de dados para responde-lo).
• Definição do problema e seus impactos.
• Justificativa para o desenvolvimento analítico.
• Reformulação do problema para termos analíticos e requisitos técnicos.
• Identificar suposições e proposições correlatas.
• Refinar e propor as declarações finais dos problemas de negócios e analíticos.
Utilização de técnicas de brainstorming e design thinking para identificação de relações de causa e efeito nos problemas.
• Classificar os requisitos e determinar se há viabilidade de tratá-los.
• Aplicar análise de causa raiz às definições de requisitos.
• Construir hipóteses que possam ser testadas e sua aplicabilidade.
• Assinalar pontos não compreendidos.
• Validar resultados esperados e requisitos de informação com os envolvidos das áreas de negócio (patrocinadores).
• Conduzir pesquisas na busca de identificar soluções às potenciais fontes de problemas encontrados.
• Aplicar critérios FINER* para avaliar quando um problema pode ser respondido.
• Converter as questões em proposições de design de estudo.
• Priorizar requisitos baseado no valor para o negócio, custo de produção e tempo.
• Validar se o design de solução atende aos requisitos de negócios.
• Definir as capacidades necessárias para produção.
• Identificar e gerir as métricas necessárias para implementação da solução e critérios de sucesso.
Nesta fase busca-se:
• Apresentar uma compreensão da realidade dos dados necessários ao projeto: disponibilidade, usabilidade, quais problemas eles ajudam a tratar e/ou descrever e o valor para o negócio.
• Determinar os dados que podem ser obtidos de forma imediata, versus aqueles necessários para solucionar o problema identificado da melhor maneira.
• Responder a capacidade de processamento desses dados, seus tipos, como captura-los e qual sua veracidade.
• Preparar o planejamento da obtenção dos dados para atender aos projetos.
Pesquisar os dados que possam ser obtidos para resolução do problema.
• Identificar os dados que podem ser obtidos e aqueles que são desejáveis, mas, não são necessariamente disponíveis.
• Analisar como os dados identificados são refletidos no negócio, processos e fluxos operacionais.
• Verificar a proveniência e governança sobre os dados.
• Extrair os dados estruturados de suas fontes.
• Extrair os dados não estruturados.
• Realizar a integração dos dados das diversas fontes.
• Determinar a privacidade e proteção dos dados.
• Data Quality – aplicar processos de limpeza e enriquecimento.
• Mapear os dados resultantes com o negócio, processos e fluxos operacionais.
• Modelar a estrutura de dados de maneira adequada ao tipo de análise que será realizada.
• Identificar relações entre os dados.
• Explorar dados de caráter desconhecido.
• Traçar o perfil dos dados.
• Estabelecer e executar um processo estruturado para a descrição das principais agregações, tendências e características dos dados.
• Realizar análise exploratória, usando análise descritiva, de frequência e distribuições.
• Investigar dados outlier.
• Determinar hipóteses para tratar o problema.
Utilizar ferramentas de data Discovery para examinar as associações de dados.
• Criar protótipos de visualização adequados aos tipos de dados e análises.
• Documentar gráficos e visões que ajudem a explicar o contexto e insights dos dados.
Nesta fase busca-se:
• Estabelecer um framework com considerações e orientações de aplicação de técnicas analíticas (e não a discussão de quais técnicas, em constante desenvolvimento), para que sejam acessíveis e de entendimento normalizado por todo o time analítico, para aplicação no desenvolvimento, teste e uso dos modelos.
• Um modelo analítico ajuda a explicar um sistema e seus efeitos em diferentes componentes, podendo prever comportamentos.
• Um modelo de desenvolvimento analítico traduz, de forma natural, uma aproximação matemática, por meio dos dados coletados e padrões estabelecidos, em relacionamentos e tendências.
Determinar métodos estatísticos e testá-los na busca de conclusões.
• Aplicar modelos e processos e comparar os resultados.
• Comparar características de dados categóricos e numéricos.
• Identificar medidas quantitativas que descrevem as propriedades das amostras de dados.
• Definir a significância estatística, intervalos de confiança e testes de hipóteses.
• Diferenciar dados categóricos ou contínuos e as estratégias de testes mais adequados para realização de inferências sobre esses dados.
Utilizar métodos visuais para examinar as relações entre os dados.
• Distinguir variáveis preditoras e variáveis resposta e seus papeis nos testes de associação.
• Descrever os tipos de testes usados para medir as associações, incluindo paramétricos e não paramétricos.
• Estabelecer diferenças entre associações e relações de causa e efeito.
• Identificar as classes de modelos preditivos.
• Elencar os tipos e métodos supervisionados e não supervisionados usados nos modelos.
• Relacionar os problemas com os tipos de métodos de análise (estatísticos, mineração de dados ou aprendizagem de máquina).
• Reconhecer modelos comuns que possam ser aplicados (modelos preditivos, clusterização, redes neurais, machine learning).
Classificar os tipos de problemas que podem ser resolvidos com reconhecimento de padrões
• Descrever as várias classificações de abordagens.
• Mostrar diferenças entre as seleções e extrações.
• Descrever as diferenças entre classificações e discriminações.
Nesta fase busca-se:
• Estabelecer os processos que tratam da transição dos protótipos para a produção, ou seja, da fase de testes, implementação e construção da estratégia para os mecanismos de apresentação.
• Refinar a solução antes de torná-la pública à organização, pois pode impactar significativamente a forma como as pessoas trabalham, incluindo a alteração dos seus processos de negócios. Havendo resistência natural às mudanças e impacto na cultura organizacional.
• Estabelecer a comunicação e a interatividade do projeto na camada de apresentação, sendo a materialização visível do trabalho. Deve-se realizar uma abordagem que propicie o acesso.
Conduzir a interpretação dos resultados analíticos.
• Capacitar e orientar os patrocinadores.
• Realizar a validação dos modelos junto ao negócio.
• Comparar os resultados dos vários modelos em sua aplicação no negócio.
• Explorar explicações alternativas.
Incorporar os resultados analíticos ao fluxo de negócio, de forma a impactar a operação e as atividades de negócios.
• Documentar o modelo, sua usabilidade e os requisitos sistêmicos para produção.
• Implantar o modelo em produção.
• Suportar os impactos nas mudanças de processos de negócios e seus usuários.
• Dar suporte a implementação.
• Avaliar a usabilidade e o impacto nos fluxos operacionais.
• Documentar e comunicar os resultados (incluindo suposições, limitações e restrições).
• Comunicar de maneira efetiva às diversas audiências.
• Criar visualizações e dashboards.
• Criar data history telling (mapas, gráficos e quadros - combinados com elementos narrativos).
• Criar o ambiente de interatividade.
• Criar o ambiente de experimentação e compartilhamento.
• Realizar o trabalho de evangelização a partir dos resultados de negócios do produto.
• Socializar e compartilhar os resultados.
Nesta fase busca-se:
• Gerenciar de forma adequada aos conceitos da ciência de dados no produtos Analíticos no Projeto, nas Requisições e Produtos.
• Acompanhar, orientar e gerir com base nas melhores práticas do ciclo de vida analítico, o desenvolvimento de produtos e a sua relação com as pessoas e processos.
• Tratar com peculiaridades na gestão de “Produtos Analíticos” e foco no Ciclo de vida analítico.
• Não tratar o desenvolvimento de Produtos Analíticos “exatamente” como gestão de projetos de desenvolvimento de software, pois este desenvolvimento exige um tratamento evolutivo, “de maior fluidez”, e o “tripé escopo-custo-tempo” é afetado imediatamente pela incerteza maior dos projetos analíticos.
• Alinhamento estratégico.
• Desenvolver e dar suporte a colaboração dos produtos.
• Evangelismo analítico, buscando propagar a cultura analítica na organização.
• Analisar e quantificar os impactos e benefícios analíticos ao longo do tempo.
• Priorização analítica.
• Gestão dos projetos analíticos com princípios de Gerenciamento de Projetos.
• Estabelecimento de objetivos e marcos de projetos analíticos.
• Implantação de padrões e procedimentos para o gerenciamento de projetos analíticos.
• Monitorar e gerenciar custos e recursos.
• Realizar estimativas e cronogramas.
• Melhoria contínua na governança de dados.
• Estabelecer, documentar e seguir planos de qualidade.
• Seguir processos de testes de qualidade.
• Utilizar validação baseada em riscos.
• Criar grupos (pares) para revisão de código, produtos de dados e de visualização.
• Recalibrar e manter modelos.
• Análise de impactos de mudança.
• Atividades de capacitação, treinamento e comunicação.
• Monitorar a Gestão de mudanças.
• Promover processos para gerenciamento de mudanças e avaliação de impacto das decisões.
• Promover a cultura do compartilhamento e colaboração.
• Gerenciar recursos e avaliar performance.
• Gerenciar um portfólio de projetos e recursos analíticos.
• Gerenciar o desenvolvimento e retençãode talentos.
• Promover orientação para aumento de performance.
• Gerenciamento de conflitos.
• Lições aprendidas.
• Gerar um catálogo de recursos de dados, projetos e produtos analíticos.