Por André Targino e Nicholas R. Drabowski

Você por certo já ouviu falar do termo Big Data e os impactos que a tecnologia e a transformação digital estão causando na área da saúde. Mas, será que os hospitais e clínicas no Brasil já estão preparados para tirar o máximo proveito deste imenso volume de dados gerados e armazenados diariamente em seus arquivos e servidores? Você é gestor e também já se perguntou o que fazer com seus dados ou por onde começar?

Abig data na saúde importância do Big Data na saúde é imensa, mas ela não gira apenas em torno da quantidade de dados que uma instituição possui, mas sim o que cada uma extrai deles. O fundamental é compreender como isso impacta no dia a dia dos negócios: essa quantidade de informações pode ser analisada e processada para gerar insights e ajudar gestores em decisões estratégicas? De que forma é possível utilizar melhor as informações que fluem para dentro das organizações para reduzir custos, otimizar tempo e melhorar o atendimento aos pacientes?

Apesar da relevância e do interesse que o tema desperta, na prática, ainda são muitas as dúvidas e desafios a serem enfrentados, especialmente por profissionais da área de gestão que devem lidar diretamente com a tecnologia dentro das instituições. 

Para começar, um dos desafios hoje é conseguir contratar profissionais qualificados a atuarem neste setor. Segundo o Google, só existem 10 mil especialistas em Inteligência Artificial no mundo, o que leva a uma guerra por talentos.

Na Portal Telemedicina, os dados são levados à sério e aplicamos o estado da arte em inteligência artificial para empoderar médicos na entrega de laudos cada vez mais acurados. Para tanto, contamos em nosso time com dois profissionais especialistas em Inteligência Artificial, que trabalham diretamente na evolução da nossa plataforma de saúde digital. Foram eles que colaboraram na construção deste artigo: André Targino, nosso Lead AI Researcher, Ph.D. em Electrical and Computer Engineering (University of Illinois at Urbana-Champaign) e Nicholas Drabowski, mestrando em Automação e Sistemas (UFSC) e o principal autor da primeira patente depositada no Brasil relacionada à eletroestimulação cerebral profunda (DBS) em malha fechada.

Com a ajuda deles, buscamos  apresentar alguns conceitos-chave para você estar por dentro do tema e entender como liberar todo o poder de seus dados. Falamos também sobre como funciona a identificação automática e a captação de dados, quais os estágios de preparação para que as informações possam se tornar interessantes para análise, e como a Inteligência Artificial (IA) e o Machine Learning são essenciais para o processamento dos dados.

Big Data na saúde: as fontes de dados

O conceito de Big Data se refere à geração diária de uma quantidade enorme e bastante diversificada de dados, que já não pode mais ser analisada apenas por humanos. Estes dados chegam às instituições por inúmeras fontes, como redes sociais, bancos de informações públicos e privados, arquivos internos, entre outros.

No caso da saúde, os principais fornecedores de informações são, hoje, os aplicativos e dispositivos de monitoramento de atividades pessoais, Prontuários Eletrônicos, exames e laudos online enviados remotamente e arquivos digitais fornecidos por instituições de atendimento, como clínicas, enfermarias do trabalho etc.

Alguns exemplos do que é gerado e que pode ser captado na área da saúde:

  • Dados pessoais – CPF, sexo, nome, data de nascimento, filiação, local de moradia;
  • Dados clínicos – hábitos de risco, diagnósticos, medicações tomadas, vacinações, alergias;
  • Dados de exames – exames de imagem, exames de ECG, EEG, exames de sangue, oximetria, espirometria etc.
  • Dados de procedimentos– internações, intervenções recebidas, cirurgias, tempos de estadia em UTI etc.

Por que muitos dados não significam bons dados

Depois de entender algumas das diversas fontes possíveis de dados na saúde, o próximo passo é fazer a curadoria das informações e saber para qual objetivo os gestores de saúde precisam processá-las para gerar conhecimento que agregue valor ao negócio.

big data na saúdeQuanto mais fontes existirem, maiores são as possibilidades de gerar informação útil. Por outro lado, a complexidade aumenta. O diferencial do Big Data está justamente atrelado à possibilidade e oportunidade de cruzar informações para obter insights importantes  para as organizações.

Nesta diversidade de dados, é  preciso identificar os chamados dados estruturados e os não-estruturados. Os primeiros são aqueles que possuem uma estrutura determinada, com restrições de categorias e valores possíveis. Os dados não-estruturados são basicamente textos que divergem em sua estrutura de uma entrada para outra. Para entender melhor, veja o exemplo abaixo de duas formas distintas de armazenar dados da ficha de um paciente:

  • Não-estruturado:

Ficha 1: “O paciente chama-se João Silva e nasceu em 12/02/1958. Ele recebeu as vacinas DT e contra a febre amarela.”

Ficha 2: “André Braga, paciente, recebeu a vacina DT.”

  • Estruturado:

Ficha 1: “João / Silva / 12.02.1958 / DT: Sim / Febre Amarela: Sim”

Ficha 2: “André / Braga / não informado / DT: Sim / Febre Amarela: Não”

Neste segundo exemplo, seria mais fácil para um cientista de dados criar um programa de computador para extrair as informações, sabendo que todas as fichas seguirão o mesmo padrão, e que as barras dividem as informações.

Um nível ainda maior de estruturação seria possível com o uso de um cadastro eletrônico, onde cada informação entra em um campo específico, que verifica se o tipo de dado está correto e impede erros óbvios. Por exemplo, colocar números no lugar do nome. Como pode-se observar, existem diversos níveis de estruturação, e quanto maior o nível da estruturação, mais rápida, eficiente e barata se torna a análise em Big Data.


Estágios primordiais de preparação dos dados

Chegamos então aos estágios primordiais de preparação dos dados, que ajudam a coletar, limpar, normalizar, combinar, estruturar e organizá-los para análise.

  • Parsing decodificar e estruturar as entradas, convertendo-as para um mesmo padrão, já que há muitas inconsistências, valores inesperados, formato inadequado etc;
  • Limpeza dos Dadosorganizar e limpar os registros para eliminar erros e validar os dados para o uso;
  • Curadoriaverificar quais dados são relevantes para cada análise;
  • Pré-processamentotransformar e, novamente, padronizar os dados sem perda relevante de informação.

Dessa forma, é necessário que os engenheiros de TI e cientistas de dados da instituição de saúde façam a análise do que é captado, para que os dados obtidos se transformem em grandes data lakes de informações úteis, e não data swamps desorganizados e inacessíveis.

IA e Machine Learning

Depois de aplicar as etapas iniciais, já é possível começar a buscar respostas para problemas ou achar novas soluções para a instituição. É aí que entra o estágio de processamento dos dados com a aplicação da Inteligência Artificial (IA).

Uma subdivisão da IA muito usada para analisar esses dados é o Machine Learning (ML), ou aprendizado de máquina. De forma resumida, podemos dizer que ML é uma tecnologia composta por um conjunto de ferramentas matemáticas, com diferentes técnicas para avaliar e descobrir padrões nas informações guardadas nos computadores.

Com o Machine Learning é possível superar adversidades na área da saúde, visto que muitas delas podem ser modeladas como problemas clássicos de ML. Neste artigo, escolhemos por destacar dois deles (um supervisionado e outro não supervisionado, respectivamente) devido à sua relevância no Big Data:

  • Classificação é basicamente um problema de reconhecimento de padrões a partir de exemplos. Na medicina, por exemplo, a partir de uma grande quantidade de Raios-X de tórax com e sem colapsos, o computador pode ‘aprender’ os padrões de pulmões colapsados e se basear neles para classificar novas imagens de Raios-X;
  • Clusteringé uma tarefa que consiste essencialmente na reunião de dados mais semelhantes para identificação de grupos. Por exemplo, a criação de clusters de pacientes com base em seus hábitos alimentares pode revelar grupos diferentes e quais doenças seus integrantes estão desenvolvendo.

big data na saúdePara processar estes dados e otimizar o Big Data na saúde, a linguagem mais utilizada na atualidade é o Python. Também usa-se como framework (biblioteca de funções) o TensorFlow da Google e o Keras, que torna a programação mais fácil.

É importante frisar que o Machine Learning, especialmente quando se trata da análise de exames, aumenta a capacidade dos médicos, e não substitui a expertise do profissional e sua capacidade de diagnóstico (que leva em consideração a avaliação global do paciente).  A tecnologia auxilia na identificação de padrões, e assim, os médicos ganham mais tempo para se dedicar a cada paciente e certamente poderão prestar um atendimento mais humanizado e personalizado.

Desafios do Big Data na saúde

Contar com infraestrutura ideal

Para coletar e interpretar grandes volumes de dados, é preciso que as instituições de saúde contem com uma infraestrutura de TI capaz de processá-los. Isso inclui, por exemplo, data centers para um grande número de servidores, bancos de dados de alta performance e com enorme armazenamento.

Outra tendência é que as organizações migrem suas soluções e serviços para a computação em nuvem (Cloud Computing), que oferece mais facilidade e demanda menos investimento de tempo e dinheiro em comparação com o armazenamento tradicional, e é sobretudo mais segura. Também devem investir em profissionais capacitados (capazes de processar o Big Data na saúde) e em uma mudança na cultura organizacional, ressaltando a importância dessa tecnologia para o desenvolvimento dos negócios.

Segurança e privacidade da informação

A previsão é de que até 2020, 42% de todos os dados digitais de saúde gerados ainda estarão desprotegidos. Por isso, desde já este deve ser um fator de grande preocupação entre as instituições que já atuam de forma digital. As instituições devem dar garantia de proteção dos dados por meio de firewalls, controles de acesso e incentivo a uma cultura de segurança na empresa.

big data na saúdeA troca de informações online entre os sistemas fornecedores e captadores também precisa de encriptação de ponta-a-ponta, além de fazer a anonimização dos dados antes de torná-los públicos (abertos para filtragem de profissionais de TI, por exemplo), removendo as informações que possam identificar os pacientes, mas deixando a informação clínica.

Nos Estados Unidos, a HIPPA é a entidade que regula como os dados médicos sensíveis precisam ser tratados. No Brasil, o Conselho Federal de Medicina é quem determina e regulariza a troca de informações online (resoluções nº 1.638/2002 e nº 1.639/2002). Também há o Health Level 7 ou HL7, produzidos pela Health Level Seven International, que é um conjunto de normas internacionais para transferência de dados clínicos e administrativos entre sistemas de informação em saúde. Os padrões também são adotados pelo American National Standards Institute e pela International Organization for Standardization.

Entender o que a IA está aprendendo

big data na saúdeOutro ponto de atenção é compreender de que forma se está alimentando o sistema de Machine Learning. Por exemplo, na análise de exames de Raio-X via telemedicina, quase todas as imagens com pneumotórax (vazamento de ar do pulmão para a caixa torácica) estão com sondas implantadas para a remoção do ar, pois a doença já foi identificada e tratada. Se esses exemplos forem usados sem nenhum cuidado que mostre ao sistema a diferença entre sonda e anomalia, muito provavelmente o computador vai aprender a identificar sondas e entender que isso será sempre o pneumotórax. Daí a importância de um profissional com conhecimento não só em análise de dados e Machine Learning, mas também na área em que está atuando, no caso medicina e saúde.

Em resumo, o aproveitamento correto do Big Data na saúde pode ajudar a tomar decisões administrativas que criam vantagens competitivas para as clínicas e hospitais. Assim, o paciente também pode se beneficiar com mais agilidade no tratamento, redução de erros médicos, e novas terapias. Porém, os gestores precisam estar especialmente atentos à forma como seus dados são coletados, armazenados e tratados, para acelerar seus avanços em Big Data e ciência de dados.

*André Targino, AI Leader at Portal Telemedicina: Ph.D. em Electrical and Computer Engineering pela University of Illinois at Urbana-Champaign; vasta experiência nacional e internacional que inclui startups do Brasil, de países europeus e dos EUA; e cerca de 15 anos de prática acumulada em inteligência artificial, ciência de dados e processamento de imagens.

*Nicholas R. Drabowski, R&D engineer I Data Scientist at Portal Telemedicina: Engenheiro de Controle e Automação especializado em P&D de equipamentos médicos clínicos e Eletrocêuticos; Atualmente engajado com  detecção de patologias em exames médicos utilizando IA.
Write a comment:

*

Your email address will not be published.

2016 © Copyright - Portal Telemedicina Por Vitalweb

Entre em contato TEL: (11)2538-1455 | (11)2476-5710