![]() |
A análise automatizada das psicoses |
Um método de aprendizado de máquina descobriu uma pista oculta na linguagem das pessoas que predizia o surgimento posterior da psicose - o uso frequente de palavras associadas ao som. Um artigo publicado pela revista npj Schizophrenia mostrou as descobertas de cientistas da Emory University e da Harvard University.
Os pesquisadores também desenvolveram um novo método de aprendizado de máquina para quantificar com mais precisão a riqueza semântica da linguagem conversacional das pessoas, um indicador conhecido de psicose.
Seus resultados mostram que a análise automatizada das duas variáveis da linguagem - uso mais frequente de palavras associadas ao som e fala com baixa densidade semântica, ou imprecisão - pode prever se uma pessoa em risco desenvolverá psicoses posteriormente com 93% de precisão.
Mesmo clínicos treinados não perceberam como as pessoas com risco de psicose usam mais palavras associadas ao som do que a média, embora a percepção auditiva anormal seja um sintoma pré-clínico.
"Tentar ouvir essas sutilezas em conversas com pessoas é como tentar ver germes microscópicos com os olhos", diz Neguine Rezaii, primeiro autor do artigo. "A técnica automatizada que desenvolvemos é uma ferramenta realmente sensível para detectar esses padrões ocultos. É como um microscópio para sinais de alerta de psicose."
Rezaii começou a trabalhar no papel enquanto morava no Departamento de Psiquiatria e Ciências Comportamentais da Emory School of Medicine. Ela agora é membro do Departamento de Neurologia da Harvard Medical School.
"Sabia-se anteriormente que características sutis da psicose futura estão presentes na linguagem das pessoas, mas usamos o aprendizado de máquina para descobrir detalhes ocultos sobre esses recursos", diz o autor sênior Phillip Wolff, professor de psicologia da Emory. O laboratório de Wolff enfoca a semântica da linguagem e o aprendizado de máquina para prever a tomada de decisões e a saúde mental.
"Nossa descoberta é nova e acrescenta evidências que mostram o potencial do aprendizado de máquinas para identificar anormalidades lingüísticas associadas a doenças mentais", diz Elaine Walker, co-autora, professora de psicologia e neurociência da Emory que pesquisa como a esquizofrenia e outros transtornos psicóticos se desenvolvem. .
O início da esquizofrenia e outros transtornos psicóticos tipicamente ocorre no início dos 20 anos, com sinais de alerta - conhecidos como síndrome prodrômica - começando por volta dos 17 anos. Cerca de 25 a 30% dos jovens que preenchem os critérios para uma síndrome prodrômica desenvolverão esquizofrenia ou outra transtorno psicótico.
Usando entrevistas estruturadas e testes cognitivos, os médicos treinados podem prever a psicose com cerca de 80% de precisão naqueles com síndrome prodrômica. A pesquisa em aprendizado por máquina está entre os muitos esforços em andamento para simplificar os métodos de diagnóstico, identificar novas variáveis e melhorar a precisão das previsões.
Atualmente, não há cura para a psicose.
"Se pudermos identificar indivíduos que estão em risco mais cedo e usar intervenções preventivas, poderemos reverter os déficits", diz Walker. "Há bons dados mostrando que tratamentos como terapia cognitivo-comportamental podem retardar o início e talvez até reduzir a ocorrência de psicose."
Para o artigo atual, os pesquisadores usaram pela primeira vez aprendizado de máquina para estabelecer "normas" para a linguagem de conversação. Eles alimentaram um programa de software de computador com as conversas on-line de 30.000 usuários do Reddit, uma plataforma de mídia social onde as pessoas têm discussões informais sobre diversos tópicos. O programa, conhecido como Word2Vec, usa um algoritmo para alterar palavras individuais para vetores, atribuindo a cada um deles uma localização em um espaço semântico baseado em seu significado. Aqueles com significados semelhantes estão posicionados mais próximos do que aqueles com significados muito diferentes.
O laboratório Wolff também desenvolveu um programa de computador para executar o que os pesquisadores apelidaram de "descompactação de vetores", ou análise da densidade semântica do uso de palavras. O trabalho anterior mediu a coerência semântica entre as sentenças. A descompactação de vetores permitiu que os pesquisadores quantificassem a quantidade de informação que havia em cada sentença.
Depois de gerar uma linha de base de dados "normais", os pesquisadores aplicaram as mesmas técnicas a entrevistas diagnósticas de 40 participantes que haviam sido conduzidas por clínicos treinados, como parte do Estudo Longitudinal de Prodro Norte-Americano (NAPLS), financiado pelo National Institutos de Saúde. O NAPLS é focado em jovens com alto risco clínico de psicose. Walker é o investigador principal do NAPLS na Emory, uma das nove universidades envolvidas no projeto de 14 anos.
As análises automatizadas das amostras participantes foram então comparadas com a amostra de base normal e os dados longitudinais sobre se os participantes se converteram em psicose.
Os resultados mostraram que o uso de palavras relacionadas ao som, mais que o normal, combinado com uma taxa maior de uso de palavras com significado similar, significava que a psicose provavelmente estava no horizonte.
Os pontos fortes do estudo incluem a simplicidade de usar apenas duas variáveis - ambas com forte fundamentação teórica - a replicação dos resultados em um conjunto de dados de validação e a alta precisão de suas previsões, acima de 90%.
"No campo clínico, muitas vezes não temos precisão", diz Rezaii. "Precisamos de formas mais objetivas e quantificadas para medir variáveis sutis, como aquelas escondidas no uso da linguagem."
Rezaii e Wolff estão agora reunindo grandes conjuntos de dados e testando a aplicação de seus métodos em uma variedade de doenças neuropsiquiátricas, incluindo a demência.
"Esta pesquisa é interessante não apenas por seu potencial para revelar mais sobre doenças mentais, mas para entender como a mente funciona - como ela junta as idéias", diz Wolff. "A tecnologia de aprendizado de máquina está avançando tão rapidamente que está nos dando ferramentas para coletar dados da mente humana."
O trabalho foi apoiado por subsídios do National Institutes of Health e um Google Research Award.
Fonte da história:
Materiais fornecidos pela Emory Health Sciences . Original escrito por Carol Clark. Nota: O conteúdo pode ser editado por estilo e tamanho.