O que a Netflix pode nos ensinar sobre o tratamento do câncer

Há dois anos, o ex-presidente Barack Obama anunciou a Iniciativa de Medicina de Precisão no seu discurso sobre o estado da União. A iniciativa aspirava a uma "nova era da medicina", onde os tratamentos de doenças poderiam ser especificamente adaptados ao código genético de cada paciente. A Conversação

Isso ressoou profundamente na medicina do câncer. Os pacientes já podem gerenciar seu câncer com terapias que visam os genes específicos que são alterados em seu tumor particular. Por exemplo, mulheres com um tipo de câncer de mama causado pela amplificação do gene HER2 são frequentemente tratadas com uma terapêutica chamada herceptina. Como essas terapias direcionadas são específicas para as células cancerosas, elas tendem a ter menos efeitos colaterais do que os tratamentos tradicionais de câncer com quimioterapia ou radiação.

No entanto, tais tratamentos não estão disponíveis para a maioria dos pacientes com câncer. Em muitos tipos de câncer, as alterações genéticas específicas responsáveis ​​por um câncer permanecem desconhecidas. Para criar tratamentos de câncer individualizados, precisamos saber mais sobre as alterações genéticas funcionais.

Com dados sobre a genética do câncer crescendo rapidamente, a matemática e a estatística podem agora ajudar a desvendar os padrões ocultos nesses dados para encontrar os genes responsáveis ​​pelo câncer de um indivíduo. Com esse conhecimento, os médicos podem selecionar tratamentos apropriados que bloqueiam a ação desses genes para personalizar terapias para pacientes individuais. Minha pesquisa visa melhorar a medicina de precisão no câncer - com base nos mesmos métodos que foram usados ​​para encontrar padrões nas classificações de filmes da Netflix.

Peneirando os dados

Hoje, há acesso público sem precedentes aos dados genéticos do câncer. Esses dados vêm de pacientes generosos que doam suas amostras de tumores para pesquisa. Os cientistas então aplicam tecnologias de sequenciamento para medir as mutações e a atividade em cada um dos genes 20,000 no genoma humano.


innerself assinar gráfico


Todos esses dados são um resultado direto do Projeto Genoma Humano em 2003. Esse projeto determinou a sequência de todos os genes que compõem o DNA humano saudável. Desde a conclusão desse projeto, o custo do sequenciamento do genoma humano mais do que metade de cada ano, superando o crescimento do poder de computação descrito lei de Moore. Essa redução de custos permite que as pesquisas coletem dados genéticos sem precedentes de pacientes com câncer.

A maioria dos estudos científicos sobre genética do câncer realizados em todo o mundo divulga seus dados em um banco de dados público centralizado fornecido pela National Library of Medicine (National Institutes of Health, NIH) dos Estados Unidos. O NIH National Cancer Institute e o National Human Genome Research Institute também divulgaram gratuitamente dados genéticos de tumores 11,000 em tipos de câncer 33 através de um projeto chamado O Atlas do Genoma do Câncer.

Cada função biológica - da extração de energia dos alimentos à cura de uma ferida - resulta da atividade em diferentes combinações de genes. Os cancros sequestram os genes que permitem que as pessoas cresçam até a idade adulta e protejam o corpo do sistema imunológico. Pesquisadores dub estes o "Marcas de câncer". A chamada desregulação gênica permite que um tumor cresça descontroladamente e forme metástases em órgãos distantes do local original do tumor.

Os pesquisadores estão usando ativamente esses dados públicos para encontrar o conjunto de alterações genéticas responsáveis ​​por cada tipo de tumor. Mas esse problema não é tão simples quanto identificar um único gene desregulado em cada tumor. Centenas, se não milhares, dos genes 20,000 no genoma humano estão desregulados no câncer. O grupo de genes desregulados varia no tumor de cada paciente, com conjuntos menores de genes comumente reutilizados, permitindo cada marca registrada do câncer.

A medicina de precisão baseia-se em encontrar os grupos menores de genes desregulados que são responsáveis ​​pela função biológica no tumor de cada paciente. Mas os genes podem ter múltiplas funções biológicas em diferentes contextos. Portanto, os pesquisadores devem descobrir um conjunto de genes "sobrepostos" que têm funções comuns em um conjunto de pacientes com câncer.

Ligar o status do gene à função requer matemática complexa e imenso poder de computação. Esse conhecimento é essencial para prever o resultado de terapias que bloqueariam a função desses genes. Então, como podemos descobrir esses recursos sobrepostos para prever resultados individuais para os pacientes?

O que o Netflix pode nos ensinar

Felizmente para nós, esse problema já foi resolvido na ciência da computação. A resposta é uma classe de técnicas chamada “fatoração de matriz” - e você provavelmente já interagiu com essas técnicas em sua vida cotidiana.

Em 2009, Netflix realizou um desafio para personalizar as classificações de filmes para cada usuário do Netflix. Na Netflix, cada usuário tem um conjunto distinto de classificações de filmes diferentes. Enquanto dois usuários podem ter gostos semelhantes em filmes, eles podem variar muito em gêneros específicos. Portanto, você não pode confiar na comparação de avaliações de usuários semelhantes.

Em vez disso, um algoritmo de fatoração de matriz encontra filmes com classificações semelhantes entre um grupo menor de usuários. O grupo de usuários irá variar para cada filme. O computador associa cada usuário a um grupo de filmes em uma extensão diferente, com base em seus gostos individuais. Os relacionamentos entre os usuários são chamados de “padrões”. Esses padrões são aprendidos com os dados e podem encontrar classificações comuns não previstas apenas por gênero de filme - por exemplo, os usuários podem compartilhar uma preferência por um determinado diretor ou ator.

câncer 4 21Genevieve Stein-O'Brien, CC BY

O mesmo processo pode funcionar no câncer. Nesse caso, as medidas de desregulação gênica são análogas às classificações de filmes, gêneros de filmes à função biológica e usuários aos tumores dos pacientes. O computador pesquisa tumores de pacientes para encontrar padrões de desregulação gênica que causam a função biológica maligna em cada tumor.

De filmes a tumores

A analogia entre classificações de filmes e genética do câncer é quebrada nos detalhes. A menos que sejam menores, os usuários do Netflix não são limitados nos filmes que assistem. Porém, nossos corpos preferem minimizar o número de genes usados ​​para qualquer função. Existem também redundâncias substanciais entre os genes. Para proteger uma célula, um gene pode facilmente substituir outro por uma função comum. As funções genéticas no câncer são ainda mais complexas. Os tumores também são altamente complexos e evoluem rapidamente, dependendo das interações aleatórias entre as células cancerígenas e o órgão saudável adjacente.

Para dar conta dessas complexidades, desenvolvemos uma abordagem de fatoração de matriz chamada Atividade de gene coordenada em conjuntos de padrões - ou CoGAPS para breve. Nosso algoritmo é responsável pelo minimalismo da biologia, incorporando o menor número possível de genes nos padrões de cada tumor.

Genes diferentes também podem substituir um ao outro, cada um servindo uma função similar em um contexto diferente. Para dar conta disso, o CoGAPS estima simultaneamente uma estatística para os chamados “padrões” de função genética. Isso nos permite calcular a probabilidade de cada gene ser usado em cada função biológica em um tumor.

Por exemplo, muitos pacientes tomam um tratamento direcionado chamado cetuximab para prolongar a sobrevida nos cânceres colo-retal, pancreático, pulmonar e oral. Nosso trabalho recente descobriu que esses padrões podem distinguir a função do gene em células cancerígenas que respondem ao agente terapêutico alvo cetuximab daqueles que não o fazem.

O futuro

Infelizmente, as terapias contra o câncer que têm como alvo os genes geralmente não podem curar a doença de um paciente. Eles só podem atrasar a progressão por alguns anos. A maioria dos pacientes recai, com tumores que não respondem mais ao tratamento.

Nosso trabalho recente descobriram que os padrões que distinguem a função do gene nas células que respondem ao cetuximabe incluem os próprios genes que dão origem à resistência. Imunoterapias emergentes são promissoras e parecem curar alguns tipos de câncer. No entanto, com demasiada frequência, os pacientes com esses tratamentos também recaem. Novos dados que acompanham a genética do câncer após o tratamento são essenciais para determinar por que os pacientes não respondem mais.

Juntamente com esses dados, a biologia do câncer também requer uma nova geração de cientistas que possam ligar a matemática e a estatística para determinar as mudanças genéticas que ocorrem ao longo do tempo na resistência aos medicamentos. Em outros campos da matemática, programas de computador são capazes de prever resultados a longo prazo. Esses modelos são usados ​​comumente em previsão de tempo e estratégias de investimento.

Nestes campos e minha própria pesquisa anteriorDescobrimos que as atualizações nos modelos de grandes conjuntos de dados - como dados de satélite no caso do clima - melhoram as previsões de longo prazo. Todos nós já vimos o efeito dessas atualizações, com as previsões do tempo melhorando o quanto mais perto estamos de uma tempestade.

Assim como as ferramentas da ciência da computação usadas podem ser adaptadas tanto às recomendações de filmes quanto ao câncer, a futura geração de cientistas computacionais adotará ferramentas de previsão de uma série de campos para a medicina de precisão. Em última análise, com essas ferramentas computacionais, esperamos prever a resposta dos tumores à terapia tão frequentemente quanto prevemos o clima e talvez de maneira mais confiável.

Sobre o autor

Elana Fertig, Professora Assistente de Bioestatística e Bioinformática em Oncologia, Johns Hopkins University

Este artigo foi originalmente publicado em A Conversação. Leia o artigo original.

Livros relacionados

at InnerSelf Market e Amazon