Maskininlärning vid screening av bröstcancer

Under de senaste åren har fler och fler faktorer som påverkar risken för att utveckla bröstcancer identifierats. Det finns ansträngningar över hela världen för att utveckla en automatisk riskprognos med hjälp av artificiell intelligens, där de olika faktorerna integreras i en övergripande risk. Finska forskare som arbetar med Hamid Bahravan har undersökt en maskininlärningsstrategi [1].

Med SNP och demografiska faktorer om risken för bröstcancer

För att förutsäga risken för bröstcancer använde forskarna en kombination av nätverk av interagerande genvarianter (enkla nuklotidpolymorfismer, SNP). De identifierade dessa och demografiska riskfaktorer för bröstcancer, särskilt faktorer som är associerade med familjär ansamling av sjukdomar (grupp 1) och östrogenmetabolism (grupp 2), i tidigare studier. Faktorerna utvärderades inte tillsats, men deras interaktion med varandra undersöktes. Syftet var att identifiera de kombinationer som kan förutsäga risken för bröstcancer med en högre grad av noggrannhet än tidigare modeller.

Riskfaktorer för bröstcancer anses demografiska

Familjerelaterade riskfaktorer för bröstcancer var:

  • Övergripande cancerformer i familjen
  • Typ av cancer i familjen
  • Cancer hos släktingar i första graden
  • Bröstcancer i familjen
  • Antal förstklassiga släktingar med sprängcancer
  • Lateralitet av bröstcancer i familjen

Riskfaktorer för östrogenmetabolism inkluderade

  • Användning av orala preventivmedel (ja / nej)
  • Varaktighet av oral preventivmedel
  • Menopausal status
  • Amningshistoria (ja / nej)
  • Graviditet (ja / nej)
  • Varaktighet av hormonbehandling
  • Menstruationscykelns längd
  • Varaktighet för eventuella graviditeter
  • Body mass Index.

Databas för maskininlärning

För att utvärdera maskininlärningsmodellen använde forskarna data från det finska Kuopio Breast Cancer Project (KBCP), som registrerade både genetiska och demografiska faktorer hos 445 bröstcancerpatienter och 250 kontroller. Kontrollerna valdes på ett sådant sätt att de var jämförbara med bröstcancerpatienter när det gäller ålder och långvarig vistelse. Genotypning hade registrerat över 211.000 SNP.

Förutsägelsen av risken för bröstcancer förbättrades

Det visades att med integrationen av de namngivna demografiska faktorerna och geninteraktionen kunde den högsta precisionen i förutsägelsen av risken för bröstcancer uppnås - högre än med enbart geninteraktioner eller med endast en kategori av demografiska variabler. Resultaten pekar också på den speciella betydelsen av det östrogenassocierade ESR1-nätverket och även FGFR2-genen, en av de viktigaste genetiska känslighetsplatserna vid icke-ärftlig bröstcancer. Nätverk som är relevanta för angiogenes och apoptos identifierades också som relevanta.

Perspektiv på maskininlärningsmetoden

Forskarna vill nu validera sina resultat på en större datamängd från östra Finlands biobank. Men de tror redan att deras tillvägagångssätt har lagt en grund för bättre identifiering av personer med hög risk för bröstcancer, som skulle kunna dra nytta av mer intensiv och tekniskt mer komplex screening av bröstcancer och därmed göra screening mer effektiv. De antar också att maskininlärningsmetoden också kan överföras till andra multifaktoriella sjukdomar.