Becsült olvasási idő: 2 perc
Deep learning algoritmusokkal a ritka betegségek ellen

A ritka betegségek olyan jelenségek, amelyek általánosságban kevesebb mint 200 000 embert érintenek. Azonban, mivel a nagyvállalkozások világában, különösen a nagy gyógyszeriparban ezzel nem éri meg, vagyis nem elég jövedelmező foglalkozni, ezekkel a betegségekkel ritkán foglalkoznak – nem is beszélve az érintettek meggyógyításáról.

Például a hipertriptofanémia egy ritka betegség, amely valószínűleg a szervezet a triptofán aminosavat feldolgozó képességében fellépő rendellenességek miatt következik be. Hogy milyen ritka is a betegség maga, nehéz megmondani. A Google sem ad választ erre a kérdésre. Ahhoz mindenesetre elég ritka, hogy a böngésző még a 19 betűből 15 beírása után sem fejezte be automatikusan a szót.

Paradox módon a big data képes változtatni ezen. A big data fogalommal már találkozhattunk, tulajdonképpen egy olyan technológiai környezetet értünk alatta, mely lehetővé teszi hatalmas, komplex adatállományok feldolgozását, amelyekkel a már meglévő adatbázis-menedzsment rendszerek jelenleg nem képesek megküzdeni.

A 200 000-es nagyságrendű adatpont tulajdonképpen nem kicsi adatállomány, ráadásul egyéb problémákat is felvet. Az adatpontok nem egyetlen óriási adatbázisban találhatóak meg. Az első kihívás tehát az összes lehetséges adat összegyűjtése - azonban az adatok nagy része nem homogén, összekapcsolható és összehasonlítható adatbázisokban van. Az adatpontok mélyen el van temetve a PubMed cikkekhez és szabadalmi bejelentésekhez hasonló dokumentumokban.

A Deep Learning lehetőséget ad a kutatóknak, hogy kiemeljék ezeket az adatokat az adott dokumentumokból - ez a Vyasa nevű startup stratégiája.

„Vegyük úgy, hogy adatbázis a szénakazal, amelyben meg akarunk találni egy tűt - ami ebben az esetben az adott ritka betegség.” – mondja Vyasa vezérigazgatója és alapítója, Christopher Bouton az IEEE Spectrum Fixing the Future podcastjében. „A mi módszerünk az, hogy egy deep learning algoritmust írunk magára a nyelvre – ez lehet francia, német, vagy az adott betegségre vonatkozó szaknyelv. Amint az algoritmus elsajátította a számára hozzáférhető dokumentumok nyelvét, képes lesz azonosítani ezeket a konkrét kifejezéseket bármely más dokumentumban. Ezután pedig feltehetünk az adott témára vonatkozó bármilyen kérdést, például: Milyen tünetei vannak ennek a betegségnek? Mi a megfelelő kezelési eljárás az ilyen típusú betegségekre? Az algoritmus pedig képes önállóan megkeresni ezeket a válaszokat.”

„Tehát az algoritmusok segítségével először megtaláljuk az információt, majd választ találunk a vele kapcsolatos kérdésekre – s ez valóban hatékony módszernek bizonyul az olyan adatok kinyerésére, amelyeket korábban a gépek nehezen tudtak elemezni.” – foglalja össze Bouton.