hirdetés
hirdetés

Bemutatta MI-Központját a Continental

Mesterségesintelligencia-megoldások futószalagon

A Continental technológiai vállalat február végén hivatalosan is bemutatta a budapesti Mesterséges Intelligencia Fejlesztő Központját, ahol olyan példákat lehetett látni az MI-megoldásokból, amelyek kulcsfontosságúak az önvezető járművek fejlesztésében. 

hirdetés

A nyitást egyébként 2018. január 30-án jelentették be, és 2018 májusa óta működik a központ. A csapatuk jelenleg MI specialistákból, data-managerekből, DevOps mérnökökből és alkalmazás fejlesztőkből áll. A fejlesztés előkészítésétől a termék tervezéséig tartó folyamat rendkívül lerövidül Budapesten. Mivel az új megoldások azonnal beépíthetők a speciálisan felszerelt teszt járművekbe, így a szakértőik a valós életben szerezhetnek tapasztalatot.

"A Mesterséges Intelligencia Fejlesztő Központ a Continental vállalat magyarországi működését az automata vezetéshez szükséges megoldásokkal látja el" – hangsúlyozta Jens Brüning, a budapesti Mesterséges Intelligencia Fejlesztő Központ vezetője.

MI-gyár

A budapesti iroda csupán pár hónap alatt már komoly eredményeket ért el: gépi tanulási módszereket fejlesztenek, alkalmaznak, illetve integrálnak. Volt szerencsénk ebbe betekintést nyerni, azaz a Mesterséges Intelligenciát hogyan használja fel a gyakorlatban a Continental a jövő automata vezetői rendszereinek fejlesztése során.

Többek között bemutatták a Continental újgenerációs gyalogos felismerő rendszerét. Ez a funkció felelős a jármű környezetében lévő gyalogosok észleléséért, a védelmük érdekében. Amíg a jelenlegi fejlett vezetést segítő rendszerekben használt klasszikus gyalogos felismerő technológia csupán arról szolgáltat információt, hogy hol található a gyalogos, addig a következő generációs rendszerek már mesterséges intelligencián alapuló tanulási módszereket használnak. Ezáltal sokkal több információt képesek átadni: például beazonosítani az emberi test különféle részeit (kezeket, könyököt vagy vállat), ami alapján egy algoritmus előre jelzi az észlelt személy testtartását és várható mozdulatait. Ebből következtetéseket tud levonni a mozgásuk és figyelmük irányáról, ezáltal is növelve a biztonság szintjét.

Hogyan lesz a legfrissebb kutatásból üzleti megoldás?

A Continentalnál a gépi tanulás csoport a mesterséges intelligencia területén zajló kutatási eredményekből táplálkozik, a legmodernebb technológiák átvételével. Három lépésre osztható munkájuk: folyamatosan figyelemmel kísérik az elképesztő sebességű fejlődést, a friss kutatások átvételekor erősen fókuszálnak azokra a termékcsoportjaikra, amelyekhez szükség van a gépi tanulásra, és nyilvántartják, hogy az üzleti oldalnak milyen megoldásokra, funkciókra, termékekre van szüksége. Az ígéreteseket átveszik – olyanokra kell gondolni, mint a neurális háló architektúrák, gépi tanuló tréning, optimáló algoritmusok, kiértékelési módok, adatmanipulációs technikák.

Második lépésben a kutatásból átvett technológiát tüzetes vizsgálatnak és kiértékelésnek vetik alá, hogy kiderüljön, az adott megoldás alkalmazható-e a termékproblémákra. Ezt követően előállítják a szükséges szoftvereket házon belül a kutatási eredményekhez, és megvizsgálják, mennyire releváns számukra. A harmadik lépés során pedig ebből előállítják a mérnöki közösség számára azt a mérnöki terméket, amellyel az alkalmazások hasznossá tehetők.

Ralph Lauxmann, a Chassis & Safety divízió Systems & Technology terület vezetője
Ralph Lauxmann, a Chassis & Safety divízió Systems & Technology terület vezetője

Tehát a kiértékelt prototípus-implementációt alaposan megtervezett mérnöki termékké (szoftver) alakítják, az implementáció során figyelemmel kísérik, hogy milyen termékszcenáriókban és problémákra lehet alkalmazni azt, elkészítik a termelésre kész kódot, dokumentációt, illetve biztosítják a tanácsadást.

Jelenleg  6-7 különböző területen dolgoznak, megoldásaikat kameratermékekben, vezetőfigyelő termékekben és következő generációs lézerszenzorokban fogják alkalmazni.

Az eddigi csúcsmegoldások általában nagyon triviális és egyszerű feltételezéseken alapultak, amelyek nem mindig biztosítottak megoldást a felmerülő problémákra, ezért a Continental elkezdte kutatni az újabb módszereket is. Az egyik metódus már ügyféldemóként fut, amennyiben sikeresen zárul, megbízható formában és teljes dokumentációval bocsátják a mérnöki közösség számára.

PIA (Professional Intelligence for Automotive) projekt

A PIA projekt egy kutatási munkálatokat támogató kooperációs projekt, amely a Continental budapesti székhelyű mély gépi tanulás központja (Deep Machine Learning Competence Center) és a Budapesti Műszaki és Gazdaságtudományi Egyetem között létesült. Lényege a szoros kapcsolat biztosítása a cég szakértői és az egyetem akadémikusai között, célja, hogy választ adjon az önvezető autók fejlesztésében bevezethető mesterséges intelligencia alapú metódusok felhasználhatóságáról.

Bár a Continental a gépi tanulás terén már számos eredményt fel tud mutatni, rengeteg olyan alterület van, amely esetén az egyetem biztosít arra lehetőséget, hogy hallgatók és akadémikusok kutathassák ki, mire van szükség még a piacon.

A projekt keretén belül az egyre nagyobb teret nyerő gépi tanulás tudományágban folytatódnak kutatási, oktatási, labor, fejlesztési és diplomamunka tevékenységek alapszakos (BSc), mesterszakos (MSc) és doktori (Ph.D.) képzésben résztvevő hallgatók számára. A Continental ugyanis vállalta egy laboratórium felszerelését az egyetem Villamosmérnöki és Informatikai Karán. A laboratóriumban olyan nagy számítási kapacitással bíró számítógépek kerülnek, amelyek speciálisan a gépi tanítási metódusok tesztelésére lettek összeállítva.

A kamera a visszapillantó dobozán néz ki kifelé az autó szélvédője mögül, egy pici processzort és neurális hálót tartalmaz, amely feldolgozza a képet, így a kamera már nem a képet adja ki magából, hanem egy strukturális leírást arról, mit lát a világban. Ezt össze lehet hozni más szenzorokkal, lidarokkal, közönséges radarokkal is, így egyesíthető az egész kép
A kamera a visszapillantó dobozán néz ki kifelé az autó szélvédője mögül, egy pici processzort és neurális hálót tartalmaz, amely feldolgozza a képet, így a kamera már nem a képet adja ki magából, hanem egy strukturális leírást arról, mit lát a világban. Ezt össze lehet hozni más szenzorokkal, lidarokkal, közönséges radarokkal is, így egyesíthető az egész kép

A laboratórium egy Duckietown környezettel is gazdagodik. A Duckietown program egy az Amerikai Egyesült Államokban lévő MIT egyetem által elindított projekt, mely pedagógiai célú környezetet biztosít a hallgatók számára a robotika és a gépi tanulás tudományának elsajátítására. A környezet egy miniatűr városi környezetből áll, utakkal és közlekedési táblákkal ellátva, melyben robotautók közlekedhetnek. A robotautók kamerával és Raspberry Pi számítógéppel vannak ellátva és feladatuk, hogy megtanulják a környezetben való szabályos közlekedést. Az elkészült robotautók majd a leghíresebb nemzetközi gépi tanulási és robotikai konferenciákon versenyezhetnek, ezáltal a hallgatók jelentős szakmai tapasztalatot sajátíthatnak el, valamint az egyetem hírnevét is fokozhatják a tudomány ezen ágában.

A nagy erőforrásigényű számítógépek beágyazott szintű algoritmusok gyártását fogják előtérbe helyezni, a jó programozási készségekkel és jó architekturális képességekkel rendelkező hallgatók számára MSC, doktori és nyári gyakorlati programot is biztosítanak, valamint állást is.

Nem arról szól, hogy mi van előttünk, hanem, hogy mi lehet előttünk!

De mi történik akkor, ha a mesterséges intelligencia alkalmazást beletesszük egy játékszoftverhez hasonló szimulátorba? Az ugyanis, hogy egy jármű képes legyen értelmezni még a bonyolult és előre nem látható közlekedési helyzeteket is, nagyon sok erőforrásba és időbe kerül, amennyiben utakon cirkáló autók által begyűjtött és emberek által felcímkézett tanítóképekkel próbáljuk megtanítani rá.

A neurális háló tulajdonképpen olyan, mint egy kisgyerek; meg kell neki mutatni, ki a gyalogos, melyik az autó, mi van a képen, ezekből rengeteget kell „látnia” a rendszernek, ahogy egy gyerek is több évig tanulja ezeket. Egy neurális hálóba, attól függően, hogy milyen célra használjuk, petabájt mennyiségű képkockát kell rögzíteni, ez rengeteg pénz és idő, míg értelmes adathalmazt nyerhető belőle, olyan, amilyen többé-kevésbé jól használható egy neurális háló hasznára. Ez a módszer nagyon rögös út, ezt váltja fel a szimulátor a mesterségesen előállított képekkel és adatokkal, mert ezek kockáról kockára reprodukálhatók és elő lehet állítani olyan eseteket is, amit egy városban cirkáló kocsi nem biztos, hogy sokszor lát (például ülő alakot).

A szimulátor állítja elő az adatokat
A szimulátor állítja elő az adatokat

Ehelyett a német Deep Dive megoldás az úgynevezett lokációkat 3D képpé varázsolja, majd a magyar Palinca (Application Framework for Real Time Inference of Neural Networks) pedig a képeket egyesével felcímkézi és megmondja a neurális háló segítségével, hol, mi és milyen biztonsággal található rajta – azaz a gyalogos gyalogos, az autó pedig autó. A két rendszer révén képesek a szakemberek olyan közlekedési szituációkat is előidézni, mint például egy láma megjelenése, ami valószínűleg nem fog előfordulni a valóságban. Az adott szituációkat pedig hóban, esőben és éjjel is „visszajátsszák”, így ugyanazon szituációról sokkal változatosabb képet kap a rendszer. Természetesen a szintetikus adatsort – hibrid tanítási eljárások révén – pontosítani kell a valós adatsorral.  

Ha bármilyen probléma felmerül a tesztelés során, akkor a Palinca a képeket is rögzíti, és vissza lehet csatolni azokba az adatbázisokba, amelyekből tanulnak a neurális hálók, így a deketált problémákat azonnal javítani is lehet. Viszont rengeteg adatra, tesztelésre és visszacsatolásra van szükség.

Mi kell ahhoz, hogy egy neurális hálót tanítani lehessen?

A Continental Deep Learning Data Infrastructure Group csoportja annotált szinkronizált adatokat, illetve ehhez szükséges elosztott módú klasztert biztosít ahhoz, hogy a deep learninges modellek futni tudjanak. Ezek komplexitása, illetve a hatalmas adatmennyiség, amelyet kezelni kell, hatalmas számítási kapacitást igényel. A már említett klaszter nem jelent mást, mint rengeteg számítógépet összekötve rengeteg erőforrással. A just-in-time módon működő gyárhoz hasonlítható megoldás révén úgy halad az adat a különböző egységek között végig, hogy minél kevesebb az állásidő, és minél jobban ki van használva a kapacitás. Egyfajta optimalizált működést biztosít. Ehhez egyébként élő deep learning-térningfuttást is bemutattak. De vajon mekkora áramszámlára számíthatunk egy neurális hálózat tanításakor? Például egy egyhetes tréning 1 GPU-s németországi futtatásának áramfogyasztása nagyságrendileg 30 euró. Egy termékhez pedig rengeteg tréningnek, jóval több GPU-n kell futnia, sokkal tovább, mint egy hét. Így az áramszámla könnyen felugorhat ezres nagyságrendre, és még számos további költséget is mellé kell tenni.

Színes járműfelismerés
Színes járműfelismerés

A Continental bemutatójának utolsó állomásán képet kaphattunk arról, hogy egyáltalán mennyire is intelligens a mesterséges intelligencia, amit fejlesztenek, mit lehet elvárni tőle. Mivel az utakon számtalan helyzet és viselkedés történhet, több szinten tanul a rendszer. Az első szinten (level 1) alakzatokat, vonalakat, köröket, szögeket, a második szinten (level 2) ezek kombinációit, míg a harmadik szint (level 3) már egészen komoly járműfelismerésre is képes. Ehhez egy tipikus német autópályát láthattunk a képernyőn. A rendszer színes oszlopokkal jelezte, hogy mennyire megbízható az úton látható objektum felismerése. Egy autósziluettet látva a neurális hálózat megtanulva a járművek tipikus elemeit (például hátsó lámpák), képes egyre megbízhatóbban azonosítani az egyes járműveket, vizsgálva a kontextus is, így például egy útra kerülő szörnyet.

Sós Éva
a szerző cikkei

hirdetés
Ha hozzá kíván szólni, jelentkezzen be!
 
hirdetés
hirdetés
hirdetés
hirdetés