petak, 24 maja, 2024
Slobodni profesionalacČasopis

Poseta Institutu za fiziku: Intervju sa Petrom Jovanovićem

Autor: Nikola Todorović

Institut za fiziku u Beogradu trenutno zapošljava oko trista ljudi i predstavlja najveću naučnu instituciju u Srbiji koja se bavi fizičkim naukama i pridruženim tehnologijama.

Petar Jovanović je softverski inženjer u laboratoriji za primenu računara u nauci, Instituta za fiziku u Beogradu. Osnovne studije je završio na Računarskom fakultetu, trenutno je na postdiplomskim studijama na Matematičkom fakultetu, Univerziteta u Beogradu. Na Institutu se bavi održavanjem Paradoksa (PARADOX), kao i učešćem na međunarodnim projektima koji se tiču razvoja računarskih infrastruktura za nauku, kao što su Prejs (PRACE), Vi-SEEM, EGI-Inspajer i drugi.img_6612

Autor ovog teksta je imao čast da poseti Institut za fiziku gde se sastao sa Petrom Jovanovićem, i da sa njim razgovara o Institutu, laboratoriji za primenu računara i Paradoksu, najmoćnijem superračunaru na Balkanu.

Čime se bavi Institut i čime biste se pohvalili?

Petar: Institut se bavi, kao što i samo ime kaže, fizikom. Istraživači Instituta čine oko 1% istraživačkog sektora Srbije, a realizuju oko 10% ukupne naučne produkcije zemlje. Istraživači su okupljeni u četiri centra izvrsnosti, ujedno, ovi centri definišu i osnovne oblasti ekspertize Instituta:

  • Centar za izučavanje kompleksnih sistema (koordinator superračunarskog postrojenja Paradoks),
  • Centar za neravnotežne procese,
  • Centar za čvrsto stanje i nove materijale,
  • Centar za fotoniku.

Čak 63% objavljenih radova je publikovano u vrhunskim međunarodnim časopisima. Institut za fiziku predvodi učešće Srbije u projektima i kolaboracijama sa vodećim međunarodnim istraživačkim centrima kao što je CERN.scl2014-rgb-small

Ja sam iz laboratorije za primenu računara u nauci, to jest iz centra za izučavanje kompleksnih sistema gde se nalazi superračunar Paradoks IV. U ovoj laboratoriji se dosta radi sa Boze–Ajnštajnovim kondenzatima, sa sistemima atoma i subatomskih čestica koje se simuliraju na određenim vremenskim skalama, posmatra se kako ti sistemi evoluiraju, pa se onda odatle proveravaju fizičke pretpostavke i izmišljaju nove teorije.

Gde se sve primenjuje slobodan softver?

Petar: Slobodan softver koristimo svuda, od studentskih računara do samog klastera. Sve se izvršava na linuksu, većina numeričkih biblioteka i softvera što koristimo je slobodan softver. Operativni sistem na klasteru je Sajentifik linuks koji je razvijen u Fermi labu, baziran je na Red hetu, ali sadrži pakete koji su zgodni za nauku.img_6610

Šta mislite o primeni slobodnog softvera u nauci i kako se on pokazao u odnosu na komercijalni softver?

Petar: Slobodan softver je odličan zbog objavljivanja rezultata i lakšeg repliciranja istih na raznim mestima, što je jako bitno. Postojanje dokumentacije i nezavisnost o nekom specifičnom vendoru značajno nam olakšava rad. Zajednica slobodnog softvera je dosta jaka, za sve probleme se vrlo lako nalaze rešenja i mi sami možemo da razvijamo određena rešenja. U odnosu na komercijalne stvari, nemamo toliko komercijalnih igrača na ovom polju. Postoji nekoliko velikih igrača kao što su Krej, IBM, SGI koji imaju svoja rešenja, ali i ta rešenja su većim delom bazirana na tehnologijama otvorenog koda.

Šta vam sve nedostaje od softvera a da je slobodan? Da li biste želeli da neki komercijalni softver koji trenutno koristite ima slobodnu alternativu koja zadovoljava vaše potrebe?

Petar: U maloj meri koristimo softver koji nije slobodan. Ali ono što koristimo su profajleri i dibageri kao što je Total vju dibager za paralelne programe. Tu postoji alternativa da se GNU dibagerom nekako debaguje, ali ovo rešenje je dosta udobnije za rad. Koriste se i okruženja kao što su Matlab i Matematika (eng. Mathematica), čije alternative otvorenog koda za sad malo zaostaju. Mislim da postoji dosta prostora za razvoj alata koji se bave pojednostavljivanjem načina programiranja i izvršavanja na paralelnim mašinama. Taj trend se može videti na primer u PGI kompajleru koji za sad jedini podržava OpenACC (što je dosta udoban način za paralelizaciju koda) ili biblioteci Teano (Theano) koja prevodi simboličke izraze u paralelan kod za grafičke kartice.

Da li mislite da slobodan softver ima svetlu budućnost u nauci?

Petar: To je definitivno, rekao bih da je to jedini tip softvera koji ima svetlu i zagarantovano dobru budućnost. Nauci je jedan od ciljeva širenje znanja i deljenje informacija.

Objasnite nam princip rada superračunara?

Petar: Klaster računari su skup običnih računara lepo složenih u ormare, rek jedinice, koji su povezani jako brzim mrežama i oni se zajedno ponašaju kao jedan računar. Obično je to organizovano tako da ima jedan glavni nod (čvor), na koji se ulogujete kroz SSH, ali postoje i drugi načini za logovanje. Taj nod koristite za kompajliranje vaših aplikacija koje želite da izvršavate na svim računarima. Dominantna paradigma programiranja za takav skup računara jeste razmena poruka (message-passing). Tako da kada napišete svoju aplikaciju, vi onda koristite beč sistem (eng. Batch system), u našem slučaju Tork (eng. Torque), na koji dodajete vašu aplikaciju u red za izvršavanje i tu navodite koliko će vam procesora trebati, da li ćete koristi GPU (grafičku procesorsku jedinicu), koliko predviđate da će izvršavanje trajati i slično. Sistem to zatim koristi za raspoređivanje. Pošto je to beč sistem, poslovi svih korisnika se ređaju po određenom redosledu i dolaze na izvršavanje ukoliko ima dovoljno slobodnih resursa. Kada se proces završi, rezultate imate na vašem fajl sistemu. Fajl sistem je deljen između svih nodova. U principu vaša aplikacija vidi taj sistem kao jedan veliki računar sa puno procesora.img_6601

Odakle dolazi ideja za naziv Paradoks i možete li nam nešto reći o svakoj verziji?

Petar: Naziv Paradoks je odatle što je ljudima koji su započeli Paradoks bilo paradoksalno da u Srbiji može da funkcioniše takav jedan sistem, da bude održiv i da se razvija. Sama ideja da Srbija ima superračunar je delovala paradoksalno. Paradoks je prošao kroz četiri generacije. Prva generacija je običan Beovulf klaster sa četiri personalna računara, druga instanca je bila u dva reka, 32-bitne mašine, koje se danas čuvaju kao eksponati. Treća verzija je bila u četiri reka sa 64-bitnim mašinama koje se danas nalaze u staroj particiji.

Koje su specifikacije Paradoksa IV?

Petar: Naš superračunar ima dve particije: novu i staru. U novoj se nalazi 106 nodova i svaki od njih ima dva osmojezgarna procesora Intel Zeon 2.6GHz Sendi bridž. Svaki nod ima 32GB operativne memorije (RAM), jednu Tesla M2090 karticu koja ima 6GB operativne memorije i 512 jezgara u kartici. Svih 106 nodova na novoj particiji su povezani InfiniBend interkonektom koji omogućava međusobno povezivanje nodova pri brzini od 40Gbps. U staroj particiji imamo oko 89 nodova koji su malo starije generacije, osmojezgarne procesore Zeon Intel sa po 8GB operativne memorije, a povezani su gigabitnim eternetom. Stari Paradoks se koristi uglavnom za poslove koji nemaju mnogo međuprocesorske komunikacije.img_6630

Na kakve sve probleme ste naišli tokom rada na superračunaru?

Petar: Sa administratorske strane, problemi su uglavnom standardne boljke oko kompajliranja i kompatibilnosti stvari pošto dosta softvera ovde instaliramo iz izvornog koda i treba se onda snaći sa svim zavisnostima. Takođe postoje hardverski problemi, jer sa povećanjem broja mašina raste verovatnoća da će vam bar jednom mesečno neki uređaj otkazati. Glavni problem na koji su korisnici nailazili je to što moraju prilagoditi svoj način programiranja. Paradigma razmene poruka (Message-passing) nameće korisnicima da sami brinu o razmeni podataka između svojih procesa, što ume da bude komplikovano.img_66gg31

Možete li nam reći nešto o Prejsu i objasniti podelu superračunara po principu „slojeva”?

Petar: Prejs (eng. PRACE – Partnership for Advanced Computing in Europe) je evropski projekat koji nastoji da se razvija infrastruktura za upotrebu računara u nauci. Kroz Prejs se dele resursi raznih superračunarskih centara koji učestvuju u njemu. Mi smo imali kroz to mogućnosti da koristimo resurse u Evropi, a moj rekord je bio upotreba superračunara Kiri, najmoćnijeg superračunara u Francuskoj, koji je tada bio broj devet u svetu. Što se tiče podele sistema u Prejsu, postoje TIER0 i TIER1 sistemi, TIER0 su oni najveći računari koji su među najmoćnijima na svetu. Paradoks nažalost nije tu. TIER1 su kompjuterski sistemi koji su najveći u državama članicama, i ovom sloju pripada naš superračunar.2016-03-31-1459451520_876x619_scrot

Šta je AEGIS i na koje sve načine je Paradoks dostupan akademskoj zajednici Srbije?

Petar: To je još jedan projekat na nivou Srbije, AEGIS (eng. Academic and Educational Grid Initiative of Serbia). Ideja je bila da se dele resursi među institucijama u Srbiji, pa tako učestvuju u ovom Matematički institut, Elektrotehnički fakultet, Univerzitet u Kragujevcu i mnogi drugi koji imaju manje klastere. Međutim, kroz taj sistem naučnici iz bilo kojih institucija mogu da puste program na izvršavanje na bilo koje institucije članica. To je jedan način na koji se može koristiti i Paradoks. Drugi način je preko formulara za prijavu koji postoji na našem sajtu (http://scl.ipb.ac.rs/). Mnogi naučnici koji su tražili direktan pristup su skoro uvek dobijali nalog i resurse na Paradoksu, za svoje projekte uz jedini zahtev da se Paradoks pomene u zahvalnici na radovima koji se objave.

Da li možete da nam nešto kažete o saradnji sa CERN-om?cms-4e-evt-876658967-3d

Petar: U okviru instituta postoji grupa ATLAS koja uže sarađuje sa LHC-om, tj. ATLAS i CMS detektorima koji su povezani sa Institutom za fiziku i Fizičkim fakultetom. Kada je LHC počeo da generiše ogromne količine podataka, tada se pojavila velika potreba za računarskim resursima. To je bilo u vreme Paradoksa II i III i dosta resursa Paradoksa je bilo posvećeno tome. U međuvremenu CERN je imao mogućnost da razvija kod sebe te mašine, ili da podeli sredstva sa partnerima da se oni razviju i da se razvije mreža partnerstva, što je bilo više održivo rešenje, pa je tako i krenula ideja razvoja tih superračunarskih centara širom Evrope. LHC je tada bio aktivniji, ali sada je to malo utihnulo. Naši ljudi su bili u CERN-u, gde su, između ostalog, obučavani i za pravljenje superračunarskih infrastruktura.

Možemo li reći da je Srbija trenutno regionalni centar u superkompjutingu i da li možemo očekivati još neki superračunar u Srbiji ili regionu?raman

Petar: U zemljama bivše Jugoslavije smo definitivno centar, a na Balkanu nam Grčka predstavlja dobru konkurenciju, ali svakako smo u samom vrhu. Najveća najava je Plavi Dunav, projekat koji se još nije ostvario. Započet je 2008. godine, ali zbog ekonomske situacije u zemlji se sve to malo sporije odvija. Nisam upoznat sa detaljima, ali zvanično je da će se ostvariti. Trebalo bi da Plavi Dunav bude mnogo veći od Paradoksa i bio bi naš novi TIER1 centar.

Zahvaljujemo se Petru na ovom intervjuu, a Institutu za fiziku želimo još više uspeha u budućnosti.