четвртак, 25 априла, 2024
Слободни професионалацЧасопис

Посета Институту за физику: Интервју са Петром Јовановићем

Аутор: Никола Тодоровић

Институт за физику у Београду тренутно запошљава око триста људи и представља највећу научну институцију у Србији која се бави физичким наукама и придруженим технологијама.

Петар Јовановић је софтверски инжењер у лабораторији за примену рачунара у науци, Института за физику у Београду. Основне студије је завршио на Рачунарском факултету, тренутно је на постдипломским студијама на Математичком факултету, Универзитета у Београду. На Институту се бави одржавањем Парадокса (PARADOX), као и учешћем на међународним пројектима који се тичу развоја рачунарских инфраструктура за науку, као што су Прејс (PRACE), Ви-СЕЕМ, ЕГИ-Инспајер и други.img_6612

Аутор овог текста је имао част да посети Институт за физику где се састао са Петром Јовановићем, и да са њим разговара о Институту, лабораторији за примену рачунара и Парадоксу, најмоћнијем суперрачунару на Балкану.

Чиме се бави Институт и чиме бисте се похвалили?

Петар: Институт се бави, као што и само име каже, физиком. Истраживачи Института чине око 1% истраживачког сектора Србије, а реализују око 10% укупне научне продукције земље. Истраживачи су окупљени у четири центра изврсности, уједно, ови центри дефинишу и основне области експертизе Института:

  • Центар за изучавање комплексних система (координатор суперрачунарског постројења Парадокс),
  • Центар за неравнотежне процесе,
  • Центар за чврсто стање и нове материјале,
  • Центар за фотонику.

Чак 63% објављених радова је публиковано у врхунским међународним часописима. Институт за физику предводи учешће Србије у пројектима и колаборацијама са водећим међународним истраживачким центрима као што је ЦЕРН.scl2014-rgb-small

Ја сам из лабораторије за примену рачунара у науци, то јест из центра за изучавање комплексних система где се налази суперрачунар Парадокс IV. У овој лабораторији се доста ради са Бозе–Ајнштајновим кондензатима, са системима атома и субатомских честица које се симулирају на одређеним временским скалама, посматра се како ти системи еволуирају, па се онда одатле проверавају физичке претпоставке и измишљају нове теорије.

Где се све примењује слободан софтвер?

Петар: Слободан софтвер користимо свуда, од студентских рачунара до самог кластера. Све се извршава на линуксу, већина нумеричких библиотека и софтвера што користимо је слободан софтвер. Оперативни систем на кластеру је Сајентифик линукс који је развијен у Ферми лабу, базиран је на Ред хету, али садржи пакете који су згодни за науку.img_6610

Шта мислите о примени слободног софтвера у науци и како се он показао у односу на комерцијални софтвер?

Петар: Слободан софтвер је одличан због објављивања резултата и лакшег реплицирања истих на разним местима, што је јако битно. Постојање документације и независност о неком специфичном вендору значајно нам олакшава рад. Заједница слободног софтвера је доста јака, за све проблеме се врло лако налазе решења и ми сами можемо да развијамо одређена решења. У односу на комерцијалне ствари, немамо толико комерцијалних играча на овом пољу. Постоји неколико великих играча као што су Креј, ИБМ, СГИ који имају своја решења, али и та решења су већим делом базирана на технологијама отвореног кода.

Шта вам све недостаје од софтвера а да је слободан? Да ли бисте желели да неки комерцијални софтвер који тренутно користите има слободну алтернативу која задовољава ваше потребе?

Петар: У малој мери користимо софтвер који није слободан. Али оно што користимо су профајлери и дибагери као што је Тотал вју дибагер за паралелне програме. Ту постоји алтернатива да се ГНУ дибагером некако дебагује, али ово решење је доста удобније за рад. Користе се и окружења као што су Матлаб и Математика (енг. Mathematica), чије алтернативе отвореног кода за сад мало заостају. Мислим да постоји доста простора за развој алата који се баве поједностављивањем начина програмирања и извршавања на паралелним машинама. Тај тренд се може видети на пример у ПГИ компајлеру који за сад једини подржава ОпенАЦЦ (што је доста удобан начин за паралелизацију кода) или библиотеци Теано (Theano) која преводи симболичке изразе у паралелан код за графичке картице.

Да ли мислите да слободан софтвер има светлу будућност у науци?

Петар: То је дефинитивно, рекао бих да је то једини тип софтвера који има светлу и загарантовано добру будућност. Науци је један од циљева ширење знања и дељење информација.

Објасните нам принцип рада суперрачунара?

Петар: Кластер рачунари су скуп обичних рачунара лепо сложених у ормаре, рек јединице, који су повезани јако брзим мрежама и они се заједно понашају као један рачунар. Обично је то организовано тако да има један главни нод (чвор), на који се улогујете кроз ССХ, али постоје и други начини за логовање. Тај нод користите за компајлирање ваших апликација које желите да извршавате на свим рачунарима. Доминантна парадигма програмирања за такав скуп рачунара јесте размена порука (message-passing). Тако да када напишете своју апликацију, ви онда користите беч систем (енг. Batch system), у нашем случају Торк (енг. Torque), на који додајете вашу апликацију у ред за извршавање и ту наводите колико ће вам процесора требати, да ли ћете користи ГПУ (графичку процесорску јединицу), колико предвиђате да ће извршавање трајати и слично. Систем то затим користи за распоређивање. Пошто је то беч систем, послови свих корисника се ређају по одређеном редоследу и долазе на извршавање уколико има довољно слободних ресурса. Када се процес заврши, резултате имате на вашем фајл систему. Фајл систем је дељен између свих нодова. У принципу ваша апликација види тај систем као један велики рачунар са пуно процесора.img_6601

Одакле долази идеја за назив Парадокс и можете ли нам нешто рећи о свакој верзији?

Петар: Назив Парадокс је одатле што је људима који су започели Парадокс било парадоксално да у Србији може да функционише такав један систем, да буде одржив и да се развија. Сама идеја да Србија има суперрачунар је деловала парадоксално. Парадокс је прошао кроз четири генерације. Прва генерација је обичан Беовулф кластер са четири персонална рачунара, друга инстанца је била у два река, 32-битне машине, које се данас чувају као експонати. Трећа верзија је била у четири река са 64-битним машинама које се данас налазе у старој партицији.

Које су спецификације Парадокса IV?

Петар: Наш суперрачунар има две партиције: нову и стару. У новој се налази 106 нодова и сваки од њих има два осмојезгарна процесора Интел Зеон 2.6GHz Сенди бриџ. Сваки нод има 32GB оперативне меморије (RAM), једну Тесла М2090 картицу која има 6GB оперативне меморије и 512 језгара у картици. Свих 106 нодова на новој партицији су повезани ИнфиниБенд интерконектом који омогућава међусобно повезивање нодова при брзини од 40Gbps. У старој партицији имамо око 89 нодова који су мало старије генерације, осмојезгарне процесоре Зеон Интел са по 8GB оперативне меморије, а повезани су гигабитним етернетом. Стари Парадокс се користи углавном за послове који немају много међупроцесорске комуникације.img_6630

На какве све проблеме сте наишли током рада на суперрачунару?

Петар: Са администраторске стране, проблеми су углавном стандардне бољке око компајлирања и компатибилности ствари пошто доста софтвера овде инсталирамо из изворног кода и треба се онда снаћи са свим зависностима. Такође постоје хардверски проблеми, јер са повећањем броја машина расте вероватноћа да ће вам бар једном месечно неки уређај отказати. Главни проблем на који су корисници наилазили је то што морају прилагодити свој начин програмирања. Парадигма размене порука (Message-passing) намеће корисницима да сами брину о размени података између својих процеса, што уме да буде компликовано.img_66gg31

Можете ли нам рећи нешто о Прејсу и објаснити поделу суперрачунара по принципу „слојева”?

Петар: Прејс (енг. PRACE – Partnership for Advanced Computing in Europe) је европски пројекат који настоји да се развија инфраструктура за употребу рачунара у науци. Кроз Прејс се деле ресурси разних суперрачунарских центара који учествују у њему. Ми смо имали кроз то могућности да користимо ресурсе у Европи, а мој рекорд је био употреба суперрачунара Кири, најмоћнијег суперрачунара у Француској, који је тада био број девет у свету. Што се тиче поделе система у Прејсу, постоје ТИЕР0 и ТИЕР1 системи, ТИЕР0 су они највећи рачунари који су међу најмоћнијима на свету. Парадокс нажалост није ту. ТИЕР1 су компјутерски системи који су највећи у државама чланицама, и овом слоју припада наш суперрачунар.2016-03-31-1459451520_876x619_scrot

Шта је АЕГИС и на које све начине је Парадокс доступан академској заједници Србије?

Петар: То је још један пројекат на нивоу Србије, АЕГИС (енг. Academic and Educational Grid Initiative of Serbia). Идеја је била да се деле ресурси међу институцијама у Србији, па тако учествују у овом Математички институт, Електротехнички факултет, Универзитет у Крагујевцу и многи други који имају мање кластере. Међутим, кроз тај систем научници из било којих институција могу да пусте програм на извршавање на било које институције чланица. То је један начин на који се може користити и Парадокс. Други начин је преко формулара за пријаву који постоји на нашем сајту (http://scl.ipb.ac.rs/). Многи научници који су тражили директан приступ су скоро увек добијали налог и ресурсе на Парадоксу, за своје пројекте уз једини захтев да се Парадокс помене у захвалници на радовима који се објаве.

Да ли можете да нам нешто кажете о сарадњи са ЦЕРН-ом?cms-4e-evt-876658967-3d

Петар: У оквиру института постоји група АТЛАС која уже сарађује са ЛХЦ-ом, тј. АТЛАС и ЦМС детекторима који су повезани са Институтом за физику и Физичким факултетом. Када је ЛХЦ почео да генерише огромне количине података, тада се појавила велика потреба за рачунарским ресурсима. То је било у време Парадокса II и III и доста ресурса Парадокса је било посвећено томе. У међувремену ЦЕРН је имао могућност да развија код себе те машине, или да подели средства са партнерима да се они развију и да се развије мрежа партнерства, што је било више одрживо решење, па је тако и кренула идеја развоја тих суперрачунарских центара широм Европе. ЛХЦ је тада био активнији, али сада је то мало утихнуло. Наши људи су били у ЦЕРН-у, где су, између осталог, обучавани и за прављење суперрачунарских инфраструктура.

Можемо ли рећи да је Србија тренутно регионални центар у суперкомпјутингу и да ли можемо очекивати још неки суперрачунар у Србији или региону?raman

Петар: У земљама бивше Југославије смо дефинитивно центар, а на Балкану нам Грчка представља добру конкуренцију, али свакако смо у самом врху. Највећа најава је Плави Дунав, пројекат који се још није остварио. Започет је 2008. године, али због економске ситуације у земљи се све то мало спорије одвија. Нисам упознат са детаљима, али званично је да ће се остварити. Требало би да Плави Дунав буде много већи од Парадокса и био би наш нови ТИЕР1 центар.

Захваљујемо се Петру на овом интервјуу, а Институту за физику желимо још више успеха у будућности.