Home|AllHPC Day'12PDCS'13CC'13HPC-UA'13HPC Day'13PDCS'14HPC-UA'14
HPC-UA on Facebook

Cluster Computing
Lviv, June 3-5, 2013


09:00 – 10:00


@ Foyer
Valentyna Cherepynets
10:00 – 10:10

Opening Session

@ Assembly Hall
Sergiy SvistunovRoman Bazylevych
10:10 – 13:00

Plenary Session

@ Assembly Hall
Andrii Golovynskyi

HORIZON 2020 and development of cooperation between EU and Ukraine in the ICT area

Ivan Kulchytskyy

У статті представлено аналітичні матеріали проекту PICTURE 7 Рамкової Програми (7РП) ЄС щодо перспективних напрямків співпраці Україна-ЄС за напрямком ІКТ, а також пропонується звернути увагу на нові очікування ЄС щодо досліджень у сфері ІКТ у рамках програми наукових досліджень Horizon (2014-2020 роки).


Towards a Government Public Cloud Model: The Case of South Africa

Promise Mvelase

Worldwide governments are actively looking into cloud computing as a means of increasing efficiency of service delivery and reducing infrastructure costs. As a result of introducing cloud computing, interoperability issues arise and yet it is vital for e-government services to be efficiently achieved; this is also a challenge for the South African government. In response, this project aims at developing a South African government-public cloud model that can be used to address the interoperability issues and further enable the government to benefit from other cloud computing advantages.

11:10 – 11:40

Coffee Break

@ Foyer

Design and development of valid and scalable parallel programs using Intel toolkit

Ekaterina Antakova



To migrate or not to migrate: decision based on virtualization patterns

Anna Melekhova

The migration of virtual machines is a complicated task. But the decision on performing automatic migration under overload condition is even more sophisticated. To decide if the migration is worth doing, we should estimate overall resource consumption. If overload is persistent, we should migrate a VM with expected low memory and disk access rate. But for both of these decisions we should predict the resource consumption of virtual machines. This presentation describes a new approach to the problem. Use of machine learning allows estimate resource consumption based on virtualization patterns; that is a sequence of virtualization events. The paper discusses the correlation between guest OS internal events and virtualization events. The alternative methods for restoring dependency are analyzed as well.


Parallel Approaches for Solving Large-scale Travelling Salesman Problem

Roman Bazylevych

The Traveling Salesman Problem (TSP) belongs to class of NP-hard problems. Computations for large-scale problems require a lot of time. The article proposes parallel approach for solving such kind of problems. Solving is done in four stages: decomposition, finding partial solution, merging of partial solutions and optimization of complete solution. One of existing TSP algorithms is used as base heuristic for finding solutions in clusters as well as for joining them. The developed “ring” approach is used in the merging stage. Computations at the main stages can be done in parallel. Optimization stage is applied to improve quality of the complete initial solution. Experiments on multi-core and multi-processor systems are executed.

13:00 – 14:00


@ Dining room
14:00 – 15:10

Architecture and System Software

@ Assembly Hall
Andrii Malenko

Notes on Effective HPC Architecture

Victor Haydin

Effective HPC system is so much more than just GPGPU. Real-world applications often need to stream large amounts of data from across system boundaries to the dozens of worker nodes in a most scalable and efficient way. They usually require storing huge amounts of data, scheduling of computation jobs, monitoring of system health and results visualization. Having first-hand experience in design, development and implementation of end-to-end HPC solutions, we will share our experience on some of the pitfalls to avoid and things to consider when planning your next HPC system that works.


Performance Analysis on Energy Efficient High-Performance Architectures

Roman Iakymchuk

With the shift in high-performance computing (HPC) towards energy efficient hardware architectures such as accelerators (NVIDIA GPUs) and embedded systems (ARM processors), arose the need to adapt existing performance analysis tools to these new systems. We present EZTrace -- a performance analysis framework for parallel applications. EZTrace relies on several core components, in particular on a mechanism for instrumenting functions, a lightweight tool for recording events, and a generic interface for writing traces. To support EZTrace on energy efficient HPC systems, we developed a CUDA module and ported EZTrace to ARM processors. The evaluation on a suite of the standard computation kernels show that EZTrace allows to analyze HPC applications running on such systems with a low performance overhead.


Automatic parallelization on GPU on .NET platform

Artem Lebedev

Предлагается принцип построения кроссплатформенной системы автоматического распараллеливания программ на графических процессорах для платформы .NET. Описывается трехфазная схема компиляции вычислительных процедур, разработанная для среды Common Language Runtime. Рассматривается класс линейных программ. Анализ, преобразования и распараллеливание кода осуществляются в рамках модели многогранников. Преобразования программы осуществляются как в промежуточном представлении, так и в представлении абстрактного синтаксического дерева. Показана важность оптимизации локальности при распараллеливании решения тестовой задачи – поиска решения уравнения Пуассона методом последовательной сверхрелаксации с красно-черным переупорядочиванием (двухмерный случай). Эксперименты проводятся на аппаратуре NVidia и AMD. В качестве входного языка применяется C#.

15:10 – 16:20

Parallel Algorithms and Numerical Methods

@ Assembly Hall
Andrii Malenko

Analysis of approximation algorithms computations parallelizations

Valentina Turchina

In this work the known tasks of the schedules for the works connected with relation of the partial order are studied. Mathematical models of the consistent relations are the oriented graphs. The tasks are formulated as optimization tasks on graphs. Since they belong to the class of NP-complete problems, it is appropriate the search of effective approximate algorithms with polynomial complexity. The authors identify sub-classes of graphs studying well-known algorithms and propose new ones. In particular, the following graphs are researched: unbranched arithmetic expressions and branched arithmetic expressions, and also cyclic processes. It is shown that the estimate of the algorithm accuracy based on the level principle is achievable even for graphs that model unbranched arithmetic expressions.


Internal representation of numbers in a long arithmetic library for GPU

Maksim Vereschak

CUDA can be also used to improve perfomance of cryptographic algorithms. Most of cryptosystems are based on arbitrary-precision arithmetic, but arbitrary-precision arithmetic libraries are not available for CUDA now. This paper describes the first steps of developing universal arbitrary-precision arithmetic library for CUDA technology.


Comparative Analysis of Large Data Sets Parallel Computing Technology MapReduce

Nikolay Alieksieiev

Проведено порівняльний аналіз сучасних технологій, які направленні на вирішення задач обробки структурованих і неструктурованих даних значних обсягів, так названих «Великих Даних». Зроблені висновки про доцільність вибору конкретної технології у залежності від типів задач аналізу даних та їх особливостей.

16:20 – 16:50

Coffee Break

@ Foyer
16:50 – 17:50

Security and Cryptography

@ Assembly Hall
Andrii Malenko

Use of cluster computing for solving the problem of multidimensional data randomization in risk analysis

Vladimir Shishkin

The subjects of the research are the models and tools of risk analysis under incomplete and heterogeneous information. On substantive reasons, a priori, there is a requirement to obtain resulting indices in a stochastic form. In such conditions it is impossible to use the classic methods for operating with uncertain information which is supposed to be homogenous. The situation is complicated by the fact that the analyzed system is a complex causal structure which itself can be under uncertainty. The use of analytical methods for calculations becomes impossible, and the only method that provides the solution of the problem is a resource-intensive statistical modeling. The article describes different types of initial data setting, methods of homogenization and unification for further calculation and randomizing. A necessary technological part of the developed process is an HPC system which hasn’t been used before for this purpose. There is also web-resource for solving risk analysis tasks in remote access mode.


Distributed password recovery system

Alexey Chilikov

Various data protection methods, including encryption, are now widely used. This has become one of the major obstacles for computer forensics in any digital investigation and encrypted evidence discovery. In many cases the only way to get access to encrypted data is brute-force password recovery. However, up-to-date strong encryption algorithms make this process extremely time-consuming.

Using of high-performance computing clusters solves this problem. During our presentation we will share our experience in development and support of commercial systems that use such clusters for calculation tasks, password recovery in particular (Passware Kit Forensic). We will talk on architecture of a distributed heterogenic cluster, problems that emerge in such operations and ways of solving them.

18:00 – 21:00

Welcome Party

@ "Zodiak" cafe


09:00 – 10:00

HPC Breakfast

@ Foyer

Perfect time to wake up, get some coffee and socialize!

10:00 – 13:00

Grid Technologies

@ Assembly Hall
Vladimir Shmelev

QosCosGrid - New middleware for new communities

Krzysztof Kurowski

The QosCosGrid (QCG) middleware is an integrated system offering advanced job and resource management capabilities to deliver to end-users supercomputer-like performance and structure. By connecting many distributed computing resources together, QCG offers highly efficient mapping, execution and monitoring capabilities for variety of applications, such as parameter sweep, workflows, MPI or hybrid MPI-OpenMP. Thanks to QosCosGrid, large-scale applications, multi-scale or complex computing models written in Fortran, C, C++ or Java can be automatically distributed over a network of computing resources with guaranteed QoS. The middleware provides also a set of unique features, such as advance reservation and co-allocation of distributed computing resources.


Building a Balanced Cluster

Sergii Dudinov


11:10 – 11:40

Coffee Break

@ Foyer

Using FlowVision for solving heat and mass transfer and aerohydrodynamics problems

Vladimir Shmelev



Using grid infrastructure as a distributed fault-tolerant data storage for web services

Mariya Volzheva

Использование грид-инфраструктуры для надежного хранения данных для веб-сервисов на примере деперсонализированных данных медицинских исследований в рамках проекта "Медгрид".


Study of autoradiation damage in zircon by method of molecular dynamics

Alexey Grechanovsky

Радиационная устойчивость циркона ZrSiO4 изучена с помощью методов компьютерного моделирования для четырёх различных полуэмпирических потенциалов. Эти вычисления были выполнены в грид-среде с использованием виртуальной организации ВО «GEOPARD» . Методом молекулярной динамики изучено формирование в цирконе поврежденной области после прохождения атома тория с энергией 20 кэВ. Проанализировано распределение междоузельных атомов кислорода в кристаллической решетке циркона. Введен параметр, характеризующий часть энергии атома тория, которая расходуется на образование френкелевских пар. Установлено, что наилучшее согласие с экспериментом обеспечивает потенциал, параметры которого выведены из первых принципов. Также с помощью метода молекулярной динамики было изучено перекрывание трех каскадов смещенных атомов. Результаты показали, что количество френкелевских пар увеличивается практически линейно с накоплением таких каскадов. Полученные результаты указывают на то, что наиболее корректной моделью для описания авторадиационных повреждений структуры циркона является модель «прямой аморфизации».


Distributed Grid Brokers Architecture Using Web-Services

Pavlo Svirin

In order to provide users with performance and task execution effectivity GRID has to implement an effective brokering algorithm. The main goal of such load balancing in GRID is to decrease the overall execution time and make utilization of the computing resources effective. In this work the modern approach to building metaschedulers in Grid segments is discussed.

13:00 – 14:00


@ Dining room
13:30 – 15:00

FlowVision Tutorial

@ Assembly Hall
Vladimir Shmelev
15:00 – 18:00

HPC Applications

@ Assembly Hall
Andrii Golovynskyi

On the possibilities of parallel processing in a grid storage of medical images for diagnostic efficiency

Oleksandr Dyomin

В работе рассмотрена система хранения и обработки медицинских изображений с использованием Грид-технологий, создаваемая в настоящее время в Институте сцинтилляционных материалов в сотрудничестве с другими учреждениями НАНУ и АМН. Большой объем данных, структурированность и распределенность и требования к надежности и доступности требуют использования ГРИД технологий. В качестве стандарта записи медицинской информации используется DICOM. Данная система может использоваться не только для хранения и обработки изображений, но и для решения статистичкских и эпидемиологических задач. Особое внимание уделено возможностям параллельной обработки медицинских данных, накопленных в рассматриваемой системе.


Modeling of Dynamics of Charge Transfer in Biopolymer with Temperature

Nadezhda Fialko

In Holstein model, the transfer of a charge (non-relativistic quantum particle) along one-dimensional chain of sites and motions of classical sites of the chain are described by the self-consistent ODE system. To estimate the charge mobility value in the chain at finite temperature of thermostat, we use direct modeling - calculation of the set of trajectories and averaging over ensemble,– and apply Cubo formulas. We applied 2 variants of calculation scheme for modeling of charge transfer in biopolymer at temperature prescribed: natural parallelization with the performance of each sample on a separate node, and parallelization of one sample on the multi-core node with shared memory. Programs are written in C using MPI and openMP. Tests were made on the supercomputer mvs-100k of Joint Supercomputer Center RAS. The effectiveness of the natural parallelism is of almost 100%. For calculations of one sample on the 4-core node, speed-up depends on the chain length, with a maximum of 3.3 times.


Adapting SPECFEM3D software, implementing the method of spectral elements to calculate full wave field, to the seismic problems

Alexey Gula

Настоящая работа посвящена моделированию полей упругих волн в средах с плоскими границами методом спектральных элементов с помощью программного пакета SPECFEM3D и программного инструмента для создания гексаэдрических сеток конечных элементов CUBIT.

16:00 – 16:30

Coffee Break

@ Foyer

HPC calculations of inhomogeneous fluids using open source computing packages

Iaroslav Zagumennyi

Работа посвящена численному моделированию течений непрерывно стратифицированной жидкости на базе открытого пакета OpenFOAM с использованием объектно-ориентированного языка программирования С++. Обсуждаются вопросы проведения параллельных вычислений на суперкомпьютерных комплексах НИВЦ МГУ и МСЦ РАН, построения высокоразрешающих расчетных сеток и постановки сложных граничных с помощью встроенных и расширенных утилит пакета OpenFOAM, разработки собственных решателей, обработки и визуализации расчетных данных. Демонстрируются рассчитанные картины течений непрерывно стратифицированной жидкости около непроницаемых препятствий – пластины, клина, диска и цилиндра. Непроницаемое неподвижное препятствие, помещенное в толщу неравновесной стратифицированной среды нарушает однородность фонового диффузионного потока стратифицирующей компоненты и приводит к формированию сложной вихревой системы медленных течений, которые носят название “индуцированных диффузией на топографии”. При начале движения пластины начинает формироваться поле опережающих и присоединенных волн, квазистационарные высокоградиентные прослойки, разделяющие различные типы возмущений, и спутный след. Приводятся сравнения данных аналитического, численного и лабораторного моделирований стратифицированных течений около препятствий различных геометрических конфигураций, оговариваются условия согласия и расхождения результатов, проблемы переноса данных моделирования на природные системы.


Finite element solver Nadra-3D

Maksym Bilous

В Институте кибернетики имени В.М. Глушкова НАН Украины разработана информационная технология Надра-3D моделирования пространственных процессов в многокомпонентных средах. Основу ее математического аппарата составляют математические модели пространственных процессов в виде систем дифференциальных уравнений в частных производных в трехмерной постановке. Программная реализация выполнена в виде программного комплекса, состоящего из пре/пост-процессора и параллельного конечно-элементного решателя, функционирующего на многопроцессорных вычислительных комплексах семейства СКИТ Института кибернетики им. В.М. Глушкова и позволяющего выполнять расчеты для конечно-элементных сеток с миллионами узлов. В данной работе проводится обзор некоторых особенностей архитектуры этого конечно-элементного решателя


Using parallel computing in the "P-algorithm" method

Andriy Morozov

У статті розглядається P-алгоритм розв’язання дискретної мінімаксної задачі розміщення джерел фізичного поля на фіксовані посадкові місця. Наведено формальну постановку задачі та загальну схему алгоритму. Оскільки на кожному кроці алгоритму розглядається K задач про призначення з різними функціями цілі, але з однаковою множиною допустимих розв'язків, певні кроки алгоритму пропонується виконувати паралельно, зокрема, обчислення потенціалів та оцінок (для отримання чергового опорного плану) тощо. Для програмної реалізації використано мову програмування C# та вбудовані механізми реалізації паралельних обчислень .NET-платформи. Отримані результати обчислювального експерименту свідчать про досягнення виграшу у швидкодії при використанні двох процесорів у 1,6 рази, чотирьох – у 3,4.


10:00 – 15:00


Walking excursion around city center and beer museum.

Vitalii Yakovyna

Poster Session

Monday 14:00 – Tuesday 18:00
@ Foyer

Computer modelling of carbonatefluorapatite structure

Elena Kalinichenko

Computer modeling of structural defects (CO3-groups, excess Fx atoms, Na atoms, Ca vacancies, OH-groups, fixed H2Ofix molecules) in the crystal lattice of carbonatefluorapatite (CFAP) has been performed with GULP program using grid-techniques. The translated cell of 3*3*3 elementary cells [Ca252Na9□9]270[(PO4)140(CO3)15□7]162 [F36OH16(CO3)1]54(Fx)9•7H2Ofix with the chemical composition near to the synthesized sample (2.7 wt % CO2, 3.3 wt % F) has been considered. There were optimizing of about 300 variants of CFAP structure (at even distributions of CO3-groups and PO4-vacancies and different distributions of atoms of Fx and Na, Ca vacancies, OH-groups and H2Ofix molecules), from that 35 variants have been optimized. The web--sites of uagrid.org.ua and grid.inpracom.kiev.ua. were used for calculations, all calculations were executed in the "GEOPARD" virtual organization. The structural defects of certain type in the most probable CFAP structure were found to be located approximately evenly, distanced from each other: H2Ofix molecules - in PO4-vacancies, excess Fx atoms - in О3* vacancies in (CO3)В-groups in the AB cluster, distanced and nearly of H2Ofix molecules, aside from H2Ofix, ОН- groups in channels – near CO3-groups. The Na (I) atoms (mainly, near the (CO3Fx)B-clusters, in the direction of О1 and Fx) and Са(II) vacancies (mainly, near the CO3-groups with О3* vacancies) are most distanced from each other and the AB cluster. Simulation data suggest the experimental results: ОН-groups and F atoms are localized in two different structural sites that correspond to data of NMR 1H and 19F for the synthesized sample.


Constructing of mass real estate estimate

Anna Belyaeva

Вопрос эффективности алгоритмов оценки стоимости объектов недвижимости является одним из самых актуальных. Несмотря на то, что массовая оценка сама по себе обеспечивает построение моделей для большого числа объектов с небольшими трудозатратами, остаются вопросы оптимальности алгоритмов построения элементов моделей (таких как пространственные матрицы весов и пр.) и проведения тестирования на оценку качества моделей. В связи с планом реформирования налогообложения и введения налога на недвижимость (вместо налога на землю и налога на имущество), обозначенный выше вопрос становится еще более актуальным для России.


Cluster Analysis: Some Theoretical Results and Practical Applications

Adalat Kerimov

The problem of automatic classification of objects described by quantitative features is considered. To solve this problem there is proposed the approach, consisting of a combination of two algorithms. Next, the solution of this problem is considered in terms of Boolean programming. There presented the analysis of the selection of combinations of informative features that define the object of cluster analysis, and a set of software algorithms of prognosis and enhance of the oil layer.


About one class polynomial problems with not polynomial certificates

Bagram Kochkarev

We build a class of polynomial problems with not polynomial certi cates. The
parameter concerning which are de ned eciency of corresponding algorithms is the number n
of elements of the set has used at construction of combinatory objects (families of subsets) with
necessary properties.


Ab initio calculation of dynamic and elastic properties of Sn2P2S6 ferroelectric crystals

Vladimir Sabadosh

Chalcogenide semiconductor ferroelectrics of the Sn2P2S6 family show a variety of important physical properties that makes them the objects of intense research, both for practical applications and fundamental studies.

In this work, dynamic and elastic properties of Sn2P2S6 crystals were calculated from first principles. We performed our calculations using the plane wave density functional theory (DFT), program ABINIT [1], within local density approximation (LDA). All calculation were performed by using the resources of the cluster at the V.M. Glushkov Institute of Cybernetics of the National Academy of Science of Ukraine. The Troullier-Martins norm-conserving pseudopotential was used with a plane wave kinetic energy cutoff of 30 Ha. Brillouin zone integration for charge density and total energy is performed with a 6x6x6 Monkhorst-Pack grid. We optimized the lattice geometry by the Broyden-Fletcher-Goldfarb-Shanno method and obtained values, which is only slightly different ( Here we present ab initio calculation results of phonon spectra, the complete matrices of elastic stiffness and compliance coefficients as well as piezoelectric constants for ferroelectric state of Sn2P2S6 crystals based on the DFPT method. Calculated frequencies and phonon modes symmetry in the center of the Brillouin zone are in good agreements with available theoretical and experimental data obtained from Raman and infrared spectra. From the compliance tensor Young's modulus as a function of direction were calculated, that are in good agreement with results of our experimental nanoindentation study. Elastic stiffness and compliance tensors are compared with existing experimental results for Sn2P2S6 crystals at room temperature.

Please note! Schedule may change for some reason. Please check it now and then.

Powered by MyConf conference management system