Рейтинг@Mail.ru
Навигация

← Предыдущая статья             Содержание номера             Следующая статья →

Журнал First Break – Декабрь 2017 – Выпуск 12 – Том 35 – Новости EAGE

Разработки в области высокопроизводительных вычислений стали основной темой семинара в Афинах

Третий по счёту семинар по высокопроизводительным вычислениям в разведке и добыче вернулся в Грецию, где он когда-то впервые проходил, а точнее — туда, где рукой подать до афинского Акрополя. Семинар собрал специалистов в этой области, чтобы они могли обсудить основные современные приложения, применяемые в разведке и добыче, и проанализировать, какие возможности открывают возросшие вычислительные мощности. В семинаре приняли участие почти 60 специалистов из разных компаний нефтегазовой отрасли, научных учреждений и поставщиков вычислительной техники, что свидетельствует о представительности семинара. От высокопроизводительных вычислений и ИТ-специалистов в большой степени зависит способность разведки и добычи стать «быстрее, дешевле и лучше». Именно это стало основной темой конференции, особенно в том, что касается усилий по оцифровке массивов данных, предпринимаемых всеми компаниями нефтегазовой отрасли.

Семинар проводился в «однодорожечном» формате, которому отдали предпочтение участники, что позволяло им уделять всё внимание каждой из обсуждаемых тем. Сессии были посвящены вопросам, которые обычно поднимаются на подобных мероприятиях, таким как ISC и суперкомпьютеры, но также включали темы, находящиеся на стыке нефтегазовой отрасли и высокопроизводительных вычислений. Впервые были затронуты такие аспекты, как аналитическая обработка данных, облачные технологии и большие массивы данных. Семинар начался с фуршета, во время которого участники смогли пообщаться с коллегами, наслаждаясь видом на величественный Акрополь.

Научная сессия открылась основным докладом двукратного лауреата премии Гордона Белла Omar Ghattas из Техасского университета в Остине. Он представил последние достижения в области применение байесовской инверсии при решении проблем обработки сейсмических данных, которая может применяться при высоком разрешении только путём эффективной сериализации вычислительных ресурсов. Затем началась первая сессия семинара, посвящённая масштабированию. В наше время стало возможным моделирование коллектора из миллиардов ячеек при использовании лишь части тех вычислительных мощностей, которые потребовались бы раньше. Докладчик из Saudi Aramco показал, что масштабирование пропускной способности имитационных моделей с учётом капитальных затрат также имеет большое значение, сделав краткий обзор того, как это происходит в нефтегазовой отрасли.

Оборудование для высокопроизводительных вычислений переживает экспоненциальный рост, следовательно, необходимость адаптировать коды моделирования к новейшему, самому лучшему аппаратному обеспечению может вызывать затруднения. Выходом могут стать символьные вычисления, которые и стали темой второй сессии. Группа специалистов из Имперского колледжа Лондона продемонстрировала, как быстро разрабатывать приложения для работы с сейсмическими данными, эффективно выполняя их с помощью использования доменно-специфичных языков. Затем были представлены достижения CGG в создании алгоритмической среды (на языках Python и C++), которая обеспечивает эффективный параллелизм вычислений от многоузловых до многопотоковых благодаря деревьям задач и ограниченному порядку выполнения. Несмотря на общий характер такого подхода, он был применён в области геостатистической инверсии. И, наконец, Total показала, как упростить кодирование так называемого комплексного обращения для FWI с помощью анализатора символьных выражений с целью автоматического создания правильных цепных правил, на основании которых выбираются параметры (и распространители) для инверсии, избегая дорогостоящих ошибок и экономя время разработчиков.

На третьей сессии этого дня по контейнерам и облачным вычислениям в основном шла речь о достижении высшей производительности путём использования облачных ресурсов или контейнеризации приложений для высокопроизводительных вычислений. Представитель RStor описал (успешные) усилия в этой области благодаря использованию сингулярности, а в докладе Saudi Aramco шла речь о контейнеризации имитатора пласта за счёт инструментов типа Docker, что привело лишь к незначительному снижению производительности. В докладе Total сообщалось об опыте компании в проведении различных экспериментов по проверке концепций, связанных с перемещением рабочих процессов визуализации сейсмических данных и моделирования пласта в облако.

На второй день семинара с основным докладом выступил Andrew Jones из NAG. Он убедительно рассказал о высокопроизводительных вычислениях и одновременно выразил сомнение в шести «волшебных палочках» (ЦП → решают все проблемы с производительностью, облако → решает все проблемы с ростом затрат и гибкостью, языки/DSL → решают все проблемы программирования, возможность всё открыть → решает проблемы адаптации, искусственный интеллект /машинное обучение/ виртуальная среда → решают все <любые> проблемы, и, наконец, квантовые вычисления → решают все проблемы одновременно!).

В центре внимания оказалось быстрое распространение различных типов оборудования, которому были посвящены две сессии: по волновым моделям и производительности. В докладе INRIA объяснялось, как сэкономить на памяти для решения проблем уравнения Гельмгольца в 3D с помощью гибридизируемых разрывных методов Галёркина. Экономия была достигнута за счёт уменьшения узора разрежённости, что позволило меньше задействовать параллельный прямой решатель. В докладе Total рассказывалось об опыте компании в управлении производительностью с помощью OpenACC для конечно-разностного вычисления матрицы на ЦП. Применение стандарта OpenACC также позволило команде специалистов из Научно-технологического университета имени короля Абдаллы, не имеющих опыта высокопроизводительных вычислений, преобразовать код ЦП в эффективное приложение на базе ЦП. Saudi Aramco, Intel и Научно-технологический университет имени короля Абдаллы представили совместную работу по объединению пространственного и временного соединения в блоки за счёт титрования волнового фронта алмазом. В результате была создана комбинированная системы выполнения, распараллеливающая задачи для многоядерной архитектуры. Intel/Shell/Vortech представили работу по оптимизации сложного пропагатора волн (TTI) для различных x86-архитектур, включая KNL. И, наконец, в докладе Saudi Aramco были описаны различные сложности, связанные с совмещением вычислений и передачи сообщений.

Между двумя сессиями состоялась очень оживлённая панельная дискуссия, в которой приняли участие лидеры отрасли (IBM, HPE, NAG и Университет Кёртин), посвящённая большим объёмам данных, высокопроизводительному анализу данных, а также машинному и глубокому обучению (ML/DL).

В последний день семинара David Lecomber из ARM сделал основной доклад о необходимости параллельной отладки набора инструментальных средств, что отвечает требованиям пользователей высокопроизводительных вычислений из-за постоянно меняющейся аппаратной среды. Затем последовали две сессии. Первая была посвящена алгоритмам, а вторая — вводу/выводу данных.

Барселонский супервычислительный центр представил алгоритм SPIKE для решения больших ленточных/разрежённых матриц, возникающих в гармонических по времени (волновых) уравнениях. Последний, хотя и считается прямым решателем, использует усечённые ряды Нейманна для вычисления отдельных обратных функций во время процесса факторизации (что приводит к снижению затрат памяти и повышает масштабируемость). Затем прозвучал доклад Сколтеха. В нём шла речь о многосеточном алгоритме, позволяющем решать на месте, с помощью небольшого количества вычислительных ресурсов, линейные уравнения, возникающие из эллиптических задач, которые лежат в основе инструментов и программ проектирования гидроразрыва.

Компания Baker Hughes представила метод ускорения и параллелизации в процессе прямого моделирования решения уравнений Максвелла в квазистационарном случае, применяемых в электромагнитном каротаже. В этом подходе используется стратегия вложенной поточной обработки в случае превышения лимита вычислительных ресурсов. Последний основной доклад сделал Franz-Josef Pfreundt, который рассказал о высокопроизводительных вычислениях в институте Fraunhofer ITWM. Он продемонстрировал высокую квалификацию специалистов ITWM в использовании различных ключевых алгоритмов (Кирхгофа, конечно-разностной миграции и обратной миграции во временной области, итерационных решателей, машинного обучения) и их применении для решения проблем нефтегазовой отрасли. Во время сессии, посвящённой вводу/выводу, в докладе Saudi Aramco говорилось о присвоении хосту ввода-вывода записывающего устройства в MPI имитатора пластов с массовым параллелизмом. Этот метод позволяет определять и рекомендовать лучшее отображение записывающих устройств, которое даёт возможность лучше сбалансировать рабочую нагрузку ввода/вывода, распределив её между хостами, и максимально повышает общую производительность ввода/вывод на протяжении всего процесса имитации. Компания Tullow Oil разработала библиотеку параллельного ввода/вывода (ExSeisPIOL) для решения проблемы загрузки больших объёмов данных сейсморазведки с акцентом на визуализации сейсмических данных. Основные цели при создании этой библиотеки заключались в повышении эффективности разработки и повышении производительности (и это ПО с открытым исходным кодом!). И, наконец, Total продемонстрировала результаты изучения производительности в случае применения прокси-серверов и обратной миграции во временной области у различных систем высокопроизводительных вычислений с точки зрения сохранения состояния процесса. Было наглядно показано, что использование библиотеки ADIOS обеспечивает ощутимое повышение производительности, более эффективное управление вводом/выводом и сокращает количество конфликтов метаданных.

Последняя дискуссия на семинаре была посвящена проблемам ввода/вывода. Предметом обсуждения стали несколько тем, поднятых участниками семинара, таких как: i) разнообразие имеющихся решений для хранения данных ввода/вывода в области высокопроизводительных вычислений (например, DDN, GPFS, Lustre); ii) позиция Intel в отношении файловой системы Lustre после прекращения её поддержки. Цель Intel заключается в том, чтобы вернуть файловую систему Lustre в сообщество разработчиков ПО с открытым исходным кодом для дальнейшей разработки. Присутствующие поделились своим опытом, рассказали о новых возможностях и проблемах ввода-вывода в области высокопроизводительных вычислений для нефтегазовой отрасли.

О необходимости проведения очередного семинара по высокопроизводительных вычислениям осенью 2019 года говорит возможность значительного наращивания мощностей в экосистеме общего алгоритма развития ПО и вычислительного оборудования, а также растущие потребности нефтегазовой отрасли в освоении все более труднодоступных ресурсов нефти и газа.




← Предыдущая статья             Содержание номера             Следующая статья →















Яндекс цитирования
Журнал First Break и материалы всех мероприятий EAGE направляются на индексацию в систему Scopus.
Журналы Basin Research, Geophysical Prospecting, Near Surface Geophysics и Petroleum Geoscience направляются на индексацию в системы Scopus и Web of Science.