Интервью с Кристофером Брэдли – одним из авторов DAMA DMBOK
Кристофер Брэдли – специалист по информационной стратегии с более чем 40-летним опытом работы в сфере управления данными. Вместе с коллегами по ассоциации Data Management Advisors (DAMA), Крис проводит консультации по вопросам стратегии управления данными.
В интервью Владимиру Иткину (Qlik) Крис рассказал как собрать 100 авторов вместе и написать книгу по управлению данными всего на 600 страниц, почему новые «волшебные» технологии не гарантируют успех и что такое «колесо DAMA».
Крис является вице-президентом по профессиональному развитию DAMA International, а также одним из основных авторов Свода знаний по управлению данными DMBOK и экзаменатором по программе профессиональной сертификации CDMP.
Видео интервью можно посмотреть на YouTube. А ниже мы приводим практически полный текст беседы.
– Здравствуйте, мистер Брэдли! Расскажите нам немного о себе, о DAMA и о миссии DAMA.
– Я работаю в сфере управления данными уже более 40 лет. В 1979 я получил степень аспиранта в химической инженерии, но все это время я проработал в области управления данными. Я стал одним из первых участников Ассоциации DAMA в Великобритании в 1983 году.
DAMA – Data Management Association – Ассоциация управления данными, была основана в США в самом конце 1970-х. Цель и миссия DAMA заключаются в продвижении и поддержке профессионалов в области управления данными по всему миру. Мы – первая международная профессиональная организация по менеджменту данных. В организации работают на добровольной основе: у нас всего несколько сотрудников и это административный персонал. Так что я и мои коллеги по международному совету DAMA, мы, можно сказать, волонтёры. Работа, которую мы делаем, идет во благо сообщества управления данными.
Миссия ассоциации, как я уже говорил, заключается в продвижении важности управления данными и понимания его сути.
Я уверен, что все знают, почему важно управлять данными, но многие люди и многие наши коллеги из бизнеса считают, что некая волшебная технология решит все имеющиеся у них проблемы. И, как мы все знаем, это неправда.
Я уже достаточно давно в этой области и встречал уже много «волшебных» технологий, которые появляются на рынке. Технологии сами по себе могут быть отличными, но без других строительных блоков, без определенной степени уверенности в достоверности информации, все ваши усилия будут бессмысленны.
– Я знаю, что вы один из авторов книги DAMA DMBOK2. Расскажите нам немного подробнее о книге и о ее цели.
– На самом деле, я был одним из авторов и первой редакции книги, DMBOK1. DMBOK – это Свод знаний по управлению данными (Data Management Book of Knowledge). Мы подготовили первое издание в 2009 году, а второе издание – в 2017 году. Сейчас я начинаю планировать третье издание, но об этом позже.
У DMBOK есть несколько целей. Первая – продвижение некоего общего языка, общего понимания используемых терминов по теме управления данными. Вы наверное знаете о «колесе DAMA»? Оно включает различные дисциплины управления данными. И во второй версии DMBOK, мы собрали в него 11 дисциплин. В центре находится тема руководства данными (Data Governance), которую окружают все остальные области знаний, например, моделирование данных, архитектура, безопасность, управление основными и справочными данными и другие.
Мы в DAMA собрали этот артефакт, чтобы сформулировать спектр дисциплин управления данными. Мы не продвигаем конкретные инструменты или определенных вендоров.
Всё, что мы делаем – мы создаём общий язык, общий фреймворк, чтобы люди во всем мире могли понимать основные вопросы в отношении управления данными.
Более того, в DMBOK мы обращаем внимание на факторы бизнес-среды, потому что, как бы мы не любили управление данными, оно не существуют в вакууме, само по себе. Оно помогает поддерживать бизнес. Поэтому мы говорим и про культуру компании, организационные модели, стиль принятия решений.
Знаете, я много лет работаю в нефтяной индустрии и, например, здесь есть очень-очень сильная тенденция к централизации. Все решения принимаются в головном офисе, и затем распространяются на всю компанию. А есть компании где подход более федеративный. И это нормально. Но в управлении данными мы должны распознавать и работать с внешними факторами бизнес-среды, с разной деловой культурой, если мы пытаемся сделать наши методики по управлению данными успешными.
Культура ест статегию на завтрак
Поэтому мы включаем в DMBOK большое количество тем, которые затрагивают культурные вопросы. Не смотря на то, что мы стараемся обходиться умеренным количеством подробностей и деталей, второе издание DMBOK содержит больше 600 страниц. Это очень объемная книга. Но вы можете получить еще более подробную информацию по каждой из областей знаний, читая книги других авторов. Например, в DMBOK2 около 40 страниц посвящено моделированию данных. И это здорово, это дает читателю очень хорошее представление о том, чем является моделирование данных. Но если они захотят узнать больше, им нужно прочитать книги других авторов по теме.
Ключевая цель DMBOK заключается в освоении этого общего языка, который помогает выявить проблемы, с которыми сталкиваются профессионалы в области управления данными во всем мире.
Еще одна цель – рассказать и сфокусировать внимание на основных темах и ключевых вопросам в каждой из 11 областей знаний. И, конечно, показать читателям направление для дальнейшего изучения каждой темы. В конце концов, обеспечить основу для профессиональной сертификации.
– Большой объем книги означает, что в ее составлении принимало участие большое количество авторов. Расскажите, как вы обеспечивали целостность подачи материала?
– Да, у нас было более 100 рецензентов – людей, которые вносили свой вклад и комментарии. Было около 12, или чуть больше, ключевых авторов и основная редакционная группа из 5 человек. Редакционную группу возглавила Лаура Себастьян-Коулман (Laura Sebastian-Coleman), которая проделала отличную работу. У нее была незавидная задача попытаться собрать всех этих людей с различными эго и разными мнениями.
И даже несмотря на то, что сейчас в книге 624 страницы, есть еще несколько сотен дополнительных страниц, которые не были включены в итоговую версию. Мы пытались отфильтровать материал, «выжать» самое главное, выровнять уровень подачи материала, и это была довольно сложная задача.
– Возможно, у вас есть партнёрские отношения с университетами в США в Европе или в других странах? Потому что такие объемные материалы означают, что вы должны иметь такие партнёрские отношения.
– Короткий ответ – да, у нас есть партнерства. Длинный ответ – да, но их недостаточно. Мы сотрудничаем с 7 университетами, с которыми у нас есть прямое партнерство. Это еще одно из направлений, к которому я прилагаю большое количество усилий, являясь вице-президентом по профессиональному развитию в DAMA. Я стремлюсь, чтобы DAMA более активно участвовала и расширяла эти партнерские отношения. Мы сотрудничаем с одним университетом в США, двумя в Великобритании, одним во Франции, одним в Хельсинки, с парой университетов в Австралии.
Data Science и продвинутая аналитика – это здорово, модно, это круто и весело. Но это не волшебная таблетка.
Я бы сказал, что созданию курсов в университетах сильно способствовали неоправданно-завышенные ожидания изучения технологий больших данных, искусственного интеллекта и машинного обучения. Некоторые из наших университетов-партнеров сообщили, что лучше всего продаются курсы (а мы все знаем, что университеты должны зарабатывать деньги) по Data Science и продвинутой аналитике. И это здорово, это модно, это круто и весело. Но это не волшебная таблетка и не серебряная пуля. Работа этих технологий зависит от степени достоверности информации. Мы не можем просто поверить в популярную технологию, про которую люди говорят: «Просто возьмите свои данные и положите их сюда, положите их в озеро данных, и случится волшебство». Потому что это неправда, не так ли?
– Я думаю, нам также важно услышать ваше мнение о том, как вы рекомендуете использовать DMBOK на практике?
– Очень хороший вопрос. Не нужно относиться к DMBOK как к «книге готовых рецептов», лучше использовать его как руководство.
DMBOK можно использовать для проведения самооценки своих навыков, чтобы сказать «да, это область, которая мне нужна и нужно сосредоточиться на ней прямо сейчас».
Я бы сказал, что, более практично использовать ее для трех основных задач. Во-первых, чтобы убедиться, что у всех есть общее понимание различных дисциплин управления данными. Во-вторых, чтобы помочь себе понять, в каких областях вы преуспеваете, а в каких областях вам не хватает знаний. Это похоже на проведение самооценки своих навыков, чтобы сказать «да, это область, которая мне нужна и нужно сосредоточиться на ней прямо сейчас». И, в-третьих, чтобы использовать книгу как руководство, как помощь, чтобы углубиться в ту или иную область знаний, на которой вы хотите сосредоточиться.
– Я знаю, что у вас есть программа сертификации CDMP. Расскажите, что это такое?
– CDMP расшифровывается как «Сертифицированный специалист по управлению данными». Это международная программа сертификации для профессионалов по управлению данными, без привязки к какому-либо вендору. У нее есть четыре уровня. Первый уровень называется «Associate» и для того, чтобы получить этот уровень сертификации требуется пройти один экзамен, который называется «Основы управления данными». Это, по сути, свод всех дисциплин управления данными, тех 11 областей знаний, о которых мы уже говорили. Эта базовая сертификация – вроде как одна миля в ширину, один ярд в глубину, или как мы скажем сейчас, километр в ширину и метр в глубину. Поэтому, на этом уровне сертификации, вы должны в общем понимать все дисциплины управления данными. Достаточно пройти экзамен на 60%.
прошли экзамен «Основы управления данными» за период с апреля 2019 по октябрь 2020 со средним результатом 85%
Следующие два уровня сертификации называются «Practitioner» и «Master». Для них нужно пройти базовый экзамен по основам управления данными, но нужен более высокий балл – 70% для «Practitioner» и 80% для «Master». В дополнение к этому, вы должны сдать углубленные экзамены по двум из 11 тем. Например, вы можете выбрать в качестве специализации BI и хранение данных или моделирование данных, или управление метаданными, или качество данных. Для получения уровня «Master» вы также должны рассказать о своем опыте работы одному из экзаменаторов из CDMP уровня «Fellow». Мы смотрим на по-настоящему большой опыт работы, с 10-летним стажем и более.
И я – один из тех экзаменаторов. Это четвертый уровень сертификации – «Fellow». И он для тех, кто уже получил все предыдущие уровни сертификации, написал книги и внес большой вклад в область управления данными. Уровень «Fellow» – у тех людей, которые работают уже как минимум 30 лет в DAMA и все еще живы. Вероятно, поэтому я тоже один из них.
– Должен ли я быть членом Ассоциации DAMA для того, чтобы пройти сертификацию?
Когда вы проходите сертификацию, то получаете основное членство в DAMA на три года как часть прохождения сертификации. Любому, кто нуждается в обновлении своей сертификации после того, как они прошли ее, необходимо быть членом основной DAMA. Предположим, вы сейчас не имеете членства нигде. Вы хотите сдать экзамен. Вы платите взнос – 300 долларов, но со скидкой из-за пандемии будет на 15% дешевле – и, будем надеяться, проходите экзамен. Вы немедленно получаете статус «Associate», первый уровень CDMP. Затем, у вас есть три года членства в основной DAMA. Я настоятельно рекомендую всем также присоединиться к местному отделению DAMA в своей стране. По прошествии трех лет, вам понадобится возобновить свое международное членство – таким образом мы отслеживаем сертификацию, именно так она обновляется.
– Мистер Брэдли, большое спасибо за ваше время. Очень интересное интервью и я желаю вам хорошего дня. Надеюсь, что мы скоро увидимся, возможно, в Москве!
Data Literacy Project в России ведет проект по популяризации «DAMA-DMBOK2: Cвода знаний по управлению данными». Публикация кратких выводов по каждой главе книги происходит примерно раз в месяц и сопровождается проведением доступных онлайн-дискуссий с экспертами по работе и управлению данными в России и странах СНГ.
Подписывайтесь на анонсы новых глав и бесплатных вебинаров на странице проекта.
DAMA-DMBOK2: трудности перевода
В 2019 году на русском языке вышел первый перевод книги DMBOK2 ассоциации DAMA.
Эффективность организации управления данными во многом определяет успех цифровой трансформации, невозможной без реинжиниринга корпоративных бизнес-процессов, и русское издание DAMA-DMBOK2 может стать здесь важным подспорьем.
Обсуждение цифровой трансформации невозможно без переосмысления понятия «данные», вопросы управления которыми рассматриваются сегодня уже на федеральном уровне. Так, в рамках программы «Цифровая экономика Российской Федерации» предусмотрено уже к 2021 году создание национальной системы управления данными (НСУД). В основе этой системы лежат три принципа: данные — стратегический актив, имеющий ценность; ценность может быть повышена за счет дополнительной обработки; как и любым другим активом, данными необходимо управлять. Между тем о важности проблемы управления данными серьезно задумались многие коммерческие и некоммерческие организации.
Поле деятельности в сфере управления данными достаточно обширно и включает буквально все — начиная от принятия решений о том, как извлечь стратегическую выгоду из имеющихся информационных активов, и кончая развертыванием и эксплуатацией цифровых платформ и их поддержкой. Управление данными требует весьма разнообразных как технических, так и бизнес-навыков, а ответственность за управление данными распределяется между бизнес-менеджерами и сотрудниками, обеспечивающими координацию бизнеса и ИТ (директор по данным, распорядитель данных, бизнес-аналитик и пр.). Ясно, что эффективное сотрудничество всех этих специалистов невозможно без общего языка общения.
В целом можно считать, что к профессионалам по управлению данными относится любой сотрудник любой организации, который по характеру своей работы имеет отношение к одному из аспектов управления данными. Для оказания помощи таким специалистам еще 30 лет назад была образована Международная ассоциация управления данными DAMA (Data Management Association International), объединяющая профессионалов в области управления данными по всему миру и призванная собирать, систематизировать и пропагандировать лучший опыт. Важная задача DAMA — выработка единой терминологии и рамочной структуры (framework) знаний и подходов.
В 2009 году вышло первое издание Руководства DAMA к своду знаний по управлению данными (DMBOK), заложившее фундамент развития и созревания совокупности профессий, относящихся к управлению данными, а в 2017 году увидело свет второе издание — DAMA-DMBOK2.
Основное назначение DMBOK — предоставление наиболее полного, точного и актуального введения в дисциплину управления данными:
Сегодня в России все больше предприятий определяют себя как «управляемые данными» (data-driven) — у отечественного бизнеса, нацеленного на сохранение своей конкурентоспособности, не остается иного выбора, кроме как перейти к применению аналитики в поисках действенных решений и отказаться от принятия решений, основанных лишь на интуитивных предположениях. Более того, нынешний темп изменений в бизнес-среде прямо указывает на то, что назревшие перемены в области управления данными носят уже характер обязательных, а не факультативных. «Цифровой прорыв» стал нормой, и для адекватной реакции на него бизнес должен плотно взаимодействовать со всеми специалистами по управлению данными для создания наиболее эффективных решений.
Управление на основе данных подразумевает безусловное признание необходимости управлять ими эффективно, причем речь идет не о создании отдельных частных решений по повышению качества данных или управлению нормативно-справочной информацией (НСИ), а о построении полнофункциональной системы управления данными. Требуется определить основные функции этой системы, выделить и устранить пробелы в их реализации. Подобного рода система должна опираться на хорошо проработанную рамочную структуру функциональных областей управления данными — именно такая структура («колесо» DAMA — DAMA Wheel) и предлагается в DMBOK2. Однако до недавнего времени в России отсутствовал русскоязычный вариант этого авторитетного справочника, написанного ведущими аналитиками во взаимодействии с участниками ассоциации DAMA.
Сегодня появился перевод книги DMBOK2 [1]. Однако на пути к всеобъемлющему и целостному изданию, охватывающему все области знаний по управлению данными, было множество препятствий — начиная от отсутствия устоявшейся русскоязычной терминологии и заканчивая необходимостью учета множества нюансов в каждой из областей знаний, имеющих отношение к управлению данными. Тем не менее была обеспечена достаточно высокая степень соответствия оригиналу благодаря применению при переводе DMBOK2 следующих трех принципов:
При переводе отраслевой терминологии был достигнут компромисс между стремлением использовать привычные и понятные русскоязычные термины и сохранением терминологической стройности, связности и лаконичности оригинального текста. В этой связи возникли проблемы в отношении двух ключевых терминов: Data Governance и Data Stewardship, для которых наиболее приемлемым решением стало введение семантических неологизмов (сочетаний терминов, которые звучат не совсем по-русски, но по смыслу наиболее точно соответствуют оригиналу): «руководство данными» и «распоряжение данными». Наиболее весомыми аргументами в пользу этих вариантов стали пояснения, приведенные в тексте DMBOK2. Например, в отношении термина Data Governance приводится такой комментарий: «Слово “руководство” (governance) образовано от глагола “руководить” (govern), который в данном случае — ключевой. Смысл руководства данными проще всего понять на примере политического руководства. В отношении данных предусматриваются функции, подобные законодательным (определение политик, стандартов и корпоративной архитектуры данных), судебным (управление проблемными вопросами и эскалация) и исполнительным (защита и обслуживание, выполнение обязанностей по администрированию). Для лучшего управления рисками большинство организаций выбирают представительную форму руководства данными, обеспечивающую учет мнений всех заинтересованных сторон». Поэтому слово «руководство» наиболее точно передает смысл, заложенный в оригинале. При этом следует заметить, что более корректным является следующий вариант перевода: «руководство в области управления данными». Однако, с учетом высокой частоты его использования и наличия многих производных от него терминов, такой вариант был бы крайне неудобен.
Подробные пояснения приведены и относительно термина Data Stewardship: «Деятельность, связанная с несением ответственности и подотчетностью за данные и процессы, обеспечивающие эффективный контроль и использование информационных активов, чаще всего обозначается термином “распоряжение данными” (data stewardship). Распорядитель (steward) — это лицо, чья работа заключается в управлении собственностью другого лица. Распорядители данных управляют информационными активами от имени других лиц и в интересах организации. Часто по отношению к тем, кто выполняет функции, подобные распорядительским, применяют такие термины-синонимы, как “хранитель” (custodian) или “попечитель” (trustee)».
DAMA-DMBOK2 — терминология
Важная задача ассоциации DAMA — выработка единой терминологии в области управления данными:
От эффективности организации управления данными во многом зависит успех цифровой трансформации, поэтому неудивительно, что сегодня уже на федеральном уровне активно обсуждаются такие вопросы, как обязанности и полномочия руководителей цифровой трансформации органов федеральной власти по реинжинирингу рабочих процессов внутри министерств и ведомств для поддержки инфраструктур оказания онлайн-услуг населению. Русское издание DAMA-DMBOK2 может быть важным подспорьем в решении этих ответственных задач. Выпуск книги стал важным шагом на пути к созданию терминологии для общения отечественных специалистов, работающих с данными, и к продвижению современных методических подходов к управлению данными в российских государственных и коммерческих структурах.
Варианты перевода многих терминов из книги DAMA-DMBOK2 могут вызывать вопросы, однако пока вышла лишь первая редакция русского издания, подготовленная компанией Unidata. Работа над следующими редакциями будет продолжена, в том числе и при активном участии сообщества Unidata Community.
Dama dmbok что это
Основной драйвер ИБ — стремление минимизировать риски и обеспечить устойчивый рост бизнеса. Обеспечение безопасности данных снижает риски и дает дополнительные конкурентные преимущества. Это ценный актив компании.
Защита данных должна обеспечиваться не только в местах хранения (data-at-rest — «данные в покое»), но и при их передаче из системы в систему (data-in-motion — «данные в движении»). Передача данных требует наличия сети, которая должна быть надежно защищена.
Данные, обращение с которыми регламентируется извне — законами, отраслевыми стандартами или действующими договорами и соглашениями.
Для регламентируемых данных предписываются:
→ порядок использования данных,
→ порядок доступа к ним,
→ круг лиц, имеющих право доступа,
→ допустимые цели использования данных.
Организационные и культурные изменения
Политики в области данных должны, с одной стороны, позволить компании успешно достигать поставленных целей, а с другой — обеспечивать надежную защиту чувствительной и регламентированной информации от ненадлежащего использования или несанкционированного доступа. При этом учет интересов всех заинтересованных сторон и минимизация рисков не должны существенно осложнять доступ к данным, необходимым для текущей работы.
Доступность информации о наборах прав пользователей
Каждый набор прав (определяющий совокупность элементов данных, которые становятся доступными для пользователя после его авторизации) должен тщательно проверяться на стадии внедрения системы на предмет наличия в нем прав доступа к какой-либо регламентируемой информации.
Обеспечение безопасности данных в условиях аутсорсинга
На аутсорсинг может быть передано всё, за исключением ответственности за результаты деятельности организации.
Аутсорсинг ИТ-услуг сопряжен с дополнительными проблемами и обязанностями в отноше- нии безопасности данных. В такой ситуации считавшиеся ранее неформальными роли и обязанности должны быть точно определены в виде контрактных обязательств. Договоры аутсорсинга должны содержать подробные описания обязанностей и ожиданий по каждой роли, а также механизмов контроля (например, SLA, ограничения ответственности, независимые мониторинг поставщика услуг и т.д.)
Обеспечение безопасности данных в облачных средах
Облачные вычисления, обеспечивающие использование распределенных по сети ресурсов для обработки данных и информации, являются логичным завершением перехода к предоставлению «всего как услуги» (Anything-as-a-Service, XaaS).
Политики защиты данных в такой ситуации должны учитывать распределение данных по различным моделям услуг. Это подразумевает максимально возможное применение внешних стандартов в области безопасности данных.
Dama dmbok что это
Мы уже рассказывали про профессиональный стандарт бизнес-аналитика – руководство BABOK и его значимость в области больших данных. Сегодня рассмотрим еще 3 подобных свода знаний, которые полезны для архитектора, разработчика, менеджера, инженера, исследователя и аналитика Big Data: PMBOK, SWEBOK и DMBOK. А также разберем, что такое EABOK и насколько это применимо в Data Governance.
Еще раз о том, зачем нужен очередной Body Of Knowledge
Практически каждый профессиональный стандарт представляет собой рамочный документ (фреймворк), который регламентирует основные входы, выходы и критерии их оценки, а также инструменты выполнения определенной деятельности. При том, что свод знаний принято называть руководством, он не содержит детального описания процессов решения задач, хотя включает их список и перечень полезных методов, подходов и техник. Поэтому любой Body Of Knowledge (BOK) рассчитан на компетентных специалистов с опытом практической работы, позволяя им структурировать уже имеющиеся знания и навыки с помощью концентрированного изложения основных доменных идей.
Из множества применимых к ИТ-области BOK’ов мы рассмотрим следующие популярные и коррелирующие со сферами Big Data и Data Science своды знаний:
Разумеется, это далеко не весь список профессиональных ИТ-стандартов. Некоторые менее известные, но также очень полезные на практике руководства (SEBoK, GISTBoK, CITBOK, ABOK) мы оставим за рамками данной статьи.
BABOK, EABOK и PMBOK для больших данных
BABOK предназначен для профессиональных бизнес-аналитиков. Но изложенные в данном стандарте методы и техники будут полезны Data Scientist’у, Data Analyst’у, Data Steward’у, архитектору, а также руководителю проектов цифровизации и внедрения новых технологий Big Data. В частности, умения понимать главную потребность заказчика и выявлять бизнес-требования позволят избежать фатальных ошибок на этапе проектирования новой системы и неловких ситуаций, когда итоговый результат не соответствует ожиданиям. Например, здесь мы рассказывали о типичных ошибках при реализации Data Science проектов.
С точки зрения ИТ-архитектуры и управления данными в BABOK наиболее интересна перспектива Business Intelligence (BI), которая в т.ч. включает концептуальную схему процессов работы с корпоративным хранилищем данных (Data Warehouse, DWH). Она не содержит детальных технических решений, однако достаточно наглядно показывает прикладной конвейер Big Data, от сбора данных из различных источников до трансформации в бизнес-инсайты c помощью DWH и BI-дэшбордов.

При том, что BABOK включает также перспективу бизнес-архитектуры, существует отдельный свод знаний по архитектуре предприятия, EABOK. Это руководство разработано Центром инновационных вычислений и информатики MITRE, который финансируется правительственными учреждениями США. EABOK позиционируется как критический обзор проблем архитектуры предприятия в контексте корпоративных потребностей [1]. Текущая версия для печати помечена как черновик (Draft) от 6 февраля 2004 года и одобрена для публичного выпуска [2]. С тех пор новые версии не выпускались, однако официальный сайт проекта дополняется новыми материалами [3]. Данный стандарт включает описание наиболее популярных моделей корпоративных архитектур: Zachman Framework, TOGAF, FEA, DoDAF, MoDAF и т.д. Поэтому он, в первую очередь, предназначен для бизнес-архитектора и генерального руководителя, однако, пригодится также и ИТ-архитектору [4].
Здесь же стоит отметить еще один свод знаний широкого применения – PMBOK, который описывает суть процессов управления проектами в терминах их взаимной интеграции и взаимодействия, а также цели, которым они служат. Применительно к области Big Data, данный стандарт предлагает структурированный набор процессов и инструментов проектного менеджмента: от организационных структур до Agile-практик по внедрению новых технологий [5]. Таким образом, данный свод знаний будет полезен как профессиональному Project Manager’у, так и бизнес-аналитику, аналитику данных и руководителю проектов цифровой трансформации.
SWEBOK и DMBOK в области Big Data
Если основная аудитория BABOK, EABOK и PMBOK – это аналитики, архитекторы и руководители широкого профиля, то SWEBOK и DMBOK в большей степени сфокусированы на технических специалистах. В частности, все 15 областей знаний программной инженерии, изложенные в SWEBOK v3, актуальны для процессов разработки ПО [6]. А потому этот стандарт напрямую коррелирует с ежедневными задачами разработчика Big Data решений и Data Scientist’а, который пишет программный код для ML-алгоритмов.
Аналогичным образом, DMBOK можно назвать настольной книгой Data Scientist’а, Data Steward’a и аналитика данных. Этот свод знаний детально описывает процессы, методы и инструменты Data Governance, включая обеспечение качества и информационной безопасности, а также вопросы моделирования, хранения и использования данных, проектирования DWH и управление НСИ. Темы Big Data и Data Science рассматриваются на протяжении всей книги, в частности, главах, посвященных проектированию DWH, моделированию и аналитике больших данных. Из инструментальных средств упоминается экосистема Apache Hadoop и NoSQL-СУБД для хранения файлов Big Data. Впрочем, DMBOK содержит еще много интересных и по-настоящему прикладных материалов, которые пригодятся аналитику, архитектору, инженеру, стюарду, администратору и разработчику Big Data систем [7].

Подводя итог рассмотренным профессиональным стандартам, сделаем вывод в стиле капитана очевидность: каждый предметный Body Of Knowledge – это действительно полезные и необходимые для специалиста знания. На первый взгляд, изложение материалов в BOK может показаться слишком сухим и скучным. Впрочем, любые руководства – это не самое увлекательное чтиво, а рамочная инструкция по применению определенных инструментов для решения конкретных задач. Поэтому каждому стоит полюбить чтение профессиональных стандартов своей предметной области и периодически перечитывать их.
Другие инструменты управления знаниями в области больших данных и проектов цифровизации рассматриваются на специализированных курсах в нашем лицензированном учебном центре обучения и повышения квалификации для разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве:




