data science в медицине что это такое

Врач со знанием Data Science – путь к уникальной специальности

Как сближение медицины и Data Science открывает новое направление деятельности. И что наука о работе с данными может привнести в российское здравоохранение уже в ближайшие несколько лет.

Попова Елена. Студент Geek University, факультет Искусственного интеллекта

Я врач – работаю по специальности терапия уже скоро пять лет. Профессия мне нравится – она даёт навыки, которых не получишь больше нигде. Но в последнее время мне стало не хватать возможностей для самореализации: нынешний круг задач – не то, чему я хотела бы посвятить жизнь. Тем более, работать приходится в условиях российской системы здравоохранения, которая, на мой взгляд, отстает в развитии. Что ж, за осознанием проблемы должны следовать действия.

Всё началось с того, что в медицинской и научной литературе мне стали регулярно попадаться на глаза термины «Искусственный интеллект», «Анализ больших данных», Data Science (наука о работе с данными). Тогда я ещё не очень представляла себе, что стоит за каждым из этих понятий и как связанные с ними технологии могут изменить отрасль. Но я была заинтригована, и чем больше погружалась в тему, тем интереснее мне становилось.

Долгое время практическая медицина была очень далека от сферы информационных технологий. Ещё два десятка лет назад это были почти не соприкасающиеся друг с другом миры. Однако ближе к 2010-му году IT-решения начали активно интегрироваться практически во все сферы жизни. И медицина в этом смысле не исключение, скорее наоборот – одно из направлений, где применение новых технологий наиболее заметно и востребовано.

Особенно вдохновляюще выглядят проекты по фолдингу белка и последние сообщения СМИ о том, что применение искусственного интеллекта помогло обнаружить новый перспективный антибиотик. Как врач я знаю, что за последние годы большой шаг вперёд сделала компьютерная обработка медицинских изображений, в частности, рентгеновских снимков. Да и вообще, обработка данных для последующего принятия решений – фундамент, на котором строится работа любого врача. Без этого постановка диагноза и лечение невозможны. А вычислительные системы и искусственный интеллект могут ускорить поиск решения и минимизировать риск ошибки.

В какой-то момент я поняла, что применение достижений Data Science в медицине – именно то, чем мне хотелось бы заниматься. Но сначала я сомневалась, стоит ли в 28 лет кардинально менять направление деятельности. Изучила вопрос подробнее, пообщалась со знакомыми медиками, которые используют в работе ИИ, поняла, что это очень востребованное направление, есть много подобных интересных кейсов, и да, это сложный, но очень подходящий мне путь.Интересно работать на пересечении двух сфер, каждая из которых бурно развивается!

Нынешняя эпидемия дала огромный толчок для развития медицинских технологий. Эта область и раньше считалась перспективной, а сейчас её актуальность стала очевидна всему миру. Здравоохранению приходится подстраиваться под ситуацию, преодолевать свою ригидность, в том числе. Поэтому я считаю, что в следующие несколько лет стоит ждать взрывного роста на рынке medtech. Уже сейчас появилась возможность дистанционной продажи лекарств и сняты некоторые ограничения на телемедицину. Искусственный интеллект в борьбе с эпидемией играет не последнюю роль – он действительно помогает в анализе данных и выработке лучших схем лечения.

Что есть у нас сегодня

Сейчас даже в самой простой государственной поликлинике врачи не пишут ничего от руки, как это было всего несколько лет назад. Все российские поликлиники сейчас подключены к единой медицинской информационно-аналитической системе (ЕМИАС). В ней хранятся данные о диагнозах, о каждом посещении пациентом специалистов, результаты обследований и даже показатели с фитнес-трекеров. Кстати, с недавнего времени всю информацию из своей медицинской карты вы можете просматривать в специальном приложении.

Но самое главное – ЕМИАС накапливает огромные массивы данных о здоровье населения и работе врачей. Анализ этих данных в перспективе позволит лучше контролировать и корректировать работу системы здравоохранения.

Другое очень интересное направление, которое сейчас активно развивается – это телемедицина. И, конечно, мы уже пользуемся системами автоматизированного анализа рентгеновских снимков. Практика показала, что искусственный интеллект справляется с этой задачей не хуже докторов.

Я не думаю, что ИИ в обозримом будущем заменит собой врача, но то, что он даст огромный толчок развитию медицины, уже очевидно. Сегодня он уже расширяет возможности специалистов-генетиков, разработчиков медицинского оборудования и лекарств.

Перечислять все возможные области применения ИИ в медицине можно было бы на протяжении целой статьи, но у нас другая тема. Поэтому перейду лучше к рассказу о том, как я начала изучать Data Science и что из этого получается.

Перспективы трудоустройства

Прежде чем осваивать новую специальность, я исследовала рынок труда, причём вакансии аналитика данных искала именно в области медицины. Я не собиралась конкурировать с техническими специалистами широкого профиля, но выбрала для себя нишу, где нужны специалисты со знанием медицины и информационных технологий. Мне удалось найти подобные вакансии, их количество и параметры меня устроили. К тому же, я поняла, что у IT-специалиста возможностей для трудоустройства гораздо больше, чем у врача, особенно если рассматривать работу за рубежом.

Итак, вакансии есть. Уверенность в том, что специалисты в области аналитики медицинских данных будут востребованы и через пять, и через 10 лет – тоже. Тема здравоохранения всегда была актуальна, а в современном мире интерес к ней только увеличивается. Всё больше людей следят за своим здоровьем, готовы вкладывать в это время и деньги. По моим наблюдениям, тема новых технологий в медицине сейчас только набирает популярность, рынок ещё не полностью сформирован и будет развиваться. Следовательно, число вакансий будет расти.

Быстрое погружение в новые технологии

В начале пути у меня не было опыта в программировании и достаточной математической базы для работы с большими массивами данных. Поэтому я искала образовательный проект, где можно было начать освоение Data Science «с нуля». В итоге выбрала программу GeekUniversity, которая включала базовые курсы по математике и востребованному в аналитике языку Python.

За время обучения я начала смотреть на многие вещи в своей работе под другим углом, стала замечать неочевидные пути решения проблем, с которыми сталкиваюсь ежедневно. Например, когда я работаю с медицинскими информационными системами, обращаю внимание на то, как их можно улучшить, как найти им более широкое применение и расширить их возможности.

У меня появились идеи для нескольких проектов, которые я хотела бы реализовать:

Автоматизация аускультации («выслушивания» фонендоскопом) с помощью машинного обучения. Для этой задачи даже специальное оборудование создавать не придется. В свободной продаже уже есть фонендоскопы с функцией записи, которые могут передавать запись на внешнее устройство, например, на смартфон.

Экспертная система, которая поможет врачам принимать решения и анализировать эффективность схем лечения. В рамках ЕМИАС уже есть готовая база знаний, которая позволяет анализировать данные из множества учреждений. Как получить эти данные, конечно, вопрос, но предположу, что создатели системы будут стараться расширить область её применения. Кроме того, немало подобных баз данных можно найти в открытом доступе – на Kaggle, например.

Система долгосрочного мониторинга и предиктивной аналитики состояния здоровья пациентов.

После года учебы и экспериментов с кодом я уже представляю, как должны работать подобные системы, и чувствую в себе силы попробовать реализовать задуманное.

Портфолио

В рамках курса я успела реализовать два проекта из области предиктивной аналитики:

Для решения этих задач понадобилось задействовать практически весь арсенал изучаемых инструментов и методов. Чтобы на основе данных смоделировать ситуацию и просчитать её возможные последствия, прежде всего нужно было выбрать, какие данные показательны, а какие лучше игнорировать. Оценить важность тех или иных признаков помогает матрица корреляции. С её помощью в огромном массиве разрозненных показателей вы начинаете прослеживать связи и зависимости.

Например, в работе над системой кредитного скоринга – начисления заёмщикам баллов «благонадёжности» – мы на реальных данных выяснили, что наличие жилищной ипотеки гораздо больше сказывается на платежеспособности клиента, чем просто сам факт наличия жилья. А средний для клиента размер займа более показателен, чем размер наибольшего непогашенного на данный момент кредита.

В проекте по оценке недвижимости удалось выявить множество коррелирующих между собой признаков, влияние которых на конечную стоимость не сильное, но на основе которых можно отнести жилье к тому или иному классу. Например, на цену недвижимости влияет степень развития инфраструктуры. Дальше мы анализировали все значимые факторы и делали предсказания по стоимости объектов.

Совместить работу и учёбу: трудно, но возможно

Честно, сложно. Но и не могу сказать, что невозможно. Основную сложность для меня составляет то, что, всё таки нужно оставаться хорошим специалистом в своей области, а это тоже требует много времени и трудозатрат. Так что, да, эти две области постоянно друг с другом соперничают, и очень важно сохранять баланс. Кроме того, мой график работы зачастую «конфликтует» с расписанием вебинаров, так что приходится смотреть их в записи.

На работе я свою учебу ни от кого не скрываю. Относятся к этому, в основном, нейтрально. Большинство врачей о современных технологиях и тем более об ИИ имеют весьма расплывчатое представление.

Каждый день я стараюсь выделять на обучение не меньше двух часов. Главное – мне нравится и интересно учиться. А когда занятие в радость, два часа в сутки для него всегда можно найти.

Препятствия и их преодоление

Сложнее всего поначалу мне давалось программирование. Когда сталкиваешься с новой областью знаний впервые, бывает трудно разобраться в самых базовых вещах, которые позже начинают казаться простыми и очевидными. И на самом трудном, начальном, этапе, очень важно, чтобы кто-то мог вам подсказать и помочь советом. Мне в этом плане повезло – у меня довольно много друзей и знакомых в сфере IT, плюс я всегда могу обратиться к преподавателям на курсах, получить обратную связь по сделанным работам и узнать, что в них можно улучшить.

Очень важно не бояться задавать вопросы и просить помощи, вступать в коммуникации с теми, кто знает больше. К тому же, поскольку на основной своей работе и в повседневной жизни я с программированием не сталкиваюсь, свежие знания в этой области могут очень быстро уходить в пассив и выветриваться. Поэтому пройденный материал я обязательно конспектирую, чтобы удобнее было его периодически повторять. И когда тот или иной инструмент потребуется на практике, всегда можно будет перечитать конспект и вспомнить базовые вещи.

На мой взгляд, в любом учебном процессе важнее всего – самодисциплина. Чтобы получить результат, обязательно выработать у себя привычку учиться. Когда вы из раза в раз преодолеваете непонимание и заставляете себя вникать в сложные темы, это становится нормой и частью вашей повседневной жизни.

Ожидания и реальность

Пока мои ожидания от учёбы оправдываются. Так как ранее я с этой сферой совсем не сталкивалась, все предметы считаю для себя полезными. Конечно, что-то вызывает больший интерес, что-то меньший, но в моем случае даже поверхностные знания в какой-то области помогают формированию более целостной картины.

Самыми интересными для меня оказались курсы программирования на Python, курсы, непосредственно по Data Science, а также статистика и математика. Непривычно было погружаться в такие типично программистские темы, как архитектура операционных систем, например. Но аналитику нужно в этом разбираться, чтобы грамотно использовать инфраструктуру заказчика, ведь работа с большими данными требует серьёзных ресурсов. Специалист, который умеет извлекать больше полезных сведений с меньшими затратами, ценен для работодателей, потому что экономит их деньги.

Когда я приступала к обучению, даже не представляла, что со временем буду знать и уметь всё то, что знаю сегодня. Но я с самого начала настраивалась на серьёзную работу, большей частью самостоятельную. И этот подход полностью оправдывает себя. Учёба дает мне план, сроки, темы, задания. А то, насколько глубокие и крепкие знания я приобрету, зависит уже полностью от меня.

Источник

Data Science в медицине: кто, как и зачем обрабатывает данные

Пандемия существенно повлияла на рынок Data Science в мире: возросли не только объемы обрабатываемой ежедневно информации, но и потребность в прогностических моделях и специалистах. Хотя на эту тему уже достаточно много сказано и написано, сама суть профессии все еще вызывает вопросы. Поэтому мы в «Хайтеке» вместе с GeekBrains решили рассказать о том, какие задачи решают дата-сайентисты в медицине, что изменил коронавирус и как зайти в эту профессию.

Читайте «Хайтек» в

Несмотря на то, что с методологической точки зрения ИТ и медицина достаточно далеки друг от друга, именно биология и медицинские исследования двигали анализ данных и применение различных аналитических моделей вперед. Сегодня даже в медицинских институтах, на курсах медицинской статистики, изучаются основы Data Science. И хотя эти методы в медвузах называются иначе, врачам достаточно трудно их применять — сказывается отсутствие опыта в программировании. Умение программировать — первое, что требуется от специалиста в данной области. Необходимо разбираться в современных алгоритмах анализа данных — в нейронных сетях. Причем не просто теоретически понимать, как работает алгоритм, — для этого нужно неплохо владеть высшей математикой и уметь эти алгоритмы использовать на реальных медицинских данных. Это, в свою очередь, требует от специалиста знаний специальных инструментов Data Science — библиотек Python и методов предобработки данных.

Как коронавирус стал катализатором для Data Science в медицине

На сегодняшний день есть два ключевых направления прикладного применения Data Science в медицине — здравоохранение и фармацевтика. В первое направление входят задачи диагностики, оптимизация работы клиник и врачей, подбор лекарств и лечения на основе диагноза. Решения, которые применяются в каждой из этих глобальных задач, базируются на основе алгоритмах анализа данных и машинного обучения. В разработке лекарств активно используются накопленные медицинские данные. Речь идет как о применении в поиске действующих веществ, так и о тестировании препаратов на животных и людях.

Особую роль в развитии технологий Data Science сыграла пандемия коронавируса. Резко возросла потребность в предсказательных моделях, которые могли бы дать более точные данные о будущем распространении коронавируса: предсказать количество госпитализаций, влияние тех или иных ограничительных мер и вакцинации на COVID-19. И если в классической эпидемиологии подобные предсказания основываются на относительно простых эпидемиологических моделях, то в реальности эти модели показали себя крайне плохо, тогда как современные методы Data Science способны их заменить и повысить точность прогнозов.

Основные направления применения Data Science в медицине во время пандемии остались прежними, но объем данных и ожидаемое время на решение задачи существенно изменились. Например, задача диагностики заболевания по КТ легких уже давно изучена, на рынке присутствует достаточное количество рабочих решений. Но благодаря глобальности пандемии, постоянному обмену данными и их доступности задача автоматической диагностики COVID-19 по КТ была решена в кратчайшие сроки. То же относится и к предсказанию тяжести исхода заболевания, это могло бы помочь для прогнозирования количества свободных мест в больницах. Для решения этой задачи в нескольких странах параллельно собирается и анализируется гигантский объем данных. Но специфика медицины такова, что внедрение новых решений на практически невозможно. Как и в случае с вакцинами, требуется тщательная проверка любой модели прежде, чем от нее будут зависеть врачебные решения.

Какие базовые знания необходимы для работы в Data Science:

Как Data Science помогает в борьбе с раком, болезнью Альцгеймера и в поиске новых лекарств

Остановимся на различных направлениях применения Data Science в медицине. Одно из самых перспективных — диагностика онкологических заболеваний. Сегодня дата-сайентисты используют целый спектр алгоритмов для разработки решений в этой области: выбор за конкретным методом зависит от поставленной задачи, данных, которые имеются, и их объема. К примеру, можно делать диагностику по изображениям опухоли — в этом случае специалисты Data Science скорее всего будут использовать нейронные сети. Для диагностики по результатам анализов будет выбран один из методов машинного обучения, лучше других подходящий для конкретной задачи. Также существуют специфические алгоритмы, используемые, например, для анализа данных ДНК, полученных от единичных клеток. Такие данные чаще всего анализируются с помощью алгоритмов на графах. Но это скорее исключение из правил.

Кроме того, есть несколько методов, применяемых для улучшения изображений и повышения точности результата. Платформы больших данных (такие, как Hadoop) применяют, например, MapReduce для поиска параметров, которые можно использовать в различных задачах. Для тех, кто собирается разработать свой продукт в этой сфере, или просто энтузиастов есть несколько открытых наборов данных визуализации мозга: BrainWeb, IXI Dataset, fastMRI и OASIS.

Еще один кейс — это моделирование органов человека, одна из сложнейших технических задач. Причем при разработке того или иного решения специалист должен точно понимать, для чего и на каком уровне сложности моделируется орган. Например, можно сделать модель определенной опухоли на уровне экспрессии генов и сигнальных путей. Сегодня решением таких задач занимается компания Insilico Medicine. Этот подход используется для поиска мишени терапии, в том числе методами Data Science. Подобные модели в основном применяются для научных исследований, до практического применения им пока что еще далеко.

Анализ последовательности генов — целое направление медицины, развитие которого просто невозможно без Data Science. Если в Data Science крайне важен навык программирования на Python, то при работе с генами также необходимы знание языка программирования R и специфические инструменты биоинформатики — программы для работы с последовательностями ДНК и белков. Большинство таких программ работают на операционной системе Unix и не очень «дружелюбны» к пользователям. Чтобы их освоить, нужно как минимум понимать основы молекулярной биологии и генетики. К сожалению, даже в медицинских вузах с этим сегодня большие проблемы, и большинство врачей на самом деле плохо представляют, как устроены последовательности генов. В России этим направлением занимаются две компании — «Атлас» и «Генотек». Популярным в настоящее время является и анализ на мутации отдельных генов. Большинство крупных компаний, которые занимаются медицинскими анализами, предоставляют такие услуги. Пациенты, например, могут выяснить, нет ли у них предрасположенности к раку груди в тех же генах, что у Анджелины Джоли. Эта сфера характеризуется дефицитом кадров, так как существует всего несколько мест, где можно получить соответствующее образование. К тому же многие либо остаются работать в науке, либо уезжают за границу. Русскоязычных онлайн-ресурсов, где можно научиться подобному анализу, достаточно мало. Обычно они рассчитаны на врачей или биологов и обучают только программированию и основам работы с данными. Для того чтобы получить более практико-ориентированное образование с выходом в эту область, можно окончить курс на Факультете Data Science в медицине в GeekBrains.

Сегодня на рынке существует несколько инструментов для анализа данных в этой области: MapReduce, SQL, Galaxy, Bioconductor. MapReduce обрабатывает генетические данные и сокращает время, необходимое для обработки генетических последовательностей.

SQL — это язык реляционных баз данных, который мы используем для выполнения запросов и извлечения данных из геномных баз данных. Galaxy — приложение для биомедицинских исследований с открытым исходным кодом, основанное на графическом интерфейсе. Оно позволяет выполнять различные операции с геномами.

И, наконец, Bioconductor — это программное обеспечение с открытым исходным кодом, разработанное для анализа геномных данных.

Важное коммерческое и одновременно исследовательское направление — создание лекарственных препаратов нового поколения. Специалисты фармы используют машинное обучение для поиска мишени терапии и биомаркеров. Ни первое, ни второе, конечно, ещё не сами лекарства. Мишени — это молекулы в организме, с которыми лекарство взаимодействует, а биомаркеры — молекулы, сообщающие врачу о том, кому следует применять лекарство. Поэтому практически все компании, которые разрабатывают лекарства от болезней с неизвестными мишенями и биомаркерами — Novartis, Merck, Roche и российский BIOCAD — используют машинное обучение. Это, в первую очередь, онкологические и аутоиммунные заболевания, болезнь Альцгеймера. Сюда же можно отнести поиск новых антибиотиков.

Почему врачи не способствуют внедрению Data Science

Последние годы показали, что Data Science является двигателем индустрии прогностических и аналитических моделей в медицине, например, в применении нейронных сетей для определения пространственной структуры белков. Но пандемия вскрыла во многих странах глобальную проблему, связанную с оптимизацией ресурсов клиник и недостатком персонала. За последний год появилось множество компаний, предлагающих решать эти проблемы с помощью Data Science. Использование данных стало большим прорывом и для частных клиник, поскольку делает медицинские услуги дешевле. На фоне пандемии также вырос спрос на услуги телемедицины, в которых широко применяются алгоритмы машинного обучения. Сервисы телемедицины востребованы для предварительной постановки диагноза, работы с анализами и создания чат-ботов.

С точки зрения технологических ограничений применение компьютерного зрения и машинного обучения практически не имеет препятствий. Более глубокое внедрение алгоритмов и сервисов упирается в желание клиник и врачей применять методы Data Science. Также остро ощущается нехватка данных для обучения, причем это вопрос не только к коммерческим медицинским учреждениям, но и к государству: правительствам следует демократизировать доступ к данным бюджетных больниц, чтобы компании-разработчики могли создавать современные продукты.

Обучение даже одной программы требует много качественных данных. Для того чтобы научиться различать опухоль в кадре, программе необходимы тысячи вручную проанализированных снимков пациентов, причём к анализу следует привлекать опытных врачей.

Врач должен сначала найти опухоль, а потом показать, где она находится. Как вы понимаете, у опытных врачей есть много других дел. Но пандемия, как ни странно, помогла некоторым областям. Так, например, DiagnoCat, российский стартап, применяющий компьютерное зрение для анализа снимков в стоматологии, во время локдауна смог привлечь незанятых врачей для анализа снимков. Что касается нежелания клиник и врачей, то врачи попросту не доверяют подобным технологиям. Хороший врач наверняка найдет такой случай, когда программа поставит неверный диагноз, неопытный врач испугается, что программа сделает все лучше его. В итоге всегда можно оправдаться заботой о пациенте и юридическими аспектами.

Синергия Data Science и медицинских технологий уже позволила совершить скачок в разработке решений для диагностики онкологических, аутоиммунных и нейродегенеративных заболеваний. Сервисы, работающие на основе анализа данных и машинного обучения, способны прогнозировать распространение вирусов и искать лекарства новых поколений. Несмотря на то, что классическое медицинское образование отстает от вызовов, которые стоят сегодня перед индустрией, стать современным специалистом, работающим на стыке двух научных направлений — Data Science и медицины — реально. И один из способов — онлайн-курс на факультете «Data Science в медицине» в GeekBrains.

Источник

Data science в медицине: кардио-МРТ с ИИ, умное планирование лучевой терапии и случайное обнаружение болезней

Эпоху, в которой мы живем, называют информационной эрой. Каждый из нас ежесекундно имеет доступ к такому количеству данных, какое до широкого распространения интернета люди не могли и представить. Онлайн-шопинг и общение, наши ежедневные поисковые запросы — именно активность в интернете стала источником огромного массива информации, который принято называть Big Data. Но ключевую роль анализ больших данных сегодня играет в медицине, помогая врачам ставить диагнозы, случайно обнаруживать болезни и точно рассчитывать параметры лучевой терапии. Ведущий научный сотрудник лаборатории Philips Research в «Сколково» Ирина Федулова рассказала о том, как анализ больших данных меняет здравоохранение и какие проекты реализует лаборатория компании Philips в сфере Data science.

Читайте «Хайтек» в

Новая наука XXI века

Существование больших данных не имело бы смысла, если бы их никто не анализировал и не систематизировал. Но вручную работать с такими объемами невозможно — необходимо применять специальные методы, основанные на компьютерных мощностях, которые позволяют использовать в полной мере потенциал собранной информации. Этим и занимается Data science — наука о данных.

Профессия дата-сайентиста стала одной из самых востребованных специальностей в XXI веке. Ключевое направление этой дисциплины — машинное обучение. От стандартного программирования оно отличается тем, что специалист не пишет алгоритм, по которому работает компьютер, а учит машину создавать программу без человеческого участия на основе собранных данных. Сегодня большинство людей сталкивается с приложениями, построенными на основе машинного обучения, неоднократно в течение дня: навигатор благодаря ему самостоятельно строит маршруты, различные онлайн-сервисы рекомендуют фильмы, музыку и еду. Если рассматривать менее очевидные на бытовом уровне задачи, можно вспомнить о том, насколько интенсивно машинное обучение используется в безопасности — например, для контроля государственной границы или в логистике для навигации, доставки, оптимизации товаров на складе. В финансовой сфере подобные технологии нужны для управления рисками, алгоритмической биржевой торговли, кредитования и страхования.

Data science в медицине

Растущая необходимость в специалистах по Data science есть и в медицине. Цифровизация — безусловный тренд в здравоохранении, и это подтверждается заинтересованностью государств. Например, в России в рамках нацпроекта «Здравоохранение» на внедрение инновационных медицинских технологий выделено 63,9 млрд рублей.

Среди крупных технологических компаний одними из пионеров применения Data science в медицине стали компании Google (проекты в рамках направления Google Health) и IBM, которые создали линейку решений под маркой IBM Watson, и сейчас активно используют их в здравоохранении: портфолио IBM Watson Health включает в себя платформы для онкологии, кардиологии, радиологии и других разделов медицины.

Программы, созданные на основе машинного обучения, помогают врачам принимать более обоснованные решения и назначать максимально подходящее лечение. Например, чтобы полностью видеть картину заболевания и автоматически оценивать состояние пациента не только во время приема, но и между визитами, можно использовать носимые устройства — фитнес-трекеры и браслеты, специальные мобильные приложения. В некоторых странах гаджеты уже могут передавать показатели здоровья напрямую в базы данных медицинских учреждений, а электронная система анализирует информацию, выявляет возможные отклонения и с помощью уведомления подсказывает врачу, когда пациенту требуется консультация.

В конечном итоге все новшества в здравоохранении нужны, чтобы повысить качество и снизить стоимость медицинской помощи. Data science позволяет врачу уделять больше времени пациенту, пока компьютер быстро и точно анализирует массив данных. В лабораториях Philips Research занимаются множеством аспектов Data science: научные сотрудники работают над проектами в области распознавания образов и обработки изображений, анализа медицинских текстов, поиска аномалий, рекомендательных систем. Дата-сайентисты здесь принимают участие в создании интеллектуальных систем и занимаются изобретательской деятельностью.

Цифровая помощь в анализе изображений

Один из приоритетов специалистов по Data science в Philips Research — разработка инновационных подходов к автоматическому анализу медицинских снимков. Ученые стремятся автоматизировать некоторые из задач врачей, деятельность которых связана с оценкой изображений — например, рентгенологов и патоморфологов.

Как именно ИИ улучшает качество оценки изображений, можно увидеть на примере рентгенологии. Каждый день врачи применяют свой опыт и знания, чтобы делать правильные выводы на основании снимков. Имея тысячи изображений, которые уже обработал и разметил профессионал, можно обучить нейронную сеть распознавать отклонения на новых снимках. Натренированная на большом количестве примеров из базы данных нейросетевая модель анализирует картинку и делает вывод о наличии заболевания. Такая схема может быть полезна для массовых обследований населения: например, в некоторых странах есть национальные программы диагностики туберкулеза на основании флюорографии. Система сможет отсеивать снимки, на которых не обнаружено патологий, и предоставлять врачам только те случаи, когда состояние пациента вызывает сомнения. На данный момент подобные решения находятся на стадии разработки и проходят клиническую апробацию.

Data science в МРТ и КТ

Возможности ИИ все чаще применяются в магнитно-резонансной томографии. Оценка изображений, полученных этим методом, порой требует много времени и усилий. За время одного исследования врачи могут получить десятки снимков. Чтобы помочь врачу проанализировать этот массив данных, ученые внедрили в работу МР-сканеров искусственный интеллект, который оценивает качество снимка, рассчитывает жизненно важные параметры и сравнивает результаты с предыдущими показателями для выявления динамики заболевания.

Например, для исследований сердца Philips создал кардио-МРТ, один из самых современных методов диагностики кардиологических заболеваний. После того, как получены снимки, для определения эффективности работы сердца необходимо вычислить объемы камер сердца в сокращенном и расслабленном состояниях. Специалисты предполагают, что эти действия можно поручить ИИ, обученному выделять на снимках сердечную мышцу, стенки, клапаны, сосуды и самостоятельно рассчитывать объемы камер. Сейчас в разработке находятся прототипы моделей, которые дадут возможность врачам тратить меньше времени на решение рутинных задач и больше концентрироваться на постановке диагноза.

Еще одна разработка дата-сайентистов — возможность генерировать один вид изображения на основании других. В медицине это применимо, когда пациенту требуется несколько процедур: компьютерная томография и МРТ, что требуется, например, при планировании лучевой терапии, когда необходимо точно очертить контуры областей для облучения, а также соседних здоровых органов, которые облучать не надо. Для расчета дозы необходимо также знать рентгеновскую проницаемость всех тканей, через которые будут проходить рентгеновские лучи. Информацию для точной оценки контуров зон облучения лучше всего дает МРТ-исследование, которое безвредно для человека. Однако МРТ-изображение не несет информации о рентгеновской проницаемости тканей — эту информацию можно получить только при помощи КТ. К сожалению, компьютерная томография основана на рентгеновском излучении, вредном для человека. На его изображении хуже видны контуры различных мягких тканей, поэтому пациентам приходится делать и КТ, и МРТ, а потом совмещать две картинки. Чтобы снизить уровень лучевой нагрузки, особенно если пациент — ребенок, а также снизить общую стоимость планирования операции, ученые создали метод генерации синтетического КТ-изображения по данным МРТ. Согласно ему обученная программа учиться генерировать КТ на основе существующих МРТ. В итоге пациент проходит одну процедуру вместо двух. Таким образом уменьшается время и стоимость обследования, а главное — доза облучения.

Data science и патоморфология

Несмотря на многообразие неинвазивных методов диагностики, в онкологии точный диагноз может быть поставлен единственным способом — с помощью анализа ткани через микроскоп. Именно этим занимается патоморфология. В помощь врачам-патоморфологам дата-сайентисты создают алгоритмы для обработки изображений клеток, подобные тем, которые распознают людей и различают предметы на фотографиях. Это специальные системы принятия врачебных решений, которые выявляют и классифицируют пораженные клетки, а затем сообщают врачу о своих находках. Кроме того, специалист сразу же получает дополнительную полезную информацию (например, сведения о концентрации клеток, стадии заболевания, особенностях внутриклеточных процессов и так далее), которая помогает ему при постановке диагноза.

Почему использовать Data science для здравоохранения непросто

Как любая молодая наука, Data science все еще сталкивается с определенными вызовами. Если говорить о медицине, на первый план выходит этический аспект. Исследование Philips «Индекс здоровья будущего — 2019» показало, что главным барьером на пути к внедрению цифровых медицинских технологий является обеспокоенность вопросом конфиденциальности данных. Люди хотят знать ответ на вопрос, насколько защищена информация, которую они предоставляют компьютеру для анализа или передают врачу дистанционно.

Людям будет проще принять изменения в медицине, когда каждый поймет, что инновации создаются не для того, чтобы заменить врачей в их работе. Цифровые технологии лишь помогают профессионалам принимать наиболее точные и обоснованные решения. Нейросеть может определять наличие некоторых заболеваний по симптоматике и предлагать варианты назначений, но пациенты могут быть уверены, что последнее слово по-прежнему за врачом — только он может поставить окончательный диагноз и определить необходимое лечение.

Сложности в Data science возникают не только в этическом поле, но и с технической стороны. В здравоохранении зачастую не хватает полных, консистентных, репрезентативных, предварительно размеченных данных, на основании которых можно было бы обучать машину анализировать материал, классифицировать его и составлять прогнозы. Сбор и обработка медицинской информации должна проводиться вручную, это трудоемкий, монотонный и долгий процесс, на который зачастую не хватает ресурсов.

Даже если данных достаточно, проблемы могут возникнуть уже на этапе использования готового алгоритма. Многие заболевания эволюционируют, да и для традиционных болезней характерна большая вариативность признаков. Нельзя предсказать, как поведет себя система, если столкнется с нестандартной ситуацией. Представим себе алгоритм, обученный обнаруживать патологии в сердце, которое у подавляющего большинства людей находится в левой части грудной клетки. Но что произойдет, если однажды он столкнется с редкой особенностью анатомического развития — декстрокардией, при которой сердце находится справа? Большинство алгоритмов может выдавать только финальное решение — да или нет, норма или патология. Ни один алгоритм пока не может сообщить: «Я такого никогда не видел и не знаю, что это». Поэтому сейчас важно научить компьютер не только давать ответ, но и оценивать степень достоверности полученных результатов.

Инновации в ответ на современные вызовы

Главные вызовы здравоохранения — это рост населения, снижение доступности медицинской помощи, увеличение продолжительности жизни и, как следствие, частоты хронических заболеваний. Чтобы решить эти проблемы, ученые стремятся вывести медицину на новый уровень. Например, Data science сделает возможным случайное обнаружение болезней (на англ. incidental finding — «Хайтек»). Врачи обычно рассматривают анализы и снимки в свете того диагноза, с которым пришел пациент. В то же время машина, умеющая различать сотни болезней, может обратить внимание специалиста на другие отклонения от нормы — например, найти рак легких на снимке с переломом ребра. Одна из целей машинного обучения в медицине — помочь врачам проверять человека на всё и сразу при минимальном количестве исследований.

Другое направление, которым занимается Philips Research, — это прогнозная аналитика, то есть предсказание заболеваний в зависимости от местности и группы населения. Если будут учитываться медицинские показатели миллионов человек, можно будет находить взаимосвязи и закономерности, выяснять, почему где-то одни заболевания распространены больше, чем другие, и затем на основании полученной информации определять группы риска и проводить профилактику до возникновения вспышек болезней.

Источник