Инновации
0

Остановить приватизацию данных о состоянии здоровья

by editorСентябрь 15, 2016

Технические гиганты, продвигающие свои технологии в сферу здравоохранения, могут усилить неравенство и навредить исследованиям, если у людей не будет возможности к доступу и обмену собственными данными, предупреждают Джон Уилбанкс и Эрик Тополь.

В течение прошлого года такие технические титаны, как Google, Apple, Microsoft и IBM, нанимали передовиков в области медицинских исследований, бросив усилия на изменение медицины.

В сентябре 2015 года Том Инсель объявил, что покидает должность главы национального института психического здоровья США, чтобы присоединиться к Google Life Sciences (сейчас Verily). Три месяца спустя Майкл Макконел временно оставил должность руководителя важнейших проектов по исследованию сердечно-сосудистых заболеваний, проводимых в Стендфордском университете, в Калифорнии, чтобы присоединиться к Инселю. А в прошлом месяце Стивен Френд занял руководящую должность в Apple. Он — один из основателей и бывший президент Sage Bionetworks, некоммерческой организации, которая способствует “открытой” науке и привлекает пациентов к исследованиям(где работает наш коллега).

Уже давно наблюдается тенденция к миграции ученых-клиницистов в технологические корпорации, которые ориентированы на сбор, анализ и хранение информации. Из-за затрат и трудностей в получении данных о здоровье и болезни, учёные, проводящие клинические или популяционные исследования, редко имели возможность внимательно наблюдать достаточное число пациентов, что позволяло сделать лишь ориентировочный прогноз. Учитывая подобные ограничения, кто не заинтересован в получении доступа к интернет-регистрам с комплексными данными о состоянии здоровья (инженеры могут сконструировать датчики для сбора данных и алгоритмы для анализов) и к ресурсам, позволяющим реализовывать проекты со скоростью и масштабами, которые просто немыслимы для государственного сектора?

Тем не менее, существует негативный аспект в том, что такие монолиты, как Google или небольшие компании, как фирма бытовой генетики 23andMe, владеют данными о состоянии здоровья или даже контролируют инструменты и методы, используемые для привязывания цифровых профилей здоровья к определённым сервисам.

Иначе говоря, цифровые профили уже создают то, что было названо обществом “чёрного ящика”. Рекламные объявления в сети ориентированы на людей определённого возраста, места проживания, на их траты и поисковые запросы. Некоторые розничные службы доступны преимущественно для конкретных групп людей. Правоприменителей обеспечивают инструментами, помогающими им принять решение по вынесению приговора, который не может быть открыто оценён (см. go.nature. com/29umpu1). Всё это возможно благодаря осмотрительно скрытым сборам и манипуляциям с персональными данными.

Если неразглашаемый алгоритм принятия решений станет включать данные о состоянии здоровья, способность “чёрного ящика” предвосхищать общественные сдвиги может резко возрасти. Важно отметить, что если имеющие профили граждане не будут получать свои данные или не будут иметь возможность вступать в контакт с другими пользователями, они никогда не узнают о неверных или дискриминирующих мерах, принятых для их лечения, тем более не смогут подвергнуть их критической оценке. А большинство исследователей не будет иметь доступ к данным о состоянии здоровья и уникальной информации, которую они могли бы почерпнуть из них.

Поток информации

Носимые устройства, которые отслеживают физическую форму - богатый источник данных о состоянии здоровья в режиме реального времени. Источник: журнал Nature.

Носимые устройства, которые отслеживают физическую форму — богатый источник данных о состоянии здоровья в режиме реального времени. Источник: журнал Nature.

Мы полагаем, что приток экспертов из области здравоохранения в Силиконовую долину может быть предзнаменованием успеха в области биомедицинских исследований и медицинской помощи.

В различных странах, в числе которых Великобритания, Швеция, Норвегия и Эстония, под непрерывным давлением правительства и гражданского общества были приняты нормы стандартизации электронных записей о состоянии здоровья. Вполне возможно, что в течение пяти лет в США будет представлена система электронных записей о здоровье, информацию из которой можно будет получить независимо от того, в какую клинику обратился пациент. Между тем, достигнуты успехи в области машинного обучения, а также растет доступность цифровых данных о состоянии здоровья вне медицинской системы. Информация такого формата значительно удобнее для обработки алгоритмами машинного обучения, нежели привычное обследование больного.Кроме того, некоторые технические корпорации, выходящие на рынок здравоохранения, имеют огромные денежные резервы в сотни миллионов долларов.Совокупность этих факторов позволит новым участникам не просто присоединиться, но и затмить “ветеранов”.

До сих пор получение данных о состоянии здоровья целиком и полностью зависит от профессионалов, которые один или два раза в год делают десятки и сотни записей об осмотрах в клинике или больничной палате, а также от исследователей, которые кропотливо извлекают информацию из труднодоступных нестандартизированных записей о состоянии здоровья. Теперь, благодаря приложениям для смартфонов, к примеру, созданным с помощью выпущенной в прошлом году программной среды ResearchKit от Apple, и ношению датчиков, которые могут определять походку, местоположение, частоту сердечных сокращений и даже активность мозга, аналитики могут опираться на десятки тысяч наблюдений, каждый день и даже каждую минуту собираемых в режиме реального времени от десятков тысяч людей.

Информация о здоровье также входит в перечень самых частых поисковых запросов. В феврале 2015 года Google в сотрудничестве с клиникой Майо, некоммерческой медицинской организацией, и группой исследователей, базирующейся в Рочестере, штат Миннесота, отбирали различные факты, связанные со здоровьем, например, наиболее распространенные причины боли в пояснице. Команды Google включают отобранную и верифицированную медицинскую информацию в Knowledge Graph, встроенный в поисковую службу алгоритм умного поиска, который предоставляет пользователям наиболее актуальную и, предположительно, более точную информацию по запрашиваемым симптомам и синдромам. Служба (которая для многих людей с недомоганиями может стать альтернативой визита к врачу) будет способствовать повышению качества предоставляемых Google, и только Google, данных о состоянии здоровья. По собственным подсчетам технологических гигантов, из 40000 ежесекундных поисковых запросов, 2000 приходятся на запросы связанные со здоровьем.

В 2011 году протестующие в Берлине призвали к праву на конфиденциальное хранение персональных цифровых данных. Источник: журнал Nature.

В 2011 году протестующие в Берлине призвали к праву на конфиденциальное хранение персональных цифровых данных. Источник: журнал Nature.

В то же время, машинное обучение позволяет исследователям получать петабайты данных для моделей и ассоциаций. К примеру, технологическая платформа IBM Watson просеивает неструктурированные данные, используя обработку текстов, написанных на естественных языках, и машинное обучение. С апреля прошлого года IBM создаёт “знатоков” в области здоровья, используя облачную платформу Watson Health: клиенты, которые хранят свои данные в облаке. получают доступ к алгоритмам, которые позволят им разобраться в данных. IBM уже использует Watson для решения комплексных диагностических задач в сотрудничестве с Онкологическим центром имени М. Д. Андерсона Техасского университета в Хьюстоне, в частности — как использовать геномную информацию, полученную от раковых клеток, для предоставления пациентам таргетной терапии.

Даже элементарные измерения, уже осуществляемые смартфонами и носимыми датчиками, могут предоставить лучшие результаты, чем десятилетиями развивавшиеся медицинские устройства. Например, в 2014 году женщина больная диабетом первого типа смонтировала вместе крошечный процессор, инсулиновую помпу и непрерывно работающий глюкометр для автоматизированной регуляции уровня “сахара” в крови. Внутри небольшого сообщества пациентов коллективное использование подобных “ самодельных” систем привело к прогрессу, который значительно опережает технологии, предлагаемые на традиционном рынке услуг.

Проще говоря, крупных и мелких предпринимателей привлекает огромная прибыль, которая может быть извлечена из достаточно дешевых данных о состоянии здоровья. Около десяти лет назад некоторые стартапы за скромную плату хранили и предоставляли информацию о геноме и других данных о состоянии здоровья пациентов, что делало их доступными для фармацевтических партнеров и других клиентов. В 2016 году, все крупные технологические корпорации, в том числе Apple, Google, IBM, Facebook и даже Uber, уже заявили о своём намерении выйти на рынок “цифрового здравоохранения”.

Обратная связь

Источник: журнал Nature

Источник: журнал Nature

По-справедливости, освоение достижений в области технологий и аналитики, которые в корне могут улучшить медицинское обслуживание, является главной целью многих компаний. Но это говорит о том, что более ранние игроки уже владеют информацией по принципу “обратной связи”.

Взять, к примеру, носимое устройство для диабетиков Enlite, в 2013 году выпущенное фирмой Medtronic, базирующейся в Дублине. Оно поставляет инсулин в кровь больного, когда сенсор выявляет повышение уровня глюкозы. Хотя пациенты могут мониторировать уровни глюкозы, совокупность данных для них недоступна. И не существует никакого механизма, с помощью которого пациенты или исследователи, не относящиеся к компании Medtronic, могли бы получить доступ к десяткам тысяч проводимых ею измерений. То же самое верно и для других носимых устройств, которые производит та же фирма. В действительности, компания отказалась предоставить данные о работе сердечно-сосудистой системы пациентов (см. go.nature.com/29tdzud).

Даже когда корпорации дают клиентам доступ к агрегированным ими данным, встроенная блокировка их распространения затрудняет для пользователей пожертвование данных во имя науки. 23andMe, обладатель самого большого в мире хранилища данных о геноме человека, позволяет пользователям просматривать и загружать собственные односимвольные варианты ДНК и делиться этими данными с учреждениями, внесенными в списки. Но чтобы эти данные действительно пошли на пользу клиентам, они должны иметь возможность с легкостью отправлять информацию врачу или медицинскому учреждению, генетическому консультанту или любому другому аналитику, которого они выбрали.

Фармацевтические фирмы уже давно располагают ограниченными и труднодоступными данными, например, о том, как специфические химические вещества влияют на некие показатели крови в клинических испытаниях. Но они, как правило, не имеют достаточного количества данных длительного наблюдения за состоянием здоровья индивидов за пределами проводимых ими исследований, и часто не могут сопоставить участника одного испытания с участником другого. Многие из новичков в сфере электронной медицины, деятельность которых не ограничивается фрагментированными платформами электронных медицинских карт, готовы собрать резервный фонд данных и ввести их в уже оптимизированные системы (в первую очередь для публикации объявлений), чтобы делать индивидуальные прогнозы.

Компании, стремящиеся работать в этой сфере, наталкиваются на серьезные препятствия в лице органов здравоохранения: особенно испытывают сложности в получении разрешения регулирующих органов на оборот полезной для пациентов информации. Тем не менее, согласно отчету eMarketer за январь (см. ‘The digital health rush’ и go.nature.com/29fbvch), объем рынка функционирующих через интернет устройств, собирающих и анализирующих данные о состоянии здоровья и физической форме, связанных с медицинским оборудованием и оптимизирующих заботу о пациенте и медицинские исследования, к 2020 году по оценкам, превысит 163 миллиона долларов. Такой, подобный цунами, прирост не укладывается в рамки этики принятия решений, ориентирующейся на максимизацию выгоды для граждан в долгосрочной перспективе.

Уже ясно, что патентованные алгоритмы могут дублировать и усугублять социальные предрассудки и структурные проблемы. Несмотря на все усилия программистов компании Google, объявления о поиске на работу, обеспечиваемые рекламным алгоритмом сервиса, предлагают пользователям женского пола менее оплачиваемые вакансии, чем мужчинам [2]. В мае, расследование ProPublica показало, что алгоритмы, используемые правоохранительными органами, могут с высокой долей вероятности ошибочно приписывать виновность чернокожим подсудимым (см. go.nature.com/29aznyw). А также, благодаря “демографически слепым” алгоритмам, в нескольких городах США чернокожие люди в среднем в два раза чаще, чем “белые”, живут в районах, имеющих доступ к однодневной службе доставки Amazon (see go.nature. com/29kskg3).

Мы считаем, что бизнес модели в области здравоохранения, основанные на закрытых данных и закрытых алгоритмах, будут в широком масштабе препятствовать научному прогрессу, блокируя открытие разнообразных путей исследования и интерпретации данных о состоянии здоровья. В долгосрочной перспективе, вместо того, чтобы уменьшить неравенство и несправедливость, они могут их увеличить. Так, нетрудно представить будущее, в котором компании могут продавать профили заболеваний пациентов без их ведома . Или такое, где решения в области здравоохранения глубоки и трудно оспоримы, а прогресс заключается в понимании используемых агрессивных рыночных услуг, связанных со здоровьем людей, вне зависимости от того, несут ли эти услуги пользу их здоровью.

Как бы там ни было

Мы не намерены демонизировать технологические компании. Закрытые системы, в сравнении с открытыми, имеют некоторые исходные краткосрочные преимущества. К примеру, они быстрее могут достичь слаженности и масштаба, так как их руководители могут диктовать форматы, стандарты и нормы. Но частный капитал будет лучше служить интересам общественности, если хотя бы некоторые уровни формирующейся инфраструктуры поиска информации о состоянии здоровья будут открыты (один уровень — необработанные данные, другой — инструменты для анализа и третий — разработка методов лечения и оказания пациентам услуг).

На наш взгляд, сенсоры и другие сведения и методы, используемые для превращения этих данных в клинически полезную информацию, должны быть полезны обществу. Технические и бизнес-услуги, задевающие моральные принципы отдельных граждан, вполне могут быть завершены. Это может быть организовано по аналогии с Google, Apple Maps и Waze, которые составляют карты на основе предоставленных правительством геопространственных данных. Согласно этому сценарию, частный капитал будет финансировать воссоздание информативной картины накопленного пациентом опыта, а не коммерциализацию врачебной тайны.

По собственным подсчетам технологических гигантов, из 40000 ежесекундных поисковых запросов, 2000 приходятся на запросы связанные со здоровьем.
В теории, усложнение государственного урегулирования могло бы уберечь сбор и анализ цифровых данных о состоянии здоровья от высокоприбыльного бизнеса. Европейский союз уже принял решительные меры по защите цифровой информации граждан от эксплуатации в коммерческих или иных целях. Но в США, по крайней мере в ближайшие 2-3 года, шансы на принятие достойных законов, защищающих гражданские права в области цифровых данных, невелики.

Многие из крупнейших технических корпораций в своих правах стали походить на малые народы: они обладают огромными “природными ресурсами” (базы данных и вычислительная способность) и заинтересованы в их защите на глобальном уровне. Пять технических фирм, базирующихся в США — Apple, Microsoft, Alphabet (дочерняя компания Google), Cisco Systems и Oracle, денежные резервы которых на конец года составили в общей сложности 504 миллиарда долларов, большую часть этих резервов содержат в офшорах, чтобы избежать налогооблажения и урегулирования (см. go.nature.com/29ep3zx). Даже если правительство захочет вмешаться, оно не сможет идти в ногу со стремительно развивающимися технологиями и сопровождающими их бизнес-моделями.

По нашему мнению, наиболее перспективным способом урегулирования закрытых моделей является создание надежных конкурентов с открытым исходным кодом. В конце 1990-х годов, IBM, на тот момент один из крупнейших игроков на рынке программного обеспечения, отказалась от патентованного серверного программного обеспечения в пользу продажи программного обеспечения с открытым исходным кодом. После того как пользователей достигли веб-сервер Apache и операционная система Linux с открытым исходным кодом, предложившие достойную альтернативу коммерческим пакетам, IBM стала продавать им свое программное обеспечение и комплектующие. Примерно в то же время увидел свет исходный код браузера Netscape, дав толчок инновациям на рынке браузеров и не допустив Microsoft к созданию монополии с Internet Explorer. В обоих случаях сообщества, которых насчитывается около сотни или, в лучшем случае, тысячи, трансформировали поле деятельности крупнейших мировых корпораций.

Определенную роль в этом играет создание общественных ресурсов за счет государственного финансирования. Вскоре после того, как открыто финансируемый проект Геном Человека в 2000 году анонсировал завершение своего существования, частная, занимающаяся секвенированием компания Celera перестала взимать с исследователей плату за доступ к данным, поместила эти данные в публичную базу данных GenBank и сфокусировалась на разработке методов лечения болезней. Тем не менее, на сегодняшний день суммы, направляемые на такие общественные проекты, как проект администрации Обамы, Precision Medicine Initiative, который нацелен на установление соответствия проводимой терапии генетическим и физиологическим данным пациента, меркнут, в сравнении с инвестициями, которые могут внести многие компании (Последний сбор средств 23andMe — приблизительно 150 миллионов долларов, что составило 70% всех федеральных инвестиций, отведенных на Precision Medicine Initiative).

Что действительно необходимо, так это сети открытых проектов в сочетании с достаточным числом пациентов и граждан, мотивированных на то, чтобы снабдить такие проекты данными о состоянии здоровья.

Изучение проблемы

В Sage Bionetworks мы проводим четыре непрерывных клинических исследования различных заболеваний, включая болезнь Паркинсона. Также, для пациентов мы предоставляем онлайн-интерфейсы, позволяющие загрузить свою информацию, а также порталы для обмена данными, по трем другим исследованиям (диабета, астмы и здоровья сердца). С марта 2015 года мы зарегистрировали более 90000 участников в рамках этих исследований (см. go.nature.com/29qqk57). Участники автоматически получают права на доступ и загрузку полных копий собственных данных. Также они имеют право предоставить свои данные для многократного использования широким кругом лиц “квалифицированных исследователей”, которые подтвердили свою идентичность, прошли короткий тест и подписали кодекс этических норм и правил.

Более 75% участников наших исследований выбирают коллективное использование данных, по всей видимости, чтобы максимизировать шансы исследователей найти путь, который поможет им и им подобным. Нашему подсчету мешает тот факт, что мы наблюдаем людей, которые уже участвуют в клинических исследованиях. Но в 2015 году при проведении более общего популяционного исследования в США с помощью National Public Radio, 53% опрошенных сказали, что они были бы готовы к анонимному обмену данными с профессионалами в области здравоохранения (см. go.nature. com/29qr0b7). Если даже 5% населения США пожертвует науке копию данных о состоянии здоровья — это будет революционным прорывом. В конце концов, крупными сдвигами в компьютерной индустрии во всем мире управляет лишь небольшое число программистов, создающих программное обеспечение с открытым исходным кодом.

В целом, это движение не отличается от окружающих, оно необходимо, чтобы открыть людям глаза на то, как используются их данные и осветить то, как они могут быть использованы в будущем. В США это было объединённое лоббирование небольших групп активистов в 1960-х и 1970-х годах: они были обеспокоены разными причинами, и это привело к ряду новаторских федеральных инициатив, таких как закон о чистом воздухе и создание агентства охраны окружающей среды. Точно также среди доноров данных могут быть преимущественно те, кто делают это из каких-то личных побуждений, или те, кто обмениваются данными о состоянии здоровья с философской точки зрения, например, будучи частью сообщества Quantified Self, целью которого является использование технологий для измерения всех аспектов нашей повседневной жизни. Такие ранние сторонники распространения данных, могли бы помочь изменить нормы, более четко осветив проблему согласия и повысив осведомленность о преимуществах.

Открытость не является лёгкой задачей. Должны быть разработаны многочисленные системы блокировки, в том числе и для защиты конфиденциальности, чтобы смягчить ущерб от некоторых моментов, ставших достоянием общественности, а также отсеять людей, которые не желают быть фенотипированы. Но если эра цифрового здравоохранения сопровождается исходящим от граждан стремлением к общей открытости, это не может просто ограничиться изменениями в сфере оказания медицинской помощи.

Слишком долго граждане всего мира были пешками системы здравоохранения, которые слепо следуют инструкциям лечащих врачей. А исследования, отслеживающие реакции на открытие глобальных программ наблюдения, показывают, что большинство людей смирились с идеей о том, что собственность и контроль личных данных несовместимы с эпохой интернета.

Тем не менее, так же, как социальные сети за последние десять лет произвели фурор по всему земному шару, всемирный ресурс знаний вскоре может быть использован для того, чтобы определить наилучший курс лечения индивидуума на основе опыта миллионов. Этот ресурс никогда не будет создан, если каждый из нас не возьмет на себя ответственность за собственное здоровье и болезни, а также за информацию, которую мы можем оставить о себе. Когда дело доходит до контроля наших персональных данных, данные о состоянии здоровья должны быть там, где мы проведем границу.

Оригинал

Перевод: Елена Лисицына

Редакция: Ирина Боровикова, Михаил Гусев

Изображения: Антон Осипенко

About The Author
editor