Дерматология - это область с растущим взаимодействием цифровизации, телемедицины и информатики. Растущее присутствие ИИ во всем мире привело к многочисленным попыткам использовать эту технологию для дерматологических применений. В недавнем международном опросе 1271 дерматологов 85,1% респондентов были осведомлены об ИИ как новой теме в своей области, но только 23,8% имели хорошие или отличные знания по этому вопросу. Кроме того, 77,3% согласились с тем, что ИИ позволит улучшить дерматологическую помощь, а 79,8% считали, что ИИ должен быть частью медицинской подготовки. Информирование заинтересованных сторон о текущей позиции ИИ, таким образом, необходимо для содействия тому, что сами дерматологи считают растущим, полезным и потенциально обязательным аспектом этой области. На сегодняшний день существует множество публикаций по конкретным темам ИИ в дерматологии, но лишь немногие из них дают базовый обзор и затрагивают широкий круг вопросов. В данной статье мы обобщаем состояниелитературы по ИИ в дерматологии, используя три раздела. Во-первых, мы выделяем типы статей, опубликованных по этой теме. Затем мы сосредотачиваемся на дерматологических заболеваниях, нацеленных на ИИ, и, наконец, мы обращаем внимание на выявленные барьеры, препятствующие внедрениюИИ.
Подавляющее большинство статей, опубликованных на сегодняшний день, являются оригинальными научными статьями. Они описывают дизайн программ ИИ, которые могут выполнять задачи, связанные с дерматологией. Например, в статьях были изучены инструменты, которые могут распознавать псориазное поражение или дифференцировать доброкачественные и злокачественные поражения кожи. Хотя эти инструменты ИИ еще не были внедрены клинически, в этих работах описана их технологическая осуществимость и определена потенциальная клиническая значимость в случае их дальнейшей валидации. Часть из этих исследований являются плодами сотрудничества инженеров и дерматологов. Несмотря на то, что число этих исследований растет, только небольшое число работ связано с тесным сотрудничеством с дерматологами в области замысла, разработки и интерпретации исследований. Для преодоления известных барьеров на пути клинического внедрения ключевое значение имеет партнерство с дерматологами. Zakhem и др. подчеркнули в своем недавнем обзоре программ для скрининга меланомы, что когда в дизайн исследования были вовлечены дерматологи, программы ИИ использовали значительно большие наборы данных пациентов, которые были более репрезентативными для истинных клинических сценариев. Еще одной важной формой сотрудничества является проведение проспективных клинических исследований, и их существует очень мало. Одно знаковое исследование было проведено Dreiseitl и др.. , в котором пациенты с недиагностированными пигментными поражениями представлялись в дерматологическую клинику и оценивались отдельно как неэкспертными врачами с использованием устройства ИИ, так и экспертными дерматологами. Таким образом, дизайн исследования напоминал реалистичный сценарий клинической практики. Полученные результаты свидетельствуют о неполноценности автоматизированной системы, и, к сожалению, до настоящего времени подобных исследований опубликовано не было. Остается неясным, является ли отсутствие подобных исследований предвзятостью публикаций или пробелом в литературе.
В настоящее время существует небольшое число систематических обзоров. Большинство из них охватывают потенциальное использование ИИ для дифференциации доброкачественных и злокачественных поражений кожи. Например, в исследованиях были рассмотрены особенности и чувствительность инструментов ИИ для скрининга меланомы. Насколько нам известно, только один систематический обзор был опубликован по дерматологическим приложениям ИИ в целом, не ограничиваясь неопластическими поражениями.
Существует большое количество комментариев на тему ИИ в дерматологии. В этих документах либо освещается потенциальное воздействие ИИ, либо подчеркиваются проблемы его осуществления.
Существует обильное и растущее количество исследований, демонстрирующих предварительный успех применения ИИ при различении доброкачественных невусах и меланомах. Основной принцип, лежащий в основе этих приложений, заключается в том, что дерматоскопические или недерматоскопические изображения повреждений могут быть разбиты на отдельные пиксели для анализа. Показательный пример Jafariи др. описывает программу, которая анализирует изображения пиксель за пикселем и извлекает 60 признаков из каждого, чтобы спрогнозировать классификацию заболеваний. Эти приложения обычно проверяются путем сравнения их способности правильно диагностировать повреждения со способностью сертифицированных дерматологов. Один обзор заявок на распознавание фотографий от Safran и др. включал 48 инструментов для скрининга меланомы и продемонстрировал среднюю чувствительность 87,60% и среднюю специфичность 83,54%. Интерес к этой теме вырос до такой степени, что в 2016 году был проведен Международный конкурс по визуализации кожи, который с тех пор проводится ежегодно.Хотя эти программы стали более надежными, но клинические испытания проводятся редко, при том, что существующие барьеры для внедрения постоянно обсуждаются.
Все большее число оригинальных исследований также начали классифицировать немеланомные раки кожи (также известные как кератиноцитарные карциномы) в сравнении с доброкачественными и предраковыми поражениями. Например, Spyridonos и др. разработали модель ИИ, которая способна дифференцировать актинический кератоз и нормальную кожу со специфичностью 89,8% и чувствительностью 91,7%. В целом, исследования на тему кожи демонстрируют технологическую целесообразность, а также доказывают клиническую полезность. Остается продемонстрировать, что можно применять такие инструменты и полагаться на них в повседневной клинической практике.
ИИ также использовался не только для распознавания фотографий. Вместо обработки пикселей изображения программы также могут обрабатывать числовые значения в различных последовательностях. Например, Tan и др. описали программу, которая предсказывала степень сложности микрографического хирургического вмешательства по шкале Мооса на основе имеющихся данных, оцененных при первом визите пациента, таких как размер опухоли и возраст пациента. Они смогли создать предварительную модель, которую теоретически можно было бы использовать для сортировки пациентов и определения приоритетности хирургического вмешательства по шкале Мооса. Хотя большая часть исследований ИИ в области диагностики рака кожи основана на алгоритмах распознавания фотографий, существуют и другие возможности.
Растет число исследований по применению ИИ в области диагностики диабетических и других язв. Таким образом, до настоящего времени большинство исследований демонстрируют методы улучшения оценки ран с использованием распознавания изображений.
В статьях описаны программы, способные измерять точные границы ран и различать типы вовлеченных тканей. Например, Dhane и др. продемонстрировали способность программы ИИ различать область плохо выраженных язв с чувствительностью 87,3% и специфичностью 95,7%. Mukerjee и др. продемонстрировали способность ИИ классифицировать грануляцию, корки и некротическую ткань с точностью 87,61%.Существуют также инструменты прогнозирования рисков. Alderden и др. описали инструмент, который использует данные в электронных записях о здоровье госпитализированных пациентов, чтобы предсказать их склонность к развитию пролежневых язв. В целом, эти программы предварительно были показаны как технологически осуществимые, но еще не были широко проверены в клинических испытаниях.
Существует несколько оригинальных научных статей, посвященных применению ИИ при воспалительных дерматозах.Большинство этих исследований до сих пор были сосредоточены на совершенствовании методов классификации псориаза с использованием распознавания изображений.Показательным примером является исследование, проведенное Shrivasta и др., в котором сравнивались возможности нескольких программ для классификации степени тяжести псориаза.Описанные системы достигали средней чувствительности в пределах 93,81-99,76% и средней специфичности в пределах 97-99,99%.
Emam и др. описали программу для псориаза, не использовавшую распознавания изображений.Они продемонстрировали способность системы предсказывать реакцию пациентов с псориазом на биологическую терапию с использованием параметров, измеренных при первоначальном посещении, таких как вес пациента и возраст начала псориаза. Они смогли создать предварительную модель, которую теоретически можно было бы использовать для оптимизации терапии пациентов.
Помимо псориаза, были описаны программы, диагностирующие акне, красный плоский лишай и дерматомиозит. Seite и др. разработали инструмент ИИ для смартфонов, который оценивает и различает типы поражений акне (например, комедональные, воспалительные, поствоспалительная гиперпигментация и т. д.). Huang и др. разработали мультиклассификатор заболеваний, который может анализировать 34 признака (например, эритема, шелушение, площадь высыпаний, определенные границы и т. д.) и дифференцировать несколько папулосквамозных заболеваний, таких как псориаз, себорейный дерматит, красный плоский лишай, розовый питириаз и хроническую экзему.
Хотя большинство этих экспериментов опирались на изображения кожи, в одной из программ оценивались ультразвуковые изображения мышц и проводилось дифференцирование между нормальной мышцей, дерматомиозитом, полимиозитом и миозитом с точностью 76,2 - 86,6%. В целом, теоретическая полезность этих программ для воспалительных заболеваний значительна, необходимы как дальнейшие технологические проверки, так и клинические эксперименты.
Проводятся также исследования по использованию ИИ для сведения к минимуму воздействия на кожу сенсибилизирующих веществ. Показателен пример Zang и др., описавших программу, способную анализировать физико-химические свойства веществ ( например, температуру плавления) и определять, может ли это вещество быть сенсибилизатором или нет. Программа продемонстрировала точность 81% когда вещества были изучены в людской когорте. Wilm и др. проанализировали текущие достижения в области тестирования сенсибилизации кожи и выделили ряд других примеров, где ИИ предоставил метод, позволяющий сократить тестирование на животных. Необходимы значительные технологические и клинические валидационные исследования.
Описаны программы, позволяющие автоматизировать обработку и классификацию гистологических изображений.Например, Arevalo и др. описали систему, которая анализирует гистопатологические изображения и может классифицировать базально-клеточный рак с точностью 98,1%.Olsen и др. описана система, которая диагностировала дермальные невусы и себорейный кератоз с высокой точностью и может служить в будущем методом повышения эффективности анализа этих распространенных доброкачественных опухолей. Также были описаны алгоритмы, позволяющие идентифицировать прогностические гены и биомаркеры. Reimann и др. описали модель ИИ, способную диагностировать обыкновенный псориаз на основе уровня экспрессии 4 генов с точностью 96,4%.В другом исследовании, оценивающем генетические различия в генотипах псориаза, Patrick и др. использовали комбинацию статистического и машинного обучения для выявления новых локусов и прогнозирования склонности пациентов с псориазом к развитию симптомов псориатического артрита.Хотя эти исследования находятся на ранней стадии, потенциал их воздействия может быть значительным.
Алгоритмы ИИ постоянно разрабатываются, и каждый из них имеет свои преимущества и проблемы. Beam и др. подробно описывают, как прогнозирующие технологии могут рассматриваться в спектре машинного обучения. Статистические модели менее предпочтительны из-за вмешательства людей, вводящих предположения и влияющих на многие аспекты алгоритма.Истинное машинное обучение является наиболее предпочтительным, потому что алгоритмы развиваются без участия человека. Систематический обзор Christodoulou и др. не обнаружил никакого объективного преимущества машинного обучения по сравнению с продольной регрессией для бинарного клинического прогноза.Однако в обзоре суммируются различные теоретические причины, по которым машинное обучение может превосходить продольную регрессию в некоторых случаях, таких как обработка данных с сильным отношением сигнал / шум (например, почерк) или со значительным числом подкатегорий предикторов (например, изображения).Поэтому остается много нерешенных вопросов относительно того, действительно ли необходимы продвинутые формы ИИ или же более примитивные технологии могут выполнять те же самые задачи.
Одним из основных ограничений для ИИ является то, что решения, принимаемые этими технологиями, в конечном счете являются отражением входных данных, используемых для обучения системы.Это теоретически означает, что приложения могут быть надежно использованы только в популяциях, которые они были обучены оценивать. Если приложения обучаются в одной популяции и тестируются в другой, результаты технически не являются обобщаемыми и подвержены систематическим искажениям, таким как чрезмерная подгонка.Например, Han и др. экспериментировали с алгоритмом обнаружения рака кожи и пришли к выводу, что общая производительность может быть улучшена, если ИИ обучать с большим разнообразием данных из нескольких этнических групп. Однако простое использование большего количества данных не обязательно решает эту проблему.Например, Navarrete-Dechent и др. вместе с Han и др. создали алгоритм для ИИ, который был обучен с относительно разнообразным набором данных и протестировали его в уникальной базе данных американцев европейского происхождения из южной части Соединенных Штатов. Они обнаружили, что производительность была ниже оптимальной по сравнению с первоначальной. Таким образом, вопрос об обобщаемости не является простым для решения и может потребовать либо уникальных, либо расширенных данных в зависимости от состава тестируемой популяции. Эта тенденция к систематической предвзятости имеет многочисленные последствия для дерматологии, учитывая различные демографические факторы, влияющие на постановку диагноза, такие как возраст, пол, раса, этническая принадлежность и многие другие.
Даже если программа обучается с использованием данных из правильной популяции, изображения новых поражений должны быть сопоставимы.Под каким углом следует снимать изображение? Какое освещение должно быть в комнате? Каким должен быть фон? Есть ли маркировка? Это факторы, которые могут повлиять на принятие решений ИИ.Например, исследование Winkler и др. показало, что следы хирургического вмешательства значительно затрудняли способность системы правильно диагностировать дерматоскопические изображения меланомы и повышали частоту ложноположительных результатов. ИИ опирается на стандартизацию, но в отличие от других специальностей (например, радиологии) в дерматологии существует множество нестандартизированных аспектов. Хотя базы данных намеренно велики для учета изменчивости, такие факторы создают бесконечную возможность для расхождений.
Для подпитки алгоритмов ИИ необходимо большое количество данных надлежащего качества. В Соединенных Штатах усиливаются попытки преодолеть этот барьер с помощью электронной системы регистрации здоровья Американской академии дерматологии DataDerm.Для достижения идеального сценария, в котором представлены все необходимые категории данных, вероятно, потребуется международное сотрудничество.
Алгоритмы ИИ формируются, переоцениваются и постоянно меняются без участия человека.Именно поэтому эту технологию часто называют технологией "черного ящика". Хотя ИИ поэтому является гибким и теоретически может достичь большего, чем человек и управляемые человеком статистические алгоритмы, многие аспекты и, конечно же, логика принятия решений часто не поддаются интерпретации.Когда сертифицированный дерматолог проводит персонализированную оценку и приходит к заключению, это заключение можно рационализировать и объяснить на основании существующих клинических данных. В настоящее время решения, принимаемые ИИ, не могут быть истолкованы подобным образом. Это серьезное ограничение, которое влияет на то, будут ли общество и регулирующие органы принимать его в повседневной медицинской практике.
Надлежащий анамнез с последующим физикальным осмотром в хорошо освещенной комнате, с оценкой текстуры и выявлением специфических для данного поражения признаков, дополненные дополнительными исследованиями / визуализацией или биопсией являются стандартным способом установления диагноза в дерматологии.Кроме того, считается, что, хотя некоторые диагнозы являются клиническими, другие основываются исключительно на гистологических данных или комбинации клинических и гистологических результатов. Этот целостный подход не может быть полностью заменен компьютерными программами, и это считается одним из наиболее важных препятствий для внедрения ИИ.Многие пациенты также желают живого контакта с врачом, который нацелен на оказание им помощи и могут быть не удовлетворены изолированными компьютеризированными инструментами.
Существует также вопрос об ответственности. Если понадеяться на ИИ и возникает неблагоприятный исход, является ли дерматолог ответственным? Имея это в виду, общепринятое мнение заключается в том, что ИИ станет только инструментом руководства, а не абсолютным диагностическим инструментом.
Для устранения этих препятствий на сегодняшний день было вынесено несколько широких рекомендаций. Одна из очевидных потребностей - это проспективные клинические испытания. Если вопрос заключается в том, может ли ИИ улучшить дерматологическую клиническую практику, то исследования, которые вращаются вокруг клинической практики, имеют решающее значение. Сотрудничество с дерматологами также было признано необходимым. Системы должны быть обучены с полным спектром человеческих популяций и различных клинических случаев, вызывающих затруднения. Системы могут также извлечь выгоду из получения данных по другим показателям, доступным для врачей, таким как анатомическое расположение, длительность поражения и изображения интактной кожи.Кроме того, необходимо внедрить практику стандартизации для фотографирования новых очагов поражения.Наконец, учитывая недостаточную интерпретируемость многих программ ИИ, мы выдвигаем гипотезу о том, что улучшение непрофессиональных описаний алгоритмов и схем исследований может привести к улучшению восприятия их врачами и обществом в целом.Это также помогло бы лицам, принимающим регулирующие решения, занять определенную позицию в отношении ответственности.
ИИ все чаще изучается в дерматологии. Хотя большинство приложений включает в себя анализ и классификацию изображений, существуют и другие инструменты, такие как калькуляторы оценки рисков.Наибольший прогресс к настоящему времени достигнут в области диагностики меланомы, за которой следуют инструменты для оценки язв и псориаза, а затем многочисленные менее часто изучаемые программы. Однако существуют критические барьеры и пробелы в литературе, которые значительно ограничивают применимость ИИ в клинической практике в настоящее время.Что касается менее распространенных систем, то для улучшения возможностей и повышения интереса к ним необходимы технические документы и комментарии.Для более насыщенных тем существует большая потребность в клинических испытаниях, обеспечивающих доказательства клинической эффективности при успешном преодолении выявленных барьеров. Соответствующая роль ИИ в дерматологии может быть достигнута с учетом этих исследовательских целей.
Artificial Intelligence Applications in Dermatology: Where Do We Stand? Аннотация на английском языке:
Artificial intelligence (AI) has become a progressively prevalent Research Topic in medicine and is increasingly being applied to dermatology. There is a need to understand this technology's progress to help guide and shape the future for medical care providers and recipients. We reviewed the literature to evaluate the types of publications on the subject, the specific dermatological topics addressed by AI, and the most challenging barriers to its implementation. A substantial number of original articles and commentaries have been published to date and only few detailed reviews exist. Most AI applications focus on differentiating between benign and malignant skin lesions, however; others exist pertaining to ulcers, inflammatory skin diseases, allergen exposure, dermatopathology, and gene expression profiling. Applications commonly analyze and classify images, however, other tools such as risk assessment calculators are becoming increasingly available. Although many applications are technologically feasible, important implementation barriers have been identified including systematic biases, difficulty of standardization, interpretability, and acceptance by physicians and patients alike. This review provides insight into future research needs and possibilities. There is a strong need for clinical investigation in dermatology providing evidence of success overcoming the identified barriers. With these research goals in mind, an appropriate role for AI in dermatology may be achieved in not so distant future.
Ключевые слова на английском языке
Запись в Medline
|