Cуть предложения — изучение предметной области, анализ научной литературы, сравнение существующих подходов и разработку наиболее перспективного алгоритма. Проект ориентирован на использование нейросетевых архитектур и методов машинного обучения, а также традиционных алгоритмов обработки изображений для создания точного и надежного инструмента, который облегчит диагностику для врачей и улучшит качество медицинского обслуживания.
Введение
Данный проект ориентирован на исследование и разработку подходов для решения задачи детекции сосудистых окклюзий по данным КТ-ангиографии. Цель проекта заключается в изучении существующих методов и алгоритмов для автоматического выявления окклюзий, которые могут привести к инсультам. Результатом станет создание алгоритма, способного точно и надежно определять окклюзии, что облегчит диагностику для врачей и улучшит качество медицинского обслуживания. Решение включает использование передовых нейросетевых архитектур и методов машинного обучения, интегрированных с традиционными алгоритмами обработки изображений.
Клиент — СберМедИИ
Боль-Запрос
Высокая вероятность человеческой ошибки при анализе КТА.
→ Необходимость автоматизации процесса анализа изображений.
Длительное время анализа медицинских изображений.
→ Ускорение диагностики за счет применения новых технологий.
Недостаточная точность диагностики сосудистых окклюзий.
→ Разработка точных алгоритмов для сегментации и детекции.
Ограниченность существующих методов.
→ Внедрение передовых нейросетевых архитектур.
Высокие затраты на анализ медицинских данных.
→ Снижение затрат благодаря автоматизации и оптимизации.
Описание проекта
Проект посвящен разработке и внедрению методов автоматической сегментации сосудов и детекции окклюзий в данных КТ-ангиографии (КТА) с использованием нейросетевых архитектур и алгоритмов машинного обучения.
Цели проекта
- Изучение существующих методов: Анализ текущих подходов к детекции сосудистых окклюзий и выбор наиболее эффективных.
- Разработка моделей: Создание нейросетевых моделей для сегментации сосудов и обнаружения окклюзий.
- Подготовка данных: Создание размеченного набора данных из КТА-исследований для обучения и тестирования моделей.
- Оптимизация и тестирование: Настройка параметров моделей и оценка их эффективности на валидационных и тестовых данных.
- Практическая реализация: Внедрение разработанных алгоритмов в медицинскую практику для помощи врачам в диагностике.
Выполненные задачи
- Изучение предметной области: Проведен анализ научных статей и существующих подходов.
- Подготовка данных: Разметка 51 примера КТА-исследований.
- Разработка моделей сегментации: Реализованы модели на основе UNet.
- Обучение и тестирование: Обучение моделей на 3D тензорах, оценка по метрикам DICE и BCE.
- Разработка методов обнаружения окклюзий: Протестированы подходы 3D-сегментации, детекции и классификации кончиков сосудов.
- Оптимизация моделей: Настройка параметров обучения и функции потерь.
- Анализ результатов: Сбор отзывов врачей и анализ метрик качества.
- Предложения по улучшению: Рекомендации по увеличению данных и улучшению алгоритмов.
Длительность проекта
Общая длительность проекта — 1 год
Команда
- 1 Data Science Lead
- 2 Data Scientists
- 1 Project Manager
- Команда врачей (от заказчика)
Стоимость реализации проекта
Общая стоимость проекта составила ~ 10 млн
Решение
Схема решения
План исследования
В рамках проекта было выполнено следующее:
- Проведение анализа научных статей: Оценка существующих подходов к детекции окклюзий и коллатерального кровотока.
- Подготовка документации: Разработка документов с результатами анализа, описанием предложенного технического решения, качеством набора данных и характеристиками модели.
- Разработка требований к данным: Формат, структура и количество изображений для разметки.
- Сборка и валидация данных: Создание и проверка размеченного набора данных.
- Разработка скриптов: Создание скриптов для загрузки, обработки и трансформации изображений КТ.
- Разработка модели машинного обучения: Итеративное создание моделей для сегментации сосудов и детекции окклюзий.
- Оценка качества модели: Анализ работы моделей с использованием метрик IoU, DICE, mAP, Precision, Recall.
- Контейнеризация: Подготовка контейнеров с моделями и необходимым окружением для запуска и обучения.
Результат проекта
Сегментация сосудов
Архитектура модели: UNet
Для задачи сегментации сосудов по данным КТ-ангиографии была выбрана архитектура UNet. Эта архитектура, состоящая из 5 блоков в энкодере и декодере, позволяет эффективно выделять сосуды на медицинских изображениях.
Параметры обучения:
- Число эпох: 600
- Learning rate: 1e-4
- Алгоритм оптимизации: Adam
- Функция потерь: DiceLoss
Метрики качества:
Комментарии врачей:
- Модель хорошо работает с крупными сосудами.
- Проблемы наблюдаются в местах изгибов сосудов и устьях ВСА.
- Частые ошибки в местах близости сосудов и костей.
Обнаружение окклюзий
Для задачи обнаружения окклюзий сосудов использовались различные подходы машинного обучения. Были рассмотрены следующие методы:
1) 3D-сегментация окклюзий
— Learning rate: 1e-4
— Алгоритм оптимизации: Adam
— Mean Dice = 0.030
- Архитектура: Unet
- Параметры обучения
— Learning rate: 1e-4
— Алгоритм оптимизации: Adam
- Метрики:
— Mean Dice = 0.030
- Выводы: Низкие значения метрик указывают на недостаточную способность модели к детектированию окклюзий.
2) Детекция окклюзий (object detection)
— Learning rate: 1e-2
— Алгоритм оптимизации: Nesterov momentum SGD
— Функция потерь: Focal Loss
— mAP:0.1_0.5_0.05 = 0.02
- Архитектура: RetinaNet
- Параметры обучения:
— Learning rate: 1e-2
— Алгоритм оптимизации: Nesterov momentum SGD
— Функция потерь: Focal Loss
- Метрики:
— mAP:0.1_0.5_0.05 = 0.02
- Выводы: Модель показала явное переобучение под фоновый класс, что привело к низким результатам.
3) Классификация кончиков сосудов
— Learning rate: 1e-4
— Алгоритм оптимизации: Adam
— Функция потерь: CrossEntropyLoss
— Precision = 0.612
— Recall = 0.51
— F1-Score = 0.556
- Архитектура: DenseNet121
- Параметры обучения:
— Learning rate: 1e-4
— Алгоритм оптимизации: Adam
— Функция потерь: CrossEntropyLoss
- Метрики:
— Precision = 0.612
— Recall = 0.51
— F1-Score = 0.556
- Выводы: Смещение модели под нулевой класс задачи из-за сильного дисбаланса в данных.
Анализ качества работы
Алгоритм оценки качества: Качество обучения моделей оценивалось при помощи метрики DICE. Финальная функция потерь представляла собой комбинацию Dice Loss и Binary Cross Entropy Loss.
Выводы:
- Сегментация сосудов: Модель демонстрирует способность к сегментации сосудов, что подтверждается высокими значениями метрик и положительными отзывами врачей.
- Обнаружение окклюзий: Текущие методы не обеспечивают достаточного качества для практического применения и требуют дополнительных данных и улучшений алгоритмов.
- Комбинированный подход: Использование классических алгоритмов компьютерного зрения и нейросетевого классификатора показало перспективные результаты, что указывает на необходимость дальнейших исследований и экспериментов.
Пример работы модели сегментации сосудов
Предложения по улучшению:
- Увеличение количества тренировочных данных.
- Использование аугментации данных.
- Применение других архитектур нейросетей.
- Тонкая настройка параметров обучения.
- Новые подходы с использованием операций компьютерного зрения на пост- и препроцессинге данных.
Пример сегментации модели по итерации 2
(красная маска — прогноз модели, зелёная — разметка от врачей)
(красная маска — прогноз модели, зелёная — разметка от врачей)
Релевантность
- Медицинская значимость: Автоматическое выявление сосудистых окклюзий помогает в быстрой и точной диагностике инсультов и других сосудистых заболеваний, что может значительно улучшить исход лечения и спасти жизни.
- Технологическая инновация: Проект применяет передовые нейросетевые архитектуры и методы машинного обучения, что способствует развитию технологий в области медицинской визуализации.
- Практическая польза: Внедрение алгоритмов сегментации и детекции облегчает работу врачей, позволяя им быстрее и точнее анализировать медицинские изображения, что повышает эффективность и качество медицинского обслуживания.
- Научный вклад: Исследование и разработка новых подходов к сегментации и детекции сосудов способствуют развитию научного сообщества, предоставляя новые данные и методы для дальнейших исследований и разработок.
Преимущества продукта
- Точность диагностики: Автоматическое выявление окклюзий улучшает точность и скорость диагностики, снижая вероятность человеческой ошибки.
- Сокращение времени анализа: Врачи получают 3D-карту сосудов, что позволяет быстрее обнаруживать отклонения и принимать решения.
- Использование передовых технологий: Применение современных нейросетевых архитектур и методов машинного обучения для решения сложных медицинских задач.
- Улучшение качества лечения: Быстрая и точная диагностика окклюзий сосудов способствует более эффективному лечению пациентов.
- Научный вклад: Разработка новых методов и алгоритмов в области медицинской визуализации и диагностики.
- Экономическая эффективность: Сокращение времени и ресурсов, затрачиваемых на анализ медицинских изображений, снижает затраты на медицинское обслуживание.
Дополнительные материалы
ДВЕ ОККЛЮЗИИ С РАЗНЫХ СТОРОН:
ОТСУТСТВИЕ ОККЛЮЗИИ:
Модель не нашла ни одной окклюзии и в этом полностью совпала с ground truth.
Подробнее о кейсе рассказали на вебинаре.