Йеспер Твейт,
Харальд Орлиен,
Сергей Плис и др.
JAMA Neurology 2023 Aug 1, Volume 80, Number 8, p805-812
Можно ли обучить модель искусственного интеллекта (ИИ) интерпретировать стандартные клинические электроэнцефалограммы (ЭЭГ) с точностью, эквивалентной точности специалистов?
В этом диагностическом исследовании на 30493 ЭЭГ была обучена модель искусственного интеллекта (SCORE-AI), вначале для того, чтобы отделять нормальные ЭЭГ от аномальных, а затем для классифицирования аномальных ЭЭГ как: ЭЭГ с фокальной эпилептиформной активностью, ЭЭГ с генерализованной эпилептиформной активностью, ЭЭГ с фокальными неэпилептиформными изменениями и ЭЭГ с диффузными неэпилептиформными изменениями. SCORE-AI была валидирована с использованием трех независимых наборов данных, состоящих из 9945 ЭЭГ, не использованных для обучения; SCORE-AI смогла достигнуть диагностической точности, подобной специалистам.
Результаты этого исследования позволяют предположить, что применение SCORE-AI может помочь улучшить качество помощи пациентам в районах, где экспертные навыки чтения ЭЭГ труднодоступны, а также для повышения эффективности и взаимосогласованности интерпретации ЭЭГ в специализированных центрах.
Актуальность
Электроэнцефалография является очень важным методом обследования в неврологии. Интерпретация электроэнцефалографии требует наличия специалистов с соответствующими знаниями и навыками, что, к сожалению, во многих уголках мира недоступно. У ИИ есть потенциал для удовлетворения этих потребностей. Ранее разработанные модели ИИ касаются лишь ограниченных аспектов интерпретации ЭЭГ, таких как отличие аномальной ЭЭГ от нормальной или выявление эпилептиформной активности. Необходима комплексная, полностью автоматизированная интерпретация стандартной ЭЭГ на основе искусственного интеллекта, подходящая для клинической практики.
Цель
Разработать и валидировать модель ИИ (Standardized Computer-based Organized Reporting of EEG—Artificial Intelligence [SCORE-AI]) с возможностью отличать аномальные ЭЭГ от нормальных и классифицировать аномальные ЭЭГ по категориям, важным для принятия клинических решений: ЭЭГ с фокальной эпилептиформной активностью, ЭЭГ с генерализованной эпилептиформной активностью, ЭЭГ с фокальными неэпилептиформными изменениями и ЭЭГ с диффузными неэпилептиформными изменениями.
Дизайн исследования
В этом многоцентровом исследовании диагностической точности была разработана и валидирована модель сверточной нейронной сети SCORE-AI с использованием ЭЭГ, записанных в период с 2014 по 2020 годы. Данные анализировались с 17 января 2022 года по 14 ноября 2022 года. Всего в набор данных для разработки, аннотированный 17 экспертами, было включено 30493 записи пациентов, направленных на ЭЭГ. В набор данных разработки включались ЭЭГ пациентов в возрасте старше 3 месяцев на момент записи ЭЭГ, не находившихся в критическом состоянии. SCORE-AI была валидирована с использованием трех независимых наборов тестовых данных: многоцентрового набора данных из 100 репрезентативных ЭЭГ, оцененных 11 экспертами, одноцентрового набора данных из 9785 ЭЭГ, оцененных 14 экспертами, а также для сравнения с ранее опубликованными моделями ИИ — набор данных из 60 ЭЭГ с внешним эталонным стандартом. Ни один пациент, отвечающий критериям отбора, не был исключен.
Основные конечные точки и параметры
Диагностическая точность, чувствительность и специфичность работы SCORE-AI по сравнению с оценкой экспертов и внешним эталонным стандартом обычных клинических эпизодов пациентов, записанных во время видео-ЭЭГ.
Результаты
Характеристики наборов данных ЭЭГ: набор данных для разработки (N = 30493; 14980 мужчин; средний возраст 25,3 года [95% ДИ, 1,3–76,2 года]), многоцентровой набор тестовых данных (N = 100; 61 мужчина; средний возраст 25,8 года [95% ДИ, 4,1–85,5 лет]), одноцентровой набор тестовых данных (N = 9785; 5168 мужчин; средний возраст 35,4 года [95% ДИ, 0,6–87,4 года]) и набор тестовых данных с внешним эталонным стандартом (N = 60; 27 мужчин; средний возраст 36 лет [95% ДИ, 3–75 лет]). SCORE-AI достигла высокой точности: площадь под ROC-кривой составляла от 0,89 до 0,96 для различных категорий нарушений на ЭЭГ, а производительность была аналогична таковой у людей-специалистов. Сравнительный анализ с тремя ранее опубликованными моделями ИИ ограничивался сравнением способности выявлять эпилептиформную активность. Точность SCORE-AI (88,3%; 95% ДИ, 79,2–94,9%) была значительно выше, чем у трех ранее опубликованных моделей (P < 0,001), и аналогична точности людей-специалистов.
Выводы и значимость
В этом исследовании SCORE-AI, полностью автоматизированно интерпретируя стандартные ЭЭГ, достигла уровня человека-эксперта. Применение SCORE-AI может улучшить диагностику и качество оказываемой медицинской помощи в регионах с недостатком экспертов в электроэнцефалографии, а также повысить эффективность и взаимосогласованность работы специализированных эпилептологических центров.
doi:10.1001/jamaneurol.2023.1645