Откакто IBM Watson стартира през 2007 г., хората непрекъснато се стремят към разработването на медицински изкуствен интелект (ИИ). Една използваема и мощна медицинска система с ИИ има огромен потенциал да промени всички аспекти на съвременната медицина, като позволи по-интелигентни, по-точни, ефикасни и приобщаващи грижи, осигурявайки благополучие на медицинските работници и пациентите и по този начин значително подобрявайки човешкото здраве. През последните 16 години, въпреки че изследователите в областта на медицинския ИИ са се натрупали в различни малки области, на този етап те все още не са успели да превърнат научната фантастика в реалност.
Тази година, с революционното развитие на технологиите за изкуствен интелект, като ChatGPT, медицинският изкуствен интелект постигна голям напредък в много аспекти. Безпрецедентен пробив в възможностите на медицинския изкуствен интелект: Списание Nature непрекъснато стартира изследванията на медицинския голям езиков модел и основния модел на медицинско изображение; Google пуска Med-PaLM и неговия наследник, достигайки експертно ниво по въпросите на изпита за медицински специалисти в САЩ. Големи академични списания ще се фокусират върху медицинския изкуствен интелект: Nature публикува перспективата за основния модел на общия медицински изкуствен интелект; След серия от прегледи на изкуствения интелект в медицината по-рано тази година, New England Journal of Medicine (NEJM) публикува първия си дигитален здравен преглед на 30 ноември и пусна първия брой на под-списанието на NEJM NEJM AI на 12 декември. Почвата за кацане на медицинския изкуствен интелект е допълнително узряла: Под-списанието JAMA публикува глобалната инициатива за споделяне на медицински данни за изображения; Американската агенция по храните и лекарствата (FDA) разработва проект на насоки за регулиране на медицинския изкуствен интелект.
По-долу разглеждаме значителния напредък, който изследователи по целия свят са постигнали в посока на използваем медицински изкуствен интелект през 2023 г.
Основен модел на медицинския изкуствен интелект
Изграждането на основен модел на медицинския изкуствен интелект несъмнено е най-горещият фокус на изследванията тази година. През годината списанията Nature публикуваха обзорни статии за Универсалния основен модел на здравеопазване и модела на здравеопазването, базиран на големи езици. Medical Image Analysis, водещото списание в индустрията, направи преглед и очаква с нетърпение предизвикателствата и възможностите на изследванията на основни модели в анализа на медицински изображения и предложи концепцията за „родословие на основен модел“, за да обобщи и насочи развитието на изследванията на основни модели в медицинския изкуствен интелект. Бъдещето на основните модели на изкуствен интелект за здравеопазването става все по-ясно. Въз основа на успешните примери на модели на големи езици като ChatGPT, използвайки по-усъвършенствани методи за самоконтролирано предварително обучение и огромно натрупване на данни за обучение, изследователите в областта на медицинския изкуствен интелект се опитват да изградят 1) специфични за заболяването базови модели, 2) общи базови модели и 3) мултимодални големи модели, които интегрират широк спектър от режими с масивни параметри и превъзходни възможности.
Модел с изкуствен интелект за събиране на медицински данни
В допълнение към големите модели с изкуствен интелект, които играят голяма роля в задачите за анализ на клинични данни надолу по веригата, в процеса на получаване на клинични данни нагоре по веригата се появи и технологията, представена от генеративни модели с изкуствен интелект. Процесът, скоростта и качеството на получаване на данни могат да бъдат значително подобрени чрез алгоритми с изкуствен интелект.
По-рано тази година, Nature Biomedical Engineering публикува проучване от турския университет Straits, което се фокусира върху използването на генеративен изкуствен интелект за решаване на проблема с патологичната диагностика с помощта на изображения в клинични приложения. Артефактите в замразената тъкан от срези по време на операция са пречка за бързата диагностична оценка. Въпреки че тъканта, вградена във формалин и парафин (FFPE), осигурява проба с по-високо качество, процесът на нейното производство е времеемък и често отнема 12-48 часа, което я прави неподходяща за използване в хирургията. Поради това изследователският екип предложи алгоритъм, наречен AI-FFPE, който може да направи външния вид на тъканта в замразената срез подобен на FFPE. Алгоритъмът успешно коригира артефактите на замразените срези, подобри качеството на изображението и същевременно запази клинично значимите характеристики. При клинично валидиране, алгоритъмът AI-FFPE значително подобрява диагностичната точност на патолозите за туморни подтипове, като същевременно значително съкращава времето за клинична диагноза.
Cell Reports Medicine съобщава за изследователска работа на екип от Трети клиничен колеж на университета Джилин, катедрата по радиология, болницата Zhongshan, свързана с университета Фудан, и Шанхайския университет за наука и технологии [25]. Това проучване предлага универсална рамка за дълбоко обучение и итеративно реконструиране (Hybrid DL-IR) с висока гъвкавост и гъвкавост, показваща отлична производителност при реконструкция на изображения при бърз ЯМР, нискодозова КТ и бърз ПЕТ. Алгоритъмът може да постигне многосеквенционно сканиране на един орган в ЯМР за 100 секунди, да намали дозата на радиация до само 10% от КТ изображението и да елиминира шума, като може да реконструира малки лезии от ПЕТ получаване с 2 до 4 пъти ускорение, като същевременно намалява ефекта от артефактите от движение.
Медицински изкуствен интелект в сътрудничество с медицински работници
Бързото развитие на медицинския изкуствен интелект накара медицинските специалисти сериозно да обмислят и проучат как да си сътрудничат с изкуствен интелект за подобряване на клиничните процеси. През юли тази година DeepMind и мултиинституционален изследователски екип съвместно предложиха система с изкуствен интелект, наречена Complementary Driven Clinical Workflow Delay (CoDoC). Диагностичният процес първо се диагностицира от предсказваща система с изкуствен интелект, след което се оценява от друга система с изкуствен интелект въз основа на предишния резултат и ако има съмнение, диагнозата окончателно се поставя от клиницист, за да се подобри точността на диагностиката и да се балансира ефективността. Що се отнася до скрининга за рак на гърдата, CoDoC намали процента на фалшиво положителни резултати с 25% при същия процент на фалшиво отрицателни резултати, като същевременно намали натоварването на клиницистите с 66%, в сравнение с настоящия процес на „двойно четене на арбитраж“ във Великобритания. По отношение на класификацията на туберкулозата, процентът на фалшиво положителни резултати беше намален с 5 до 15% при същия процент на фалшиво отрицателни резултати в сравнение с независимия изкуствен интелект и клиничните работни процеси.
По подобен начин, Ани Й. Нг и др. от Kheiron Company в Лондон, Великобритания, въведоха допълнителни AI четци (в сътрудничество с човешки експерти), за да преразгледат резултатите, когато няма резултати от повторно отчитане в процеса на арбитраж на двойно четене, което подобри проблема с пропуснатото откриване при ранен скрининг за рак на гърдата и процесът почти не даде фалшиво положителни резултати. Друго проучване, ръководено от екип от Медицинския факултет Макговърн към Тексаския университет и проведено в четири центъра за инсулт, приложи AI технология, базирана на компютърна томографска ангиография (CTA), за автоматизиране на откриването на голям съдов оклузивен исхемичен инсулт (LVO). Клиницистите и рентгенолозите получават известия в реално време на мобилните си телефони в рамките на минути след завършване на CT изображението, уведомявайки ги за евентуалното наличие на LVO. Този AI процес подобрява работните процеси в болницата при остър исхемичен инсулт, намалявайки времето от вратата до слабините от приемането до лечението и предоставяйки възможности за успешно спасяване. Констатациите са публикувани в JAMA Neurology.
Модел на здравеопазване с изкуствен интелект за всеобща полза
През 2023 г. ще се появи и много добра работа, използваща медицински изкуствен интелект, за да открие характеристики, невидими за човешкото око, от по-леснодостъпни данни, което ще позволи универсална диагностика и ранен скрининг в голям мащаб. В началото на годината Nature Medicine публикува проучвания, проведени от Очния център Zhongshan към университета Sun Yat-sen и Втората свързана болница към Медицинския университет Fujian. Използвайки смартфони като терминали за приложения, те използваха видео изображения, подобни на анимационни филми, за да индуцират погледа на децата и да запишат поведението на погледа и чертите на лицето на децата, и допълнително анализираха анормални модели, използвайки модели на дълбоко обучение, за да идентифицират успешно 16 очни заболявания, включително вродени катаракти, вродена птоза и вродена глаукома, със средна точност на скрининг над 85%. Това осигурява ефективни и лесни за популяризиране технически средства за мащабен ранен скрининг на нарушения на зрителните функции при кърмачета и свързани с тях очни заболявания.
В края на годината, Nature Medicine съобщи за работа, извършена от повече от 10 медицински и изследователски институции по света, включително Шанхайския институт по панкреатични заболявания и Първата филиална болница на университета Zhejiang. Авторът е приложил изкуствен интелект за скрининг на рак на панкреаса при асимптоматични хора в центрове за физически прегледи, болници и др., за да открие характеристиките на лезиите в обикновени компютърни томографски изображения, които са трудни за откриване само с невъоръжено око, така че да се постигне ефективно и неинвазивно ранно откриване на рак на панкреаса. При преглед на данни от повече от 20 000 пациенти, моделът е идентифицирал и 31 случая на клинично пропуснати лезии, което значително е подобрило клиничните резултати.
Споделяне на медицински данни
През 2023 г. по света се появиха много по-съвършени механизми за споделяне на данни и успешни случаи, осигуряващи многоцентрово сътрудничество и отвореност на данните, при условие че защитават поверителността и сигурността на данните.
Първо, с помощта на самата технология за изкуствен интелект, изследователите на изкуствен интелект допринесоха за споделянето на медицински данни. Ци Чанг и други от университета Рутгерс в Съединените щати публикуваха статия в Nature Communications, предлагайки федерална рамка за обучение DSL, базирана на разпределени синтетични състезателни мрежи, която използва генеративен изкуствен интелект за обучение на специфични генерирани данни от многоцентрове и след това замества реалните данни от многоцентрове с генерираните данни. Осигуряване на обучение на изкуствен интелект въз основа на големи данни от многоцентрове, като същевременно се защитава поверителността на данните. Същият екип също така предостави с отворен код набор от данни от генерирани патологични изображения и съответните им анотации. Моделът на сегментиране, обучен върху генерирания набор от данни, може да постигне подобни резултати като реалните данни.
Екипът на Дай Ционгхай от университета Цинхуа публикува статия за npj Digital Health, предлагайки Relay Learning (релейно обучение), което използва големи данни от множество обекти за обучение на модели с изкуствен интелект, при условие че е налице локален суверенитет на данните и липса на междусайтова мрежова връзка. То балансира съображенията за сигурност и поверителност на данните с преследването на висока производителност на изкуствения интелект. Впоследствие същият екип съвместно разработи и валидира CAIMEN, система за диагностика на пан-медиастинални тумори на гръдния кош, базирана на федерално обучение, в сътрудничество с Първата свързана болница към Медицинския университет в Гуанджоу и 24 болници в цялата страна. Системата, която може да се приложи към 12 често срещани медиастинални тумора, постигна 44,9% по-добра точност, когато се използва самостоятелно, отколкото когато се използва само от човешки експерти, и 19% по-добра точност на диагнозата, когато човешки експерти бяха подпомогнати от нея.
От друга страна, в ход са няколко инициативи за изграждане на сигурни, глобални, мащабни медицински набори от данни. През ноември 2023 г. Агустина Саенц и други от катедрата по биомедицинска информатика в Медицинския факултет на Харвард публикуваха онлайн в Lancet Digital Health глобална рамка за споделяне на данни от медицински изображения, наречена „Данни за изкуствен интелект за цялото здравеопазване“ (MAIDA). Те работят със здравни организации по целия свят, за да предоставят изчерпателни насоки за събирането на данни и деидентификацията, използвайки шаблона на US Federal Demonstration Partner (FDP) за стандартизиране на споделянето на данни. Те планират постепенно да публикуват набори от данни, събрани в различни региони и клинични условия по света. Очаква се първият набор от данни да бъде публикуван в началото на 2024 г., като предстоят още с разширяването на партньорството. Проектът е важен опит за изграждане на глобален, мащабен и разнообразен набор от публично достъпни данни за изкуствен интелект.
След предложението, Британската биобанка даде пример. На 30 ноември Британската биобанка публикува нови данни от цялостното секвениране на генома на своите 500 000 участници. Базата данни, която публикува пълната геномна последователност на всеки от 500 000 британски доброволци, е най-голямата пълна база данни за човешкия геном в света. Изследователи от цял свят могат да поискат достъп до тези анонимизирани данни и да ги използват, за да изследват генетичната основа на здравето и болестите. Генетичните данни винаги са били силно чувствителни за проверка в миналото и това историческо постижение на Британската биобанка доказва, че е възможно да се изгради отворена, свободна от поверителност глобална широкомащабна база данни. С тази технология и база данни, медицинският изкуствен интелект със сигурност ще доведе до следващия скок.
Проверка и оценка на медицинския изкуствен интелект
В сравнение с бързото развитие на самата технология за медицински изкуствен интелект, развитието на верификацията и оценката на медицинския изкуствен интелект е малко бавно. Валидирането и оценката в общата област на изкуствения интелект често игнорират реалните нужди на клиницистите и пациентите от изкуствен интелект. Традиционните рандомизирани контролирани клинични изпитвания са твърде трудоемки, за да се справят с бързата итерация на инструментите с изкуствен интелект. Подобряването на системата за верификация и оценка, подходяща за инструменти с медицински изкуствен интелект, възможно най-скоро е най-важното нещо за насърчаване на медицинския изкуствен интелект да прескочи научноизследователската и развойна дейност до клинично приложение.
В изследователската статия на Google за Med-PaLM, публикувана в Nature, екипът публикува и бенчмарка за оценка MultiMedQA, който се използва за оценка на способността на моделите с големи езици да придобиват клинични знания. Бенчмаркът комбинира шест съществуващи професионални медицински набора от данни с въпроси и отговори, обхващащи професионални медицински знания, изследвания и други аспекти, както и онлайн набор от данни с медицински въпроси, разглеждащ онлайн въпросите и отговорите между лекар и пациент, опитвайки се да обучи ИИ в квалифициран лекар от много аспекти. В допълнение, екипът предлага рамка, базирана на човешка оценка, която отчита множество измерения на фактите, разбирането, разсъжденията и евентуалните пристрастия. Това е едно от най-представителните изследователски усилия за оценка на ИИ в здравеопазването, публикувано тази година.
Означава ли обаче фактът, че моделите с големи езици показват високо ниво на кодиране на клинични знания, че моделите с големи езици са компетентни за клинични задачи в реалния свят? Точно както студент по медицина, който издържи професионалния изпит за лекар с перфектен резултат, все още е далеч от самостоятелен главен лекар, критериите за оценка, предложени от Google, може да не са перфектен отговор на темата за оценката на медицинския ИИ за модели с ИИ. Още през 2021 и 2022 г. изследователи предложиха насоки за отчитане като Decid-AI, SPIRIT-AI и INTRPRT, надявайки се да насочат ранното разработване и валидиране на медицинския ИИ при условие че се вземат предвид фактори като клинична практичност, безопасност, човешки фактори и прозрачност/интерпретируемост. Съвсем наскоро списанието Nature Medicine публикува проучване на изследователи от Оксфордския университет и Станфордския университет относно това дали да се използва „външна валидация“ или „повтаряща се локална валидация“. За валидиране на инструменти с ИИ.
Безпристрастният характер на инструментите с изкуствен интелект също е важна насока за оценка, която получи внимание тази година както от статии в Science, така и от NEJM. Изкуственият интелект често проявява пристрастия, защото е ограничен до данни за обучение. Това пристрастие може да отразява социалното неравенство, което допълнително се развива в алгоритмична дискриминация. Националните здравни институти наскоро стартираха инициативата Bridge2AI, чиято стойност се оценява на 130 милиона долара, за изграждане на разнообразни набори от данни (в съответствие с целите на споменатата по-горе инициатива MAIDA), които могат да бъдат използвани за валидиране на безпристрастността на медицинските инструменти с изкуствен интелект. Тези аспекти не се разглеждат от MultiMedQA. Въпросът как да се измерват и валидират модели на медицински изкуствен интелект все още се нуждае от обширно и задълбочено обсъждане.
През януари Nature Medicine публикува статия, наречена „Следващото поколение медицина, базирана на доказателства“, от Вивек Субия от Онкологичния център „MD Anderson“ към Тексаския университет, в която се разглеждат ограниченията на клиничните изпитвания, разкрити в контекста на пандемията от COVID-19, и се посочва противоречието между иновациите и придържането към процеса на клинично изследване. И накрая, статията посочва бъдещето на преструктурирането на клиничните изпитвания – следващото поколение клинични изпитвания, използващи изкуствен интелект, т.е. използването на изкуствен интелект от голям брой исторически изследователски данни, данни от реалния свят, мултимодални клинични данни, данни от носими устройства, за да се намерят ключови доказателства. Означава ли това, че технологията с изкуствен интелект и процесите на клинично валидиране с помощта на изкуствен интелект могат да се подсилват взаимно и да се развиват съвместно в бъдеще? Това е отвореният и провокиращ размисъл въпрос на 2023 г.
Регулиране на медицинския изкуствен интелект
Напредъкът на технологиите за изкуствен интелект (ИИ) също така поставя предизвикателства пред регулирането на ИИ, а политиците по целия свят реагират внимателно и предубедено. През 2019 г. FDA публикува за първи път „Предложена регулаторна рамка за софтуерни промени в медицинските устройства с изкуствен интелект“ (Проект за дискусия), в който подробно описва потенциалния си подход към предварителен преглед на ИИ и софтуерни модификации, задвижвани от машинно обучение. През 2021 г. FDA предложи „План за действие за софтуер, базиран на изкуствен интелект/машинно обучение, като медицинско устройство“, който изясни пет специфични медицински регулаторни мерки за ИИ. Тази година FDA преиздаде „Предварително подаване на документи за функции на софтуера на устройството“, за да предостави информация относно препоръките за предварително подаване на документи за оценка от страна на FDA на безопасността и ефикасността на функциите на софтуера на устройството, включително някои функции на софтуера на устройството, които използват модели за машинно обучение, обучени чрез методи за машинно обучение. Регулаторната политика на FDA се е развила от първоначално предложение до практическо ръководство.
След публикуването на Европейското пространство за здравни данни през юли миналата година, ЕС отново прие Закона за изкуствения интелект. Първият има за цел да използва здравните данни по най-добрия начин за предоставяне на висококачествено здравеопазване, намаляване на неравенствата и подкрепа на данните за превенция, диагностика, лечение, научни иновации, вземане на решения и законодателство, като същевременно гарантира, че гражданите на ЕС имат по-голям контрол върху личните си здравни данни. Вторият ясно показва, че системата за медицинска диагностика е високорискова система с изкуствен интелект и тя трябва да приеме целенасочен строг надзор, надзор на целия жизнен цикъл и надзор преди оценка. Европейската агенция по лекарствата (EMA) публикува проект на документ за размисъл относно използването на изкуствен интелект в подкрепа на разработването, регулирането и употребата на лекарства, с акцент върху подобряването на доверието в изкуствения интелект, за да се гарантира безопасността на пациентите и целостта на резултатите от клиничните изследвания. Като цяло регулаторният подход на ЕС постепенно се оформя и окончателните подробности за прилагането може да бъдат по-подробни и строги. В рязък контраст със строгата регулация на ЕС, регулаторният план на Обединеното кралство за изкуствен интелект ясно показва, че правителството планира да предприеме мек подход и засега да не приема нови законопроекти или да създава нови регулатори.
В Китай, Центърът за технически преглед на медицински изделия (NMPA) към Националната администрация за медицински продукти вече е публикувал документи като „Точки за преглед на софтуер за подпомагане на вземането на решения с дълбоко обучение“, „Ръководни принципи за преглед на регистрацията на медицински изделия с изкуствен интелект (Проект за коментар)“ и „Циркуляр относно ръководните принципи за класификация и дефиниране на софтуерни продукти с изкуствен интелект за медицина (№ 47 през 2021 г.)“. Тази година отново беше публикувано „Обобщение на резултатите от първата класификация на медицинските изделия през 2023 г.“ Тази поредица от документи прави дефиницията, класификацията и регулирането на софтуерните продукти с изкуствен интелект за медицина по-ясни и по-лесни за работа и предоставя ясни насоки за стратегиите за позициониране и регистрация на продукти на различни предприятия в индустрията. Тези документи предоставят рамка и управленски решения за научното регулиране на медицинските изделия с изкуствен интелект. Струва си да се очаква, че в дневния ред на Китайската конференция за медицински изкуствен интелект, проведена в Ханджоу от 21 до 23 декември, ще бъде създаден специален форум за цифрово медицинско управление и висококачествено развитие на държавните болници, както и форум за развитие на индустрията за стандартизация на технологиите за тестване и оценка на медицински изделия с изкуствен интелект. По това време служители от Националната комисия за развитие и реформи и NMPA ще присъстват на срещата и е възможно да публикуват нова информация.
Заключение
През 2023 г. медицинският ИИ започна да се интегрира в целия медицински процес нагоре и надолу по веригата, обхващайки събирането на болнични данни, сливането, анализа, диагностиката и лечението, както и скрининга на общността, и органично да си сътрудничи с медицинските/контролиращи заболяванията работници, показвайки потенциала за подобряване на човешкото здраве. Започват да се зараждат използваеми изследвания в областта на медицинския ИИ. В бъдеще напредъкът на медицинския ИИ зависи не само от самото технологично развитие, но и от пълното сътрудничество на индустрията, университетите и медицинските изследвания, както и от подкрепата на политиците и регулаторните органи. Това междудисциплинарно сътрудничество е ключът към постигането на интегрирани с ИИ медицински услуги и със сигурност ще насърчи развитието на човешкото здраве.
Време на публикуване: 30 декември 2023 г.




