Исследователи Центр искусственного интеллекта Московского государственного университета имени М.В. Ломоносова предложили метод анализа гистологических изображений на основе графовых нейросетей и механизма псевдоразметки. Подход позволяет повысить точность классификации типов тканей при ограниченном объёме размеченных данных и снизить зависимость от ручной разметки. Результаты исследования опубликованы в журнале Machine Learning and Knowledge Extraction.
Гистологические изображения имеют важное значение в современной медицинской диагностике, особенно при диагностике онкологических заболеваний. Эти изображения – это крупные цифровые снимки тканей, содержащие обширный объем визуальных данных. Для их анализа необходима высокая квалификация врачей и существенные затраты времени. Разработка размеченных баз данных по-прежнему является одним из главных препятствий для использования методов машинного обучения в этой сфере.
В рамках новой разработки предложен метод, объединяющий графовые нейросети и механизм псевдоразметки. В этом методе псевдоразметка служит для организации механизма внимания между различными частями изображения: модель определяет, к какому классу относится каждый участок изображения, и использует эти определения для анализа взаимосвязей между схожими областями. Такой подход позволяет увеличить объем обучающей выборки благодаря автоматически сгенерированным меткам. Графовая нейросетевая модель, в свою очередь, воспринимает изображение как совокупность взаимосвязанных областей, учитывая структуру этих связей, что обеспечивает более точное описание пространственной организации ткани.
В процессе работы особое внимание было уделено анализу полноразмерных гистологических изображений, характеризующихся высоким разрешением и сложной организацией. Разработанный подход позволяет учитывать как специфические черты отдельных фрагментов изображения, так и их относительное расположение, что критически важно для более точной классификации тканей и создания карт сегментации.
Набор данных PATH-DT-MSU WSS2v2 позволил модели достичь значения Macro F1, равного 0.95, что является улучшением по сравнению с результатами, полученными с использованием существующих патчевых и графовых подходов.
«Наша цель заключалась в создании подхода, способствующего более продуктивному использованию доступных ресурсов. Использование псевдоразметки наряду с графовым отображением и механизмом внимания позволяет учитывать структуру изображения и повышать точность прогнозов», — подчеркнул Александр Хвостиков, научный сотрудник Центра искусственного интеллекта МГУ, а также старший научный сотрудник факультета ВМК МГУ.
Предложенный метод пригоден для разработки систем, помогающих врачам принимать решения, и может применяться в задачах автоматизированной обработки медицинских изображений. В будущем эти подходы способны улучшить точность анализа и расширить возможности специалистов при работе с гистологическими данными.
Информация предоставлена пресс-службой МГУ