Искусственный интеллект научили накладывать шов при помощи робота да Винчи
Вложение или вложенное пространство – низкоразмерное пространство1, в которое можно перевести многомерный вектор2. Во время перевода вложение сохраняет семантическую взаимосвязь входов, помещая сходные входы близко друг к другу в пространстве внедрения. Встраивания (или вложения) упрощают машинное обучение для больших входных данных, таких как разреженные векторы3. Многомерное пространство помогает группировать семантически связанные элементы, разделяя разнородные элементы друг от друга. Это может оказаться очень полезным в задаче машинного обучения.
Изучение эффективных методов визуального представления во вложенном пространстве может облегчить обобщение последующих задач, таких как сегментация и имитация действий. В статье “Motion2Vec: Semi-Supervised Representation Learning from Surgical Videos” (Motion2Vec: полуавтоматическое обучение на основе хирургических видео) исследователи изучают интерпретацию роботом хирургических видеоматериалов с кадрами манипуляций, группируя их в сегменты действий/подцели/варианты полуавтоматическом способом.
Чтобы наглядно понять, о чем идет речь, просмотрите интерактивную модель Word2Vec, основанную на том же принципе, что и Motion2Vec. В Word2Vec вложения охватывают семантические отношения между словами, такие как время глагола, отношения страна-столица, гендерные аналогии и пр.
Ученые разработали алгоритм Motion2Vec со способностью изучать пространство функций глубокого встраивания методом просмотра и анализа видеоматериалов, минимизируя потерю метрического обучения4 в сиамской нейронной сети5. Изображения из одного и того же этапа(сегмента) действий объединяются, отделяясь от случайно выбранных изображений других сегментов. При этом временной порядок изображений соблюдается. Вложения итеративно сегментируются с помощью рекуррентной нейронной сети6 для заданной параметризации пространства вложения после предварительного обучения сиамской сети.
Исследователи используют только небольшой набор помеченных сегментов видео, чтобы семантически выровнять пространство встраивания и присвоить псевдо-метки оставшимся немаркированным данным путем вывода на основе изученных параметров модели. Использование этого представления демонстрируется для имитации хирургических движений наложения швов из общедоступных видеороликов. Таким образом, программа глубокого обучения Motion2Vec может воспринимать видеоролики, интерпретировать полученную информацию и воспроизводить последовательности заученных действий.
В видеоролике ниже выученное представление (интерпретация) применяется ИИ для хирургической сигментации наложения швов, имитации движений при моделировании и практическом применении в интергации с технологией da Vinci.
Разработка прошла первое тестирование. Алгоритму была поставлена задача: изучить процесс наложения шва и воспроизвести манипуляцию с использованием роботических рук da Vinci. Наложение шва было выбрано как состоящее из однотипных движений действие, оптимально поддающееся автоматизации. Результаты тестирования показали точность сегментации наложения шва 85,5% со средней ошибкой 0,94 сантиметра в точности нацеливания (имитации кинематической позы).
Будущее технологии Motion2Vec
Впоследствии искусственный интеллект сможет самостоятельно зашивать раны с высокой точностью на реальных пациентах. В данный момент ИИ еще не готов приступить к тестированию на людях. Исследователи заявляют, что до внедрения технологии в рутинную практику хирургов пройдет много времени. Однако в будущем ИИ сможет проводить сложные операции самостоятельно, выполняя маневренные и прецизионные движения, недоступные человеческой руке.
Сегодня такие манипуляции выполняются при помощи хирургического робота da Vinci. Однако система не производит действия самостоятельно: ей управляет опытный хирург.