Пионер искусственного интеллекта Дафна Коллер видит, что генеративный искусственный интеллект приведет к прорывам в лечении рака

Pioneer of Artificial Intelligence Daphne Koller sees the potential breakthroughs in cancer treatment with Generative Artificial Intelligence

Дафна Коллнер

Генеративный искусственный интеллект, подобный тому, который питает модель DALL-E от OpenAI, ChatGPT и другие популярные программы, станет важным инструментом для достижений в онкологии, изучении рака, согласно Дафне Коллнер. Коллнер является пионером искусственного интеллекта, соучредителем и генеральным директором компании по искусственному интеллекту в сфере жизнедеятельности Insitro.

“Мы предпринимаем усилия для того, чтобы действительно понять язык гистопатологии [изучение тканей]… и затем использовать его для […] нахождения потенциальных целей [лекарств]”, – сказала Коллнер на дневной сессии, организованной Институтом AI с участием человека Стэнфордского университета во вторник под названием “Новые горизонты в генеративном искусственном интеллекте: наука, творчество и общество”.

Также: Генеративный ИИ – это все, всюду и сразу

Коллнер является преподавателем компьютерных наук в Стэнфорде. Существует двухэтапный процесс, который может привести к появлению новых целевых объектов для лечения рака.

На первом этапе машинное обучение AI от Insitro способно анализировать изображения раковых тканей, гистологическое изображение, созданное на основе биопсии. По словам Коллнер, патолог-человек обычно сводит эти изображения из миллиардов пикселей к трём числам, и “ясно, что в них содержится гораздо больше информации”, которую мы сейчас не используем.

Также: Cerebras и M42 из Абу-Даби создали ЛЛМ, посвященный решению медицинских вопросов

Путем использования машинного обучения, компьютер действительно “выучивает язык гистопатологии”, позволяя машине предсказывать генетические изменения пациентов с раком с точностью от 90% до 95%.

“Таким образом, глядя на снимок, вы можете сказать, что у этого пациента есть генетическая мутация, в отличие от другого пациента, то, что клиницист на самом деле не может сделать,” – пояснила она.

Это первый этап. Чтобы найти цели лечения, нужно иметь намного больше образцов тканей, чем обычно берут – тысячи вместо десятков. Чтобы решить проблему с поставками изображений, команда Insitro использовала генеративный ИИ для создания “глубоких подделок” изображений тканей, как рассказала Коллнер. “Вместо создания изображений знаменитостей, мы генерируем изображения гистологических снимков”.

Также: Microsoft представляет новые расширения для Fabric и Azure, специально разработанные для медицинского ИИ

С помощью увеличения количества образцов тканей с сотен до тысяч, по словам Коллнер, можно анализировать гораздо больше образцов с помощью специального инструмента, разработанного в Стэнфорде, называемого анализом ATAC-seq. Команда смогла увеличить количество образцов раковых тканей с 400 до почти 100 000. Это масштаб позволяет задавать вопросы, на которые было бы невозможно ответить с меньшим количеством образцов.

Генеративный ИИ используется для создания “глубоких подделок” изображений тканей, что позволяет значительно увеличить объем выборки, который можно затем изучить с использованием генетического анализа.

“И теперь вы можете начать задавать вопросы о “открытости” или “закрытости” какого-то гена – то есть активности какого-то гена – связанностью с выживаемостью. Это было бы невозможно сделать, если бы у вас было только 30 пациентов.

Тысячи фальшивых образцов, протестированных с помощью этой анализирующей процедуры, могут выявить новые потенциальные цели для лекарств по лечению рака.

Анализируя, к примеру, с помощью метода ATAC-seq, тысячи глубоких подделок изображений тройно-отрицательного рака груди, технология выявляет ранее неизвестные генетические изменения, которые могут стать кандидатами для целей лекарств. “Некоторые из этих целей новы для тройно-отрицательного рака груди [но] они связаны с другими видами рака,” сказала Коллер. “Это дает уверенность в их причинной роли и [они] представляют собой потенциально интересные новые цели для лекарств.”

Коллер описала программу генеративного искусственного интеллекта в биологии, как работающую с уровнем сложности, который “не является чем-то, что человеческий мозг способен по-настоящему понять.”

“Для решения этой области нам действительно нужно, в первую очередь, собирать очень большой объем данных, с безупречной точностью и масштабом, на разных уровнях биологической крупности, и затем позволять машинам делать то, что они делают гораздо лучше людей – понимать тонкие закономерности в этих данных, помогать нам переопределять гетерогенность и сложность человеческих заболеваний и выявлять узлы вмешательства, которые могут привести к созданию терапевтических препаратов, эффективных в клинике.”

Также: Генеративный искусственный интеллект превзойдет то, что может ChatGPT. Вот всё о новых возможностях технологии

Соорганизатор семинара, Перси Лианг, профессор компьютерных наук в Стэнфорде, отметил, что Коллер, профессор Стэндфордского университета, “вдохновлял целое поколение исследователей” в области искусственного интеллекта. Коллер также является сооснователем онлайн-образовательной компании Coursera.

Лианг отметил, что на семинаре, помимо Коллер, было много примеров “мульти-модальности”, где одни и те же программы генеративного искусственного интеллекта работают с различными типами данных – от биологических данных до звуковых данных и даже песен китов. Как ENBLE отметил, мульти-модальность, объединяющая различные типы данных, является одним из самых важных будущих направлений в этой области.

Заключая свою речь, Коллер отметила, как наука проходит через периоды огромного прогресса. “Подумайте о конце XIX века и химии, с открытием периодической таблицы [элементов],” – предложила она, “Или о начале XX века, конечно, физике, с связью между энергией и материей, пространством и временем.”

Также: 3 способа, которыми ИИ революционирует обслуживание пациентов в здравоохранении. Могут ли LLM-модели, как ChatGPT, помочь?

По словам Коллер, в 1990-х годах произошел подобный взрыв открытий в двух дисциплинах – “обработка данных, машинное обучение, искусственный интеллект, которые действительно начались тогда, и количественная биология, возможность измерять биологические процессы с безупречной точностью.”

Эти две дисциплины сейчас объединяются, чтобы создать новое направление, называемое цифровой биологией, которое представляет собой “возможность дигитализированного чтения биологии с этой невероятной точностью на беспрецедентном масштабе, интерпретировать то, что мы видим, используя инструменты, такие как машинное обучение и искусственный интеллект, а затем создавать биологию с помощью таких техник, как CRISPR и комбинаторная химия, и прочих методов, чтобы заставить биологию делать то, что она не могла бы делать иначе.”

Также: Генеративный искусственный интеллект и машинное обучение формируют будущее в этих 9 областях

Это новое направление, по словам Коллер, окажет “огромное влияние на человеческое здоровье, а также на окружающую среду, энергетику, биоматериалы, устойчивое сельское хозяйство и многие другие дисциплины, которые помогут сделать наш мир лучше, поэтому я думаю, что это действительно захватывающее место для работы.”

Полный порядок дня семинара размещен онлайн, и вы можете посмотреть запись всего мероприятия на YouTube.