Также компания представила документальный фильм о проекте.
Облачная платформа Yandex Cloud опубликовала исходный код алгоритма машинного обучения для экомониторинга Байкала. Технология помогает анализировать пробы воды: определять и классифицировать содержащиеся в ней микроорганизмы. Теперь биологи и ML-специалисты по всему миру смогут использовать нейросеть для разработки собственных систем мониторинга водоемов и отслеживать важные экологические тренды. Алгоритм опубликован на GitHub по открытой лицензии Apache 2.0.
В открытый доступ выложены датасеты, модели машинного обучения и документация для мониторинга. Такой набор поможет тестировать гипотезы по детекции, сегментации и классификации объектов в разных научных проектах. В частности разработчики смогут выявлять проблемы в балансе микроорганизмов водных объектов, и следовательно — помогать сохранять водоемы в неизменном состоянии дольше.
Изначально нейросеть разрабатывалась для проекта «Точка №1», который длится с 1945 года. Ученые НИИ биологии Иркутского государственного университета более 75 лет анализируют фито- и зоопланктон Байкала для мониторинга состояния озера вручную. Нейросеть помогла автоматизировать и ускорить весь цикл исследований. Сейчас алгоритм умеет работать с 70 формами планктона и продолжает обучаться в облачном сервисе для разработки и эксплуатации ML-алгоритмов Yandex DataSphere. В создании технологии также участвовали компания MaritimeAI и Фонд поддержки прикладных экологических разработок и исследований «Озеро Байкал».
О том, как ученые и разработчики прошли путь от решения локальной задачи на Байкале до выкладки нейросети в опенсорс, рассказывает документальный фильм. В основе сюжета — беседы со специалистами НИИ биологии ИГУ, разработчиками MaritimeAI и сотрудниками Яндекса. Участники рассказали, почему иногда непросто найти общий язык людям из науки и ИТ, как они боролись с основными сложностями в проекте, и зачем облачные технологии и искусственный интеллект решают научные задачи. Фильм «Двенадцать тысяч проб» можно бесплатно посмотреть на канале Яндекса на YouTube и Кинопоиске.
«Доступность технологий — один из наших ключевых приоритетов. Яндекс не только систематически выкладывает в опенсорс свои собственные решения, но и помогает развивать открытый исходный код в совместных проектах со сторонними разработчиками. Яндекс является лидером среди российских компаний по вкладу в опенсорс, по данным ossindex. Публикуя алгоритм экомониторинга с MaritimeAI, мы продолжаем следовать нашим главным принципам. Разработка поможет не просто решить задачу конкретной научной группы, а тестировать гипотезы о состоянии водных объектов повсюду. Ведь Байкал — далеко не единственное место на планете, где ведется подобный мониторинг», — рассказал Алексей Башкеев, руководитель платформы Yandex Cloud.
Подробнее о том, как разрабатывался алгоритм экомониторинга в статье на Habr.com