«Розроблення ліків триває щонайменше 10 років і вартує до $2 мільярдів». Як IT допомагає українському стартапу пришвидшити створення медичних препаратів

RECEPTOR.AI — український стартап з розробки ліків за допомогою ІТ-технологій, який нещодавно отримав грант на розвиток у 100 тисяч доларів від Google for Startups Ukraine Support Fund. Ми поспілкувалися зі СТО стартапу Сергієм Старосилою про його роботу й те, як ІТ допомагає створювати ліки.

Я медичний хімік, маю ступінь PhD в молекулярній біології. У галузі drug discovery я понад 10 років. Раніше працював в україно-канадській фірмі Otava Chemicals, основний напрям діяльності якої — органічний синтез і раціональний драг-дизайн. Паралельно працював у Інституті молекулярної біології та генетики НАН України, де весь час присвячував розробці біологічно-активних сполук: проти раку й туберкульозу.

Впродовж своєї кар’єри я займався і «мокрими» експериментами в лабораторіях, і комп’ютерним моделюванням. Саме останнє допомагає суттєво прискорити процес створення ліків та значно зекономити кошти. Тож зараз ІТ у фармацевтичній індустрії — потужна галузь, без якої неможливо розробляти препарати.

Довідково:

Органічний синтез — галузь науки, яка займається отриманням органічних хімічних сполук шляхом проведення органічних реакцій.

Драг-дизайн — це розроблення нових ліків із завчасно заданими властивостями.

Метод мокрої хімії — один з методів аналізу речовини шляхом розчинення її у воді, кислотах, лугах, органічних розчинниках. Переважно на практиці використовують водні розчини речовин, тому науковці мають справу з реакціями, які відбуваються у воді.

Про створення ліків

Процес розроблення ліків триває щонайменше 10 років — від ідеї до постачання на полички аптек. Кожна компанія має свою частину роботи. Такі, як наша, і спеціалізовані інститути займаються першим етапом, drug discovery. Ми маємо розробити якісну активну хімічну сполуку, яка здатна викликати певну біологічну відповідь в організмі, лікувати хворобу й водночас бути безпечною. На цьому етапі розробляють сотні таких сполук і за результатами тестування на тваринах серед них обирають найкращу. Далі до процесу приєднуються інші компанії, які опікуються drug development. Зокрема, ті, що проводять клінічні випробування вже безпосередньо на людях.

В Україні майже не представлена галузь drug development, цим здебільшого займаються за кордоном. Тому всі наші клієнти — закордонні компанії: від академічних установ до великих гравців фармацевтичного ринку на кшталт Merck та Incyte.

Як виникла RECEPTOR.AI

Понад два роки тому у СЕО компанії Алана Нафієва, досвіченого AI leader, який має досвід у розробленні ліків, виникла думка: мало хто в Україні робить drug discovery, попри перспективу галузі. Він почав проводити зустрічі в інститутах та університетах у пошуках однодумців. Так прийшов до мене, ми познайомилися, і я підтримав його задум. За аналогічною схемою запросили доктора Семена Єсилевського. Згодом заснували стартап, знайшли українське стартове фінансування і зібрали команду. Наразі вона складається з двох наукових консультантів та 13 співробітників, більшість із яких — технічні працівники.

В Україні багато хороших програмістів, тож знайти їх не було проблемою. Здебільшого це випускники КПІ, а майже всі біологи та медичні хіміки — з КНУ.

Я сам професійно програмую понад 10 років. Цікавився цим ще зі школи й починав з Pascal, як і багато хто свого часу. Уже в університеті обрав Java й C++. З початком кар’єри зрозумів, що треба підтягнути навички, і пройшов професійні курси з Java, але згодом перейшов на Python.

Java — не найкраща мова для програмування в біології, багато базових речей доводиться писати самому. Тож у компанії використовуємо Python, ця мова зручна для науки й має широкий інструментарій. Крім того, досить популярна й легша за Java, тож знайти айтівців з відповідним стеком було легко.

Значно важче було шукати науковців. Сумно, але в напрямі drug discovery лише десятки людей в Україні. У нас багато хіміків та біологів, але медичних хіміків мало. У нашій команді їх троє, ми займаємося алгоритмуванням з погляду хімії й біології та пишемо код.

Як віднаходять хімічні сполуки

Основою будь-яких ліків є певна хімічна сполука. Саме вона запускає необхідні процеси в організмі. Завдання команди RECEPTOR.AI — знайти її. Сьогодні існують мільярди хімічних сполук, серед яких треба відшукати найкращу. Це досить складне завдання, оскільки пошук відбувається за сотнею параметрів. Наприклад, розчинність сполуки, проникність через стінки кишківника (якщо препарат розробляється як пероральний), параметри розподілу її в організмі, період напіввиведення та основні шляхи виведення сполуки з організму, біодоступність, стабільність, низка параметрів токсичності, прогноз дії на модельні організми на стадії доклінічних досліджень (миші, криси, собаки) та інші. Не так складно віднайти дієву сполуку, найважче — зробити її безпечною, щоби майбутній препарат лікував, а не калічив.

Ми моделюємо всі ці параметри: для цього розробляємо спеціальні алгоритми, використовуємо машинне навчання та штучний інтелект для побудови моделей, які їх прораховують. Застосовуємо штучні нейронні мережі, що добре підходять для опрацювання великих обсягів інформації. Часто в основі лежать графові чи згорткові архітектури, розширені іншими спеціалізованими блоками на основі лінійних, LSTM, attention чи інших шарів, залежно від завдання. Графові нейромережі взагалі органічно підходять для задач хімії й біології, оскільки хімічні сполуки — і низькомолекулярні, й макромолекули, — за своєю природою є графами, вузлами яких є атоми, а ребрами — хімічні зв’язки.

Процес розроблення ліків триває щонайменше 10 років

Дані для навчання беремо з літератури, з великих відкритих баз даних, наприклад ChEMBL, PDB, BindingDB тощо, а також використовуємо комерційну базу GOSTAR, що є провідною в нашій галузі. Збором даних займаються наші медичні хіміки й дата-інженери. Також вони впорядковують і стандартизують інформацію. Окреме завдання — це розібратися з молекулярною мішенню, відповідно до якої будуть розроблятися біологічно активні сполуки. Здебільшого це білок. Ми маємо у своєму арсеналі близько 10 тисяч підготовлених структур білків. Проте для деяких білків структури відсутні, й тоді ми їх окремо моделюємо. Коли дані готові, наші AI/ML інженери розробляють моделі.

Після того, як за допомогою обчислень з мільярдів сполук отримано вибірку з кількох тисяч сполук, ми аналізуємо її. Цим займаються медичні хіміки, зокрема я. Жартома можна сказати, що ми люди, які можуть пояснити «традиційним» хімікам, чого саме хочуть біологи. Медичні хіміки дбають про раціональний дизайн ліків: ми не перевіряємо мільйони сполук безпосередньо експериментально в лабораторії, а обираємо з них сотню за допомогою ІТ-технологій. Ці сполуки синтезують хіміки, а біологи — перевіряють. Так ми знаходимо сполуку-кандидата, яка в перспективі може стати ліками.

Ми приділяємо багато уваги автоматизації, тому створили свою SaaS-платформу для розроблення ліків. Вона сильно прискорює роботу та охоплює величезну частину етапів молекулярного моделювання. Нею користуємось як ми самі, так і наші клієнти.

За допомогою неї можна проводити високопродуктивні віртуальні скринінги величезних хімічних баз даних відносно заданої молекулярної мішені. Платформа має інтуїтивно зрозумілий інтерфейс, проте призначена для профільних спеціалістів — біоінформатиків/медичних хіміків. Вона містить зручну систему особистих кабінетів та керування проєктами й базами даних. Багато роботи з драг-дизайну платформа ховає «під капот». Тож створивши в ній проєкт, лише потрібно ретельно задати всі налаштування — обрати молекулярну мішень, перевірити її, обрати базу сполук для скринінгу, встановити межі параметрів майбутніх активних сполук залежно від потреб проєкту і запустити скринінг. Далі платформа здійснить обчислення. Розміри баз, що ми можемо обробити, дійсно дуже великі. І за сучасними мірками, робимо ми це дуже швидко, — для прикладу, 10 мільярдів сполук скринінгуються на платформі менш ніж за добу.

В результаті платформа видає 1000 найбільш перспективних сполук. І їх вже має опрацювати медичний хімік і вибрати з них найкращі для біологічного тестування. Цю роботу можна також зробити прямо на платформі, оскільки ми додали функціонал постобробки: фільтрування, сортування, вибір і завантаження лише потрібних сполук, графіки й аналіз 3D-комплексів сполук з молекулярною мішенню.

Так виглядає розроблена стартаперами платформа

Про безпеку та науковий скептицизм

RECEPTOR.AI працює в «хмарі» й здебільшого базується на потужностях Amazon Web Services. Ми стали партнерами AWS, отримали всі необхідні сертифікації, тож впевнені, щоб кіберзахищені. Щодо науки, то метрикою кваліфікації вчених є публікації — вони є у мене, колеги Семена Єсилевського, наукових консультантів й деяких співробітників. Частина публікацій безпосередньо відповідають профілю та підтверджують досвід у пошуку активних хімічних сполук.

З боку ІТ нам треба доводити свою безпечність, а з боку науки — долати науковий скептицизм. Під час зустрічі з клієнтами ми спершу спілкуємося з людьми, які відповідають за організацію бізнесу: директор, СЕО, бізнес-девелопери. Ці люди не сильні в науці. Однак на подальші зустрічі приходять учені, які прискіпливо переглядають профілі компанії та вчених, піддають сумнівам основи роботи методів, моделі, навчальні вибірки тощо. Якщо нам вдається довести свою ефективність і подолати науковий скептицизм, можна говорити про деталі й умови співпраці.

Про фармацевтичний ринок і відсутність монополії

Український фармацевтичний ринок відрізняється від світового. Наші компанії здебільшого виготовляють дженерики, лікарські препарати, які відтворюють оригінальні ліки, на які сплив термін патентного захисту. Самі вони нічого не розробляють, тож уся діяльність побудована на простих препаратах і дженериках, які можна швидко вивести на ринок. Їх сертифікувати значно легше, тому що ліки вже були допущені до продажу.

А за кордоном усе серйозно, регуляторні органи працюють на висоті, а кожна країна має свої вимоги. Однак опікуватися цим — здебільшого робота фармацевтичних компаній, наших колег і клієнтів. Звісно, ми теж вивчаємо ринок, адже розглядаємо можливість розширити обов’язки та відповідальність RECEPTOR.AI.

Інші країни значно жорсткіше регулюють діяльність фармкомпаній, ціноутворення і доступність ліків. Іноді держави можуть фінансувати проєкти, які компанії не хочуть втілювати, наприклад, з виготовлення антибіотиків. Це злободенна тема, адже антибіотики швидко викликають резистентність через неправильне застосування: з’явився невеликий кашель, людина одразу приймає антибіотик, виникає резистентність у бактерій, і далі ліки не діятимуть. Сільське господарство теж часто безконтрольно використовує антибіотики, наприклад для лікування птиці та стимулювання її зростання або для боротьби з патогенними мікроорганізмами в агровиробництві, що врешті теж спричиняє резистентність. Важко заробити гроші на препаратах, які настільки швидко втрачають свою дієвість, тож фармкомпанії відмовляються за них братися. Однак антибіотики дуже важливі, тому держави фінансують їхнє виготовлення і впливають на фармкомпанії.

Вивести препарат на ринок — неймовірно складно. Спочатку потрібно пройти сотні тестів: від пробірки в лабораторії до тварин і людей. Одночасно тестуються сотні сполук, тому виготовлення ліків коштує дорого — до двох мільярдів доларів.

Але попри всі складнощі на фармацевтичному ринку є багато великих гравців і ще більше середніх і маленьких. Між ними серйозна конкуренція. Монополії загалом немає, адже роботи вистачає всім, а держави регулюють ринок.

Про цілі

На жаль, я не вірю, що колись ми зможемо скасувати тести на тваринах. Тестувати одразу на людях заборонено за законами біоетики. Але ми можемо зменшити ризики, час і кошти для виробництва.

Процес виготовлення ліків ітераційний. Спочатку ми проводимо одну ітерацію і дивимося на одне покоління сполук, оптимізуємо їх — і так, поки не знайдемо найкращу сполуку. Буде добре, якщо з першої ж ітерації даватимемо ідеальні молекули, які можна успішно перевірити на коротких тестах на тваринах. Так ми зекономимо роки розроблення ліків, кошти, а препарат швидше вийде на ринок і принесе максимум користі. Я не прибічник думки, що все впирається в гроші, — насамперед ліки мають приносити користь. Цієї мети реально можна досягнути упродовж кількох років. Я в це вірю.

Друга мета є практичною: почати розробляти свої ліки, запустити кілька серйозних проєктів. Для цього, звісно, треба отримати велике фінансування. До цього вже хочеться мати біологічні лабораторії, де ми зможемо самі виконувати частину експериментальної роботи. Глобально це суттєво скоротить цикл створення ліків.

Команда RECEPTOR.AI під час святкування річниці проєкту

Про грант від Google

Заявку на Google for Startups Ukraine Support Fund ми подали ще у вересні. Це не перший акселератор, в якому ми беремо участь. До цього був Y Combinator, ми пройшли до останнього рівня, але тоді ще не мали доходів, через що, напевно, нас і не взяли. Google нам подобається, бо він технологічний. Я вже не раз мав з ними справу, вони надають хороший супровід, тож я радий, що ми отримали фінансування у 100 тисяч доларів.

Частина коштів від Google піде на заробітні плати, інша — на операційну діяльність. Також нам надали доступ до безоплатних ресурсів компанії на рік у межах 100 000 доларів: інфраструктури, сервісів та серверів. Це корисно і для нас, і для них, адже ми можемо знайти для себе щось нове і корисне й користуватися інструментом надалі, згодом на платній основі.

Наразі ми серйозно зав’язані на AWS, платформа дуже розвинена, — і в хмарних технологіях, можливо, сильніша за Google. Наша SaaS-платформа для розробки ліків і надалі залишатиметься на AWS. Однак вільні ресурси від Google дали змогу перенести багато внутрішньої роботи з розроблення моделей, молекулярного моделювання та молекулярної динаміки на платформи Google. Це спонукає нас робити кросплатформові технології. До того ж нині ми серйозно розвиваємо гілку з використанням Kubernetes, що може зробити нас більш незалежними від будь-яких сервісів, від AWS чи Google.

Похожие статьи:
IТ-компании встретили весну и поздравили своих сотрудниц с 8 марта. Давайте посмотрим, как это было: A-Level Ukraine Утром тюльпаны наполнили...
EPAM, GlobalLogic, Luxoft, Fintech Band (mono) та Intellias отримали найбільше доходів у 2023 році. У YouControl поділилися з DOU переліком ІТ-компаній, які увійшли...
Розробник програмного забезпечення DataArt, який має орієнтовно 6 тисяч співробітників у різних країнах і містах, повідомив про...
Speaker — Nikolay Pavlov, Founder at Biomech Topic — ‘Human Motion Recognition with R’ 2,5 — hours workshop about Human Motion Recognition with R just before the Christmas. Workshop includes introduction to basics...
Grammarly приглашает в гости всех, интересующихся продуктовой разработкой. Поговорим о прелестях работы Product Owner’а, об общих...
Яндекс.Метрика