Как я работаю: Сергей Шельпук, СЕО DeepTrait, в прошлом Head of Data Science
[В рубрике «Как я работаю» мы приглашаем гостя рассказать о своей работе, организации воркспейса, полезных инструментах и лайфхаках]
Сергей Шельпук — сооснователь и СЕО стартапа DeepTrait. Компания разрабатывает методику ускоренного анализа генома при помощи искусственного интеллекта — самообучающихся нейронных сетей. Технология помогает понять, какой именно участок генома отвечает за те или иные характеристики.
Сейчас в команде Сергея 6 человек. В 2019 году DeepTrait привлек $300 тыс. от польских инвесторов. В этом году заключил контракт с первым коммерческим клиентом.
До того как основать собственный стартап, Сергей возглавлял Data Science отделы в компаниях SoftServe и Eleks, а также преподавал AI и Machine Learning на факультете прикладных наук в УКУ.
На рабочем месте в офисе
О себе
Программированием я заинтересовался еще в детстве. В младших классах у нас в школе был класс информатики с советскими компьютерами 1991 года выпуска — «Поисками», где нас учили основам Basic. Как я теперь понимаю, в
В 2003 году я поступил на факультет электроники в КПИ — надеялся научиться программированию. Но мне не понравилось, что и как нам преподавали. Я не понимал объяснения лекторов — причем даже по тем предметам, по которым у меня были сертификаты и хорошие оценки с внешних курсов. Один из таких примеров — курс по IP-сетям. В итоге первый год учебы оставил впечатление о том, что я абсолютно непригоден к точным наукам.
Поэтому на третьем курсе я параллельно поступил в Национальную юридическую академию им. Ярослава Мудрого изучать юриспруденцию. Это был конец
Какое-то время учеба в двух университетах шла параллельно, но в КПИ я так и не доучился: на
В
Тогда же я восстановился в КПИ на
В 2011 году мне посчастливилось пройти первые три курса Стэнфорда, которые университет выложил в бесплатный доступ: Artificial intelligence by Sebastian Thrun & Peter Norvig, Machine Learning by Andrew Ng и Databases by Jennifer Widom.
Это был важный для меня момент: я увидел, как выглядит качественный курс точных наук. Он очень отличался от того, что было в КПИ. А машинное обучение как дисциплина показалось особенно увлекательным.
О переезде во Львов и переходе в Data Science
На новогодние праздники в
В марте я уже приступил к работе бизнес-аналитиком во львовском офисе SoftServe. На тот момент я еще не нашел друзей в городе и у меня было много свободного времени. Мне всегда было интересно узнавать что-то новое, и я решил поступить на какую-нибудь дистанционную учебную программу от топового мирового университета.
Подал документы сразу в два вуза:
- В Лондонскую школу экономики и политических наук (LSE) — тогда это был один из немногих топовых вузов, который предлагал пройти полный бакалавриат удаленно. Выбрал программу «Управление информационными системами», потому что чувствовал пробелы в своей квалификации в технологическом менеджменте.
- В Стэнфорд — потому что меня восхищали подходы этого вуза к преподаванию бесплатных онлайн-курсов, и хотел посмотреть, как выглядит полноценная учеба. Выбрал магистерскую программу «Искусственный интеллект», страшно понравилось это направление. Удаленно можно было пройти треть программы.
На мое удивление, меня взяли в оба вуза. Стэнфордскую программу я закончил за 3 года, в
В 2013 году Маккинси выпустил отчет, в котором прогнозировалось, что к 2018 году в мире будет не хватать 200 тыс. Data Scientists и 2 млн менеджеров с навыками принятия решений на основании данных. Тогда я предложил SoftServe попробовать создать первый в Украине сервис для этой ниши. В компании согласились пойти на такой эксперимент, и я возглавил первый отдел Data Science.
Первый Data Scientist, которого я пригласил на работу в новый отдел, поделился интересным наблюдением. Пока у него в профиле на LinkedIn было указано, что он программист, ему каждый день писали рекрутеры. А как только поменял должность на Data Scientist — тишина. В то время в Украине еще почти никто не знал, что это такое и есть ли у этого направления перспективы.
Передо мной встал другой вопрос: как строить Data Science как сервис и как его продавать. Знания, которые я получил благодаря программе Стэнфорда, позволяли вполне на равных и очень предметно разговаривать с западными партнерами и клиентами. А программа LSE, в свою очередь, дала хорошее общее понимание менеджмента информационных систем, места каждой активности в общем процессе и их взаимосвязи.
В 2014 году я возглавил отдел Data Science в компании VITech, в
Также в
Для меня преподавательская работа — это своего рода волонтерство. Я искренне болею за качественное высшее образование и считаю, что это один из немногих реальных способов преобразовать наше государство. По сути, хорошее образование обеспечивает человеку следующие 50 лет жизни.
В 2018 году я оставил УКУ, чтобы сфокусироваться в работе над собственным стартапом.
О стартапе DeepTrait
Больше 10 лет назад я познакомился с Русланой Радчук. Руслана — ученый-исследователь немецкого Института генетики растений и исследований сельскохозяйственных культур им. Лейбница, специалист в области молекулярной и клеточной биологии, а также генной инженерии культурных растений.
У Русланы есть талант объяснять сложные вещи просто и понятно для неспециалистов в генетике. Благодаря ее объяснениям я и заинтересовался этой областью. Сначала читал блог Русланы на платформе LiveJournal, а в 2015 году мы познакомились вживую: она приехала во Львов рассказать о биоинформатике на конференции IT Arena.
С Русланой Радчук
Однажды Руслана рассказала мне об интересной биологической задаче, решений для которой еще нет. Вот краткая предыстория.
Более 100 лет назад немецкий доктор Пауль Эрлих продвигал идею о том, что химические соединения могут избирательно взаимодействовать с процессами в организме. Он назвал это «магической пулей», и с тех пор этот принцип стал основой современной фармацевтики. Фактически все лекарства состоят из какого-то химического соединения, которое взаимодействует с белками нашего организма и за счет этого усиливает или редуцирует их функцию.
В организме человека, по разным оценкам, есть более 2 млн разных белков. Мы плохо знаем их функции и понимаем, как работает лишь очень маленькая их часть. Вместе с тем при разработке новых лекарств возникает вопрос: с какими именно белками должен взаимодействовать препарат, чтобы добиться ожидаемого фармацевтического эффекта?
Белки происходят из генов, и изучать гены — существенно проще, чем белки. При этом лишь некоторая информация, содержащаяся в генах, отвечает за те или иные характеристики. К примеру, в геноме человека свыше 3 млрд нуклеотидов, однако лишь около 1,5% из них кодируют какие-то белки. Остальные принято считать «генетическим мусором». Это значительно усложняет работу генетиков. Ведь даже для незначительных изменений приходится переработать огромное количество лишней информации.
Из этой проблемы у нас с Русланой и возникла идея стартапа DeepTrait. Мы решили создать продукт для рынка разработки лекарств, который будет способен анализировать геном с помощью искусственного интеллекта. По сути, это энтерпрайз-платформа, написанная на Python.
Все наши сотрудники, кроме Русланы, живут и работают во Львове. Ядро команды — 6 человек, трое ученых и трое инженеров. Но в целом в стартапе на ранней стадии нет особо строгого деления обязанностей: все делают всё, что могут.
Как сооснователь Руслана отвечает за научную составляющую, я — за организационную и техническую. К тому же как CEO я занимаюсь операционным управлением, развитием продукта, поиском инвестиций, еще часть времени пишу код.
Для роли CEO и управления компанией мне оказался полезным весь опыт, который я получал раньше: от юридического образования до экономического моделирования и инженерии. Работа в стартапе — это работа на границе сил, возможностей и квалификации.
Йеколя — плюшевая бактерия E.coli. Именно на геноме этого организма мы впервые успешно испытали нашу технологию
Типичный рабочий день
Мы работаем в режиме Lean startup: формулируем гипотезы и методично их проверяем. К примеру, есть гипотеза: «Такая-то проблема, которую мы решаем, — актуальна для фармакологического рынка». Наша задача — как можно быстрее и без лишних затрат подтвердить или опровергнуть эту гипотезу. И только после этого мы принимаем решение о том, вкладывать ли ресурсы в техническую разработку.
Ни у меня, ни у сотрудников пока что нет типичного рабочего дня. Все зависит от того, какую гипотезу мы проверяем в данный момент и на какой стадии проверки находимся.
Чаще всего я начинаю рабочий день около 11 часов утра. Но иногда приходится вставать и в 7:00, потому что на 8:00 назначен какой-то важный звонок с клиентом из другой часовой зоны.
Наш метод проектного управления ближе всего к Kanban, и единственный ежедневный повторяющийся этап — короткое синхро и приоритизация задач с командой. Затем мой рабочий день может быть наполнен абсолютно всем, что важно для компании:
- встречами с клиентами и инвесторами;
- финансовой отчетностью;
- написанием статей и подготовкой презентаций;
- анализом рынка;
- какими-то стратегическими идеями;
- время от времени — написанием кода.
К примеру, когда мы писали основную функциональную часть нашего продукта, у меня на инженерные задачи уходило до 80% рабочего времени. Это был в какой-то мере новый опыт, ведь последние 5 лет я больше работал с организационными задачами, чем с конкретными технологиями.
Сейчас на программирование уходит до 10% времени. А остальные 90% — как раз на организационные вопросы и коммуникацию с клиентами, инвесторами и другими участниками рынка.
Сколько часов в неделю работаю — сказать не могу. Иногда заканчиваю рабочий день около 19:00, иногда приходится засидеться до ночи. Но на самом деле работа не заканчивается, когда отхожу от компьютера: какие-то рабочие мысли продолжают крутиться на фоне. Многие из идей, которые мы успешно используем, приходили в голову во внерабочее время, например, на прогулке.
Инструменты и продуктивность
Для меня единственная мера продуктивности — это результат. А идеальный сотрудник — тот, кто сам берется за задачу, определяет сроки выполнения и выполняет ее в рамках этих сроков.
Я не использую какие-то специальные подходы по тайм-менеджменту, но очень верю в Ordnung в немецком его понимании и плохо переношу хаос в рабочем процессе. Если переводить слово Ordnung буквально — это порядок. Но в Германии в это понятие вкладывают бОльший смысл: это «то, как должно быть правильно».
Я для себя под этой концепцией понимаю организованный подход к работе. Если мы за что-то беремся, то доводим процесс до конца. Если поставили дедлайн, то придерживаемся его и при этом не страдает качество работы. Если назначаем встречу или созвон на такое-то время, то не опаздываем. В прошлом я уже сталкивался с более хаотичным подходом к работе, когда отношение к планированию и обязательствам более расслабленное, и понял, что для меня это некомфортно.
Идеи и задачи мы с командой фиксируем на доске в Trello. Стараемся так формулировать каждую задачу, чтобы на ее исполнение уходило от одного дня до недели. Примеры: подготовить новый набор геномных данных для машинной обработки, найти контакты представителей инвестиционного фонда, которые специализируются на стартапах нашего направления.
Все рабочие митинги я заношу в Google-календарь: так удобнее отслеживать, какие временные слоты уже заняты, чтобы случайно не назначить два разных звонка на одно и то же время. К тому же календарь присылает автоматическую напоминалку.
Для организации базы знаний и документации мы используем Confluence. Как хранилище кода — GitHub. Еще из интересных инструментов — GPU computing. У нас очень большие объемы данных, поэтому работать на собственных серверах получается дешевле, чем в облаке. Мы приобрели два сервера: Titan X и Tesla V100.
Мессенджеры и почту проверяю регулярно, это важно для работы. А вот с соцсетями у меня свои методы: я есть только в Facebook и подписан там на небольшое количество людей и страниц изданий вроде The Economist, The New York Times, TechCrunch. За день у меня в ленте может появиться
Книги и самообразование
Наш стартап находится на стыке двух сфер: биологии и искусственного интеллекта. И если со вторым я знаком давно, то знания по биологии и генетике приходится восполнять по ускоренной программе :)
Очень помогают разбираться в новых областях онлайн-курсы на Coursera, Udacity и edX. К примеру, недавно проходил:
- Classical papers in molecular genetics — курс про ключевые открытия молекулярной биологии в ХХ веке;
- Drug development — обзорная программа о процессе разработки лекарств и фармацевтическом бизнесе;
- Writing in sciences — курс о написании научных статей, но на самом деле — о том, как красиво излагать любую информацию на английском.
Чтобы быть в курсе новостей из мира искусственного интеллекта и машинного обучения, читаю научные статьи. Стараюсь не пропускать публикации, которые выходят на NeurIPS, ICML, CVPR.
Также моя любовь с детства — книги. Около года назад я открыл для себя Amazon Audible. Каждый день у всех нас есть какое-то количество времени, когда головной мозг не загружен: утренняя рутина, занятия спортом, дорога на работу и домой. В это время его можно занять аудиокнигой.
Таким образом я за год прослушал более двух десятков книг. Где-то половина из них касалась биологии, генетики и фармацевтики, вторая половина — все что угодно.
Скажем, недавно дослушал The Fantastic Laboratory of Dr. Weigl Артура Аллена — документальная повесть о львовском биологе межвоенного периода Рудольфе Вайгле, изобретателе вакцины от сыпного тифа, многократном нобелевском номинанте и праведнике мира. Его технология производства вакцины требовала выращивания вшей в лабораторных условиях. И многие представители львовской интеллигенции, включая Стефана Банаха и членов львовской математической школы, смогли пережить войну благодаря тому, что работали «кормителями вшей» в лаборатории Вайгля. К сожалению, этой книги нет в переводе.
Ретроспектива и планы
Мне сложно посоветовать себе 10 лет назад что-то конкретное — я бы этих советов 10 лет назад все равно не послушал :) Всему свое время.
Что касается советов ребятам, которые сейчас задумываются о запуске своего стартапа: я уверен, что это будет интересное приключение. Но в то же время — больше стресса и неопределенности, чем при «обычной» работе в IT-компании. В краткосрочной перспективе вы, скорее всего, недозаработаете какие-то деньги и даже наоборот, потратите личные сбережения. Но есть вероятность, что в долгосрочной — все наверстаете. И если не деньгами, то бесценным опытом.
За эти два года с DeepTrait я глубоко погрузился в фармацевтику и биотехнологии. Буквально на каждом шагу удивлялся и продолжаю удивляться тому, насколько эта сфера огромна, сколько в ней нерешенных проблем невероятного потенциала для нашего здоровья и жизни, а также — сколько возможностей для применения современных методов анализа данных и искусственного интеллекта. Как минимум ближайшие годы я бы хотел провести здесь.
Сейчас мы уже подходим к концу первого этапа развития стартапа, который связан с поиском и проверкой гипотез. Мы все еще учимся предсказуемо выполнять технические задачи, находить клиентов, генерировать интерес на рынке. Если получится удачно завершить этот этап, я, может быть, схожу в отпуск на недельку-другую, чтобы переключиться :) А потом мы начнем следующий этап — этап роста. Будем заключать новые контракты и развивать продукт.