Как я работаю: Сергей Шельпук, СЕО DeepTrait, в прошлом Head of Data Science

[В рубрике «Как я работаю» мы приглашаем гостя рассказать о своей работе, организации воркспейса, полезных инструментах и лайфхаках]

Сергей Шельпук — сооснователь и СЕО стартапа DeepTrait. Компания разрабатывает методику ускоренного анализа генома при помощи искусственного интеллекта — самообучающихся нейронных сетей. Технология помогает понять, какой именно участок генома отвечает за те или иные характеристики.

Сейчас в команде Сергея 6 человек. В 2019 году DeepTrait привлек $300 тыс. от польских инвесторов. В этом году заключил контракт с первым коммерческим клиентом.

До того как основать собственный стартап, Сергей возглавлял Data Science отделы в компаниях SoftServe и Eleks, а также преподавал AI и Machine Learning на факультете прикладных наук в УКУ.

На рабочем месте в офисе

О себе

Программированием я заинтересовался еще в детстве. В младших классах у нас в школе был класс информатики с советскими компьютерами 1991 года выпуска — «Поисками», где нас учили основам Basic. Как я теперь понимаю, в 1993-1995 годах это было большое везение. Также мне повезло с доступом к компьютеру: в начале-середине девяностых мой дедушка занимался конструированием микросхем и привез себе домой компьютер i386 — «тройку». Я мог заниматься на нем, когда бывал у них в гостях. Много времени уходило на игры, но был и Basic, и Turbo Pascal. Так началось мое увлечение технологиями. В те времена программирование вовсе не считалось престижной профессией, скорее наоборот.

В 2003 году я поступил на факультет электроники в КПИ — надеялся научиться программированию. Но мне не понравилось, что и как нам преподавали. Я не понимал объяснения лекторов — причем даже по тем предметам, по которым у меня были сертификаты и хорошие оценки с внешних курсов. Один из таких примеров — курс по IP-сетям. В итоге первый год учебы оставил впечатление о том, что я абсолютно непригоден к точным наукам.

Поэтому на третьем курсе я параллельно поступил в Национальную юридическую академию им. Ярослава Мудрого изучать юриспруденцию. Это был конец 2005-го: меня вдохновила Оранжевая революция. Я поверил, что теперь в стране все изменится, и хотелось участвовать в строительстве нового государства.

Какое-то время учеба в двух университетах шла параллельно, но в КПИ я так и не доучился: на 4-м курсе не подал к защите дипломную работу. Казалось, технический диплом мне уже не понадобится — я устроился на работу юрисконсультом в компанию «Венбест-юрконсалтинг». Мне нравилось правоведение, я искренне им увлекался. За три года дорос до заместителя директора компании и принял решение уйти из отрасли. Дело в том, что по своим обязанностям юрист плотно взаимодействует с государственной системой страны, а результаты выборов 2010 года сильно изменили ее в худшую сторону.

В 2010-м я начал работать в IT — на должности системного аналитика в компании NetCracker. Эту вакансию мне порекомендовали знакомые, которые работали в компании. Как раз пригодились мои знания по IP-сетям, умение работать с SQL и понимание общих подходов к разработке информационных систем.

Тогда же я восстановился в КПИ на 4-й курс факультета информатики и вычислительной техники. Единственной целью было получить диплом, в котором будет написано «Компьютерные науки» — на случай, если захочу работать за рубежом.

В 2011 году мне посчастливилось пройти первые три курса Стэнфорда, которые университет выложил в бесплатный доступ: Artificial intelligence by Sebastian Thrun & Peter Norvig, Machine Learning by Andrew Ng и Databases by Jennifer Widom.

Это был важный для меня момент: я увидел, как выглядит качественный курс точных наук. Он очень отличался от того, что было в КПИ. А машинное обучение как дисциплина показалось особенно увлекательным.

О переезде во Львов и переходе в Data Science

На новогодние праздники в 2012-м мы с друзьями ездили в Карпаты и на обратном пути заехали во Львов. Мне очень понравился этот город, и я подумал: а почему бы сюда не переехать? За несколько месяцев до этого со мной связывались рекрутеры из львовского офиса SoftServe, но релокацию я даже не стал рассматривать. Как и многие коренные киевляне, был уверен, что цивилизация в Украине есть только в Киеве :) Но, когда увидел Львов вживую, мое мнение изменилось.

В марте я уже приступил к работе бизнес-аналитиком во львовском офисе SoftServe. На тот момент я еще не нашел друзей в городе и у меня было много свободного времени. Мне всегда было интересно узнавать что-то новое, и я решил поступить на какую-нибудь дистанционную учебную программу от топового мирового университета.

Подал документы сразу в два вуза:

  • В Лондонскую школу экономики и политических наук (LSE) — тогда это был один из немногих топовых вузов, который предлагал пройти полный бакалавриат удаленно. Выбрал программу «Управление информационными системами», потому что чувствовал пробелы в своей квалификации в технологическом менеджменте.
  • В Стэнфорд — потому что меня восхищали подходы этого вуза к преподаванию бесплатных онлайн-курсов, и хотел посмотреть, как выглядит полноценная учеба. Выбрал магистерскую программу «Искусственный интеллект», страшно понравилось это направление. Удаленно можно было пройти треть программы.

На мое удивление, меня взяли в оба вуза. Стэнфордскую программу я закончил за 3 года, в 2015-м. Программу LSE — за 6 лет, в 2018-м. Можно было и скорее, конечно, но балансировать такую нагрузку с работой было бы слишком сложно. Я ни на миг не жалею, что пошел учиться. Уже в 2013 году мне выпала возможность применить свои знания по искусственному интеллекту на практике.

В 2013 году Маккинси выпустил отчет, в котором прогнозировалось, что к 2018 году в мире будет не хватать 200 тыс. Data Scientists и 2 млн менеджеров с навыками принятия решений на основании данных. Тогда я предложил SoftServe попробовать создать первый в Украине сервис для этой ниши. В компании согласились пойти на такой эксперимент, и я возглавил первый отдел Data Science.

Первый Data Scientist, которого я пригласил на работу в новый отдел, поделился интересным наблюдением. Пока у него в профиле на LinkedIn было указано, что он программист, ему каждый день писали рекрутеры. А как только поменял должность на Data Scientist — тишина. В то время в Украине еще почти никто не знал, что это такое и есть ли у этого направления перспективы.

Передо мной встал другой вопрос: как строить Data Science как сервис и как его продавать. Знания, которые я получил благодаря программе Стэнфорда, позволяли вполне на равных и очень предметно разговаривать с западными партнерами и клиентами. А программа LSE, в свою очередь, дала хорошее общее понимание менеджмента информационных систем, места каждой активности в общем процессе и их взаимосвязи.

В 2014 году я возглавил отдел Data Science в компании VITech, в 2016-м — в Eleks. В Eleks за два года мы построили самый большой Data Science отдел среди украинских сервисных компаний: в команде собралось более 30 специалистов.

Также в 2016-м я стал преподавать машинное обучение и искусственный интеллект на программе компьютерных наук в УКУ. При создании учебных планов УКУ отталкивался от программ Стэнфорда и других лучших университетов мира. Нашей целью было сделать так, чтобы по окончанию бакалавриата студенты могли пройти собеседование в крупные технологические компании вроде Google, Facebook или Apple. Среди первых выпускников программы компьютерных наук УКУ были и те, кто начал карьеру в Google.

Для меня преподавательская работа — это своего рода волонтерство. Я искренне болею за качественное высшее образование и считаю, что это один из немногих реальных способов преобразовать наше государство. По сути, хорошее образование обеспечивает человеку следующие 50 лет жизни.

В 2018 году я оставил УКУ, чтобы сфокусироваться в работе над собственным стартапом.

О стартапе DeepTrait

Больше 10 лет назад я познакомился с Русланой Радчук. Руслана — ученый-исследователь немецкого Института генетики растений и исследований сельскохозяйственных культур им. Лейбница, специалист в области молекулярной и клеточной биологии, а также генной инженерии культурных растений.

У Русланы есть талант объяснять сложные вещи просто и понятно для неспециалистов в генетике. Благодаря ее объяснениям я и заинтересовался этой областью. Сначала читал блог Русланы на платформе LiveJournal, а в 2015 году мы познакомились вживую: она приехала во Львов рассказать о биоинформатике на конференции IT Arena.

С Русланой Радчук

Однажды Руслана рассказала мне об интересной биологической задаче, решений для которой еще нет. Вот краткая предыстория.

Более 100 лет назад немецкий доктор Пауль Эрлих продвигал идею о том, что химические соединения могут избирательно взаимодействовать с процессами в организме. Он назвал это «магической пулей», и с тех пор этот принцип стал основой современной фармацевтики. Фактически все лекарства состоят из какого-то химического соединения, которое взаимодействует с белками нашего организма и за счет этого усиливает или редуцирует их функцию.

В организме человека, по разным оценкам, есть более 2 млн разных белков. Мы плохо знаем их функции и понимаем, как работает лишь очень маленькая их часть. Вместе с тем при разработке новых лекарств возникает вопрос: с какими именно белками должен взаимодействовать препарат, чтобы добиться ожидаемого фармацевтического эффекта?

Белки происходят из генов, и изучать гены — существенно проще, чем белки. При этом лишь некоторая информация, содержащаяся в генах, отвечает за те или иные характеристики. К примеру, в геноме человека свыше 3 млрд нуклеотидов, однако лишь около 1,5% из них кодируют какие-то белки. Остальные принято считать «генетическим мусором». Это значительно усложняет работу генетиков. Ведь даже для незначительных изменений приходится переработать огромное количество лишней информации.

Из этой проблемы у нас с Русланой и возникла идея стартапа DeepTrait. Мы решили создать продукт для рынка разработки лекарств, который будет способен анализировать геном с помощью искусственного интеллекта. По сути, это энтерпрайз-платформа, написанная на Python.

Все наши сотрудники, кроме Русланы, живут и работают во Львове. Ядро команды — 6 человек, трое ученых и трое инженеров. Но в целом в стартапе на ранней стадии нет особо строгого деления обязанностей: все делают всё, что могут.

Как сооснователь Руслана отвечает за научную составляющую, я — за организационную и техническую. К тому же как CEO я занимаюсь операционным управлением, развитием продукта, поиском инвестиций, еще часть времени пишу код.

Для роли CEO и управления компанией мне оказался полезным весь опыт, который я получал раньше: от юридического образования до экономического моделирования и инженерии. Работа в стартапе — это работа на границе сил, возможностей и квалификации.

Йеколя — плюшевая бактерия E.coli. Именно на геноме этого организма мы впервые успешно испытали нашу технологию

Типичный рабочий день

Мы работаем в режиме Lean startup: формулируем гипотезы и методично их проверяем. К примеру, есть гипотеза: «Такая-то проблема, которую мы решаем, — актуальна для фармакологического рынка». Наша задача — как можно быстрее и без лишних затрат подтвердить или опровергнуть эту гипотезу. И только после этого мы принимаем решение о том, вкладывать ли ресурсы в техническую разработку.

Ни у меня, ни у сотрудников пока что нет типичного рабочего дня. Все зависит от того, какую гипотезу мы проверяем в данный момент и на какой стадии проверки находимся.

Чаще всего я начинаю рабочий день около 11 часов утра. Но иногда приходится вставать и в 7:00, потому что на 8:00 назначен какой-то важный звонок с клиентом из другой часовой зоны.

Наш метод проектного управления ближе всего к Kanban, и единственный ежедневный повторяющийся этап — короткое синхро и приоритизация задач с командой. Затем мой рабочий день может быть наполнен абсолютно всем, что важно для компании:

  • встречами с клиентами и инвесторами;
  • финансовой отчетностью;
  • написанием статей и подготовкой презентаций;
  • анализом рынка;
  • какими-то стратегическими идеями;
  • время от времени — написанием кода.

К примеру, когда мы писали основную функциональную часть нашего продукта, у меня на инженерные задачи уходило до 80% рабочего времени. Это был в какой-то мере новый опыт, ведь последние 5 лет я больше работал с организационными задачами, чем с конкретными технологиями.

Сейчас на программирование уходит до 10% времени. А остальные 90% — как раз на организационные вопросы и коммуникацию с клиентами, инвесторами и другими участниками рынка.

Сколько часов в неделю работаю — сказать не могу. Иногда заканчиваю рабочий день около 19:00, иногда приходится засидеться до ночи. Но на самом деле работа не заканчивается, когда отхожу от компьютера: какие-то рабочие мысли продолжают крутиться на фоне. Многие из идей, которые мы успешно используем, приходили в голову во внерабочее время, например, на прогулке.

Инструменты и продуктивность

Для меня единственная мера продуктивности — это результат. А идеальный сотрудник — тот, кто сам берется за задачу, определяет сроки выполнения и выполняет ее в рамках этих сроков.

Я не использую какие-то специальные подходы по тайм-менеджменту, но очень верю в Ordnung в немецком его понимании и плохо переношу хаос в рабочем процессе. Если переводить слово Ordnung буквально — это порядок. Но в Германии в это понятие вкладывают бОльший смысл: это «то, как должно быть правильно».

Я для себя под этой концепцией понимаю организованный подход к работе. Если мы за что-то беремся, то доводим процесс до конца. Если поставили дедлайн, то придерживаемся его и при этом не страдает качество работы. Если назначаем встречу или созвон на такое-то время, то не опаздываем. В прошлом я уже сталкивался с более хаотичным подходом к работе, когда отношение к планированию и обязательствам более расслабленное, и понял, что для меня это некомфортно.

Идеи и задачи мы с командой фиксируем на доске в Trello. Стараемся так формулировать каждую задачу, чтобы на ее исполнение уходило от одного дня до недели. Примеры: подготовить новый набор геномных данных для машинной обработки, найти контакты представителей инвестиционного фонда, которые специализируются на стартапах нашего направления.

Все рабочие митинги я заношу в Google-календарь: так удобнее отслеживать, какие временные слоты уже заняты, чтобы случайно не назначить два разных звонка на одно и то же время. К тому же календарь присылает автоматическую напоминалку.

Для организации базы знаний и документации мы используем Confluence. Как хранилище кода — GitHub. Еще из интересных инструментов — GPU computing. У нас очень большие объемы данных, поэтому работать на собственных серверах получается дешевле, чем в облаке. Мы приобрели два сервера: Titan X и Tesla V100.

Мессенджеры и почту проверяю регулярно, это важно для работы. А вот с соцсетями у меня свои методы: я есть только в Facebook и подписан там на небольшое количество людей и страниц изданий вроде The Economist, The New York Times, TechCrunch. За день у меня в ленте может появиться 10-20 постов. А если ничего нового нет, то не на что и тратить время :)





Книги и самообразование

Наш стартап находится на стыке двух сфер: биологии и искусственного интеллекта. И если со вторым я знаком давно, то знания по биологии и генетике приходится восполнять по ускоренной программе :)

Очень помогают разбираться в новых областях онлайн-курсы на Coursera, Udacity и edX. К примеру, недавно проходил:

  • Classical papers in molecular genetics — курс про ключевые открытия молекулярной биологии в ХХ веке;
  • Drug development — обзорная программа о процессе разработки лекарств и фармацевтическом бизнесе;
  • Writing in sciences — курс о написании научных статей, но на самом деле — о том, как красиво излагать любую информацию на английском.

Чтобы быть в курсе новостей из мира искусственного интеллекта и машинного обучения, читаю научные статьи. Стараюсь не пропускать публикации, которые выходят на NeurIPS, ICML, CVPR.

Также моя любовь с детства — книги. Около года назад я открыл для себя Amazon Audible. Каждый день у всех нас есть какое-то количество времени, когда головной мозг не загружен: утренняя рутина, занятия спортом, дорога на работу и домой. В это время его можно занять аудиокнигой.

Таким образом я за год прослушал более двух десятков книг. Где-то половина из них касалась биологии, генетики и фармацевтики, вторая половина — все что угодно.

Скажем, недавно дослушал The Fantastic Laboratory of Dr. Weigl Артура Аллена — документальная повесть о львовском биологе межвоенного периода Рудольфе Вайгле, изобретателе вакцины от сыпного тифа, многократном нобелевском номинанте и праведнике мира. Его технология производства вакцины требовала выращивания вшей в лабораторных условиях. И многие представители львовской интеллигенции, включая Стефана Банаха и членов львовской математической школы, смогли пережить войну благодаря тому, что работали «кормителями вшей» в лаборатории Вайгля. К сожалению, этой книги нет в переводе.

Ретроспектива и планы

Мне сложно посоветовать себе 10 лет назад что-то конкретное — я бы этих советов 10 лет назад все равно не послушал :) Всему свое время.

Что касается советов ребятам, которые сейчас задумываются о запуске своего стартапа: я уверен, что это будет интересное приключение. Но в то же время — больше стресса и неопределенности, чем при «обычной» работе в IT-компании. В краткосрочной перспективе вы, скорее всего, недозаработаете какие-то деньги и даже наоборот, потратите личные сбережения. Но есть вероятность, что в долгосрочной — все наверстаете. И если не деньгами, то бесценным опытом.

За эти два года с DeepTrait я глубоко погрузился в фармацевтику и биотехнологии. Буквально на каждом шагу удивлялся и продолжаю удивляться тому, насколько эта сфера огромна, сколько в ней нерешенных проблем невероятного потенциала для нашего здоровья и жизни, а также — сколько возможностей для применения современных методов анализа данных и искусственного интеллекта. Как минимум ближайшие годы я бы хотел провести здесь.

Сейчас мы уже подходим к концу первого этапа развития стартапа, который связан с поиском и проверкой гипотез. Мы все еще учимся предсказуемо выполнять технические задачи, находить клиентов, генерировать интерес на рынке. Если получится удачно завершить этот этап, я, может быть, схожу в отпуск на недельку-другую, чтобы переключиться :) А потом мы начнем следующий этап — этап роста. Будем заключать новые контракты и развивать продукт.

Похожие статьи:
Graphics Interchange Format (GIF) is becoming very popular among a lot of individuals and it is not a surprise to see that a lot of videos are being converted to this type of format. The most popular GIFs are the animated version because they are...
Ми поспілкувалися з Михайлом Рогальським, співзасновником monobank. Розпитали його про те скільки співробітників monobank отримують...
Beauty is in the eyes of the beholder. But when it comes to beauty packaging, the eyes of the customer can be easily lured into buying a product with an attractive design, the more instagrammable, the better. But that doesn’t come...
Компания Samsung готовит к выпуску наследника своего бюджетного смартфона Galaxy J1. Новая модель будет представлена в следующем...
Rust — не дуже поширена технологія, проте вона посідає високі сходинки в різноманітних рейтингах мов програмування....
Яндекс.Метрика