Март 31

Пішла з Lyft, щоб зрозуміти поведінку ШІ. Історія української Data Science-спеціалістки, яка досліджує AI Alignment

Марія Королюк будувала кар’єру в Data Science ще до того, як цей напрям став мейнстримом. За майже 10 років вона попрацювала в McKinsey, Stripe і Lyft. Зараз вона стала дослідницею AI alignment — напряму, який вивчає, як зробити ШІ безпечним, чесним і корисним для людини. Його напрям розвивають усього в кількох містах світу.

У розмові з DOU Марія розповіла, як увійшла в Data Science, що їй дала освіта в Європі та чому вона зрештою змінила сферу. А ще — що саме вона досліджує в поведінці LLM і чому за цей перехід довелося заплатити стабільністю.

«Data Science тоді ще так не називався». Про освіту в Україні та Європі

З 2009 року я навчалася на механіко-математичному факультеті КНУ. Тоді Data Science ще так не називався, і в мене навіть комп’ютера не було. Цей напрям починав набирати обертів у 2012-2013 роках.

Коли я була студенткою, нейронки ще не існували. AlexNet, один з перших прикладів успішного вирішення прикладних задач, зʼявився лише в 2012-му. Тому я займалася більш класичними речами: XGBoost, регресіями. З часом додавалися нові алгоритми, нові методи, софт. Коли ШІ вийшов на достатньо високий рівень, щоб бути цікавим не лише як технічний алгоритм, а як об’єкт, я перекваліфікувалася в його розробку.

Після закінчення бакалаврату 2012-го я подалася на магістратуру в Європу за програмою Erasmus Mundus (раніше Марія детально розповіла на DOU про участь у програмі — ред.). Це передбачає два роки навчання в різних країнах. У моєму випадку це був рік в Англії і рік у Швеції. Програма досі діє, на неї можна податися і отримати повну стипендію та гроші на проживання, тобто власні заощадження фактично не потрібні. Нині стипендія становить близько 1400 євро, також організатори покривають витрати на переїзд і навчання.

В Erasmus Mundus є різні напрями, зокрема технічні. Я подалася на три програми, мене взяли на дві, і я обрала ту, яка була ближчою до Data Science, бо на той момент це було для мене найорганічнішим продовженням навчання.

Відбір складався з кількох базових етапів: потрібно було подати мотиваційний лист, резюме, описати свій досвід і пройти інтерв’ю. Тоді процес не був надто довгим чи складним за структурою. Ще треба було скласти тест з англійської — IELTS на 6,5 бала і вище. Він специфічний, і до нього точно варто підготуватися. Але якщо людина вже вільно читає, дивиться фільми англійською і трохи розбереться у форматі тесту, то це цілком реально.

Конкурс на програму великий. Проте якщо ви сильний і активний студент, у вас уже є щось поза навчанням, як-от власні проєкти, волонтерство чи інші напрацювання, — це дуже підвищує шанси.

Тому, якщо вам є що показати, точно варто подаватися. А якщо поки що ні, почніть це будувати. Це не обов’язково має бути щось масштабне. Хорошим початком буде участь в хакатонах і літніх школах, open-source code, раніше цінувалися змагання на Kaggle.

До речі, на такі програми можуть подаватися люди до 35 років. Тобто можна спершу попрацювати, набратися досвіду, а вже потім повертатися до навчання.

При цьому я б не сказала, що якість освіти в Україні на Data Science гірша. Навпаки, українські заклади можуть дати більш потужну базу — наприклад, в УКУ чи KSE. Освіта в Європі для мене була способом розширити власний кругозір, завести нові знайомства і здобути досвід. Принципових відмінностей у навчанні в Україні та Європі, на мою думку, немає.

«Робота у Stripe дала потужний професійний буст». Про перші роботи

Після магістратури я знайшла свою першу роботу на фултаймі. Я працювала у Data Science команді McKinsey. Застосовувала методи штучного інтелекту для потреб бізнесу. У мене були різноманітні проєкти: від нелінійної оптимізації в логістиці до предикативних моделей у сфері маркетингу і продажів.

Як не дивно, але технічно складнішою була друга робота, у Stripe. Це американська фінтех-компанія, яка дає бізнесам інструменти для онлайн-платежів. Коли я влаштовувалася, паралельно подалася ще в чотири компанії.

«У результаті отримала два офери — від Facebook і Stripe»

Зрештою обрала Stripe. Ще кілька процесів дійшли до фінальних етапів, але без офера.

Якщо порівнювати з McKinsey, у Stripe з’явилося багато інфраструктурних задач, які досі даються важко (зараз допомагає Claude Code). До того ж це був початок COVID і мені не вистачало живої взаємодії з колегами. Саме тому технічно це був найважчий період.

Я працювала в команді Alternative Payment Methods. Попри назву, йшлося не про криптовалюти, а про банківські перекази й локальні способи оплати в різних країнах. Наприклад, у Польщі це Blik, у Нідерландах — iDEAL.

Я повинна була знаходити клієнтів Stripe, у яких уже є багато покупців з певного ринку, але ще немає локального способу оплати. Ми математично прогнозували такі потреби. Наприклад, якщо магазин продає футболки в Австралії, але має багато клієнтів із Польщі, йому варто додати польську платіжну систему Blik на сторінку оплати.

Також ми прогнозували, які методи оплати Stripe варто інтегрувати далі. Потрібно було зрозуміти, чи справді є достатньо покупців, для яких той чи інший метод важливий.

Робота в цій компанії дала мені потужний професійний буст. Мені ще було куди зростати. Дуже запам’яталася атмосфера швидкого масштабу. Коли ти запускаєш щось, чим уже завтра користуватимуться мільйони людей, і розумієш, що сам це знайшов, побудував і довів до запуску.

У той час Stripe зростав настільки швидко, що головним викликом було не знайти користувачів, а зробити рішення достатньо стабільним і надійним.

«Я отримала офер фактично з першої подачі». Про повернення в Україну і працевлаштування в Lyft

Коли почалася повномасштабна війна, я вирішила повернутися з Ірландії в Україну. Раціональних причин для повернення в мене тоді, мабуть, не було, але це здавалося правильним рішенням, і я про нього не шкодую.

Мені знадобився майже рік, щоб наважитися це зробити. Остаточне рішення я ухвалила у листопаді 2022 року і почала шукати роботу в Україні. Тоді ж подалася в Lyft. А вже в березні переїхала.

Мені не складно було шукати роботу як в Україні, так і за кордоном. Тому у Lyft перша і єдина моя подача завершилася інтерв’ю і офером. Деталі самих завдань я не розкриватиму, але згодом і сама проводила такі інтерв’ю в Lyft і добре пам’ятаю критерії оцінювання.

Якщо не рахувати розмови з рекрутером, було п’ять етапів. На першому за одну годину перевіряють максимум різних навичок. А наступні чотири вже сфокусовані кожен на окремому скілі. Для Data Science це, наприклад, продуктове мислення: тобі дають кейс, вхідні дані й дивляться, як ти міркуєш і розбираєш ситуацію.

«У моєму випадку від подачі до офера минуло приблизно два місяці»

Безпосередньо в Lyft я стала виконувати завдання в березні 2023 року. Формально робота була віддалена, але я дуже любила ходити в київський коворкінг.

У Lyft я працювала в decision-oriented Data Science. На цій ролі я мала допомагати команді визначати пріоритети, проводити A/B-тести, запускати їх, аналізувати результати й загалом розбиратися, що відбувається з метриками.

Якщо якась метрика падала чи зростала, я мала зрозуміти, чому так відбувається і що це означає. Я працювала в команді Customer Platform, яка відповідала за «здоров’я» застосунку: швидкість запуску, рендеринг, зависання, поломки — усе, що впливає на стабільну роботу застосунку.

«Як Data Scientist я ніколи займалася подібними завданнями». Чим відрізнялася робота в українській команді Lyft

Коли я потрапила в українську команду після іноземних компаній, одразу відчула різницю між колективами. Багато в чому вона була для мене плюсом. У київському офісі було набагато більше відчуття зв’язаності. Через те, що людей менше, всі одне одного знають, ти розумієш, хто чим займається, і можеш звернутися напряму по допомогу або щось уточнити.

Наприклад, у якийсь момент мені захотілося зробити власний внутрішній інструмент — Slack-бота, який щодня за допомогою ШІ зчитував мої метрики, аналізував їх і надсилав summary, як почуваються важливі метрики для кожної з комбінацій версія-операційна система. Як Data Scientist, я ніколи не займалася подібними завданнями, тому для мене це був виклик.

Тому я постійно радилася з ML-інженерами, як краще зробити, і в мене залишилися дуже теплі враження від того, наскільки охоче мені допомагали люди навіть не з моєї команди.

З іншого боку, в Україні сильніше відчувалася дистанція до центру ухвалення рішень. Коли ти працюєш в офісі, де є фаундери компанії, регулярно бачиш їх на all-hands чи навіть можеш випадково зустріти в ліфті, це створює інше відчуття близькості до продукту.

У Lyft цього мені трохи бракувало. Хоча тут зіграло роль і те, що моя команда працювала радше у фоновому шарі продукту: якщо ми все робимо добре, користувач цього просто не помічає. Ідеальна робота такої команди — коли нічого не ламається, не падає і не заважає людині користуватися застосунком.

«Я контролюю поведінку мовної моделі, змінюючи її архітектуру». Про звільнення з Lyft і кроки в AI alignment

Нині я знову живу за кордоном, у Лондоні, але вже через те, що пішла в нову сферу, якої в Україні поки що немає.

Я пропрацювала в Lyft приблизно два з половиною роки. Це був дуже класний досвід. Звільнилася з компанії у серпні 2025 року, тому що дізналася про існування AI Alignment і зрозуміла, що це саме та точка, де я можу застосувати знання. Це напрям, який досліджує, як зробити штучний інтелект безпечним, чесним і корисним для людини. Напряму всього пʼять років, його основні хаби в Лондоні і Берклі, тому довелося переіхати.

Для мене все почалося взимку 2024 року, коли я натрапила на дві статті, які повністю змінили моє уявлення про LLM. Перша — Language Models Can Learn About Themselves by Introspection. Друга про Alignment Faking від Anthropic.

Після цього я пів року просто вчилася. Дуже допоміг курс BlueDot: Technical AI Safety. Також я виконувала багато вправ на ARENA, експериментувала з моделями, пробувала нестандартні питання і дивилася, як змінюється їхня поведінка залежно від контексту.

Коли я зрозуміла, що хочу займатися цим серйозно, звільнилася з Lyft і приєдналася до MARS Fellowship — програми, де маленькі команди працюють із досвідченими менторами над задачами у сфері AI Safety.

«Проблема AI alignment в тому, що сучасні мовні моделі, як-от GPT чи Claude, уже вміють дуже багато»

Але ми досі не контролюємо, як саме вони приходять до своїх відповідей та чи справді ці відповіді розв’язують задачу, яку поставив користувач адекватним для задачі способом. З боку це виглядає просто: людина ставить запитання, модель відповідає. Але між цими двома точками всередині моделі відбувається дуже складний процес перемножень, активацій та обчислень, який ми поки не вміємо інтерптретувати.

Саме це мене і цікавить. Я намагаюся керувати тим, що відбувається всередині моделі під час генерування відповіді. Ця галузь досліджень називається механістична інтерпретованість. Ми пробуємо зробити модель, яка не зможе давати дивні, небезпечні або просто непродумані відповіді завдяки тому, що знаходимо ваги та активації відповідальні за таку поведінку. І підсилюємо чи зменшуємо їх. Наприклад, в одному з проєктів я співстворювала та спільно опублікувала модель трансформера з особливим блоком уваги. Ось код на GitHub.

Зараз я займаюся persona steering. Це дослідження того, чи можна змінювати поведінку моделі через її внутрішню архітектуру.

Зазвичай користувач намагається вплинути на модель через промт. Наприклад, пише «відповідай спокійно», «будь обережною», «поводься як асистент». Але це працює не завжди стабільно. Модель може спочатку поводитися нормально, а потім у довгій або емоційній розмові поступово «з’їхати» в іншу роль. Тобто вона вже відповідає не так, як ми очікуємо від безпечного помічника.

Саме тут і починається моя робота. Я досліджую, чи можна знайти всередині моделі ті механізми, які відповідають за її «типову» поведінку як асистента, і навчитися їх коригувати. Ідея в тому, щоб модель поводилася надійніше не тому, що її щоразу про це просять, а тому, що це закладено в сам спосіб її роботи.

Наприклад, одна з проблем у тому, що під час складних, терапевтичних або дуже емоційних розмов модель може почати надто сильно підлаштовуватися під співрозмовника. У деяких випадках це може доходити до того, що вона підтримує шкідливі або небезпечні думки користувача замість того, щоб м’яко повернути людину в безпечні рамки.

«Я розробляю методологію, щоб такі збої зупиняти»

Якщо сказати зовсім просто, то я займаюся чимось на кшталт налаштування характеру ШІ зсередини, і роблю це стабільніше, ніж команди в чаті. Для мене це важливо, бо зараз ШІ стає дедалі сильнішим, але питання безпеки не розвʼязується автоматично. Те, що модель добре пише код, відповідає на питання чи веде діалог, ще не означає, що вона завжди поводитиметься правильно. Ми вже бачили такі феномени, як галюцинації, брехня і маніпуляції.

Мене в цій сфері зачепило саме те, що тут ще дуже багато невідомого.

«Ідеї часто не живуть довше як тиждень». Про умови роботи дослідником

Для того, щоб займатися дослідницькою діяльністю, довелося чимось жертвувати. Моя робота зараз більш цікава, але умови стали складнішими, якщо порівнювати з роботою у великій компанії.

По-перше, стало менше стабільності. У Lyft у мене було відчуття передбачуваності: можна було планувати наперед, розуміти, що буде за пів року чи рік, спокійно думати про відпустку. Зараз цього майже немає. У дослідженнях ти не можеш нормально планувати на довгий термін, бо невідомо, до чого приведе навіть сьогоднішній експеримент.

По-друге, я заробляю менше. Точних цифр я не називаю, але навіть без поправки на переїзд до Лондона мій дохід після податків приблизно на 70% нижчий, ніж був раніше. А якщо враховувати, що Лондон набагато дорожчий за Київ, то ця різниця відчувається ще сильніше. Але ця різниця ще й у тому, тому, що я перейшла з сеньйорної позиції в інтернатуру, тому з часом збалансується. На донати і хліб з маслом все одно вистачає.

По-третє, змінився робочий темп. Я працюю довше і в більш інтенсивному режимі. Часто до пізнього вечора, з набагато меншим відчуттям «закритого робочого дня», ніж у корпоративному середовищі.

Водночас сам формат мені дуже подобається. У нас маленька команда — чотири людини на фултаймі на посаді research fellow. У нас є ментор і три супервайзери, які нас скеровують, але загалом ми працюємо досить самостійно. Тут набагато менше бюрократії, менше організаційних перепон і більше свободи.

Також тут значно вищий темп роботи. Якщо в продуктовій компанії одна гіпотеза могла жити місяцями, то тут ідеї часто не живуть довше як тиждень, а іноді — навіть один день. Ти перевіряєш щось зранку і якщо до вечора не бачиш результату, просто викидаєш цю ідею і рухаєшся далі. Для мене це був новий досвід, бо тут те, що ми зробили сьогодні, може повністю змінити те, що ми робитимемо завтра.

Мою роботу фінансує філантропічна організація, якій цікава тема безпечного ШІ. Також вона дає мені багато свободи в межах моєї теми.