Немає нічого неможливого, або Із військового кореспондента — в NLP Engineer
Анатолій Шара — військовий кореспондент і волонтер, який перебував у найгарячіших точках російсько-українського фронту у
Ця історія — не тільки мотивація для тих, хто сумнівається у собі, а й нагадування: відстоювати свою державу можна не лише на передовій зі зброєю в руках. Будь-яка сфера може приносити користь. Наприклад, Data Science — дієвий інструмент в інформаційному спротиві. Але про все за порядком.
Дебальцеве, 2014 р.
З військового журналіста — в айтішника
У мене вже є вища освіта за спеціальністю «Іноземна філологія», але сьогодні здобуваю другу вищу в ІПСА, КПІ.
До 2014 року працював вчителем, перекладачем контрактів, фінансових документів і договорів. Але з початком російсько-української війни став їздити на Донеччину, Луганщину як фіксер для різних світових видань (Iltalehti, NZZ, Zeit, Euronews, NYT), а потім став військовим кореспондентом «Українського тижня», де опублікував понад 40 статей, які описували бойові дії на Сході. Загалом був свідком окупації Криму, розгортання «руской вєсни» та активних бойових дій на Донбасі. Перебував у всіх без винятку гарячих точках цієї війни.
Піски, 2015 рік
Моє завдання було зібрати комплексну інформацію про бойовий шлях українських військових підрозділів, щоб через деякий час історики та військові аналітики могли використовувати ці матеріали для своєї роботи. Більшість моїх колег концентрувалися на людському вимірі війни, я ж намагався зібрати її аналітичну складову.
Це було надзвичайно складно, адже для кожної своєї статті треба було інтерв’ювати кілька десятків військових. Вони часто плуталися в описі одних і тих самих подій, додавали своє, перекручували. Доводилося постійно верифіковувати інформацію, адже тільки так можна було скласти більш-менш комплексну картину. До речі, кілька моїх статей використали як базові сценарії для документальних фільмів. Наприклад, я був перший, хто більш-менш цілісно описав кровопролитні бої за Луганський аеропорт чи Савур-Могилу, невидиму роботу підрозділів спеціального призначення.
Постійно перебуваючи на передовій, я не міг не помітити, що українська армія перебувала в жахливому стані, тому з друзями почав активно збирати допомогу. Наша команда передавала автомобілі, тепловізори, біноклі, генератори.
Це фото зроблене тоді, коли наші війська тільки взяли Дебальцеве. Я був перший з журналістів, хто там побував
Зрештою, до середини 2016 року я перебував постійно на передовій, отримав кілька контузій і відкритий перелом плеча та ключиці, але найстрашніше — посттравматичний синдром. Найцікавіше, що подолати його допомогло занурення у нову сферу — Data Science, а ще друзі з-поміж цивільних, які з’явились завдяки навчанню.
Коли я перестав їздити на фронт, мене запросили в Deutsche Welle у Німеччині. Там я і познайомився з Data Science: один журналіст у Кельні розповів, що він разом з колегами проводить журналістське дослідження, що передбачає вивчення багатьох документів і джерел інформації. На моє запитання про те, як вдається проаналізувати такі масиви даних, мені розповіли про DS. З того моменту стало цікаво, що це і як його можна ще використовувати.
Старт в Data Science
Після повернення в Україну почав шукати курси з Data Science. Один з них обіцяв зробити з мене спеціаліста за два тижні, але це просто неможливо. Натомість я почав проходити різні навчання від Projector. На курсі, організованому спільно з Grammarly, під назвою «Data Science. Natural Language Processing» я захистив курсову на тему «Пошук російських наративів про Революцію Гідності в німецьких медіа». Я був єдиним, хто взяв в роботу не англійську, українську чи російську мову, а німецьку.
Захист курсової роботи на курсі NLP від Projector та Grammarly
Як виявилось, з англійською працювати простіше, але не так цікаво: є багато інших мов і мовних груп, які не мають готових рішень в NLP і потребують розробки.
Тут згадалося, як під час захисту курсової чомусь не запустилась «демка». Буквально на колінах усе переробив, щоб показати, як працює мій класифікатор. На війні зрозумів: усе можна виправити, крім кулі в лоб. Треба вірити, що все вдасться.
Згодом, у 2019 році, я почав активно реалізовувати Data Science проєкти в українській компанії One Philosophy Group. Там я працював над різними завданнями. Але більшість з них стосувалася інформаційної безпеки. І знання, які я отримав на курсах в Projector, допомагали в цьому.
На першому проєкті потрібно було аналізувати німецькі та австрійські медіа щодо наявності російських наративів про німецько-російський газовий проєкт «Північний потік-2». По суті, це був скрейпінг даних видань і вже потім їхній детальний аналіз за допомогою різних фреймворків.
Якщо докладніше, то в результаті ми отримали величезний масив даних у вигляді коментарів під статтями про Nord Stream-2 з шести різних медіа за весь час їхнього існування і з’ясували, що понад 60% цих коментарів (більше як 200 000), слово в слово повторюють заяви російського президента Путіна, прем’єр-міністра Медвєдєва, інших політиків про цей газогін. Якщо розділити ці коментарі за популярністю, то виходить таке: «Росія — це надійний постачальник газу в Європу», «США проти „Північного потоку-2“, бо хочуть продавати свій шельфовий газ», «Україна — це ненадійний партнер», «Північний потік −2» — суто економічний проєкт" тощо. Ба більше, в цих коментарях йдеться про «громадянську війну в Україні», «шоколадного короля Порошенка», «фашистів, нацистів в Україні». Чи може це бути просто збігом? Не думаю.
Тут, власне, стало зрозуміло, що Data Science чудово допомагає у веденні інформаційної війни. На жаль, NDA забороняє розповідати, хто був замовником дослідження та як його використовували, але головне, що це було на користь України. Основна складність проєкту полягала в написанні алгоритмів для аналізу даних, бо німецька мова дещо складніша за англійську. Наприклад, речення «я маю яблуко» можна сказати по-різному: «Ich habe einen Apfel», «Einen Apfel habe ich», «Habe ich einen Apfel», тож потрібна лінгвістична підготовка. Але важливіше, звісно, знати статистику, алгоритми, фреймворки.
Наступний проєкт був пов’язаний з нав’язуванням німцям комплексу вини за Другу світову війну. Тут я отримував дані, застосовував тематичне моделювання для того, щоб дізнатися, які ключові слова входять в основні наративи, а вже потім тренував класифікатори для визначення, до якої категорії належить те чи інше повідомлення. Цей проєкт ще більше додав впевненості в тому, що росіяни на серйозному рівні «пропрацьовують» європейців. По суті, вони окупували їхній інформаційний простір, оперуючи ботами та формуючи вигідні їм меседжі у текстах коментаторів-ботів.
Чому Data Science — це цікаво
Через півтора року я змінив роботу, оскільки мені хотілось «робити щось з нуля». Перейшов до сінгапурської фінтех-компанії, у київському офісі якої будують пайплайни для в’єтнамської, індонезійської мов.
У команді — три людини. Тут розробляють некласичні методи ML для NLP, Speech-to-Text, активно застосовують Deep Learning.
Мені як NLP-спеціалісту цікаво розібратися з новими мовами. Наприклад, я не опановував в’єтнамську чи бахасу, але вивчав структурну лінгвістику, що розглядає мову як об’єкт і дає загальне розуміння, як вона влаштована. Цих знань достатньо, щоб опрацьовувати їх в контексті моєї роботи.
Рішення з визначення тональності текстів цими мовами вже зараз використовують і приносять користь бізнесу. Це не R&D, де можна довго експериментувати й не отримати видимого результату.
А недавно я перейшов в українську компанію Semantrum, яка займається медіамоніторингом. Компанія працює з багатьма європейськими мовами, окрім звичних української та російської. Я працюю над визначенням тональності повідомлень, класифікації текстів, іменованих сутностей тощо. І все це за допомогою сучасних методів ML. Це новий виклик долі для мене, який я з вдячністю прийняв.
Плани з розвитку і поради початківцям
З нуля до Data Scientist я дійшов за три роки інтенсивного навчання, але вже мав математичну підготовку. Нині продовжую розвиватися: чотири рази на тиждень вивчаю алгоритми та математичні моделі з тьюторами, один з яких працює у FAANG. Ну й не забуватимемо про навчання в ІПСА.
Планую розвиватись у вузькому напрямі, що пов’язаний з мовами та великими даними, адже бути експертом у багатьох галузях складно, лише одиницям це вдається.
Ось що я раджу початківцям або світчерам.
Відмовитись від ілюзій. Ми не можемо вибирати, в який час жити, але можемо обрати, яким чином жити. Так, буде важко, багато чого не буде вдаватись, але варто рухатись вперед — і зусилля обов’язково винагородяться. Щоб не вигоріти на початку шляху, не треба ставити на цьому етапі недосяжні цілі. Не вимагайте від себе неможливого! Великий шлях складається з маленьких кроків. Ідіть до своєї мети поступово.
Налаштуватись на постійне навчання. Швидких результатів не буде. Бо треба освоїти багато дисциплін: математику, статистику, алгоритми та багато інших суміжних сфер.
Обрати сферу. Усе залежить від особистих вподобань, але не варто себе обмежувати у спробах почати з чогось нового. Щось та й сподобається більше. У цьому напрямі треба поглиблювати знання.
Вчити англійську мову. А інакше як дивитись туторіали і читати пейпери?
Інвестувати гроші. Безкоштовне навчання — малоефективне навчання.
Звертати увагу на клімат у робочому колективі. Психологічний стан — надважливий, він залежить від тімліда та команди. Тож, обираючи роботу, треба орієнтуватись не на бонуси на зразок безкоштовних спортзалів, смузі, а на те, чи спокійний, врівноважений тімлід. Це замінить і масажі, і печиво.
Якщо вам бракує мотивації (мабуть, найважливіший розділ)
Якось 2015 року я перебував на позиціях
Під час поїздки під ДАП
Пізніше, вже перебуваючи в Німеччині, один хлопець підійшов до мене в кафе і німецькою запитав, чи я впізнав його. Виявилось, це військовий, з яким ми зустрілися в Широкиному. Сам він з Єнакієвого і воював у складі одного з добровольчих батальйонів. І йому запам’яталося, що, окрім оптики, я їм привіз торбу з книгами українських авторів. І деякі з них чоловік забрав з собою в Німеччину.
У 2016 році я відвідував фінські збройні сили, вивчав їхній досвід. Там же, у Гельсінкі, організували лекцію для фінських студентів про те, що відбувається в Україні. Після неї підійшов хлопець, який доводив, що все не так, мовляв, в Україні — громадянська війна. Довелось багато спілкуватись і переконувати, щоб він знав правду. Мені не було байдуже, тому вдалось «відбити пацана» у пропагандистів з Росії.
Замість висновку
Я переконаний, що кожен може «завести трактор» і «звалити», але чи єдиний це варіант? Бо все ж таки наше коріння — тут, в Україні. Звичайно, ми не обирали, де народитись, але чи не здається вам, що те, що не змінили наші батьки, маємо змінити ми? Принаймні спробувати. Крім того, для того, щоб допомогти своїй країні, не всім треба воювати в окопах, можна знайти інші способи, як через свою спеціалізацію приносити користь.