«Мы понимаем, как превратить технологии в классный продукт, чтобы пользователь нас больше любил»

08 ноября 2024
20 мин.
Виктор Тарнавский
Виктор Тарнавский
Директор по искусственному интеллекту Т-Банка
Директор по искусственному интеллекту Т-Банка Виктор Тарнавский рассказал Ирине Хворостян, партнеру Kept, зачем компания развивает собственное семейство больших языковых моделей и открыла доступ к модели T-lite, как искусственный интеллект защищает клиентов банка от мошенников и помогает им решать ежедневные задачи и почему вымирание профессий из-за ИИ не грозит социальной катастрофой.
Финансовый сектор бесспорно лидирует по внедрению технологий искусственного интеллекта в России, включая большие языковые модели (LLM). По большому счету, в стране немного компаний, способных развивать LLM, и Т-банк — одна из них. Как принималось решение о запуске этого масштабного проекта? Какие ожидания были на первом этапе? Что получилось, а что нет?
Действительно, небольшое количество компаний в принципе могут сделать генеративный искусственный интеллект. Особенно большие языковые модели. Это требует больших инвестиций — прежде всего финансовых. Но еще нужно суметь построить большое комьюнити профессионалов.

Это может быть неочевидно снаружи, но большая часть работы современных банков — те же скоринговые модели — основана на искусственном интеллекте. Традиционный пример — служба поддержки, качество и эффективность которой можно улучшить благодаря большим языковым моделям.

Т-Банк очень давно занимается искусственным интеллектом. Это уже многие годы не просто банк, а технологическая компания с большой экосистемой. Поэтому столь значимую технологию с большим потенциальным вкладом в бизнес мы обойти не могли, и решение о запуске масштабного проекта по созданию собственных LLM было закономерным.
Т-банк развивает собственное семейство больших языковых моделей Gen-T. В отличие от ChatGPT, это не общая универсальная модель, а несколько инструментов, заточенных под разные продукты. Почему вы на это пошли?
Есть игроки, которые предоставляют API или более близкие к бизнесу on-premise решения, на основе которых можно построить уже что-то свое. Но в таком подходе есть свои ограничения. Первый барьер связан с приватностью, и банкам достаточно сложно его преодолеть, а в некоторых случаях вовсе невозможно. Иногда в принципе нельзя построить свои контуры работы с данными на основе технологий, которые тебе не принадлежат.

Второе ограничение — сам уровень технологий. Если тебе нужно лучшее решение на рынке, оно должно быть заточенным под твои сценарии, а значит, только ты можешь его разработать. Другие компании, в том числе в нашей стране, создают действительно классные решения высокого уровня. Но если нужно решение под конкретную задачу, чтобы оно было лучше всех остальных на рынке, единственный вариант — создать его самим. К тому же при наших масштабах бизнеса, объемах данных и возможностях выгоднее иметь собственную команду для развития больших языковых моделей. Просто мало кто из конкурентов может это делать.
По некоторым оценкам, мировой рынок больших языковых моделей переоценен примерно в два с небольшим раза. Кажется, где-то мы уже это видели. Как этот факт влияет на ваши планы относительно развития данного направления?
Действительно, вокруг больших языковых моделей в мире возник некоторый пузырь. Люди слишком верили в технологию и вложили в нее слишком много денег и усилий, а отдача от инвестиций получилась не такой значимой, и акции многих компаний начали падать.

Мы понимали это, когда начинали работу над своими языковыми моделями. Мы точно не хотим создавать технологию ради технологии и строить большую базовую модель (foundation model), которая умеет решать множество задач, потому что для нас как для бизнеса это бессмысленно. Нам не нужна модель, которая, например, решает ЕГЭ или юридические тесты.
Большую модель можно сравнить с огромным неповоротливым мозгом. Во время работы она съедает очень много ресурсов и поэтому много тормозит. Небольшие модели под конкретные задачи работают быстрее, и стоимость на единицу запроса тоже значимо ниже.
Мы понимали, что у нас есть определенное количество доменных областей — по-простому сценариев и понятные задачи в этих доменных областях. Решить такие задачи сильно проще, чем сделать одну огромную модель, которая хорошо решает все задачи, — разница в затраченных ресурсах больше чем в 10 раз. В результате мы делаем не одну модель, а семейство моделей, каждая из которых заточена под свою доменную область, и ее результат в конкретной области превосходит результат большой модели и по качеству, и по возврату инвестиций.

У нас есть достаточно устойчивая финансовая модель, как с лихвой окупать все наши инвестиции в большие языковые модели. Этим в целом мало кто сейчас может похвастаться.
Вы прямо честно считаете окупаемость инвестиций в ИИ по финансовой классике?
Конечно, да. Тем более Т-Банк как финтехкомпания оценивает возврат на инвестиции практически по каждому проекту. Наши затраты на большие языковые модели были не такими большими по сравнению с другими компаниями или в тысячу раз меньше, чем у международных, и мы понимаем, какие продукты и решения принесут пользу, в том числе в деньгах, и заранее построили экономическую модель, и она сходится не через десятки лет — интервал меньше пяти лет.
Коммерциализируете ли вы свои решения или используете только внутри экосистемы Т-Банка?
Мы активно продаем наши решения. При этом мы сфокусированы на продажах конечных B2B-продуктов, которые помогают конкретному бизнесу решать его задачи. Мы не создаем cloud-решения.

Большой популярностью пользуется речевая аналитика. Кроме того, мы много работаем вместе с AnyQuery, улучшая с помощью ИИ их поиск для сайтов и интернет-магазинов.
Мы видим нашу цель в построении решений для малого и среднего бизнеса, а не для других технологических компаний.
Продажа технологических решений помогает нам совершенствоваться. Если создаешь решения только для себя, то не понимаешь, где находишься, не получаешь сигнал от рынка, насколько твое решение конкурентоспособное. Для этой задачи большой объем продаж не нужен. Нужно быть одним из ключевых игроков, но не нужно быть лидером рынка или захватывать весь рынок.
А есть ли у Т-Банка сторонники в создании больших языковых моделей для конкретной функциональной области? Кто-то уже пошел таким же путем?
Больших игроков, которые буквально делают так же, в России, по крайней мере, нет. Обычно все пытаются построить большую модель и еще помериться с другими, насколько у них большой и умный по всему спектру задач искусственный интеллект. Мы такую задачу себе не ставим, потому что это бессмысленно. Другие компании тоже начинают это понимать и разрабатывать заточенные под конкретные задачи решения.

Если посмотреть, что делают крупные компании на основе огромных моделей, станет ясно, что они пытаются дистиллировать модели — создавать маленькие и более эффективные модели из больших. Мы этот этап уже прошли. Все компании идут примерно к одному, копая этот тоннель с разных сторон. Индустриальные модели начнут появляться, просто это займет время.
Вы строили большую языковую модель T-lite для повышения эффективности собственных процессов, а потом взяли и выпустили ее в открытый доступ. Зачем?
Мы выпускаем в open-source не только модели, но еще и библиотеки. Мы видим своей миссией помогать сообществу и выпустили open-source модель, чтобы развивать вокруг нас комьюнити профессионалов в работе с большими языковыми моделями. Мы в меньшей степени смотрим на это как на конкурентное поле, в котором сражаются разные компании, и верим в силу большого комьюнити профессионалов из разных компаний. Это в бóльшей степени голубой океан, а не красный.
Когда мы помогаем друг другу, все продвигаются вперед. Нам надо объединяться, а не сепарироваться и каждому в своем в углу что-то делать.
К тому же, мы получаем от комьюнити обратную связь с точки зрения развития наших собственных технологий, моделей, опенсорсных решений — это помогает нам понимать, на каком технологическом уровне мы находимся.

Еще это повышает мотивацию нашей команды, а нам как компании важно иметь сильную команду профессионалов, заинтересованных в своей работе. Лучше работать в компании, которая помогает всей индустрии.
Это важная тема — как мотивировать страшно ценный айтишный ресурс и повысить лояльность к работодателю. Вы нашли один из ключей, потому что деньги не являются долгосрочным мотиватором, нужна нематериальная мотивация. У вас есть лаборатория T-Bank AI Research, где ученые исследуют ИИ. А зачем банку или экосистеме банка наука как таковая?
В сфере ИИ нужно быть на фронтире. Мы делаем вещи такого уровня сложности, где нет готовых решений, — нельзя просто прочитать статью и пойти воспроизвести. Например, компания OpenAI выпускает модели и не рассказывает, как они это сделали, — есть результат, но нет методички. Многие вещи приходится додумывать самим. Большую часть работы, которую выполняют ребята, мы применяем в индустриальных решениях.

Наша команда исследователей очень успешна, публикует и представляет научные статьи на больших международных конференциях — мы являемся одним из двигателей мировой науки. Одновременно благодаря большой научной команде растет и наш статус в сообществе. Плюс наука сильно переплетена с образованием, и мы достаточно сильно вовлекаемся в выращивание специалистов в области ИИ.
Вернемся к теме решений, которые вы развиваете под конкретные задачи в компании. Например, Т-Банк использует технологию распознавания и синтеза речи для общения с клиентами, NLP (обработку естественного языка) для проверки качества услуг, анализ временных рядов для прогноза необходимого количества наличных в банкомате. А можешь привести неочевидные примеры?
У нас есть два больших направления работы. Первое — сделать какой-либо процесс в компании лучше, быстрее или за меньшие деньги. Например, повышение эффективности сотрудников — одна из самых плодотворных с точки зрения возврата инвестиций областей. В службе поддержки, продажах и операционной деятельности банка можно многое оптимизировать благодаря большим языковым моделям.

Вторая большая область — это пользовательский опыт. Его часто упускают из виду, потому что невозможно напрямую оценить, сколько денег принесет улучшение пользовательского опыта. Но Т-Банк — компания продуктовая, и мы хотим делать лучшие продукты для наших клиентов. Это сфера, где за счет технологического рычага можно сильно продвинуть пользовательский опыт. Умные ассистенты, более умный поиск, речевые сервисы, которые позволяют людям лучше взаимодействовать с нашей экосистемой или с внешним миром — например, секретарь, который отвечает на звонки.

Мы используем технологию машинного обучения и из всего массива информации извлекаем ценный сигнал: на что жалуются люди, что плохо сделано. Далее мы сообщаем продактам, что именно людям нравится или не нравится, и у каждого продакта появляется понятный набор проблем для работы. То есть мы доводим это вплоть до изменения в конечном продукте. Это довольно ценная часть работы Центра искусственного интеллекта.
Для нас самое главное — выстроить долгосрочные отношения с пользователем и помогать ему лучше решать ежедневные задачи. Мы точно понимаем, как превратить технологии в классный продукт, чтобы пользователь нас больше любил.
Каждый год количество атак на банки увеличивается, и игроки финансового рынка тратят огромное количество ресурсов на противодействие этой угрозе. Это тоже один из ваших приоритетов?
Это абсолютно точно один из наших приоритетов. Наш фокус — защитить пользователя от всевозможных мошеннических угроз. Некоторые из них проще предотвратить, а борьба с другими требует технологий с очень высоким уровнем распознавания речи и большим корпусом данных, чтобы выявлять мошенников.

Например, иногда нужно быстро понять, что звонит мошенник, и обрубить звонок. Мы уже это делаем. Защиту такого уровня может позволить себе довольно небольшое количество игроков.
Также мы достаточно хорошо видим тренды в мошенничестве и риски будущего. Например, текущий вектор опасности связан с видеокружочками в мессенджерах. Мы достаточно давно знали, что это произойдет, потому что следим за технологиями и знаем, на какой стадии сейчас синтез видеоизображений и фейковых видео. Мы понимали, что это вопрос времени, когда этим воспользуются мошенники, и заранее подстелили соломку — и знаем, как защищать пользователей.
А каковы выгоды внедрения ИИ для клиентов банка? Причем разных групп: юрлиц, вкладчиков, пользователей экосистемы.
Выгода находится в трех плоскостях. Первую мы затронули — это безопасность. Если ты обладаешь лучшими на рынке технологиями или стремишься к этому, ты можешь создать самую безопасную экосистему среди конкурентов.

Вторая область — это пользовательский опыт. Мы хотим создавать самые удобные решения на рынке и считаем себя признанными инноваторами в области финтеха во всем мире. Мы много общаемся с международными компаниями и понимаем, что занимаем лидерские позиции с точки зрения пользовательского опыта.

Что это означает для пользователей? Они будут получать самые классные способы решения своих ежедневных задач — умных ассистентов, поисковые решения, рекомендации. С нами можно будет решать свои задачи быстрее и проще.

Третье направление — когда ты повышаешь эффективность внутренних процессов и сокращаешь издержки, в конечном счете цена решения для пользователя снижается.
Очень позитивная картинка. А можешь привести примеры, когда технология понятна, опыт есть, проект калибровали, но что-то пошло не так?
Путь построения продуктов и технологий на базе искусственного интеллекта — это путь проб и ошибок. Бывает, что проект не реализуется, и это нормально. Такова специфика всего R&D (сокращение от Research and Development — прим. Mustread).

Например, в лаборатории T-Bank AI Research большой процент инициатив вообще ни к чему не приводит. Такова реальность — ну да, не получилось, пошел что-то другое делать. Если привести примеры, то лет пять назад при первом заходе на создание телефонного секретаря мы были слишком оптимистичны и думали, что будет легко. Но изначальные амбиции не реализовались. На опыте ошибок мы начали заново. Это обычная история, особенно когда делаешь вещи, которые до тебя никто не делал, — не у кого подсмотреть, и ты сам проходишь весь путь.

Мы извлекаем полезные знания в том числе из наших неудач. Когда не складываются какие-то проекты, мы не сокрушаемся: «Не получилось, выкинул папочку в мусорную корзину и забыл про нее». Нет, мы корректируем идею, иногда перестраиваем способ реализации и технологию — такая наша философия.
Как устроен процесс поиска идей, как они калибруются и кто принимает решение создавать продукт?
Вася и Петя самые главные и принимают решения — это очень далеко от того, как устроен Т-Банк. Очень важно создать креативную среду из продактов, разработчиков, инженеров, которые обмениваются мнениями, благодаря чему вспыхивают идеи и затем вырастают в конечный продукт. При такой культуре и степени свободы количество идей, которые дошли до результата, значимо больше, чем при вертикальной структуре с командиром, который говорит: «Это делаем, а это — нет». Мы стараемся поддерживать горизонтальную структуру, и поэтому у нас много умных ребят с высокой насмотренностью.

Проблемы с тем, что у нас огромное количество идей и их надо фильтровать, нет. Потому что в Т-Банке challenge-среда. Идеи подвергаются достаточно жесткой калибровке — когда кто-то приходит с идеей, его сразу закидывают вопросами: «Какой будет возврат инвестиций и точно ли это нужно пользователям? Давай проведем исследование?».
Мы за data-driven подход и привержены подтверждать идеи данными — это базовый фильтр. И когда идея доходит уже до определенного уровня, например, до меня, скорее всего, она уже прошла через тернии, подкреплена данными и обрела сторонников.
С другой стороны, такой подход может демотивировать. Условно, я Ира, сотрудник Т-Банка, и у меня есть классная идея, но, пока я одолею всех «акул» и «крокодилов», желание проходить через это снова в следующий раз отпадет.
Такой риск есть, и мы считаем его частью работы. Если у тебя есть идея, тебе нужно доказать коллегам — кто акула, а кто мишка, — что идея хорошая. Мы считаем, что это правильная профессиональная среда, в которой ты должен не просто генерить идеи, а быть достаточно смелым, чтобы уметь доказать их целесообразность данными. И в целом у нас оседают люди активные, которые готовы за свои идеи побороться. Нам точно не нужны генераторы идей, которые просто красиво звучат, но за этим ничего нет. Нам нужен результат.
Давай затронем социальную тему. Мы все боимся, и СМИ нагнетают, что рано или поздно ИИ заменит человека, а мы останемся без работы. Ты упоминал, что эти опасения не разделяешь. На чем основан твой оптимизм?
Оптимизация работы сотрудников звучит страшно. Но фактически задача — дать инструмент, чтобы сотрудникам было проще выполнять свою работу.
Объясню на примере автопилотирования автомобилей. Есть шесть градаций — на первом этапе автопилот просто сигнализирует, что ты уходишь с полосы, а на последнем ты можешь сидеть на пассажирском сидении, а машина едет сама. И между этими крайностями множество градаций. Когда мы создаем решения в помощь сотрудникам, мы не с последнего начинаем. На первом этапе инструменты дают подсказки, потом предлагают определенные шаги, и только на высших уровнях решение выполняет бо́льшую часть работы за человека, а он лишь подтверждает. Есть огромный барьер между первым и высшим уровнем, и мало какая индустрия его прошла. Большая часть всей работы происходит на первых пяти этапах. Поэтому профессионалам бояться довольно странно. Эти инструменты помогут выполнять работу быстрее и лучше.

Показательная история — про генерацию изображений. Когда появился Midjourney, художники протестовали. А потом компания Adobe интегрировала в Photoshop генеративные инструменты, которые позволяли дорисовать картинку, и все такие: «Вау, крутая штука!». Прекратили протесты и начали применять эти инструменты. Думаю, так произойдет со всеми индустриями — появляются решения, благодаря которым профессионалы будут лучше выполнять свою работу.
Но у страха есть вполне рациональное зерно. Например, профессия переводчика потенциально может исчезнуть.
Да, профессия переводчика может значимо пострадать. Но, казалось бы, уже сейчас большие модели отлично переводят не только технические, но и художественные тексты. Я изучил, как меняется спрос на переводчиков в мире, и он растет — и сильно больше, чем на другие профессии, потому что расширяется взаимодействие между странами.

Сами переводчики используют нейросети как вспомогательный инструмент, и от этого они не становятся меньшими профессионалами — все равно именно они проверяют, чтобы все было правильно, и отвечают за результат.
Все-таки некоторые профессии действительно уйдут в небытие. Это происходит каждое столетие, и появляются новые профессии. У тебя как у лидера на острие развития технологий есть представление, чему сейчас стоит учиться? Какие профессии будут востребованы в будущем?
Не буду делать предсказаний — такой уровень футуризма не совсем моя зона ответственности.
Но тренды, которые мне уже достаточно очевидны, указывают на то, что знание в чистом виде как запоминание фактов теряет актуальность. Важны скиллы.
Важно уметь быстро всасывать знания и обладать фундаментальными навыками, которые позволяют быстро обучаться новому.

Второе — умение ясно излагать свои мысли становится все более важным, потому что значимая часть технологий начинает работать на естественном языке.
А если ты, как Эллочка-людоедка, не обладаешь большим словарным запасом?
Да, если ты не можешь двух слов связать, то у тебя будут проблемы. Раньше эта проблема накладывалась только на взаимодействие с людьми, а сейчас еще и на взаимодействие с машинами. Поэтому способности хорошо изъясняться, вести разговор про что угодно и воспринимать информацию становятся все более важны.
Какие собственные задачи ты лично делегируешь ИИ? Хорошо ли он с ними справляется?
В последнее время я стал использовать в жизни технологии ИИ больше, чем год назад. Я активно использую новые продукты поиска, например, Perplexity. Они позволяют не искать в интернете самому, а собирают summary.

Я активно использую инструменты работы с текстами. Они позволяют быстрее сформулировать мысли и идеи, загрузить информацию и быстро сделать выжимку. И еще я часто превращаю свои голосовые сообщения в текст.

Благодаря ИИ я могу сделать больше вещей за единицу времени. Это повышает мою продуктивность.
Есть ли у тебя сверхцель как у руководителя AI-центра? Какой идеей ты лично горишь?
Я хочу, чтобы за счет технологий жизнь людей становилась проще. Такая прямолинейная простая мотивация. Я работаю в большой технологической компании, потому что так эту задачу решать эффективнее: мы создаем продукты для большого количества пользователей, и после релиза их применяет огромное количество людей сразу. Получается, я повлиял на то, что у большого количества людей жизнь стала немножко проще.

Простой пример — финансы. Ты заходишь в приложение своего банка и можешь посмотреть структуру своих трат. Эта простая задача буквально несколько лет назад решалась просто ужасно, и до сих пор ни мы, ни другие не решили ее полноценно — нет понятного инструмента, который легко отвечает на вопрос, на что ты тратишь деньги, и позволяет спланировать, сколько копить на машину, например. Наша задача — сделать так, чтобы подобные решения появлялись. Это позволяет мне значимо повлиять на общество — сделать так, чтобы людям было проще жить.
Данные и аналитика, упоминаемые в интервью, предоставлены спикерами. Мнение редакции может не совпадать с мнением спикеров.
Виктор Тарнавский
Директор по искусственному интеллекту Т-Банка
До прихода в Т-Банк 10 лет проработал в «Яндексе»: занимался «Яндекс.Метрикой», AppMetrica и помогал создавать ClickHouse. Руководил разработкой приложения «Яндекс» и мобильного Яндекс Браузера. Последние два года в «Яндексе» руководил разработкой Яндекс Лавке.

Вам может быть интересно

Оцифровка рубля
string(80) "/upload/iblock/e03/3md4dsa5x6wwbmsdi8kemtu0i027xw9o/oblozhka-dlya-ssylok-_8_.jpg"
Мы используем файлы cookie, необходимые для работы сайта, а также аналитические cookies. Вы можете ознакомиться с Политикой использования файлов-cookies.