"ПОНИМАЮ ДИДЖИТАЛ"

Заговорить как Путин и Дудь: как устроено приложение-пародист, созданное при участии Бекмамбетова

«Фишка» приложения Parodist — возможность отправить другу мем или поздравление, озвученное голосами Владимира Путина, Ксении Собчак или Юрия Дудя. Новый сервис уже успел стать самым скачиваемым в российском App Store в категории «Развлечения» после TikTok. Сможет ли проект, созданный опытными IT-предпринимателями и знаменитым режиссером Тимуром Бекмамбетовым, сохранить популярность и научиться зарабатывать?

«Идите вы все ***** [куда подальше], ******** [нецензурное обращение], со своими поправками в Конституцию», — гремит голос Владимира Путина в начале YouTube-ролика Артемия Лебедева. Так известный дизайнер и блогер решил продемонстрировать аудитории возможности приложения Parodist, основная функция которого — клонировать голоса знаменитостей. Лебедев не без удовольствия констатировал, что и сам он «больше не нужен», потому что его текст «может озвучивать робот» (спустя месяц после публикации видео стало известно, что студия Лебедева использовала в работе еще и нейросеть).

Parodist — совместный проект прошлогоднего номинанта в рейтинг 30 самых перспективных россиян до 30 лет по версии Forbes Владимира Свешникова, автора робота-рекрутера «Вера», и Тимура Бекмамбетова, режиссера «Ночного» и «Дневного дозора», «Елок» и других известных фильмов. Результатом их сотрудничества стала нейросеть, которая голосом президента России может сказать: «Мне кажется, [подставить ФИО] может стать следующим президентом. Но только если перестанет зависать в телефоне и будет упорнее трудиться», голосом Ксении Собчак напеть популярную в TikTok песню «Патамушка», а голосом Дональда Трампа рассказать, что «America will be great again, если это видео наберет 10 000 лайков».

Шутки в якобы исполнении лидеров мнений полюбились пользователям TikTok, которые вставляют созданные нейросетью аудиодорожки в свои видео (Parodist уже использовали для создания более чем 6,4 млн роликов). А 20 июня нейросеть почти догнала по популярности и сам TikTok, оказавшись на втором месте в категории «Развлечения» в российском сегменте AppStore — и это без вложений в маркетинг.

Салют, Вера

На венчурном рынке 30-летний уроженец Владивостока Владимир Свешников известен как создатель робота-рекрутера «Вера». Это технология на базе искусственного интеллекта, которую используют на начальных этапах отбора кандидатов, преимущественно для массового хантинга. «Вера» помогает автоматизировать рутинные операции, которые занимают до 60% рабочего времени эйчаров: умеет находить на агрегаторах вакансий подходящие под запрос компании резюме, удалять дубли, обзванивать кандидатов, задавать вопросы по скрипту и распознавать ответы.

Владимир Свешников·DR

Робот-рекрутер не первый опыт Свешникова в бизнесе. Учась на четвертом курсе юридического факультета СПбГУЭФ (ФИНЭК), он запустил консалтинговое агентство «Ферст стрит», а позже занялся аутсорсингом персонала. Ниша оказалась слишком конкурентной, поэтому Свешников пробовал себя в других сферах: торговал айфонами, завезенными из Китая, а затем — капкейками, которые готовил его друг, но и это не приносило ощутимой прибыли.

«Люди перестали слушать, что робот говорит, хотя звонкам по работе на самом деле были рады и ждали их»

В 2013 году предприниматель увлекся разработкой сайтов и мобильных приложений, еще через год задумался о создании «Uber для кадровых агентств» — маркетплейса Stafory, где работодатели размещают вакансии, а кадровые агентства предлагают релевантных кандидатов (аналогичный сервис HRspace компания HeadHunter запустила только в 2016 году). К проекту присоединился знакомый Владимира Александр Ураксин, который до этого работал в кадровом агентстве «Акмэ».

Как уроженец Владивостока помогает корпорациям нанимать тысячи сотрудников

В 2016 году Stafory попал в акселератор Фонда развития интернет-инициатив (ФРИИ), где совершил свой главный пивот. Партнеры поняли, что большую часть работы рекрутеров — поиск резюме, «холодные» обзвоны с типовыми вопросами вроде: «Ищете ли вы работу?», «Интересна ли вам вакансия?» и т. д., можно автоматизировать. И придумали «Веру» — нейросеть, которая выполняет рутинные HR-операции за человека. Она умеет «читать» и распознавать текст, набирать номер телефона соискателя, синтезировать речь и задавать вопросы по заданному скрипту. Со временем у робота появился аватар — голубоглазая девушка с русыми волосами, который умеет проводить видеоинтервью с кандидатом. Но окончательное решение о том, принимать потенциального сотрудника на работу или нет, всегда оставалось за человеком.

За 2016-2018 годы стартап привлек около 300 млн рублей, основным инвестором оставался ФРИИ, которому, по данным СПАРК, принадлежит 40,01% ООО «Стафори». Кроме того, 7,4% компании у генерального директора Кировского завода (производит сельскохозяйственную, промышленную и военную технику) Георгия Семененко, который вложился в проект в конце 2018 года (детали сделки не разглашаются). Еще 5% у Алексея Костарева — IT-предпринимателя, создателя игры «Счастливый фермер» для «ВКонтакте», который был куратором проекта. Остальные доли у основателей: 34,6% — у Свешникова, 12,9% — у Ураксина.

Услугами Веры пользовались более 200 клиентов, среди которых российские представительства международных компаний PepsiCo, IKEA и L’Oreal. «Вера» заговорила на английском языке, под заказ были созданы версии на немецком, французском и итальянском. Появились клиенты в ОАЭ, Сербии, Индии. Выручка компании, по данным СПАРК, в 2017 году составила 13 млн рублей, в 2018 году — 31,2 млн. Аналитики Deloitte считали, что у проекта нет аналогов в мире, и пророчили международный успех — Свешников всерьез задумался выходить на рынок США, Германии и Великобритании, потому что в России «расти уже особо некуда было».

Робот-рекрутер «Вера»

Человек незаменимый

Но вопреки радужным прогнозам, в 2019 году рост стартапа резко прекратился — выручка «Стафори», по данным СПАРК, упала в 4,3 раза. «Мы пытаемся масштабировать «Веру» на американский рынок, поэтому на российском рынке осознанно оставили только ряд крупных клиентов — «Ростелеком»«Газпромнефть». Весь остальной бизнес срезали, потому что прибыли там мало», — объясняет Свешников. По мнению Кирилла Варламова, директора ФРИИ, причина падения в том, что стартап «раскачал рынок» и стал драйвером для появления конкурентов: «При росте конкуренции цены на сервис стали падать. И это логично, ведь он становится доступным для всех».

Основатель сервиса отбора персонала с помощью видеоинтервью VCV Арик Ахвердян, в свою очередь, предполагает, что время, когда люди с интересом реагировали на звонки роботов, прошло, и теперь их чаще принимают за спам. «Люди даже перестали слушать, что робот говорит, просто бросали трубку, хотя звонкам по работе они на самом деле были рады и ждали их», — не отрицает Свешников.

Путь «охотника за головами»: как сервис HeadHunter вырос из кадрового агентства в самую горячую IT-компанию России стоимостью более $1 млрд

«Они потеряли рынок по объективным причинам. Чат-боты при подборе персонала удобнее, надежнее с точки зрения сбора и хранения данных и дешевле, чем голосовые роботы. Коллеги попытались развиваться в сторону сбора обратной связи от сотрудников по другим HR-процессам, но для этого легче использовать не ботов, а опросные движки типа Qualtrics или SurveyMonkey», — считает автор Telegram-канала WTF_HR Александр Маслюк. По его словам, вывести технологию в более прибыльные сферы — маркетинг, телефонные продажи и обслуживание клиентов —  стартап не успел и ее быстро скопировали ведущие игроки,  в числе которых Сбербанк.

Весной 2019 года Свешников отправился в США, чтобы развивать «Веру» там, но за океаном технология тоже «заходит сложно»: мешает сильная конкуренция и юридические нюансы. «Стартап с русскими деньгами по нынешним временам там не welcome (не принимают радушно)», — считает Маслюк.

Фича для Бекмамбетова

Во время поездки в США Свешников заметил, что за границей «буйно растет» сканирование голосов — технология распознавания голоса, которая используется, например, для биометрической идентификации, — и решил развиваться в этом направлении. Технологическая база уже была накоплена — «Вера» умела распознавать текст и переводить его в речь. Чтобы нивелировать негативное отношение к роботу, Свешников хотел сделать голос ассистента более «человеческим» и узнаваемым. Но потом решил пойти дальше и научить искусственный интеллект «клонировать» голоса знаменитостей.

Для этого нейросеть прослушивает аудио с записью голоса нужного человека — в ход идут интервью или публичные выступления, — и сопоставляет спектрограмму (визуальное изображение звука) и последовательность звуков с текстовой расшифровкой. Запоминает особенности интонации, тембра голоса, паузы и вздохи, которые встречаются в речи. Нейросеть не склеивает текст из кусочков заранее записанных слов, а воспроизводит речь с нуля, отмечает основатель. Раньше для этого программе требовалось 40 часов обучения, сейчас спародировать новую личность нейросеть может после 30 минут «знакомства». Это направление назвали Vera Voice, технология обошлась стартапу в 20 млн рублей — ее развивали в начале 2019 года на привлеченные ранее инвестиции.

«Я вижу, что самое главное, что обеспечит прорыв, — это режиссура голосов. Нужно не только передать тембр, но и понимать характер говорящего»

В октябре того же года директор ФРИИ Кирилл Варламов рассказал о проекте своему давнему приятелю, режиссеру Тимуру Бекмамбетову: «Мне показалось, что его интерес к виртуальным медиамирам, где голос является неотъемлемой частью, и разработки команды Robot Vera могут иметь совместное продолжение».

Бекмамбетов развивает компанию Screenlife Technologies, которая занимается технологиями с использованием искусственного интеллекта и нейросетей в кинопроизводстве. Он заинтересовался Vera Voice по ряду причин, рассказал режиссер Forbes. Это и ее способность «создавать массу контента без участия человека», и возможность для развития творческого потенциала: «Я вижу, что самое главное, самое уникальное, что обеспечит прорыв, — режиссура этих [синтезированных] голосов. Нужно не только технически передать правильный тембр голоса и научить машину распознавать [текст], но и понимать характер говорящего человека. А это очень близко к моей профессии».

«Это похоже не на войну, а на революцию». Тимур Бекмамбетов о том, как изменится кино и вся наша жизнь после эпидемии

Кроме того, озвучка фильмов — долгий трудоемкий процесс, не всегда удается состыковать графики с актерами, «некоторые могут во время съемок уйти из жизни». Нередко Бекмамбетову приходилось прибегать к услугам профессиональных пародистов, так что синтезированные голоса станут «практичным и выгодным решением», говорит режиссер.

Сила голоса

28 октября Бекмамбетов и Свешников договорились о создании совместного предприятия Screenlife Technologies (работает от имени юрлица Bazelevs Entertainment Limited) и «Стафори», которое будет развивать наработки Vera Voice. По словам обеих сторон, это равноправное партнерство на паритетных началах. На вопрос, зачем понадобилось заключать партнерство, если можно было просто заказать услугу «под ключ» для реализации идеи или купить долю в стартапе, Бекмамбетов отвечает так: «Дело не в идеях, идей много. Дело в людях, которые способны их реализовать и сфокусироваться на них. Я просто верю в эту команду».

Официально СП пока не зарегистрировано. Свешников объясняет это тем, что партнеры еще выбирают юрисдикцию для будущего юрлица и обсуждают детали с инвесторами. Соглашения между сторонами закреплены в меморандуме о намерениях (есть в распоряжении Forbes). Команда «Стафори» отвечает за код и технологию, эксперты  Бекмамбетова — за обработку данных и звукорежиссуру.

«Мы понимаем, что можно голосом Навального позвать на митинг. Имитировать глобальные разговоры Кадырова с Путиным»

Технологией заинтересовались клиенты сразу в нескольких областях. В ноябре 2019-го партнеры подписали контракт для озвучки фильмов и рекламных проектов с основателем студии «Кубик в кубе» Русланом Габидуллиным — голосом сериалов «Отбросы», «Южный парк», «Мистер Робот», «Черное зеркало», фильмов «Ультраамериканцы» и «Дэдпул». Оказалось, о том, чтобы рекламные ролики «заговорили» голосом Габидуллина, мечтали многие российские агентства. Доходы нейросеть будет делить с обладателем голоса (в каких пропорциях — не уточняется). По словам Свешникова, в работе уже несколько коммерческих проектов, но детали не раскрываются.

В конце того же года Vera Voice бесплатно «оживила» Владимира Высоцкого для Театра на Таганке — артист теперь «говорит» со зрителями перед спектаклем. По словам Свешникова, руководство театра планирует сделать отдельную комнату, где любой желающий сможет поговорить с виртуальным клоном легенды.

«Высоцкий» запустил «сарафанное радио», к Свешникову и Бекмамбетову стали обращаться компании, которые придумали для технологии собственное практическое применение. Например, Vera Voice заключила годовой контракт с радио «Европа Плюс» — с 1 января нейросеть озвучивает новости голосами певицы Елены Темниковой и ведущего радиостанции Алексея Мануйлова. Сумма сделки не разглашается.

«Можно выбрать голос для голосового ассистента, чат-бота или озвучки рекламного ролика. Как вариант, создать диджитал-копию селебрити и использовать во всех рекламных каналах одновременно. Голос не обязательно должен быть существующего человека, его можно полностью синтезировать», — перечисляет варианты развития технологии Валерий Шарипов, основатель агентства Malivar, которое создает виртуальных инфлюенсеров.

Внезапные миллионы: какие компании неожиданно богатеют на пандемии

Всего на b2b-решениях синтезирования голоса Vera Voice, по словам Свешникова, со старта сотрудничества с Бекмамбетовым заработала 1 млн рублей выручки. В будущем предприниматели планируют создать маркетплейс, где, с одной стороны, будут «клоны» голосов знаменитостей, с другой — коммерческие заказчики.

Ненастоящий президент

Несмотря на активный интерес со стороны корпоративных заказчиков, авторы Vera Voice понимали, что настоящий вирусный эффект может дать только массовый сегмент пользователей. «UGC (контент, созданный пользователями. — Forbes) будет очень активно развиваться. Через индустрию развлечений можно более эффективно продвигать этот продукт», — объясняет стратегию Бекмамбетов.

В качестве эксперимента партнеры решили записать объяснение того, как работает их продукт, голосами Владимира Путина, Владимира Познера и Ксении Собчак и выложили ролик в YouTube. Это действие не нарушает закон, говорит Мария Дорошенко, экс-руководитель Центра общественных связей Роспатента, автор и ведущая блога «Чувство собственности», так как голос человека не является объектом интеллектуальной собственности. По ее словам, уведомлять и выплачивать вознаграждения тем, на кого сделана пародия (человеком или нейросетью — неважно), не нужно.

Ксения Собчак узнала о том, что ее голосом пользователям YouTube рассказывают о реккурентных сверточных нейросетях, от корреспондента Forbes. Проект ей настолько понравился, что она попросила контакты Свешникова и спустя пару часов сообщила, что планирует с ним сотрудничать. «Я поговорила с Володей, мы выработали общую концепцию. Мы сделаем классный пиар!» — написала Собчак в ответном сообщении (правда, комментарий о том, как она относится к использованию своего голоса, так и не дала). По словам Свешникова, они обсудили коллаборацию для передачи «Осторожно: Собчак», которая выходит на Youtube-канале Ксении. «Договорились, что они [команда Собчак] вернутся со сценарием и идеей коллаба. Технология им очень нравится», — уверяет Свешников.

Один из пользователей хотел услышать произнесенную голосом президента фразу «Я устал. Я ухожу»

Тестовая запись прошла успешно, и партнеры решили переработать Vera Voice в аналог FaceApp, где любой пользователь мог записать текст и воспроизвести его голосом выбранной звезды. Собрали фокус-группу, но оказалось, что люди чаще всего синтезировали мат, оскорбления и политические заявления. Один из пользователей, например, хотел услышать произнесенную голосом президента фразу «Я устал. Я ухожу».

Свешников понял, что технологией могут заинтересоваться мошенники: «Вопрос этики нас стопорнул. Мы понимаем, что [с помощью технологии] можно голосом Алексея Навального позвать на митинг. Имитировать глобальные разговоры Рамзана Кадырова с Владимиром Путиным. Или просто испортить публичному человеку личную жизнь псевдопризнанием». Такому проекту грозили и юридические риски, подтверждает Екатерина Тягай, партнер коллегии адвокатов Pen & Paper: «Если лицо, чей голос пародирует приложение, посчитает, что пародия наносит вред его чести, достоинству или репутации, то этот человек может обратиться с требованиями о защите нарушенных прав».

Серый кардинал YouTube: кто помогает Дудю, Саше Спилберг и Ивангаю зарабатывать миллионы

Чтобы не подвергать проект рискам, основатели решили сделать ставку на юмор: озвучить заранее подобранные шаблоны шуток и поздравлений, причем голос намеренно делают немного роботизированным, чтобы считывалась пародия. «Попытки создать виртуальные голоса на полном серьезе неэффективные. Чем больше голос похож, тем страшнее становится, тем меньше в него веришь. Если относиться к этому слишком серьезно, продукт не взлетит», — объясняет Бекмамбетов. Нюанс непохожести в известной степени защищает разработчиков и от потенциальных претензий со стороны артистов, одобряет стратегию Тягай.

Эта концепция легла в основу приложения Parodist. В его меню пользователи могут прослушать заранее записанные мемы в исполнении голосов Путина, Навального, Собчак, Юрия Дудя, Ольги Бузовой, Артемия Лебедева и других известных личностей и отправить аудиодорожку другу или скачать запись, чтобы наложить поверх свое видео. По мнению юриста Тягай, схема также обезопасила стартап от юридических рисков, связанных с правами на тексты песен, литературных произведений и т. д., которые нельзя использовать без разрешения правообладателя, и свела к минимуму возможность использовать сервис мошенниками в корыстных целях. Если мошенники или пранкеры все же сумеют использовать сервис для обмана, то им (а не разработчикам), в зависимости от тяжести преступления, будет грозить штраф или уголовная ответственность за хулиганство.

Вторая опция приложения позволяет выбрать шаблон шутки или поздравления в аудио- или видеоформате, и вписать три слова (подразумевается, что это будет ФИО нужного человека). Например, нейросеть голосом Дудя произнесет: «Здравствуй, Иванов Иван Иванович. Я знаю все причины, почему ты не придешь ко мне на интервью. И первая — это то, что я тебя на него не зову». Шутку можно скачать или отправить другу.

Разработчики понимают, что пользователи могут вписать в поле что угодно, поэтому ввели стоп-листы с нецензурной лексикой и высказываниями, связанными с терроризмом, которые тоже отлавливает нейросеть. Также в приложении есть раздел «Магия», где можно записать свой голос и узнать, на кого из знаменитостей он похож.

Вирус TikTok

Parodist появился в онлайн-магазинах приложений в марте. При раскрутке ставку решили сделать на TikTok. «У них очень точная для нас и аудитория, и бренд TikTok предполагает шутливую и юмористическую интонацию, которая стала ядром бренда Parodist», — говорит Бекмамбетов. Первые видео в TikTok с использованием аудиодорожек из Parodist появились в начале марта, их опубликовали сотрудники стартапа и их знакомые.

Благодаря алгоритмам соцсети, который рекомендует к просмотру видео даже начинающих блогеров, на ролики обратили внимание другие пользователи, в том числе Артемий Лебедев (не ответил на запрос Forbes), который продемонстрировал возможности приложения на своем YouTube-канале. А певец Алишер Моргенштерн (отказался от комментария), который опубликовал запись «официального обращения Путина к Моргенштерну»: «Дорогой Алишер Моргенштерн, не знаю, чем вы сейчас занимаетесь, но предлагаю вам сегодня провести время со мной. Надеюсь, вы мне не откажете».

Свешников уверяет, что за рекламу разработчики не заплатили ни одному из публичных лиц.

«Приложение Parodist будто создано для TikTok — идеально подходит местной аудитории. Оно попало в тренд»

Всего в TikTok с хэштегом #parodistapp вышло более 6,4 млн видео. Общее количество роликов посчитать нельзя — пользователи зачастую переименовывают звуковые дорожки, не ссылаясь на приложение.

Популярность приложения в TikTok за последний месяц дала прирост в 200 000 пользователей, отмечает Свешников. Это в два раза больше, чем с момента запуска приложения и до начала вирусного эффекта в соцсети. Пиковый приток пользователей произошел 20 июня, тогда за день Parodist скачали 14 000 человек, что вознесло его на вторую строчку российских приложений в AppStore в категории «Развлечения» сразу после TikTok (скриншот есть в распоряжении Forbes). Рейтинг обновляется ежедневно, на момент публикации приложение входило в топ-20 российского App Store.

Паника из-за FaceApp: угрожает ли приложение для «состаривания» лиц вашей конфиденциальности?

По оценке Анастасии Бабинцевой, руководителя отдела контента и маркетинга интернет-агентства Rootmedia, которое занимается созданием и продвижением мобильных приложений, если бы не виральность, на достижение сопоставимых результатов у предпринимателей ушло бы около $30 000 — на оплату интеграций у блогеров и рекламу внутри App Store. «Приложение Parodist будто создано для TikTok — идеально подходит местной аудитории. В TikTok снимается много игровых сценок, поэтому популярны перевоплощения. Они попали в тренд», — объясняет феномен популярности Parodist Ренат Янбеков, директор SMM-агентства NERPA agency и тиктокер (92 000 подписчиков).

По мнению Влады Белявской, психолога сервиса «Понимаю», людей цепляет не столько контент, сколько человек, который стоит за ним. «Путин, Собчак, Дудь, Бузова, Лебедев, [Иван] Ургант — все это известные медийные персоны. Они вызывают сильные чувства, поэтому люди хотят этим делиться», — объясняет Белявская.

Мировые амбиции

Большая часть контента в Parodist доступна бесплатно. Некоторые опции (в том числе, дополнительные шаблоны шуток, куда можно вписать три слова) открываются после активации подписки. Доступ на неделю обойдется в 149 рублей, на месяц — в 299, на год — в 1990. За последний месяц сервис заработал $5000 выручки (прибыли, по словам Свешникова, у стартапа еще нет). Пока на доступ к платному контенту подписываются 1,5-2% пользователей.

«Мы балансируем между виральностью и подпиской. Стараемся виральность не убить, но при этом сохранить какую-то понятную выручку», — говорит Свешников. Он рассчитывает к концу года привлечь 10 млн пользователей и повторить успех в США (у приложения пока 5000 установок зарубежными пользователями).

«Parodist — это будущий Photoshop в мире голоса»

Популярность приложения может оказаться мимолетной, скептичен Янбеков из NERPA agency: «Как и хайповые Prisma и FaceApp, Parodist переживет быстрый взлет, а затем падение популярности. Когда каждый пользователь по несколько раз побалуется и отправит друзьям розыгрыши, это станет неинтересно. Продукт из массового превратится в нишевый — его продолжат использовать, например, те же тикток-блогеры для своих сценок».

Но Свешников не планирует ограничиваться исключительно аудиторией TikTok. «Это просто лучший вход для продукта на рынок, а дальше [продукт] может усложняться сколь угодно, адаптироваться для других аудиторий», — парирует Бекмамбетов. С ним соглашается Кирилл Варламов: «Parodist — это будущий Photoshop в мире голоса. Команда делает доступной сложнейшие технологические вещи по клонированию голосу для каждого, у кого есть интернет».

Битва за $9 млрд: зачем компании одна за другой включаются в войну болталок

Помимо различных способов применения технологии в сфере развлечений и кино, Бекмамбетов планирует с помощью Vera Voice создавать «цифровые памятники» — чтобы люди могли оставлять близким ботов, которые умеют воспроизводить их голос, общаться с потомками через поколения. Также он уверен, что технология найдет применение в сфере образования: там, где можно добавить элемент игры или заменить учителя. Английский язык можно будет учить с виртуальной королевой Великобритании, биографию Высоцкого — послушать в исполнении бота с его голосом.

Сотрудничество со Stafory вдохновило режиссера на сценарий фильма «Мальчик и бот». «У мальчика не было друзей, и единственное, что ему ответило в интернете, был компьютерный бот», — коротко описывает сюжет режиссер. По его словам, проект еще на стадии разработки, идет подготовка к съемкам. Через год полнометражный фильм выйдет в международный прокат на английском языке при поддержке студии Universal. Кино снято в формате screenlife, когда используются не обычные съемки в павильоне или на натуре, а снимается изображение с экрана смартфона или компьютера.