Как казахстанские айтишники создали сервис по распознаванию лиц и фотографий

13581

Один из них - Уахат Бастимиев - поделился трудным опытом развития ИТ-бизнеса

Уахат Бастимиев
ФОТО: Архив компании
Уахат Бастимиев

Полтора года без зарплаты, десятки «холодных» встреч и «детские» ошибки — коммерческий директор Verigram.ai Уахат Бастимиев рассказал Forbes.kz, что помогло ему и его команде создать востребованный IT-продукт.

F: Уахат, как появилась ваша компания?

- Идея возникла в начале 2016 года. Мы с коллегами занимались ИТ-технологиями, интересовались искусственным интеллектом и увидели большой растущий тренд, связанный с машинным обучением. Мы тогда осознали: не важно, чем там заниматься - просто надо быстрее садиться в этот поезд.

Сначала мы собрали талантливую команду. Мне посчастливилось связаться со своим бывшим одноклассником, который занимался компьютерным зрением.

F: Какого рода проекты вы наметили?

- Было понимание, что когда вы открываете IT-компанию, вы либо занимаетесь только одним продуктом, постоянно улучшаете его, делаете сильнее. Либо вы создаете проектную компанию и существуете за счет заказов. Второй путь, по опыту моих друзей, это путь в никуда. Потому что ты всегда будешь зависеть от заказчика: сегодня он хороший, завтра он плохой, послезавтра его вообще нет и компания может закрыться. А продукт - это такая вечная работа. Мы захотели делать что-то одно, но глобальное, и начали поиск. Наверное, месяцев пять бросались в разные темы, связанные с компьютерным зрением и нейронными сетями.

К примеру, мы думали заняться сервисами, связанными с безопасным городом, но, к сожалению, четыре года назад это не было трендом. Всё хотели встретиться и поговорить, но никто не был готов у нас покупать.

Потом случай свел меня с моим товарищем, с которым я учился в школе. Он оказался инноватором, работал в страховой компании и как раз искал подобные разработки. Я ему объяснил, чем занимаюсь, и он сказал: «Супер! Мне как раз это нужно». У нас было несколько направлений в компьютерном зрении, в итоге мы реализовали первый продукт для страховой компании «Салем».

F: А что именно «видели» у вас компьютеры?

- Страховщики занимались обязательными видами страхования автомобилей и обрабатывали очень большое количество данных. Финансовый директор компании Азамат Керимбаев выяснил опытным путем, что когда человек продает или покупает автомобиль и его объявление на сайте исчезает, с высокой долей вероятности он в течение 5-10 дней купит страховку. Он сказал: «Нужен сервис, чтобы на фотографиях распознавать номера автомобилей. Я потом буду проверять по страховой базе, сменился ли владелец машины». Продажи страховок увеличились! Мы сделали сервис и обрабатывали около 400 тыс. фотографий ежемесячно.

F: Это был успешный проект?

- Да, но решений, связанных с распознаванием номеров, много, там очень большая конкуренция. Если вы хотите заняться компьютерным зрением, то начнете, скорее всего, с распознавания автомобильных номеров. Это как школьная задачка. Мы это четко осознали и не стали продолжать.

Вторая задача, которую нам поставил Азамат, была связана с распознаванием удостоверений личности. Нужно было упростить процедуру продажи страховых полисов. Тогда операторы, которые продают страховки, часто делали ошибки: в имени, фамилии и т. д. Если бы у оператора был сканер, который бы распознавал информацию, ошибок бы не стало.

Мы сделали продукт по распознаванию документов, но делали его очень долго — год вместо оговоренных двух месяцев. Когда закончили, страховая компания начала процедуру ликвидации, и сервис не успели внедрить.

У нас на руках осталось два сервиса, связанных с распознаванием текста. Мы начали ходить на холодные встречи и всем предлагать свой продукт. Сделали кучу детских ошибок, не умели разделять потенциальных клиентов на тех, кто готов к инновациям, и тех, кто еще не готов. Пошли по всем банкам, страховым компаниям, по всем телеком-операторам и зацепились на довольно крупном клиенте. Это был «Билайн». Там поверили в продукт, хотя видели, что он на самом деле работает отвратительно. Тогда мы продали его за смешные деньги - зарплата за несколько месяцев работы программиста. Сейчас этот продукт стоит в десятки раз дороже. Они его внедрили, и с нашим даже немного корявым сервисом они сократили время на транзакции почти в два раза, то есть смогли при помощи распознавания документов предоставлять лучший сервис. Они нас постоянно подбадривали, говорили, какие есть ошибки, и мы благодаря их фидбеку сделали отличное приложение по распознаванию документов VeriDoc.

Мы поняли, что нужно двигаться дальше, и начали развивать сервис по распознаванию лиц. Тогда это все хотели и боялись.

F: А почему боялись? Потому что это вторжение в личную жизнь или это технически сложно?

- Думаю, что первое – это покушение на личное пространство. Отпечатки пальцев — уже привычно, даже на работу в офис многие уже входили по отпечаткам. А вот лицо многие люди считали чем-то интимным и не хотели, чтобы оно где-то светилось. И второе – они не понимали, где это будет использоваться. В Казахстане в части работы с персональными данными нет жесткой регуляции, и людям это в принципе не нравится.

F: Техническая сторона вас не слишком пугала?

- На самом деле она была и до сих пор остается суперсложной. Но здесь самое главное - не бояться делать, и в конечном итоге либо у вас все получится, либо поймете, что идея была плохой и вы просто потратили время.

Мы увидели, что технология начинает показывать серьезные результаты. Очень хорошо в этом плане помогло распространение Face ID у айфонов, хотя там технология другая. Но когда мы рассказывали о технологии, нас часто перебивали и говорили: «Ну это же Face ID, все понятно, я сам пользуюсь». И это упрощало понимание сервиса.

F: Чем отличаются технологии?

- У Face ID технология построена на «железе», на ваше лицо «накидывают» сетку из 30 тысяч точек, и на этой сетке строят лицо. А мы распознаем лица при помощи изображения. Мы не можем построить 3D-слепок лица. Я считаю, это сложнее. У нас нет дополнительного оборудования, мы работаем только с фотографией, которая порой бывает очень плохого качества.

F: В чем вы видели преимущество и применение технологии?

- Когда мы только начинали, мы пытались ее продать везде: на предприятия, чтобы ставить на проходной; в МВД, чтобы искать преступников; аэропортам, чтобы искать нежелательных людей. Мы с ней очень много времени потратили и были на грани закрытия компании.

Но на самом деле, чтобы построить такое решение, систему надо делать очень и очень мощной. Мы неправильно оценили свои силы, и нам пришлось отступить. А мы на это потратили полтора года. Я не получал зарплату 14 месяцев, продал машину (до сих пор, кстати, езжу на автобусе), все свои сбережения сжег, залез в долги.

F: Что потом произошло, как поменялась ситуация?

- Мы смогли продать наше решение микрофинансовой организации «Деньги Клик». Нам позвонил сотрудник МФО, и от этого звонка я воспрял. Он сказал: «Ребята, я вас долго искал». Решение требовалось для сети терминалов. В этот раз мы попросили за сервисы распознавания документов и распознавания лиц побольше, чем в первые продажи, но в целом немного. Причем мы не ограничивали МФО в количестве транзакций: хотят миллион транзакций в месяц сделать – пожалуйста. Сейчас мы продаем транзакционно: одна транзакция стоит в районе 25-30 тенге в зависимости от верификационного сервиса, и если вы хотите сделать миллион транзакций, вам придется заплатить 30 миллионов.

Из-за того что были маленькие продажи и небольшие цены, крупные клиенты с опаской к нам относились и не хотели с нами работать. Случай свел нас с Халык банком. Мы пришли, рассказали, им понравилось, и мы смогли продать им свой продукт. Это был уже 2019 год.

F: Наверняка такие же разработки есть по всему миру, зачем ими заниматься в Казахстане?

- Вы правы, эти технологии есть во всем мире, но они продаются в долларах, стоят бешеных денег. Мы местные ребята, и мы продаем такое же решение дешевле.

F: У вас есть планы выхода за рубеж?

- Да, у нас есть серьезные амбиции, и один из наших сотрудников сейчас находится в Америке. Он активно знакомится с инфраструктурой, нарабатывает знакомства, пытается там найти применение тому, что мы делаем.

F: Вы говорите, что некоторые компании используют элементы вашего сервиса. Расскажите, из каких элементов он состоит.

- Мы можем распознавать удостоверяющие документы: удостоверения личности, вид на жительство, все паспорта. На выходе вы получаете всю текстовую информацию в цифровом виде.

Второе: вы получаете удостоверение отсканированное, обрезанное с лицевой и оборотной стороны, то есть вам не нужно тратить время на сканер. Вам и сам сканер не нужен.

Где можно это применять? При заполнении регистрационных форм, в платежных системах, в системах покупки авиабилетов и т. д. Не нужно заполнять ничего руками - просто сфотографировать документ, и все автоматом заполнится.

F: А с живыми изображениями вы не работаете?

- Тоже работаем, это второй сервис - верификация личности. Мы определяем, что перед камерой находится живой человек, а не распечатанная фотография или фотография на экране телефона. Сервис просит повернуть голову либо отдалить или приблизить телефон. Это сервис определения живости.

И третий сервис – это сервис сличения двух фотографий. Например, вашей фотографии, которую вы только что сделали при помощи селфи, и фотографии из вашего удостоверения личности, чтобы понять, что это удостоверение действительно принадлежит вам. В совокупности эти три сервиса образуют так называемую идентификационную платформу.

F: Сколько сегодня у вас клиентов?

- Мы подключаем в среднем три-четыре клиента в месяц, я надеюсь, что до конца года подойдем к полусотне.

В пандемию наши продажи выросли в три раза. Пандемия - это печальное событие, но оно подвигло людей к осознанию, что технологии, которые мы делаем, очень полезны. Именно пандемия показала, что наши сервисы хорошо работают и им можно доверять.

F: Что вы чувствовали год назад, когда пришло осознание: то, что вы делали, стало невероятно востребовано?

- На самом деле у тебя нет времени взять и этим моментом насладиться. Ты просто загружен ежедневной работой, мы с ребятами работаем шесть дней в неделю, все праздники на работе. У меня нет времени порефлексировать, сказать: «Вот оно, мы к этому готовились». Я просто говорю: «О, еще один клиент! Теперь в этом месяце два!»

   Если вы обнаружили ошибку или опечатку, выделите фрагмент текста с ошибкой и нажмите CTRL+Enter

Орфографическая ошибка в тексте:

Отмена Отправить