Как маленький стартап бросает вызов Nvidia в производстве чипов
Для искусственного интеллекта

Nvidia подчинила себе рынок чипов для ИИ, перепрофилировав полупроводники, изначально разработанные для видеоигр. А теперь небольшой стартап Groq, основанный восемь лет назад, намеревается бросить вызов одной из самых дорогостоящих компаний в мире, выпустив новый чип, созданный с нуля специально для нейросетей.
Выступая в феврале 2024 года перед аудиторией в Осло, Джонатан Росс, 42-летний генеральный директор стартапа Groq, в какой-то момент заметил, что происходит что-то странное. Росс показывал членам норвежского парламента и руководителям технологических компаний демоверсию своей разработки, которая, как он надеялся, поможет его компании, занимающейся производством чипов для нейросетей, выйти из затяжного пике. Groq разработала чат-бот, который может отвечать на вопросы почти мгновенно, даже быстрее, чем человек читает. Но в ходе демонстрации чат-бот слегка притормаживал. Это очень нервировало Росса, который надеялся заручиться поддержкой для своего проекта по открытию в Европе дата-центра на базе Groq, чтобы продемонстрировать все преимущества специализированных чипов, позволяющих нейросети работать на таких сверхскоростях. «Я то и дело проверял показатели, – вспоминает он. – А люди на презентации никак не могли понять, почему я так часто отвлекаюсь».
Оказалось, что причиной замедленной реакции демонстрационной версии бота стал приток новых пользователей. За день до презентации Росса в Осло один из основателей успешного стартапа в своем твите восторженно отозвался о «сверхбыстром ИИ-помощнике». В результате на страницу с демоверсией пришло так много нового трафика, что серверы компании не справились с нагрузкой. Это была проблема, но такая, с которой даже приятно иметь дело.
Росс основал Groq восемь лет назад с целью разработки чипов, специально предназначенных для того, что в отрасли называют «инференцией» – способности искусственного интеллекта имитировать человеческое мышление за счет обучения и применения полученных знаний к новым ситуациям. Именно инференция позволяет вашему смартфону распознавать на впервые загруженном фото вашу собаку породы корги, а генератору изображений – произвести реалистичный образ папы римского в плаще от Balenciaga. Это значительно отличается от другой, также требующей больших вычислительных мощностей задачи ИИ – обучения моделей на больших массивах данных.
Однако до того, как OpenAI в конце 2022 года выпустила ChatGPT и тем самым спровоцировала во всем мире стремительный рост интереса к нейросетям, спрос на сверхбыструю инференцию был ограничен и стартап Росса едва держался на плаву. «Groq много раз чуть не потонул, – говорит Росс во время интервью, которое проходит в его лаборатории полупроводников в Сан-Хосе, Калифорния. Он вспоминает, как в 2019 году был момент, когда у компании оставалось денег меньше, чем на месяц существования: – Возможно, мы стартовали с Groq слишком рано».
Но сейчас, когда спрос на вычислительные мощности для создания и обеспечения работы нейросетей настолько высок, что способствует глобальному энергетическому кризису, время Groq, похоже, пришло – либо как потенциального нового лидера рынка, либо как цели для поглощения крупными игроками.
Потребность настолько велика, что рыночная капитализация Nvidia выросла до $3 трлн по сравнению с $60,9 млрд в 2023 году. По сравнению с этим Groq пока еще совсем малыш с доходом на уровне $2 млн, по оценкам источников, знакомых с финансовым положением компании. Эти же источники сообщают, что с таким резким ростом интереса к чипам компания прогнозирует выйти на оптимистичные $100 млн продаж уже в этом году. «Вычислительные мощности – это новая нефть», – говорит Росс.
Разработчики продуктов на базе ИИ занимают 16 позиций в нашем девятом ежегодном рейтинге Cloud 100, в который вошли лучшие в мире частные компании в сфере облачных технологий. В рейтинге прошлого года их было всего восемь, а пять лет назад и вовсе ни одной. С учетом того, что рынок чипов для ИИ, как ожидается, вырастет до $1,1 трлн к 2027 году, Росс видит шанс заполучить часть доли Nvidia, которая сейчас занимает невероятные 80 % рынка. Groq занимается исключительно разработками для инференции. По оценкам исследовательской компании IDC, эта часть рынка в текущем году увеличится до $39 млрд, а в течение следующих четырех лет – до $60,7 млрд.
Такие стартапы, как Groq, настроены оптимистично, потому что чипы Nvidia изначально даже не предназначались для ИИ. Когда генеральный директор Дженсен Хуанг в 1999 году впервые презентовал графические процессоры (GPU), то это был продукт, разработанный для видеоигр с насыщенной графикой. То, что они оказались наиболее подходящими процессорами для обучения ИИ, – не более чем счастливое совпадение. Но Groq, как и другие новые стартапы по производству чипов следующего поколения, включая Cerebras (оценка $4 млрд) и SambaNova (оценка $5,1 млрд), видят здесь непаханое поле новых возможностей. «Если бы мы начинали работать с ИИ сейчас, то никому бы в голову не пришло использовать GPU для работы с нейросетями», – говорит Эндрю Фельдман, генеральный директор Cerebras.
Сместить Nvidia с лидерских позиций мечтают не только стартапы. Amazon и Microsoft разрабатывают свои собственные процессоры для нейросетей. Но чипы Groq – так называемые языковые процессоры (Language Processing Units, LPUs) – отличаются настолько впечатляющей скоростью, что у компании есть все шансы на победу. В выпущенной в этом году презентации для инвесторов компания заявляет, что при использовании для инференции ее чипы в 4 раза быстрее, в 5 раз дешевле и в 3 раза энергоэффективнее, чем GPU Nvidia. Сейчас стартап объявил о привлечении новых инвестиций в раунде серии D, в котором основным инвестором выступает фонд BlackRock. Groq намеревается привлечь как минимум $350 млн при оценке стоимости компании не менее $2 млрд, как говорят источники, знакомые с процессом изнутри. «Скорость их чипов для инференции явно превосходит все остальные продукты на рынке», – говорит Эмиш Шах, соучредитель фонда General Global Capital, участвовавшего в нескольких раундах финансирования Groq.
Groq вывела свои чипы на рынок два года назад, и сейчас в числе ее клиентов Аргоннская национальная лаборатория. Это основанный по следам «Проекта Манхэттен» государственный исследовательский центр, использующий чипы Groq для изучения термоядерного синтеза – типа энергии, производимого солнцем. Соглашение о применении процессоров Groq заключено и с Aramco Digital – технологическим подразделением саудовской нефтяной компании.
В марте Groq запустил сервис GroqCloud, позволяющий арендовать доступ к процессорам через онлайн-интерфейс. Чтобы продемонстрировать преимущества продукта разработчикам, Groq сделала доступ к облачному продукту бесплатным. За первый месяц на сайте зарегистрировались 70 000 пользователей. Сейчас их уже 280 000, и рост не прекращается. 30 июня компания запустила платные подписки и совсем недавно пригласила бывшего сотрудника Intel Стюарта Панна на должность операционного директора, чтобы увеличить доходы и масштабировать операции. У Панна есть все причины с оптимизмом смотреть в будущее: 40 процентов запросов от пользователей GroqCloud – это заявки на оплату дополнительных мощностей.
«Чип Groq действительно попал в яблочко», – говорит Янн Лекун, главный научный сотрудник Meta по искусственному интеллекту, когда-то преподававший Россу информатику в Нью-Йоркском университете. Недавно он присоединился к Groq в качестве технического консультанта. Росс начинал свою карьеру в Google, где работал в команде, создавшей тензорные процессоры, оптимизированные для машинного обучения. Он ушел в 2016 году, чтобы основать Groq вместе с коллегой из Google Дугом Уайтманом, который стал первым генеральным директором стартапа. В первый же год стартап привлек $10 млн в рамках раунда, где основным инвестором стал венчурный фонд Social Capital. Но после этого найти новых инвесторов оказалось непросто. Уайтман ушел из стартапа через несколько лет и не ответил на запросы Forbes об интервью для этой статьи.
Есть и те, кто все еще настроен скептически. Один венчурный капиталист, отказавшийся от участия в предстоящем раунде финансирования компании, называет подход Groq «новаторским», но не верит, что интеллектуальная собственность компании будет защищена в долгосрочной перспективе. Митеш Агравал, глава облачных решений оценивающейся в $1,5 млрд компании Lambda Labs, говорит, что его стартап не планирует предлагать чипы Groq или другие специализированные чипы в своем облаке. «Сейчас все еще слишком сложно выходить за рамки того, что предлагает Nvidia», – говорит он.
Росс знает, что компании предстоит сложный путь. «Это как победить в номинации «новичок года», – говорит он. – Нам еще очень далеко до Nvidia. Поэтому за нами сейчас все будут пристально наблюдать. И как будто постоянно спрашивать: «Ну и что вы такого сделаете дальше?».
***
Дежавю: псевдоботы
Искусственный интеллект может выполнять определенные задачи лучше, чем большинство людей. Например, рисовать котов в космических костюмах или сдавать стандартизированные экзамены на знание школьной программы. Но ожесточенные дискуссии о том, являются ли эти языковые модели по-настоящему умными или просто воспроизводят ранее усвоенную информацию, не стихают. Вот краткий обзор того, как в истории человечества появились кажущиеся разумными машины.

Около 75 года Н. Э.: Греческий математик Герон Александрийский делает статуи, которые автоматически наливают вино в храмах, что преподносится верующим как божественное действие.
1769: В Австрии Вольфганг фон Кемпелен представляет шахматный автомат под названием «Турок» – машину в форме коробки, в которой на самом деле сидел невысокий (как считается) шахматист. Говорят, что «Турок» выиграл и у Бена Франклина, и у Наполеона.
1939: Электро, говорящий и курящий сигареты робот, появляется на Всемирной выставке в Нью-Йорке. Но слова, которые он произносит, записаны заранее, а для очистки «легких» от смолы ему требуется человек.
1965: Робот ELIZA Джозефа Вайзенбаума становится ранней версией компьютерного психотерапевта. Кто-то счел этот чат-бот вполне убедительным, но на самом деле ELIZA подавала только самые стандартные реплики, например: «Как вы считаете, у вас есть психологические проблемы?» и «Расскажите об этом подробнее».
***
И напоследок
«Вопрос о том, может ли компьютер думать, настолько же интересен, как вопрос о том, может ли подводная лодка плавать», — Эдсгер В. Дейкстра.