Язык, который мы используем для описания технологий, часто вводит в заблуждение. Он призван укротить, приручить. Нам говорят, что у Google появился новый «чип». Это успокаивающее, знакомое слово. Чип — это маленький, неодушевленный квадратик кремния, который можно держать в руке.
Этот суперкомпьютер имеет модульную структуру. Один физический хост-сервер содержит четыре чипа Ironwood, а стойка таких хостов образует «куб» из 64 чипов. Для дальнейшего масштабирования эти кубы соединяются динамической сетью оптической коммутации (Optical Circuit Switch — OCS), которая позволяет системе объединить до 144 кубов в «суперпод» из 9 216 чипов. Эта архитектура обеспечивает не только масштаб; она предоставляет 42,5 Экзафлопс вычислений FP8 и доступ к 1,77 Петабайт общей высокоскоростной памяти.
Чтобы понять, что создал Google, нужно сначала отказаться от идеи отдельного, дискретного продукта. Истинной единицей вычислений стал не процессор, а сам центр обработки данных (ЦОД). Ironwood, тензорный процессор (TPU) седьмого поколения от Google, существует в виде «суперпода» — единого, целостного суперкомпьютера, объединяющего 9 216 этих новых чипов. Эта колоссальная архитектура охлаждается не простыми вентиляторами, а «передовым решением для жидкостного охлаждения» промышленного масштаба — системой кровообращения, необходимой для рассеивания огромного количества отработанного тепла, выделяемого при энергопотреблении в 10 мегаватт.
Для контекста, 10 мегаватт — это примерное энергопотребление небольшого города или крупного промышленного предприятия. Таков масштаб «грубой силы» современного искусственного интеллекта. ИИ — это не эфирное, абстрактное «облако». Это физически тяжелая промышленность, потребляющая сырье (в данном случае — энергию планетарного масштаба) для производства нового, невидимого товара: синтетического интеллекта. Под Ironwood с его конфигурацией из 9 216 чипов — это новый двигатель этой индустрии, гигант с жидкостным охлаждением, созданный для одной цели: мыслить в масштабах, которые до сих пор были невообразимы.
Это немедленно выявляет центральный конфликт определяющей технологии XXI века. Такой уровень энергопотребления, масштабированный на целую отрасль, по своей сути неустойчив. Этот 10-мегаваттный под — технологическое чудо, но одновременно и огромное бремя для окружающей среды. Вся дальнейшая история ИИ — это попытка справиться с этим единственным, фундаментальным фактом.
Эпоха Инференса (Логического вывода)
Последнее десятилетие главной задачей ИИ было «обучение» (training). Это дорогостоящий и трудоемкий процесс обучения модели, вскармливания ей всего интернета, чтобы она «выучила» язык, логику и рассуждения. Но эта эра подходит к концу. Новый рубеж — это «эпоха инференса» (age of inference) — постоянное, крупномасштабное мышление в реальном времени, которое модель выполняет после обучения.
Каждый раз, когда ИИ отвечает на вопрос, генерирует изображение или «проактивно извлекает и генерирует данные», он выполняет инференс. Ironwood, по собственному признанию Google, является их «первым ускорителем, разработанным специально для инференса». Это сигнализирует о критическом сдвиге рынка. Битва идет уже не только за создание самых больших моделей, но и за эффективный запуск «высокообъемного инференса ИИ с низкой задержкой и обслуживания моделей», который будет питать грядущую волну «ИИ-агентов», подобных Gemini от Google.
Именно здесь раскрывается истинная стратегия Google. Ironwood — это не продукт на продажу; это фундаментальный компонент «AI Hypercomputer» (Гиперкомпьютера ИИ) от Google. Это не просто оборудование, а вертикально интегрированная система, в которой аппаратное обеспечение (TPU Ironwood и новые процессоры Axion на базе Arm) «разработано совместно» (co-designed) с проприетарным стеком программного обеспечения.
Этот совместно разработанный стек — стратегический ров Google. Хотя он предлагает «коробочную» поддержку фреймворков с открытым исходным кодом, таких как PyTorch, для привлечения разработчиков, стек по-настоящему оптимизирован для собственной экосистемы Google — JAX.
- Компилятор XLA (Accelerated Linear Algebra) действует как ключевой переводчик, преобразуя высокоуровневый код в гиперэффективные инструкции, которые выполняются непосредственно на кремнии TPU. Он обеспечивает широкую «коробочную» оптимизацию, транслируя код из фреймворков, таких как JAX и PyTorch.
- Новый «Cluster Director» для Google Kubernetes Engine (GKE) — это оркестратор, программное обеспечение, способное управлять суперподом из 9 216 чипов как единым, отказоустойчивым блоком. Это ПО обеспечивает «осведомленность о топологии» для интеллектуального планирования, упрощая управление массивными кластерами и обеспечивая отказоустойчивые, самовосстанавливающиеся операции.
- А нативная поддержка vLLM максимизирует пропускную способность инференса — критически важный компонент для обслуживания моделей в «эпоху инференса». Эта поддержка крайне важна, поскольку vLLM использует высокоэффективные методы управления памятью и позволяет командам разработчиков переключать рабочие нагрузки между GPU и TPU с минимальными изменениями.
В последнее десятилетие доминирование NVIDIA строилось не только на ее GPU, но и на ее проприетарной программной платформе CUDA — «рве», в котором разработчики оказались заперты. AI Hypercomputer от Google — это прямая попытка построить конкурирующий «огороженный сад». Предлагая превосходную производительность на доллар только тем, кто перейдет на ее стек, Google позиционирует себя как фундаментальную коммунальную службу для экономики ИИ. Он не продает автомобили (как NVIDIA); он стремится продавать электричество, которое их питает.
Тот, кто коронует (Kingmaker) и Война мультиоблаков
Окончательное подтверждение этой стратегии пришло в конце 2025 года. Anthropic, ведущая лаборатория ИИ и главный конкурент OpenAI, объявила о знаковом расширении своего партнерства с Google, обязавшись использовать инфраструктуру TPU, включая новый Ironwood, в ошеломляющем масштабе: «до одного миллиона TPU».
Это не рядовая инвестиция. Это сделка на «десятки миллиардов долларов», которая к 2026 году обеспечит Anthropic «мощностью свыше одного гигаватта». Одна эта сделка служит высшим оправданием десятилетней, многомиллиардной ставки Google на собственные чипы. Заявленным обоснованием Anthropic для этого масштабного обязательства стали «соотношение цены/производительности и эффективность» — ясный сигнал о том, что вертикально интегрированный стек Google может предложить убедительную экономическую альтернативу доминированию NVIDIA.
Но у этой истории есть критический поворот, раскрывающий истинную динамику власти в индустрии ИИ. Anthropic не принадлежит Google эксклюзивно. В своем собственном заявлении Anthropic осторожно отметила, что Amazon Web Services (AWS) остается ее «основным партнером по обучению и поставщиком облачных услуг». Это партнерство с AWS строится вокруг «Проекта Rainier», массивного кластера, использующего сотни тысяч собственных ускорителей Amazon Trainium2. Компания придерживается «диверсифицированного подхода», стратегически стравливая TPU от Google, чипы Trainium от Amazon и GPU от NVIDIA друг с другом.
Это не нерешительность; это гениальный акт выживания. Утечка данных показывает, что вычислительные затраты Anthropic только на AWS поглощали до 88,9% ее выручки. Само существование лабораторий ИИ зависит от снижения этих астрономических затрат. По оценкам аналитиков, заставляя гигантов конкурировать, Anthropic, вероятно, обеспечивает себя вычислениями — самой дорогой частью своего бизнеса — с огромной скидкой в 30-50%. Публично сотрудничая с обоими гигантами, Google и Amazon, Anthropic сделала себя «создателем королей» (kingmaker). Она втягивает облачных гигантов в войну ставок, используя свой статус «трофейной» лаборатории ИИ, чтобы те, по сути, субсидировали ее огромные счета за вычисления.
Эта динамика фундаментально изменила рынок. Окончательным победителем будет не тот, у кого самый быстрый чип, а тот, у кого лучшее соотношение вычислений, мощности и стоимости. «Производительность на ватт» — это больше не просто экологический лозунг; это главное стратегическое и экономическое поле битвы всей индустрии.
Новые кремниевые титаны: Непростая олигархия
Запуск Ironwood — это прямой выпад в сторону NVIDIA, но на поле битвы тесно. Гонку вооружений в сфере ИИ ведет новая олигархия кремниевых титанов — горстка корпораций, обладающих капиталом и техническим опытом для создания «лопат» в этой новой золотой лихорадке.
- Действующий король (NVIDIA): GPU поколения Blackwell от NVIDIA, B100 и B200, и их предшественник H100, остаются отраслевым стандартом. Их доминирование защищено глубоким программным рвом CUDA, на котором обучено большинство исследователей ИИ.
- Претенденты (Гиганты облаков и AMD):
- Amazon (AWS): Самый зрелый игрок в области собственных чипов среди облачных провайдеров. AWS использует двойную стратегию: «Trainium» для экономичного обучения и «Inferentia» для высокоскоростного и недорогого инференса. Эта стратегия объединена программным пакетом AWS Neuron SDK, оптимизирующим PyTorch и TensorFlow для их чипов.
- Microsoft (Azure): Для обслуживания массивных потребностей своего ключевого партнера, OpenAI, Microsoft разработала собственный ИИ-ускоритель «Maia 100», спроектировав его специально для рабочих нагрузок ChatGPT и GPT-4. Являясь одним из крупнейших процессоров, созданных на 5-нм техпроцессе TSMC, Maia 100 — это чип мощностью 500-700 Вт, который, как и его конкуренты, имеет собственный программный стек для переноса моделей из фреймворков вроде PyTorch.
- AMD: Традиционный конкурент NVIDIA, AMD, напрямую соревнуется в производительности со своим ускорителем Instinct MI300X, который не уступает чипам нового поколения по ключевым параметрам, таким как объем памяти (192 ГБ).
Эта корпоративная гонка вооружений обусловлена тремя простыми факторами:
- Стоимость: Разработка собственного чипа — единственный способ избежать маржи NVIDIA, достигающей «середины 70%», и ее премиальных цен.
- Поставки: Это обеспечивает стратегическую независимость от хронического дефицита GPU NVIDIA, который стал узким местом для всей отрасли.
- Оптимизация: Это позволяет достичь того самого преимущества «производительности на ватт», к которому стремится Google — чипа, идеально «совместно разработанного» для его конкретного программного обеспечения и облачных нагрузок.
Облачным гигантам не нужно убивать NVIDIA. Им просто нужно создать жизнеспособную внутреннюю альтернативу, которая будет достаточно хороша. Это коммодитизирует (превращает в товар) рынок, дает клиентам выбор и вынуждает NVIDIA снижать цены, экономя гигантам миллиарды на собственных капитальных затратах.
Масштаб этой консолидации трудно осознать. Крупнейшие технологические гиганты, включая Google, Meta, Amazon и Microsoft, готовы потратить до 375 миллиардов долларов за один год на строительство этих ЦОДов и ИИ-оборудования для них. Барьер для входа на этот новый рынок ошеломляет. Это не демократизация. Это консолидация власти. Революцию ИИ решит не умный алгоритм в гараже; ее решат те пять корпораций, которые могут позволить себе строить эти 10-мегаваттные мозги.
Сравнение ускорителей ИИ в 2025 году
Google Ironwood (TPU v7): Тип: ASIC. Макс. HBM (Память): 192 ГБ HBM3e. Макс. пропускная способность памяти: 7,4 ТБ/с. Ключевая архитектура масштабирования: Суперпод на 9 216 чипов (9,6 Тбит/с ICI). Основное применение: Инференс и Обучение.
NVIDIA Blackwell B200: Тип: GPU. Макс. HBM (Память): 192 ГБ HBM3e. Макс. пропускная способность памяти: 8 ТБ/с. Ключевая архитектура масштабирования: NVLink 5 (1,8 ТБ/с). Основное применение: Обучение и Инференс общего назначения.
AMD Instinct MI300X: Тип: GPU. Макс. HBM (Память): 192 ГБ HBM3. Макс. пропускная способность памяти: 5,3 ТБ/с. Ключевая архитектура масштабирования: Кольцо из 8 GPU. Основное применение: Обучение и Инференс общего назначения.
AWS Trainium / Inferentia 2: Тип: ASIC. Макс. HBM (Память): (Trn) N/A / (Inf2) 32 ГБ HBM. Макс. пропускная способность памяти: (Inf2) N/A. Ключевая архитектура масштабирования: AWS Neuron SDK / Кластер. Основное применение: Раздельное: Обучение (Trn) / Инференс (Inf).
Microsoft Maia 100: Тип: ASIC. Макс. HBM (Память): 64 ГБ HBM2E. Макс. пропускная способность памяти: N/A. Ключевая архитектура масштабирования: Сеть на базе Ethernet. Основное применение: Внутреннее (OpenAI) Обучение и Инференс.
В тени чиповой войны
Корпоративная битва между Google, NVIDIA и Amazon ведется в тени гораздо более крупного и весомого конфликта: геополитической «Чиповой войны» между США и Китаем.
Весь современный мир, от наших смартфонов до самых передовых военных систем, построен на пугающе хрупкой цепочке поставок. «Кремниевый щит» Тайваня, где базируется TSMC, производит «около 90% самых передовых полупроводников в мире». Эта концентрация производства в Тайваньском проливе, «критической геополитической горячей точке», является единственной величайшей уязвимостью мировой экономики.
В последние годы США использовали эту зависимость как оружие, введя «масштабные экспортные ограничения», чтобы «лишить Китай… передовых чипов» в попытке замедлить его технологический и военный рост. В ответ Китай «вливает миллиарды в свои амбиции по производству чипов», ускоряя свою «стратегию военно-гражданского слияния» в отчаянной погоне за «полупроводниковой самодостаточностью».
Эту погоню олицетворяют поддерживаемые государством компании, такие как Huawei. Ее работа по созданию отечественных ИИ-чипов, таких как Ascend 910C, представляет собой прямой вызов доминированию NVIDIA в Китае. Эта вертикальная интеграция в сочетании со «стратегией военно-гражданского слияния» Китая делает все более трудным для западных стран определение того, с какими частями китайской цепочки поставок безопасно взаимодействовать.
Эта глобальная нестабильность создает экзистенциальный риск для Big Tech. Военный конфликт на Тайване может остановить индустрию ИИ в одночасье. Хронический дефицит NVIDIA — это незначительное неудобство по сравнению с катаклизмом в цепочке поставок.
С этой точки зрения, Ironwood от Google — это больше, чем просто конкурентный продукт; это акт «корпоративного суверенитета». Проектируя свой собственный кремний, такие компании, как Google, Amazon и Microsoft, «снижают риски в цепочке поставок» и «уменьшают зависимость от сторонних поставщиков». Они владеют интеллектуальной собственностью. Они больше не зависят от одной компании (NVIDIA) или одного уязвимого региона (Тайвань). Они могут диверсифицировать своих производственных партнеров, гарантируя, что их бизнес-модель переживет геополитический шок.
Корпоративная гонка вооружений и геополитическая гонка теперь — две стороны одной медали. Массивные инвестиции Google и Amazon, по сути, реализуют промышленную политику США. Они создают промышленный костяк технологической сферы западных союзников (альянс «Chip 4») и устанавливают «технологическую дистанцию», которую отчаянно пытаются сократить китайские решения, такие как Ascend 910C от Huawei.
Невыносимая тяжесть вычислений
Это возвращает нас к 10-мегаваттному поду. Гонка вооружений в сфере ИИ, подпитываемая корпоративными и геополитическими амбициями, теперь сталкивается со своими физическими пределами. Экологическая цена «грубой силы» ошеломляет.
Сделка Anthropic на TPU от Google рассчитана на «более гигаватта» мощности. Это эквивалентно 100 подам Ironwood, работающим одновременно, или полной мощности крупной атомной электростанции, выделенной одной единственной компании. И эта компания — лишь одна из многих.
Углеродный след одной «мысли» становится тревожно ясным.
- Обучение одной крупной модели ИИ может выбросить более 284 000 кг (626 000 фунтов) CO2, что «примерно эквивалентно пожизненным выбросам пяти американских автомобилей».
- Один запрос к ИИ, такому как ChatGPT, использует «примерно в 100 раз больше энергии, чем обычный поиск Google».
- Общий энергетический след индустрии генеративного ИИ «растет экспоненциально» и уже «эквивалентен энергопотреблению страны с низким уровнем дохода».
И дело не только в энергии. Центры обработки данных также «пожирают» более ограниченный ресурс: воду. Они требуют «огромного количества воды для охлаждения», создавая колоссальную нагрузку на местные ресурсы, часто в и без того засушливых регионах. По отраслевым оценкам, средний ЦОД уже использует 1,7 литра воды на каждый потребленный киловатт-час энергии.
Индустрия, включая Google, пытается отвлечь внимание от этого кризиса, хвастаясь повышением «эффективности». Google утверждает, что Ironwood «почти в 30 раз более энергоэффективен, чем наш первый Cloud TPU 2018 года». Однако это отвлекающий маневр. Это яркий пример Парадокса Джевонса: технологический прирост эффективности, примененный к востребованному ресурсу, не уменьшает потребление. Он увеличивает его, делая ресурс дешевле и доступнее.
Эффективность Ironwood не решает проблему окружающей среды; она ее ускоряет. Она делает экономически и технически целесообразным создание еще более крупных моделей и обработку еще большего количества запросов, подталкивая общее потребление энергии все выше. Гонка индустрии за «приоритет скорости над безопасностью и этикой» — спешка, которая привела к задокументированным сбоям, таким как предвзятые ответы Gemini от самого Google, — создает этический кризис планетарного масштаба, где ущерб окружающей среде выступает как масштабный внешний эффект, не отраженный в балансе.
Этот этический кризис проистекает из способности систем ИИ внедрять и усиливать человеческие предубеждения, угрожать правам человека и манипулировать общественным мнением посредством дезинформации. Счетная палата США (GAO) отметила, что даже при мониторинге эти системы, поспешно выведенные на рынок, остаются уязвимыми для атак, генерирующих фактически неверные или предвзятые данные. Эта динамика «гонки вооружений», где корпоративные цели быстрого развертывания преобладают над протоколами безопасности, создает фундаментальное противоречие между инновациями и ответственностью.
Кода: «Ловец Солнца» в небе
Инженеры Google не слепы к этому парадоксу. Они видят графики энергопотребления. Они понимают, что у масштабирования ИИ «грубой силой» есть земной предел. Предлагаемое ими решение — идеальная, сюрреалистическая метафора для всей индустрии.
Это долгосрочный исследовательский «moonshot» (суперпроект) под названием «Проект „Ловец Солнца“» (Project Suncatcher).
План состоит в том, чтобы запустить центры обработки данных ИИ в космос. Эти «компактные созвездия спутников на солнечных батареях», оснащенные TPU от Google и соединенные «свободными оптическими каналами связи», будут выведены на «синхронную с Солнцем низкую околоземную орбиту „рассвет-закат“». Там они будут получать «почти непрерывный солнечный свет», решая проблему энергии, в то время как вакуум космоса предложит решение для охлаждения без воды.
Это не фантастика. Google уже протестировала свои TPU поколения Trillium на ускорителе частиц, чтобы смоделировать радиацию на низкой околоземной орбите, и чипы «выжили без повреждений». Запуск прототипа в партнерстве с Planet Labs запланирован на начало 2027 года.
Проект «Ловец Солнца» — это молчаливое признание земной неудачи. Это признание того, что путь, избранный индустрией — путь, питаемый 10-мегаваттными мозгами вроде Ironwood, — неустойчив на планете Земля. Цель проекта, по словам самого Google, — «минимизировать воздействие на земные ресурсы», потому что «экологическое бремя» их собственной дорожной карты становится слишком тяжелым.
Это высшее проявление технологического возвышенного. Гонка вооружений в сфере ИИ, в своем стремлении к богоподобному интеллекту, создает будущее, в котором вычислительная цена нашего собственного любопытства настолько велика, что мы должны буквально бежать с нашей планеты, чтобы ее поддерживать. Чип Ironwood — это двигатель. Гиперкомпьютер — это фабрика. Чиповая война — это тень. А Проект «Ловец Солнца» — это аварийный люк: отчаянный, блестящий и пугающе логичный прыжок в пустоту.
Однако эта логика не лишена собственных глубоких технических и экономических проблем. Скептики спешат указать, что космос — это не волшебное решение для охлаждения; это «лучший теплоизолятор из существующих». Космический ЦОД не будет охлаждаться пассивно; ему потребуются массивные, сложные радиаторы, сравнимые по размеру с его солнечными панелями. Этим системам также придется справляться с экстремальной стоимостью обслуживания и постоянной бомбардировкой радиацией, которая губит процессоры — препятствия, которые превращают этот «аварийный люк» в гамбит поистине астрономических масштабов.
