Ах, Google, старый лис из мира технологий, вытащил свой последний трюк из-под пушистого хвоста — Ironwood, процессор Tensor Processing Unit (TPU) седьмого поколения. Это не просто какой-то чип, имейте в виду; это специализированный AI-ускоритель, которым Google хвастается как самым передовым на сегодняшний день. Созданный для эффективного масштабного вывода, он готов составить конкуренцию Nvidia — по крайней мере, так они говорят. 🤑
Думаешь, 'медвежий рынок' — это что-то про Baldur's Gate 3? Тебе сюда. Объясним, почему Уоррен Баффет не покупает щиткоины.
Диверсифицировать портфельIronwood TPU от Google: Мощный вычислительный кластер, чтобы заставить Nvidia попотеть! 😓
Google дала нам предварительный просмотр Ironwood во время мероприятия Google Cloud Next ’25 в апреле, и теперь они открывают шлюзы. Они представляют его как чип для «эры вывода», где моделям нужно думать, отвечать и генерировать быстрее, чем ребенок хватает последний кусок торта. 🍰
Согласно отчёту CNBC, этот шаг является частью грандиозной игры между гиперскейлерами, все из которых стремятся доминировать в AI стеке, как дети, дерущиеся за последнюю игрушку в песочнице. Под капотом Ironwood может похвастаться 3D торусным соединением, жидкостным охлаждением (потому что даже чипам нужен спа-день) и улучшенным Sparsecore для обработки сверхбольших вложений для ранжирования, рекомендаций, финансов и научных вычислений. 🧠💧
Он разработан для минимизации перемещения данных и устранения узких мест в коммуникациях – бич любой многочиповой задачи. Цифры? О, они впечатляющие: до 4 614 TFLOPs (FP8) на чип, 192 ГБ HBM с пропускной способностью 7,37 ТБ/с и 1,2 ТБ/с двунаправленной межчиповой пропускной способности. Подсборки масштабируются от 256 чипов до поразительной конфигурации из 9 216 чипов, обеспечивая 42,5 экзафлопс (FP8) вычислительной мощности. И при потреблении мощности полной подсборки около 10 МВт, жидкостное охлаждение обеспечивает её работоспособность под нагрузкой – в отличие от вашего дяди на семейных посиделках. 🥵❄️
Google утверждает, что Ironwood более чем в 4 раза быстрее своего предшественника, Trillium (TPU v6), и предлагает примерно в 2 раза лучшую производительность на ватт. Он также почти в 30 раз энергоэффективнее, чем первый Cloud TPU 2018 года. В максимальной конфигурации он, предположительно, превосходит суперкомпьютеры, такие как El Capitan — хотя, как всегда, относитесь к этим заявлениям с осторожностью. 🧂
Хотя он и может обучаться, настоящая изюминка Ironwood – это вывод для больших языковых моделей и систем Mixture-of-Experts. Подумайте о чат-ботах, агентах, моделях класса Gemini и конвейерах высокоразмерного поиска, требующих скорости и точности. Это как Усэйн Болт из чипов, но без броской одежды. 🏃♂️💨
Интеграция осуществляется через AI Hypercomputer от Google Cloud, объединяя аппаратное обеспечение с программным обеспечением, таким как Pathways, для оркестровки распределенных вычислений на тысячах кристаллов. Этот стек уже обеспечивает работу всего, от Поиска до Gmail, и Ironwood встраивается как обновление для клиентов, которым требуется управляемый, TPU-нативный маршрут наряду с GPU. 🛠️
Сообщение с рынка? Google бросает вызов трону Nvidia, утверждая, что специализированные TPU могут превзойти универсальные GPU по соотношению цены и производительности, а также по энергопотреблению для определенных задач ИИ. Первыми пользователями являются Anthropic, которые планируют развертывание в масштабе миллионов TPU для Claude — шаг, который вызывает немало вопросов. 🤨
Генеральный директор Alphabet Сундар Пичаи назвал спрос ключевым драйвером доходов, ссылаясь на рост доходов Google Cloud на 34% до 15,15 млрд долларов в третьем квартале 2025 года и капитальные затраты, связанные с развитием ИИ, в размере 93 млрд долларов. «Мы наблюдаем значительный спрос на наши инфраструктурные продукты ИИ… и мы инвестируем, чтобы удовлетворить этот спрос», — сказал он, отметив, что в этом году было подписано больше сделок на миллиард долларов, чем за предыдущие два года вместе взятые. 💰💼
Более широкая доступность Ironwood запланирована на конец 2025 года через Google Cloud, запросы на доступ открыты уже сейчас. Для предприятий, оценивающих энергопотребление, плотность размещения в стойке и целевые показатели задержки, вопрос не в хайпе — а в том, соответствуют ли под-масштабные FP8 вычисления и профиль охлаждения Ironwood их рабочим нагрузкам. 🧐
FAQ ❓
- Где будет доступен Ironwood? Через Google Cloud в глобальных регионах, включая Северную Америку, Европу и Азиатско-Тихоокеанский регион. 🌍
- Когда начинается доступ? Более широкая доступность стартует в ближайшие недели, а более масштабный запуск запланирован на конец 2025 года. ⏳
- Для каких рабочих нагрузок он создан?
Высокопроизводительный вывод для LLM, MoE, поиска, рекомендаций, финансов и научных вычислений. 🤖 - Как это сопоставляется с предыдущими TPU? Google заявляет о 4-кратной более высокой пропускной способности и в 2 раза лучшей производительности на ватт по сравнению с Trillium. 🚀
Смотрите также
- Как получить все костюмы и наряды в Stellar Blade
- Будущее криптовалюты INJ: прогноз цен на INJ
- Stellar Blade And Nikke Dev Addresses ‘Small Genital’ Gesture Backlash
- Неожиданный подарок от Shift Up разработчикам убедил фанатов, что Stellaris может появиться на Nintendo Switch 2
- Лучшие настройки для Steellar Blade — RTX 3070
- Руководство по заданию Stellar Blade: Спящая красавица
- Секретный запрос отклонен – объяснение Stellar Blade
- Как открыть секретную комнату разработчиков и костюм Ocean String в Stellar Blade.
- Порт Stellar Blade на ПК оказался неожиданно качественным, особенно при использовании Steam Deck
- Фунты или рубли: какую валюту покупать прямо сейчас?
2025-11-06 19:19