Материалы по тегу: облако

24.03.2024 [15:00], Сергей Карасёв

ИИ-облако нового поколения: выходцы из Google DeepMind создали платформу Foundry, получив $80 млн инвестиций

Компания Foundry Technologies, по сообщению ресурса Datacenter Dynamics, запустила публичную облачную платформу, оптимизированную для нагрузок ИИ. Инвестиции в проект составили $80 млн, а сама Foundry при этом получила оценку приблизительно $350 млн.

Говорится, что средства привлечены в рамках посевного раунда и раунда Series A. Инвестиционную программу возглавили Lightspeed Venture Partners и Sequoia Capital. К ним присоединились более дюжины других инвесторов, в том числе венчурное подразделение Microsoft, главный научный сотрудник Google Джефф Дин (Jeff Dean) и соучредитель Databricks Матей Захария (Matei Zaharia).

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

Джаред Куинси Дэвис (Jared Quincy Davis), генеральный директор и основатель Foundry, ранее работал научным сотрудником в команде Google DeepMind. Кроме того, в новом проекте участвуют другие специалисты DeepMind, учёные Стэнфордского университета (Stanford University) и Захария. Создание Foundry началось в 2022 году, а сейчас состоялось официальное открытие платформы.

В рамках нового ИИ-облака предоставляется доступ к нескольким типам инстансов. Некоторые из них базируются на ускорителях NVIDIA H100, тогда как другие используют менее мощные аппаратные конфигурации, ориентированные на экономическую эффективность. Клиенты могут наращивать или сокращать вычислительные ресурсы по мере необходимости.

«Мы создаём новое поколение публичных облаков на базе платформы оркестрации, которые делают доступ к вычислительным ресурсам ИИ таким же простым, как включение света», — говорит Дэвис.

Отмечается, что сервисы Foundry проектируются в соответствии с «самыми высокими стандартами безопасности». Платформа подходит для обучения ИИ-моделей, инференса и запуска готовых сервисов. Привлечённые средства компания намерена направить на развитие проекта и расширение партнёрской сети.

Постоянный URL: http://testsn.3dnews.ru/1102196
23.03.2024 [22:33], Сергей Карасёв

Akamai внедрит в своей сети ПО Neural Magic для ускорения ИИ-нагрузок

CDN-провайдер Akamai Technologies объявил о заключении соглашения о стратегическом партнёрстве с компанией Neural Magic, разработчиком специализированного ПО для ускорения рабочих нагрузок, связанных с ИИ. Сотрудничество призвано расширить возможности глубокого обучения на базе распределённой вычислительной инфраструктуры Akamai.

Компания Akamai реализует комплексную стратегию по трансформации в распределённого облачного провайдера. В частности, в начале 2023 года Akamai запустила платформу Connected Cloud на базе Linode: это более распределённая альтернатива сервисам AWS или Azure. А в феврале 2024 года была представлена система Gecko (Generalized Edge Compute), которая позволяет использовать облачные вычисления на периферии.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

В рамках сотрудничества с Neural Magic провайдер предоставит клиентам высокопроизводительную инференс-платформу. Утверждается, что софт Neural Magic даёт возможность запускать ИИ-модели на обычных серверах на базе CPU без дорогостоящих ускорителей на основе GPU. ПО позволяет ускорить выполнение ИИ-задач с помощью технологий автоматического разрежения моделей (model sparsification).

Софт Neural Magic дополнит возможности Akamai по масштабированию, обеспечению безопасности и доставке приложений на периферии. Это позволит компаниям развёртывать ИИ-сервисы в инфраструктуре Akamai c более низкими задержками и повышенной производительностью без необходимости аренды GPU-ресурсов. Платформа Akamai и Neural Magic особенно хорошо подходит для ИИ-приложений, в которых большие объёмы входных данных генерируются близко к периферии.

Постоянный URL: http://testsn.3dnews.ru/1102189
23.03.2024 [20:11], Сергей Карасёв

CoreWeave намерена привлечь новые инвестиции при оценке в $16 млрд

Компания CoreWeave, специализирующаяся на облачных услугах для решения ИИ-задач, ведет переговоры о привлечении новых инвестиций. Об этом сообщает Bloomberg, ссылаясь на информацию, полученную от осведомлённых лиц, которые пожелали остаться неизвестными.

Говорится, что CoreWeave рассматривает возможность продажи как новых, так и имеющихся акций, а некоторые держатели ценных бумаг компании могут предложить часть своих активов. Условия программы ещё не согласованы и могут измениться.

 Источник изображения: CoreWeave

Источник изображения: CoreWeave

В апреле 2023-го CoreWeave получила $221 млн в ходе раунда финансирования Series B, а позднее привлекла ещё $200 млн. В августе 2023-го компания объявила о долговом финансировании в размере $2,3 млрд под залог ускорителей NVIDIA. В декабре прошлого года CoreWeave провела очердной раунд финансирования — на $642 млн. Средства предоставили Fidelity Management & Research Company, Investment Management Corporation of Ontario (IMCO), Jane Street, J. P. Morgan Asset Management, Nat Friedman & Daniel Gross, Goanna Capital, Zoom Ventures и др.

Говорится, что в 2023 году рыночная стоимость CoreWeave оценивалась в $7 млрд. В случае привлечения новых инвестиций капитализация компании, как отмечает Bloomberg, может достичь $16 млрд. Соучредитель и генеральный директор CoreWeave Майкл Интратор (Michael Intrator) отмечает, что это поможет компании перейти «в следующую фазу стремительного роста». В середине марта 2024 года CoreWeave назначила нового финансового директора: им стал Нитин Агравал (Nitin Agrawal), который ранее занимал должность вице-президента по финансам облачной платформы Google Cloud.

На фоне подготовки к дальнейшему росту CoreWeave сообщила о нескольких других изменениях в составе своего высшего руководства. В частности, соучредитель Браннин Макби (Brannin McBee) теперь исполняет обязанности директора по развитию, а соучредитель Брайан Вентуро (Brian Venturo) назначен директором по стратегии. Питер Саланки (Peter Salanki), занимавший пост вице-президента по инжинирингу, переведён на должность технического директора.

Говорится также, что в 2023 году CoreWeave увеличила количество своих дата-центров с 3 до 14, тогда как численность персонала выросла в четыре раза.

Постоянный URL: http://testsn.3dnews.ru/1102185
23.03.2024 [15:53], Сергей Карасёв

VK купила YClients почти за 4 млрд руб.

Интернет-холдинг VK завершил сделку по приобретению YClients — крупнейшей российской платформы онлайн-записи и автоматизации бизнеса в сфере услуг. В начале 2024 года VK выплатил 1,2 млрд руб. в качестве отложенного вознаграждения за покупку сервиса, тогда как общая стоимость актива составила 3,9 млрд руб.

В обнародованном финансовом отчёте VK говорится, что соглашение о покупке 100% долей в группе компаний YClients было заключено в декабре 2023-го. Эта SaaS-платформа предназначена для онлайн-записи, автоматизации работы с клиентской базой и уведомлениями. Кроме того, она предоставляет функции аналитики, финансового и складского учёта, позволяет вести программу лояльности и осуществлять другие бизнес-процессы.

 Источник изображения: YClients

Источник изображения: YClients

YClients разрабатывает различные облачные продукты, такие как «Арника», «Дента», SQNS и др. Их пользователями являются около 45 тыс. представителей малого и среднего бизнеса, а ежемесячно компания обрабатывает более 18 млн записей. VK планирует осуществить «бесшовную интеграцию» сервисов Yclients в свои платформы.

В частности, на сегодняшний день «Календарь Mail.ru» интегрировался с платформой автоматизации YClients, добавив возможность автоматического создания события через онлайн-запись или приложение YPlaces. Благодаря этому пользователи могут добавить напоминание о предстоящем мероприятии в свой «Календарь Mail.ru» с помощью одной кнопки.

В YClients доступна интеграция с IP-телефонией: Telefon-IP, Hotlead, Mango Office. Благодаря этому ускоряется обработка звонков. Можно контролировать поток входящих вызовов и сохранять записи разговоров, чтобы анализировать их и оперативно реагировать на нестандартные ситуации. Кроме того, поддерживается интеграция с кассовым оборудованием.

YClients даёт возможность следить за всеми скидками, бонусами, сертификатами и абонементами в фоновом режиме. В целом, с помощью YClients клиент может встроить форму для записи на собственный сайт и 15 популярных партнёрских площадок, где пользователи ищут те или иные услуги.

Постоянный URL: http://testsn.3dnews.ru/1102172
22.03.2024 [14:56], Сергей Карасёв

Beeline cloud запустил облачный сервис хранения и обработки данных Data Platform

Beeline cloud объявил о запуске облачной платформы Data Platform, предназначенной для хранения и обработки данных любого типа. Говорится, что это фактически экосистема сервисов с возможностью их бесшовной и гибкой интеграции друг с другом. Data Platform является альтернативой системам зарубежных облачных провайдеров, которые начали блокировать доступ для российских пользователей.

В основу Data Platform положены open-source-технологий S3, Kafka, NiFi, Greenplum, ClickHouse и PostgreSQL. Утверждается, что новая платформа обеспечивает прозрачность и гибкость использования, позволяет управлять жизненным циклом данных, размещённых в различных корпоративных системах.

В состав Data Platform входят три ключевых сервиса. Один из них — Cloud Arenadata DB: это массово-параллельная СУБД для построения корпоративного хранилища данных, основанного на ПО с открытым кодом. Вторым компонентом является Cloud BI — подсистема визуализации и аналитики данных в облаке на базе открытого софта собственной разработки. Третий сервис — объектное хранилище Cloud Object Storage без ограничений по объёму, с возможностью моментального масштабирования и доступом из любой точки.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

Отмечается, что Data Platform даёт возможность хранить, обрабатывать и управлять большим объёмом данных с учётом бизнес-задач. При этом достигается высокая согласованность благодаря объединению разрозненной информации в единую среду управления. Beeline cloud подчёркивает, что инфраструктура обладает высокой надёжностью как на физическом, так и на программном уровне.

Постоянный URL: http://testsn.3dnews.ru/1102126
22.03.2024 [02:55], Владимир Мироненко

Новая лицензионная политика VMware грозит банкротством небольшим облачным провайдерам

Некоммерческая организация CISPE, представляющая интересы поставщиков облачной инфраструктуры в Европе, призвала регулирующие органы расследовать соглашения Broadcom/VMware по лицензированию ПО, которые приведут к банкротству некоторых её членов и нанесут ущерб конечным пользователям. В группе риска оказались, к примеру, поставщики «жизненно важных медицинских услуг».

CISPE выступила против решения Broadcom в одностороннем порядке изменить условия лицензирования ПО для виртуализации, призвав «немедленно приостановить расторжение контрактов и предоставить клиентам возможность отказаться многолетних контрактов, навязанных Broadcom, как только появятся жизнеспособные альтернативы».

Речь идёт о реорганизации, проводимой Broadcom после приобретения VMware, в рамках которой была отменена партнёрская программа VMware в пользу собственной программы Broadcom. В частности, теперь для тех, кто предлагает продукты VMware как услугу, нужно иметь минимум 3500 ядер, чтобы хотя бы претендовать на получение лицензии. Причём лицензии выдаются сразу на несколько лет вперёд. Совсем скоро Broadcom прекратит продавать лицензии небольшим облачным провайдерам, что лишит их возможности предлагать продукты VMware и приведёт к оттоку клиентов или даже закрытию бизнеса.

 Источник изображения: Broadcom

Источник изображения: Broadcom

По данным The Register, лишь немногие операторы, предлагающие решения VMware, имеют 3500 ядер. Впрочем, небольшим облачным провайдерам, которые не соответствуют этому требованию, Broadcom присваивает статус «вторичных» и предлагает им приобретать лицензии у «основных» провайдеров с 3500+ ядрами в арсенале. В числе минусов этого предложения источник The Register назвал необходимость поддержки первичными партнёрами ПО VMware для вторичных партнёров. При этом уровень поддержки может оказаться гораздо ниже, чем непосредственно у VMware.

Вторичные партнёры могут выйти из бизнеса, а над некоторыми уже нависла угроза банкротства. Но и приглашённые стать первичными партнёрами тоже не проявляют энтузиазма. «Те, кого приглашают, чувствуют давление, вынуждающее принять несправедливые условия лицензирования из-за коротких сроков, установленных для подписания контрактов <…> Новые условия включают минимальные обязательства в размере десятков миллионов евро в течение трёхлетних периодов. Затраты на лицензии возросли, в некоторых случаях — в двенадцать раз (т.е. на 1200 %)», — отметила CISPE.

Генеральный секретарь CISPE заявил, что Broadcom «требует выкуп, используя доминирование VMware в сфере виртуализации» и навязывает несправедливые условия лицензирования с целью несправедливого обогащения за счёт европейских потребителей облачных услуг. Он призвал перевести Broadcom в разряд «привратников» в соответствии с европейским Законом о цифровых рынках (Digital Markets Act — DMA), чтобы обеспечить возможность применения к ней самого жёсткого регулирования.

Постоянный URL: http://testsn.3dnews.ru/1102105
21.03.2024 [23:54], Владимир Мироненко

В Google Cloud появятся ускорители NVIDIA Grace Blackwell

Google Cloud и NVIDIA объявили о расширении партнёрства, в рамках которого новая ИИ-платформа NVIDIA Grace Blackwell и NVIDIA DGX Cloud на её основе появятся в Google Cloud Platform, а клиентам станут доступны инференс-микросервисы NVIDIA NIM. Также было сказано об общедоступности DGX Cloud на базе NVIDIA H100.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Среди ключевых нововведений отмечены следующие:

  • Внедрение NVIDIA Grace Blackwell для работы с ИИ-моделями с триллионами параметров. Google станет одним из первых облачных провайдеров, предлагающих инстансы на базе Blackwell.
  • Переход DGX Cloud в Google Cloud Platform на суперускорители GB200 NVL72. Текущий вариант DGX Cloud теперь общедоступен и работает на базе инстансов Google Cloud A3 с ускорителями NVIDIA H100.
  • Возможность использование JAX с ускорителями NVIDIA H100 посредством MaxText и Accelerated Processing Kit (XPK).
  • Появление NVIDIA NIM в Google Kubernetes Engine (GKE)
  • Упрощённое развёртывание NVIDIA NeMo с помощью GKE и Google Cloud HPC Toolkit.
  • Vertex AI теперь поддерживает инстансы Google Cloud A3 с NVIDIA H100 и инстансы G2 с NVIDIA L4.
  • Сервис Dataflow теперь также поддерживает обработку данных на ускорителях NVIDIA.
Постоянный URL: http://testsn.3dnews.ru/1102087
21.03.2024 [00:51], Владимир Мироненко

Облачный ИИ-суперкомпьютер AWS Project Ceiba получит 21 тыс. суперчипов NVIDIA GB200

Amazon Web Services (AWS) и NVIDIA объявили о расширении сотрудничества, в рамках которого ускорители GB200 и B100 вскоре появятся в облаке AWS. Кроме того, компании объявили об интеграции Amazon SageMaker с NVIDIA NIM для предоставления клиентам более быстрого и дешёвого инференса, о появлении в AWS HealthOmics новых базовых моделей NVIDIA BioNeMo, а также о поддержке AWS обновлённой платформы NVIDIA AI Enterprise.

Сотрудничество двух компаний позволило объединить в единую инфраструктуру их новейшие технологии, в том числе многоузловые системы на базе чипов NVIDIA Blackwell, ПО для ИИ, AWS Nitro, сервис управления ключами AWS Key Management Service (AWS KMS), сетевые адаптеры Elastic Fabric (EFA) и кластеры EC2 UltraCluster. Предложенная инфраструктура и инструменты позволят клиентам создавать и запускать LLM с несколькими триллионами параметров быстрее, в больших масштабах и с меньшими затратами, чем позволяли EC2-инстансы с ускорителями NVIDIA прошлого поколения.

AWS предложит кластеры EC2 UltraClusters из суперускорителей GB200 NVL72, которые позволят объединить тысячи чипов GB200. GB200 будут доступны и в составе инстансов NVIDIA DGX Cloud. AWS также предложит EC2 UltraClusters с ускорителями B100. Amazon отмечает, что сочетание AWS Nitro и NVIDIA GB200 ещё больше повысит защиту ИИ-моделей: GB200 обеспечивает шифрование NVLink, EFA шифрует данные при передаче между узлами кластера, а KMS позволяет централизованно управлять ключами шифрования.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Аппаратный гипервизор AWS Nitro, как и прежде, разгружает CPU узлов, беря на себя обработку IO-операций, а также защищает код и данные во время работы с ними. Эта возможность, доступная только в сервисах AWS, была проверена и подтверждена NCC Group. Инстансы с GB200 поддерживают анклавы AWS Nitro Enclaves, что позволяет напрямую взаимодействовать с ускорителем и данными в изолированной и защищённой среде, доступа к которой нет даже у сотрудников Amazon.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Чипы Blackwell будут использоваться в обновлённом облачном суперкомпьютере AWS Project Ceiba, который будет использоваться NVIDIA для исследований и разработок в области LLM, генерация изображений/видео/3D, моделирования, цифровой биологии, робототехники, беспилотных авто, предсказания климата и т.д. Эта первая в своём роде машина на базе GB200 NVL72 будет состоять из 20 736 суперчипов GB200, причём каждый из них получит 800-Гбит/с EFA-подключение. Пиковая FP8-производительность системы составит 414 Эфлопс.

Постоянный URL: http://testsn.3dnews.ru/1102011
20.03.2024 [13:42], Сергей Карасёв

От $0,5/с: IQM запустила облачный сервис квантовых вычислений Resonance

Компания IQM Quantum Computers объявила о запуске облачной платформы Resonance, призванной ускорить исследования в области квантовых вычислений. Сервис предоставляет разработчикам и учёным доступ к системам IQM для планирования, тестирования и оценки эффективности квантовых алгоритмов.

Посредством Resonance обеспечивается доступ к квантовым компьютерам, расположенным в дата-центрах IQM в Эспоо (Финляндия) и Мюнхене (Германия). При этом пользователи могут работать с различными топологиями квантовых процессоров (QPU).

 Источник изображения: IQM

Источник изображения: IQM

Говорится, что на сегодняшний день через облачную платформу доступны 6-кубитный квантовый компьютер IQM Deneb и 20-кубитная система IQM Garnet. IQM заявляет, что платформа Resonance предоставляет безопасный доступ к квантовым компьютерам с новейшими QPU без необходимости инвестиций в квантовое оборудование. Стоимость услуги начинается с $0,5 в секунду. Также предлагается бесплатный пробный доступ длительностью 1 час.

Среди областей применения облачного сервиса названы машинное обучение, кибербезопасность, моделирование квантовых датчиков, исследования в области передовых химических соединений, разработка новых фармацевтических препаратов и пр. В сервисе используется модель подписки на временные интервалы.

Помимо облачного сервиса, компания IQM предлагает локальные квантовые компьютеры. В частности, на днях Юлихский суперкомпьютерный центр в Германии (JSC) объявил о приобретении у IQM 5-кубитной системы Spark, ввести которую в эксплуатацию планируется в июле нынешнего года. Кроме того, компания IQM заявила о планах создания Radiance — квантового компьютера на 150 кубитов, который будет запущен в I квартале 2025-го. IQM развернула локальные квантовые системы в Суперкомпьютерном центре Лейбница в Германии (LRZ) и в Центре технических исследований VTT в Финляндии.

Постоянный URL: http://testsn.3dnews.ru/1101987
20.03.2024 [02:17], Владимир Мироненко

Oracle и NVIDIA предложат суверенные ИИ-фабрики

Oracle и NVIDIA объявили о расширении сотрудничества для предоставления суверенного ИИ клиентам по всему миру — программно-аппаратные решения обеих компаний позволят правительствам и предприятиями формировать ИИ-фабрики, говорится в пресс-релизе. Облачные сервисы Oracle используют ряд платформ NVIDIA, включая аппаратную инфраструктуру и программную платформу NVIDIA AI Enterprise, в том числе недавно анонсированные микросервисы вывода NVIDIA NIM.

Такие ИИ-фабрики позволят развернуть облачные сервисы, работающие локально и размещённые в безопасных кампусах на территории страны или организации. Сочетание полнофункциональной ИИ-платформы NVIDIA с корпоративным ИИ-инструментами Oracle, которые можно развернуть в выделенном регионе OCI, позволит получить современное ИИ-решение с повышенным уровенем контроля, защиты и безопасности. По словам Oracle, компания является единственным гиперскейлером, способным предоставлять ИИ-решения и полноценные облачные услуги локально и в любом месте.

Oracle также задействует чипы NVIDIA Blackwell (GB200 и B200) в OCI Supercluster и OCI Compute. OCI Supercluster станет значительно быстрее благодаря новым bare metal-инстансам, RDMA-сети со сверхмалой задержкой и высокопроизводительному хранилищу. В OCI появятся и сервисы NVIDIA NIM и CUDA-X, а также NVIDIA NeMo Retriever.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Наконец, в DGX Cloud on OCI станут доступны инстансы на базе суперускорителей GB200 NVL72 для работы с LLM с триллионами параметров. Полный кластер DGX Cloud будет включать более 20 тыс. ускорителей GB200, интерконнект NVLink 5 и сеть NVIDIA InfiniBand XDR.

Постоянный URL: http://testsn.3dnews.ru/1101930