Материалы по тегу: software

20.10.2025 [01:23], Владимир Мироненко

Ускорителей хватит на всех — Alibaba Aegaeon оптимизировал обработку ИИ-нагрузок, снизив использование дефицитных NVIDIA H20 на 82 %

Alibaba Cloud представила Aegaeon, систему пулинга вычислений, позволяющую сократить количество ускорителей NVIDIA, необходимых для обслуживания ИИ-моделей, на 82 %, пишет ресурс SCMP. По словам разработчиков, благодаря Aegaeon количество ускорителей NVIDIA H20, необходимых для обслуживания десятков моделей с 72 млрд параметров, удалось сократить с 1192 до 213 единиц. «Aegaeon — это первое решение на рынке, которое выявило чрезмерные затраты, связанные с обслуживанием параллельных рабочих нагрузок LLM», — сообщили исследователи из Пекинского университета и Alibaba Cloud.

Провайдеры облачных сервисов, такие как Alibaba Cloud и ByteDance Volcano Engine, предоставляют пользователям одновременно тысячи ИИ-моделей — множество вызовов API обрабатывается одновременно. Однако на практике для инференса чаще всего используются лишь несколько моделей, таких как Qwen и DeepSeek, а большинство других моделей применяются лишь эпизодически. Это приводит к неэффективному использованию вычислительных ресурсов: исследователи обнаружили, что 17,7 % ускорителей выделяется на обслуживание лишь 1,35 % запросов в Alibaba Cloud.

Aegaeon выполняет «автоматическое масштабирование» на уровне токенов, обеспечивая переключение ускорителей между обслуживанием различных моделей в процессе генерации. В рамках системы один ускоритель поддерживает обработку до семи моделей по сравнению с двумя-тремя моделями в альтернативных системах. При этом задержка, связанная с переключением между моделями, снижена на 97 %, заявили исследователи. Alibaba Cloud сообщила, что решение уже используется на её торговой площадке моделей Bailian.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Глава NVIDIA Дженсен Хуанг (Jensen Huang) объявил, что из-за экспортных ограничений доля компании на рынке передовых чипов в Китае сократилась с 95 % до нуля. Этому также способствовала стратегия Пекина, направленная на самообеспечение местного рынка. В связи с этим планы NVIDIA возобновить отгрузки ИИ-ускорителей H20, на которые ранее были установлены ограничения правительством США, встретили в Китае довольно прохладно. Более того, в Китае вынесли запрет местным компаниям на покупку разработанного специально для местного рынка ускорителя NVIDIA RTX Pro 6000D, поскольку пришли к выводу, что китайские ИИ-чипы не уступают продукции NVIDIA, разрешённой к экспорту в Китай.

Постоянный URL: http://testsn.3dnews.ru/1131059
17.10.2025 [14:49], Андрей Крупин

VK Cloud, Yandex Cloud и «Флант» создадут первую в России некоммерческую ассоциацию по облачным технологиям

Компании VK Cloud, Yandex Cloud и «Флант» объявили о планах по созданию некоммерческой Ассоциации облачно-ориентированных технологий (АОТ) — первой в РФ организации, которая займётся развитием новых подходов, стандартов и архитектуры нативных облачных технологий без привязки к конкретному вендору.

АОТ призвана объединить игроков отечественного облачного рынка для популяризации облачных технологий, таких как Kubernetes и Cloud-native. Ключевыми задачами ассоциации станут продвижение и внедрение Cloud-native-решений через стандартизацию подходов и компетенций в разработке ПО, поддержка и развитие Open Source-продуктов, а также их внедрение в бизнес-среде, популяризация облачных технологий и Kubernetes, а также развитие и объединение профессионального сообщества.

 Источник изображения: Monisha Selvakumar / unsplash.com

Источник изображения: Monisha Selvakumar / unsplash.com

Стать партнёром АОТ сможет любая компания, использующая в работе облачные технологии, а участником — любой IT-специалист. Статус партнёра предполагает ежегодные взносы, которые идут на проекты ассоциации, и открывает доступ к проектам и ресурсам АОТ.

«Мы считаем, что базовые облачные технологии должны быть доступны всем, и у каждого должна быть возможность вносить в них свой вклад. Наша совместная задача с партнёрами из Ассоциации облачно-ориентированных технологий — объединить усилия крупнейших организаций и всех инженеров, которым не безразличен Open Source, чтобы ускорить развитие индустрии в целом», — прокомментировали инициативу в компании «Флант».

Постоянный URL: http://testsn.3dnews.ru/1130985
16.10.2025 [16:20], Андрей Крупин

VK Tech запустил сервис виртуальных карт GPU

Российский разработчик корпоративного программного обеспечения VK Tech (входит в экосистему VK) сообщил о включении в состав облачной платформы VK Cloud виртуальных GPU-карт.

Виртуальные GPU реализованы на базе аппаратных решений компании Nvidia и доступны в VDI-сервисе Cloud Desktop, предназначенном для доставки пользователям рабочих столов, развёрнутых на удалённом сервере и функционирующих в виртуализированном окружении. Поддержка GPU может быть актуальна для проектирования, анимации, редактирования видео, 3D-моделирования, рендеринга, тяжёлых вычислений, машинного обучения и других ресурсоёмких задач.

 Источник изображения: Christina @ wocintechchat.com / unsplash.com

Источник изображения: Christina @ wocintechchat.com / unsplash.com

«Мы стремимся сделать технологии более доступными для наших пользователей. Облачные вычисления на базе GPU помогут повысить производительность решений, сократить время на обработку данных и снизить расходы. Новый сервис позволяет быстро получить готовую к работе видеокарту и оплатить только необходимый объем её мощностей», — отмечает VK Tech.

Инфраструктура VK Cloud соответствует 152-ФЗ на высшем уровне защищённости (УЗ-1), а также стандартам ГОСТ Р 57580 и PCI DSS.

Постоянный URL: http://testsn.3dnews.ru/1130931
16.10.2025 [13:51], Андрей Крупин

Postgres Professional вышла на рынок аналитических СУБД в России с продуктом Tengri Data

Компания Postgres Professional объявила о выпуске Tengri Data — корпоративной аналитической платформы для работы с большими данными. Решение позволяет обрабатывать данные суммарным объёмом до 10 Пбайт, что открывает крупным организациям доступ к масштабной аналитике без ограничений.

В отличие от многих аналогичных продуктов, основанных на Greenplum, платформа Tengri Data разработана на парадигме OpenLakehouse. Она использует принцип разделения вычислений (Compute) и хранилища (Storage), а также хранит данные в объектном хранилище S3, что обеспечивает гибкость, масштабирование и высокую производительность, независимо от нагрузки и количества аналитиков. В свою очередь это позволяет снизить стоимость владения (TCO) и повысить рентабельность инвестиций (ROI).

 Архитектура платформы Tengri Data (источник изображений: tngri.postgrespro.ru)

Архитектура платформы Tengri Data (источник изображений: tngri.postgrespro.ru)

Tengri Data поддерживает знакомый IT-специалистам стек технологий: язык SQL для трансформации данных, язык Python для скриптования, машинного обучения и искусственного интеллекта, а также стандартные способы подключений. Это позволяет организациям использовать Tengri Data без затрат на переобучение сотрудников или перестройку бизнес-процессов.

 Схема развёртывания Tengri Data

Схема развёртывания Tengri Data

«Многие компании в России по-прежнему работают на решениях, созданных на базе Greenplum, который больше не развивается в рамках Open Source. Эти технологии требуют замены и не отвечают современным требованиям и способам аналитической работы с данными, не справляются с ростом объёмов хранилища и числа пользователей. Tengri Data предлагает рынку принципиально иной уровень аналитики, отвечающий запросу на масштабируемую и гибкую платформу», — отмечает Postgres Professional.

Рынок платформ для работы с данными рассматривается разработчиком как стратегически перспективный на фоне прогнозируемого стремительного роста: по оценке J’son & Partners Consulting, среднегодовые темпы роста упомянутого сегмента до 2028 года составят свыше 30 % от уровня 2024 года, а потенциальный объем рынка вендорских решений этого класса в РФ оценивается в 10,1 млрд рублей. К 2028 году Postgres Professional планирует занять не менее 50 % объёма рынка лицензий этого сегмента.

Постоянный URL: http://testsn.3dnews.ru/1130918
15.10.2025 [15:38], Андрей Крупин

SL Soft FabricaONE.AI представила систему корпоративного интеллектуального поиска SL AI Search

Российская компания SL Soft FabricaONE.AI (акционер — ГК Softline), занимающаяся разработкой программного обеспечения на базе искусственного интеллекта, сообщила о выпуске SL AI Search — корпоративной системы интеллектуального поиска нового поколения.

SL AI Search обеспечивает быстрый доступ к корпоративным данным, объединяя разрозненные базы знаний и документы в единое цифровое пространство, поиск по которому может осуществляться с использованием запросов на естественном языке. Решение работает со смыслом и контекстом, поддерживает семантический и векторный поиск, а также понимает синонимы и профессиональную лексику. Возможен сквозной поиск по локальным и сетевым папкам, СЭД, КЭДО, архивам, ERP-системам, корпоративным порталам, облачным хранилищам, деловой переписке и внешним ресурсам. Продукт позволяет находить нужные данные в текстах, таблицах, изображениях и других типах файлов.

 Источник изображения: Glenn Carstens-Peters / unsplash.com

Источник изображения: Glenn Carstens-Peters / unsplash.com

Интеллектуальный поиск SL AI Search реализован в двух режимах. Первый — диалоговый чат на основе технологии Retrieval-Augmented Generation (RAG) и больших языковых моделей: он возвращает точный и обобщённый ответ на основе корпоративных документов и базы знаний. Если запрос пользователя неоднозначный и требует детализации, система задаёт уточняющие вопросы. Второй режим — классическая поисковая строка, которая умеет искать не только по словам, но и по их синонимам и связанным терминам, чтобы находить нужные документы даже при запросе в свободной форме.

Продукт SL AI Search может быть встроен в единое окно корпоративного портала, интегрирован c IM-клиентами и информационными системами предприятия.

Постоянный URL: http://testsn.3dnews.ru/1130856
14.10.2025 [15:49], Андрей Крупин

«Группа Астра» представила программно-определяемую систему хранения данных TROK

«Группа Астра» объявила о выпуске TROK — российского программно-определяемого хранилища данных (Software-defined storage, SDS), предназначенного для построения отказоустойчивых облачных инфраструктур и корпоративных систем хранения.

Система TROK может быть развёрнута на любом типовом сервере с архитектурой x86-64, amd64 или Arm. Решение позволяет управлять виртуальными устройствами, поддерживает разные протоколы доступа (блочный, файловый, объектный), параллельную синхронную репликацию данных между узлами хранения, возможность подключения по iSCSI, NVMEoF Target, NFS и различные механизмы восстановления данных. Доступен API управления хранилищем с поддержкой аутентификации. Продукт интегрирован в экосистему «Группы Астра» и совместим с отечественными платформами, включая ОС Astra Linux и СУБД Tantor.

 Источник изображения: trok-sds.ru

Источник изображения: trok-sds.ru

По заверениям разработчика, TROK подходит для построения частных, гибридных, публичных облаков и обеспечивает снижение совокупной стоимости владения (TCO) до 50 % по сравнению с проприетарными СХД.

Стоимость TROK зависит от количества поддерживаемых виртуальных блочных устройств (доступны варианты на 10 Тбайт и 1 Пбайт), типа лицензии (бессрочная или подписка) и срока технической поддержки.

Платформа зарегистрирована в реестре отечественного программного обеспечения и полностью подходит для задач импортозамещения.

Постоянный URL: http://testsn.3dnews.ru/1130785
14.10.2025 [10:00], Сергей Карасёв

«Базис» и MIND Software представляют первое в России коробочное HCI-решение для ускорения цифровой трансформации бизнеса

Компании MIND Software и «Базис» объявили о запуске первого в России полностью интегрированного HCI-решения. В его основу легла платформа для управления динамической инфраструктурой Basis Dynamix Standard, в которую встроена распределённая программно-определяемая система хранения данных MIND uStor.

Разработанное MIND Software и «Базис» решение позволяет бизнесу создавать гиперконвергентную инфраструктуру (HCI, Hyper Converged Infrastructure), максимально сбалансированную по утилизации аппаратных ресурсов, без избыточных сервисов и точек отказа. Все необходимые для создания инструменты доступны заказчику «из коробки», без сложной настройки и длительного внедрения — для запуска системы достаточно нескольких кликов, и через 15 минут кластер полностью готов к работе. Управление гиперконвергентной инфраструктурой осуществляется из единой панели с графическим интерфейсом.

Представленный продукт объединяет преимущества платформы Basis Dynamix Standard, такие как лёгкость развёртывания и гибкость управления, с надёжностью и экономичностью СХД MIND uStor. Новое HCI-решение позволяет значительно сократить время развёртывания ИТ-инфраструктуры и снизить операционные издержки, что особенно актуально для компаний, стремящихся ускорить цифровую трансформацию.

 Источник изображения: «Базис» / Денис Насаев

Источник изображения: «Базис» / Денис Насаев

Антон Груздев, генеральный директор MIND Software, отметил: «Интеграция MIND uStor и Dynamix Standard позволяет нам сделать современные технологии хранения данных более доступными и простыми во внедрении. Мы стремимся избавить заказчиков от сложностей с настройкой и дать им возможность сразу сосредоточиться на эффективности и масштабировании бизнеса».

Дмитрий Сорокин, технический директор компании «Базис», добавил: «Поиск технологических партнёров и новых возможностей для развития продуктов — важная часть стратегии "Базиса". Мы давно и успешно сотрудничаем с MIND, и глубокая интеграция с MIND uStor — логичный шаг в развитии нашей платформы Dynamix Standard. Кроме того, мы видим значительный интерес бизнеса к HCI-платформам с прозрачной архитектурой и высокой степенью автоматизации, а значит, наше сотрудничество принесёт пользу рынку в целом».

Постоянный URL: http://testsn.3dnews.ru/1130618
09.10.2025 [18:30], Андрей Крупин

Российская платформа управления серверной виртуализацией VMmanager получила крупное обновление

Компания ISPsystem (входит в «Группу Астра») выпустила масштабное обновление платформы управления серверной виртуализацией VMmanager.

VMmanager подходит для управления аппаратной и контейнерной виртуализацией, изоляции и абстрагирования виртуальной инфраструктуры от физической, а также для предоставления услуг облачного хостинга в форматах IaaS (инфраструктура как сервис) и SaaS (программное обеспечение как сервис). Решение поддерживает микросервисную архитектуру и построение отказоустойчивых кластеров (Unbreakable clusters), содержит библиотеку готовых ОС и приложений, позволяет создавать изолированные сети внутри кластера виртуальных машин (IP-fabric), выполнять проброс ресурсов физического графического процессора в виртуальную среду и решать прочие задачи. Также в составе программного комплекса представлены средства мониторинга виртуальной инфраструктуры для отслеживания ключевых метрик виртуальных машин и узлов.

 Платформа управления серверной виртуализацией VMmanager (источник изображения: ispsystem.ru/vmmanager)

Платформа управления серверной виртуализацией VMmanager (источник изображения: ispsystem.ru/vmmanager)

Ключевой особенностью нового релиза VMmanager стала реализация гиперконвергентного сценария (HCI) на основе программно-определяемого хранилища Ceph. Также продукт получил обновлённую ролевую модель доступа и ряд улучшений, повышающих гибкость и отказоустойчивость виртуальной инфраструктуры. В частности, сообщается о реализации функции паузы виртуальной машины, мгновенно освобождающей ресурсы CPU и обеспечивающей консистентность данных при резервном копировании, добавлении средств централизованного управления подключениями iSCSI, упрощающих работу с внешними дисковыми системами, и встраивании механизма контроля синхронизации времени, автоматизирующего настройку протокола NTP и предупреждающего о потенциальных сбоях в кластере.

Ещё одним важным нововведением стала поддержка подключения графических ускорителей в режиме vGPU. Эта технология позволяет делить ресурсы одного физического GPU между несколькими виртуальными машинами, делая оборудование доступным для сценариев VDI, машинного обучения и рендеринга.

Постоянный URL: http://testsn.3dnews.ru/1130568
09.10.2025 [16:50], Руслан Авдеев

«Безответственный» ИИ: большинство компаний пока несут финансовые потери, связанные с внедрением ИИ

По данным исследования британской консалтинговой компании EY (Ernst & Young), почти каждый крупный бизнес, внедривший ИИ в свои операции, понёс определённые финансовые потери. Часто это происходит из-за несоблюдения нормативных требований, получения ошибочных результатов, «предвзятости» или негативного влияния на достижение целей устойчивого развития, сообщает Reuters. Несколько реже сообщалось о репутационном ущербе и юридических проблемах.

В июле-августе 2025 года EY провела анонимный опрос среди 975 топ-менеджеров, курирующих внедрение ИИ в компаниях со всего мира с годовым оборотом не менее $1 млрд. Совокупные потери бизнеса оцениваются в $4,4 млрд, при этом от ожиданий бизнеса отставали показатели вроде роста выручки, уровня экономии затрат и степени удовлетворённости сотрудников. Тем не менее, представители опрошенных компаний настроены оптимистично и полагают, что внедрение ИИ в конце концов принесёт ощутимые плоды.

 Источник изображения: micheile henderson/unsplash.com

Источник изображения: micheile henderson/unsplash.com

По словам представителя EY, искусственный интеллект, безусловно, повышает производительность и эффективность бизнеса — сотрудники при прочих равных способны выполнять больше задач и делать это быстрее. При этом создание ценности не настолько велико, поскольку часто удаётся выполнять больший объём работы, а не обязательно сокращать расходы или получать немедленную выручку.

Исследование EY уделяло основное внимание «ответственному внедрению ИИ» — ряду показателей, которые дают возможность оценить, разработал ли бизнес внутреннюю политику управления ИИ, довели ли до пользователей чёткие правила эксплуатации и осуществляют ли контроль за соблюдением правил. По словам EY, компании с более подробно разработанной политикой «ответственного ИИ» (Responsible AI) утверждают, что добились больших продаж, сокращения затрат и большее высокой степени удовлетворённости сотрудников.

Примечательно, что жертвой ИИ недавно стал другой консалтинговый гигант — компания Deloitte, представившая австралийскому правительству документ с фейковыми ссылками, цитатами и даже полностью выдуманной выдержкой из постановления Австралийского федерального суда.

Постоянный URL: http://testsn.3dnews.ru/1130550
08.10.2025 [16:35], Андрей Крупин

Российский рынок IaaS и PaaS отметился 30-проценным ростом с начала года

За первые девять месяцев 2025 года рынок инфраструктурных облачных сервисов (IaaS) и платформенных решений (PaaS) в России вырос почти на 30 процентов год к году. При этом совокупный объём двух сегментов в публичном облаке составил 104 млрд руб. Таковы результаты исследования, проведённого аналитической компанией Apple Hills Digital.

Согласно представленным Apple Hills Digital данным, на рынке наметился интерес бизнес-заказчиков к сервисам на базе искусственного интеллекта, что стимулирует спрос на решения с GPU-ускорителями: сегмент рынка GPU-серверов в публичном облаке вырос на 45 %, AI/ML-платформ — на 35 % по отношению к аналогичному периоду 2024 года.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Отмечается, что ожидаемый рост сегментов IaaS и PaaS от квартала к предшествующему кварталу в третьем квартале 2025 года несколько замедлился — с 9–10 % в первом и втором кварталах 2025 года до 5 % в третьем квартале. При сохранении тенденции к замедлению это может привести к понижению прогноза годового роста в 2025 году с ожидаемых 25 % до 22 % роста рынка к 2024 году.

«Отечественный рынок публичных облаков в 2025 году сохраняет высокий темп роста, однако динамика внутри сегментов становится более дифференцированной. Основной драйвер — спрос на гибкие ресурсы для задач искусственного интеллекта и обучения моделей, как в инфраструктуре, так и в платформенных сервисах. Замедление квартальных темпов внутри года может указывать на возможный переход отрасли от экстенсивного роста к фазе масштабирования и повышения эффективности», — говорится в исследовании Apple Hills Digital.

Постоянный URL: http://testsn.3dnews.ru/1130487