Материалы по тегу: software
|
20.10.2025 [01:23], Владимир Мироненко
Ускорителей хватит на всех — Alibaba Aegaeon оптимизировал обработку ИИ-нагрузок, снизив использование дефицитных NVIDIA H20 на 82 %Alibaba Cloud представила Aegaeon, систему пулинга вычислений, позволяющую сократить количество ускорителей NVIDIA, необходимых для обслуживания ИИ-моделей, на 82 %, пишет ресурс SCMP. По словам разработчиков, благодаря Aegaeon количество ускорителей NVIDIA H20, необходимых для обслуживания десятков моделей с 72 млрд параметров, удалось сократить с 1192 до 213 единиц. «Aegaeon — это первое решение на рынке, которое выявило чрезмерные затраты, связанные с обслуживанием параллельных рабочих нагрузок LLM», — сообщили исследователи из Пекинского университета и Alibaba Cloud. Провайдеры облачных сервисов, такие как Alibaba Cloud и ByteDance Volcano Engine, предоставляют пользователям одновременно тысячи ИИ-моделей — множество вызовов API обрабатывается одновременно. Однако на практике для инференса чаще всего используются лишь несколько моделей, таких как Qwen и DeepSeek, а большинство других моделей применяются лишь эпизодически. Это приводит к неэффективному использованию вычислительных ресурсов: исследователи обнаружили, что 17,7 % ускорителей выделяется на обслуживание лишь 1,35 % запросов в Alibaba Cloud. Aegaeon выполняет «автоматическое масштабирование» на уровне токенов, обеспечивая переключение ускорителей между обслуживанием различных моделей в процессе генерации. В рамках системы один ускоритель поддерживает обработку до семи моделей по сравнению с двумя-тремя моделями в альтернативных системах. При этом задержка, связанная с переключением между моделями, снижена на 97 %, заявили исследователи. Alibaba Cloud сообщила, что решение уже используется на её торговой площадке моделей Bailian. Глава NVIDIA Дженсен Хуанг (Jensen Huang) объявил, что из-за экспортных ограничений доля компании на рынке передовых чипов в Китае сократилась с 95 % до нуля. Этому также способствовала стратегия Пекина, направленная на самообеспечение местного рынка. В связи с этим планы NVIDIA возобновить отгрузки ИИ-ускорителей H20, на которые ранее были установлены ограничения правительством США, встретили в Китае довольно прохладно. Более того, в Китае вынесли запрет местным компаниям на покупку разработанного специально для местного рынка ускорителя NVIDIA RTX Pro 6000D, поскольку пришли к выводу, что китайские ИИ-чипы не уступают продукции NVIDIA, разрешённой к экспорту в Китай.
17.10.2025 [14:49], Андрей Крупин
VK Cloud, Yandex Cloud и «Флант» создадут первую в России некоммерческую ассоциацию по облачным технологиямКомпании VK Cloud, Yandex Cloud и «Флант» объявили о планах по созданию некоммерческой Ассоциации облачно-ориентированных технологий (АОТ) — первой в РФ организации, которая займётся развитием новых подходов, стандартов и архитектуры нативных облачных технологий без привязки к конкретному вендору. АОТ призвана объединить игроков отечественного облачного рынка для популяризации облачных технологий, таких как Kubernetes и Cloud-native. Ключевыми задачами ассоциации станут продвижение и внедрение Cloud-native-решений через стандартизацию подходов и компетенций в разработке ПО, поддержка и развитие Open Source-продуктов, а также их внедрение в бизнес-среде, популяризация облачных технологий и Kubernetes, а также развитие и объединение профессионального сообщества.
Источник изображения: Monisha Selvakumar / unsplash.com Стать партнёром АОТ сможет любая компания, использующая в работе облачные технологии, а участником — любой IT-специалист. Статус партнёра предполагает ежегодные взносы, которые идут на проекты ассоциации, и открывает доступ к проектам и ресурсам АОТ. «Мы считаем, что базовые облачные технологии должны быть доступны всем, и у каждого должна быть возможность вносить в них свой вклад. Наша совместная задача с партнёрами из Ассоциации облачно-ориентированных технологий — объединить усилия крупнейших организаций и всех инженеров, которым не безразличен Open Source, чтобы ускорить развитие индустрии в целом», — прокомментировали инициативу в компании «Флант».
16.10.2025 [16:20], Андрей Крупин
VK Tech запустил сервис виртуальных карт GPUРоссийский разработчик корпоративного программного обеспечения VK Tech (входит в экосистему VK) сообщил о включении в состав облачной платформы VK Cloud виртуальных GPU-карт. Виртуальные GPU реализованы на базе аппаратных решений компании Nvidia и доступны в VDI-сервисе Cloud Desktop, предназначенном для доставки пользователям рабочих столов, развёрнутых на удалённом сервере и функционирующих в виртуализированном окружении. Поддержка GPU может быть актуальна для проектирования, анимации, редактирования видео, 3D-моделирования, рендеринга, тяжёлых вычислений, машинного обучения и других ресурсоёмких задач.
Источник изображения: Christina @ wocintechchat.com / unsplash.com «Мы стремимся сделать технологии более доступными для наших пользователей. Облачные вычисления на базе GPU помогут повысить производительность решений, сократить время на обработку данных и снизить расходы. Новый сервис позволяет быстро получить готовую к работе видеокарту и оплатить только необходимый объем её мощностей», — отмечает VK Tech. Инфраструктура VK Cloud соответствует 152-ФЗ на высшем уровне защищённости (УЗ-1), а также стандартам ГОСТ Р 57580 и PCI DSS.
16.10.2025 [13:51], Андрей Крупин
Postgres Professional вышла на рынок аналитических СУБД в России с продуктом Tengri DataКомпания Postgres Professional объявила о выпуске Tengri Data — корпоративной аналитической платформы для работы с большими данными. Решение позволяет обрабатывать данные суммарным объёмом до 10 Пбайт, что открывает крупным организациям доступ к масштабной аналитике без ограничений. В отличие от многих аналогичных продуктов, основанных на Greenplum, платформа Tengri Data разработана на парадигме OpenLakehouse. Она использует принцип разделения вычислений (Compute) и хранилища (Storage), а также хранит данные в объектном хранилище S3, что обеспечивает гибкость, масштабирование и высокую производительность, независимо от нагрузки и количества аналитиков. В свою очередь это позволяет снизить стоимость владения (TCO) и повысить рентабельность инвестиций (ROI).
Архитектура платформы Tengri Data (источник изображений: tngri.postgrespro.ru) Tengri Data поддерживает знакомый IT-специалистам стек технологий: язык SQL для трансформации данных, язык Python для скриптования, машинного обучения и искусственного интеллекта, а также стандартные способы подключений. Это позволяет организациям использовать Tengri Data без затрат на переобучение сотрудников или перестройку бизнес-процессов.
Схема развёртывания Tengri Data «Многие компании в России по-прежнему работают на решениях, созданных на базе Greenplum, который больше не развивается в рамках Open Source. Эти технологии требуют замены и не отвечают современным требованиям и способам аналитической работы с данными, не справляются с ростом объёмов хранилища и числа пользователей. Tengri Data предлагает рынку принципиально иной уровень аналитики, отвечающий запросу на масштабируемую и гибкую платформу», — отмечает Postgres Professional. Рынок платформ для работы с данными рассматривается разработчиком как стратегически перспективный на фоне прогнозируемого стремительного роста: по оценке J’son & Partners Consulting, среднегодовые темпы роста упомянутого сегмента до 2028 года составят свыше 30 % от уровня 2024 года, а потенциальный объем рынка вендорских решений этого класса в РФ оценивается в 10,1 млрд рублей. К 2028 году Postgres Professional планирует занять не менее 50 % объёма рынка лицензий этого сегмента.
15.10.2025 [15:38], Андрей Крупин
SL Soft FabricaONE.AI представила систему корпоративного интеллектуального поиска SL AI SearchРоссийская компания SL Soft FabricaONE.AI (акционер — ГК Softline), занимающаяся разработкой программного обеспечения на базе искусственного интеллекта, сообщила о выпуске SL AI Search — корпоративной системы интеллектуального поиска нового поколения. SL AI Search обеспечивает быстрый доступ к корпоративным данным, объединяя разрозненные базы знаний и документы в единое цифровое пространство, поиск по которому может осуществляться с использованием запросов на естественном языке. Решение работает со смыслом и контекстом, поддерживает семантический и векторный поиск, а также понимает синонимы и профессиональную лексику. Возможен сквозной поиск по локальным и сетевым папкам, СЭД, КЭДО, архивам, ERP-системам, корпоративным порталам, облачным хранилищам, деловой переписке и внешним ресурсам. Продукт позволяет находить нужные данные в текстах, таблицах, изображениях и других типах файлов.
Источник изображения: Glenn Carstens-Peters / unsplash.com Интеллектуальный поиск SL AI Search реализован в двух режимах. Первый — диалоговый чат на основе технологии Retrieval-Augmented Generation (RAG) и больших языковых моделей: он возвращает точный и обобщённый ответ на основе корпоративных документов и базы знаний. Если запрос пользователя неоднозначный и требует детализации, система задаёт уточняющие вопросы. Второй режим — классическая поисковая строка, которая умеет искать не только по словам, но и по их синонимам и связанным терминам, чтобы находить нужные документы даже при запросе в свободной форме. Продукт SL AI Search может быть встроен в единое окно корпоративного портала, интегрирован c IM-клиентами и информационными системами предприятия.
14.10.2025 [15:49], Андрей Крупин
«Группа Астра» представила программно-определяемую систему хранения данных TROK«Группа Астра» объявила о выпуске TROK — российского программно-определяемого хранилища данных (Software-defined storage, SDS), предназначенного для построения отказоустойчивых облачных инфраструктур и корпоративных систем хранения. Система TROK может быть развёрнута на любом типовом сервере с архитектурой x86-64, amd64 или Arm. Решение позволяет управлять виртуальными устройствами, поддерживает разные протоколы доступа (блочный, файловый, объектный), параллельную синхронную репликацию данных между узлами хранения, возможность подключения по iSCSI, NVMEoF Target, NFS и различные механизмы восстановления данных. Доступен API управления хранилищем с поддержкой аутентификации. Продукт интегрирован в экосистему «Группы Астра» и совместим с отечественными платформами, включая ОС Astra Linux и СУБД Tantor.
Источник изображения: trok-sds.ru По заверениям разработчика, TROK подходит для построения частных, гибридных, публичных облаков и обеспечивает снижение совокупной стоимости владения (TCO) до 50 % по сравнению с проприетарными СХД. Стоимость TROK зависит от количества поддерживаемых виртуальных блочных устройств (доступны варианты на 10 Тбайт и 1 Пбайт), типа лицензии (бессрочная или подписка) и срока технической поддержки. Платформа зарегистрирована в реестре отечественного программного обеспечения и полностью подходит для задач импортозамещения.
14.10.2025 [10:00], Сергей Карасёв
«Базис» и MIND Software представляют первое в России коробочное HCI-решение для ускорения цифровой трансформации бизнесаКомпании MIND Software и «Базис» объявили о запуске первого в России полностью интегрированного HCI-решения. В его основу легла платформа для управления динамической инфраструктурой Basis Dynamix Standard, в которую встроена распределённая программно-определяемая система хранения данных MIND uStor. Разработанное MIND Software и «Базис» решение позволяет бизнесу создавать гиперконвергентную инфраструктуру (HCI, Hyper Converged Infrastructure), максимально сбалансированную по утилизации аппаратных ресурсов, без избыточных сервисов и точек отказа. Все необходимые для создания инструменты доступны заказчику «из коробки», без сложной настройки и длительного внедрения — для запуска системы достаточно нескольких кликов, и через 15 минут кластер полностью готов к работе. Управление гиперконвергентной инфраструктурой осуществляется из единой панели с графическим интерфейсом. Представленный продукт объединяет преимущества платформы Basis Dynamix Standard, такие как лёгкость развёртывания и гибкость управления, с надёжностью и экономичностью СХД MIND uStor. Новое HCI-решение позволяет значительно сократить время развёртывания ИТ-инфраструктуры и снизить операционные издержки, что особенно актуально для компаний, стремящихся ускорить цифровую трансформацию. Антон Груздев, генеральный директор MIND Software, отметил: «Интеграция MIND uStor и Dynamix Standard позволяет нам сделать современные технологии хранения данных более доступными и простыми во внедрении. Мы стремимся избавить заказчиков от сложностей с настройкой и дать им возможность сразу сосредоточиться на эффективности и масштабировании бизнеса». Дмитрий Сорокин, технический директор компании «Базис», добавил: «Поиск технологических партнёров и новых возможностей для развития продуктов — важная часть стратегии "Базиса". Мы давно и успешно сотрудничаем с MIND, и глубокая интеграция с MIND uStor — логичный шаг в развитии нашей платформы Dynamix Standard. Кроме того, мы видим значительный интерес бизнеса к HCI-платформам с прозрачной архитектурой и высокой степенью автоматизации, а значит, наше сотрудничество принесёт пользу рынку в целом».
09.10.2025 [18:30], Андрей Крупин
Российская платформа управления серверной виртуализацией VMmanager получила крупное обновлениеКомпания ISPsystem (входит в «Группу Астра») выпустила масштабное обновление платформы управления серверной виртуализацией VMmanager. VMmanager подходит для управления аппаратной и контейнерной виртуализацией, изоляции и абстрагирования виртуальной инфраструктуры от физической, а также для предоставления услуг облачного хостинга в форматах IaaS (инфраструктура как сервис) и SaaS (программное обеспечение как сервис). Решение поддерживает микросервисную архитектуру и построение отказоустойчивых кластеров (Unbreakable clusters), содержит библиотеку готовых ОС и приложений, позволяет создавать изолированные сети внутри кластера виртуальных машин (IP-fabric), выполнять проброс ресурсов физического графического процессора в виртуальную среду и решать прочие задачи. Также в составе программного комплекса представлены средства мониторинга виртуальной инфраструктуры для отслеживания ключевых метрик виртуальных машин и узлов.
Платформа управления серверной виртуализацией VMmanager (источник изображения: ispsystem.ru/vmmanager) Ключевой особенностью нового релиза VMmanager стала реализация гиперконвергентного сценария (HCI) на основе программно-определяемого хранилища Ceph. Также продукт получил обновлённую ролевую модель доступа и ряд улучшений, повышающих гибкость и отказоустойчивость виртуальной инфраструктуры. В частности, сообщается о реализации функции паузы виртуальной машины, мгновенно освобождающей ресурсы CPU и обеспечивающей консистентность данных при резервном копировании, добавлении средств централизованного управления подключениями iSCSI, упрощающих работу с внешними дисковыми системами, и встраивании механизма контроля синхронизации времени, автоматизирующего настройку протокола NTP и предупреждающего о потенциальных сбоях в кластере. Ещё одним важным нововведением стала поддержка подключения графических ускорителей в режиме vGPU. Эта технология позволяет делить ресурсы одного физического GPU между несколькими виртуальными машинами, делая оборудование доступным для сценариев VDI, машинного обучения и рендеринга.
09.10.2025 [16:50], Руслан Авдеев
«Безответственный» ИИ: большинство компаний пока несут финансовые потери, связанные с внедрением ИИПо данным исследования британской консалтинговой компании EY (Ernst & Young), почти каждый крупный бизнес, внедривший ИИ в свои операции, понёс определённые финансовые потери. Часто это происходит из-за несоблюдения нормативных требований, получения ошибочных результатов, «предвзятости» или негативного влияния на достижение целей устойчивого развития, сообщает Reuters. Несколько реже сообщалось о репутационном ущербе и юридических проблемах. В июле-августе 2025 года EY провела анонимный опрос среди 975 топ-менеджеров, курирующих внедрение ИИ в компаниях со всего мира с годовым оборотом не менее $1 млрд. Совокупные потери бизнеса оцениваются в $4,4 млрд, при этом от ожиданий бизнеса отставали показатели вроде роста выручки, уровня экономии затрат и степени удовлетворённости сотрудников. Тем не менее, представители опрошенных компаний настроены оптимистично и полагают, что внедрение ИИ в конце концов принесёт ощутимые плоды.
Источник изображения: micheile henderson/unsplash.com По словам представителя EY, искусственный интеллект, безусловно, повышает производительность и эффективность бизнеса — сотрудники при прочих равных способны выполнять больше задач и делать это быстрее. При этом создание ценности не настолько велико, поскольку часто удаётся выполнять больший объём работы, а не обязательно сокращать расходы или получать немедленную выручку. Исследование EY уделяло основное внимание «ответственному внедрению ИИ» — ряду показателей, которые дают возможность оценить, разработал ли бизнес внутреннюю политику управления ИИ, довели ли до пользователей чёткие правила эксплуатации и осуществляют ли контроль за соблюдением правил. По словам EY, компании с более подробно разработанной политикой «ответственного ИИ» (Responsible AI) утверждают, что добились больших продаж, сокращения затрат и большее высокой степени удовлетворённости сотрудников. Примечательно, что жертвой ИИ недавно стал другой консалтинговый гигант — компания Deloitte, представившая австралийскому правительству документ с фейковыми ссылками, цитатами и даже полностью выдуманной выдержкой из постановления Австралийского федерального суда.
08.10.2025 [16:35], Андрей Крупин
Российский рынок IaaS и PaaS отметился 30-проценным ростом с начала годаЗа первые девять месяцев 2025 года рынок инфраструктурных облачных сервисов (IaaS) и платформенных решений (PaaS) в России вырос почти на 30 процентов год к году. При этом совокупный объём двух сегментов в публичном облаке составил 104 млрд руб. Таковы результаты исследования, проведённого аналитической компанией Apple Hills Digital. Согласно представленным Apple Hills Digital данным, на рынке наметился интерес бизнес-заказчиков к сервисам на базе искусственного интеллекта, что стимулирует спрос на решения с GPU-ускорителями: сегмент рынка GPU-серверов в публичном облаке вырос на 45 %, AI/ML-платформ — на 35 % по отношению к аналогичному периоду 2024 года.
Источник изображения: Growtika / unsplash.com Отмечается, что ожидаемый рост сегментов IaaS и PaaS от квартала к предшествующему кварталу в третьем квартале 2025 года несколько замедлился — с 9–10 % в первом и втором кварталах 2025 года до 5 % в третьем квартале. При сохранении тенденции к замедлению это может привести к понижению прогноза годового роста в 2025 году с ожидаемых 25 % до 22 % роста рынка к 2024 году. «Отечественный рынок публичных облаков в 2025 году сохраняет высокий темп роста, однако динамика внутри сегментов становится более дифференцированной. Основной драйвер — спрос на гибкие ресурсы для задач искусственного интеллекта и обучения моделей, как в инфраструктуре, так и в платформенных сервисах. Замедление квартальных темпов внутри года может указывать на возможный переход отрасли от экстенсивного роста к фазе масштабирования и повышения эффективности», — говорится в исследовании Apple Hills Digital. |
|
