Июльское затишье
Уже третий год убеждаемся: лето на хайп вокруг искусственного интеллекта действует замораживающе: он не растет. Но и уронить оно его не в силах, он просто застывает на уровнях, достигнутых весной, в ожидании возвращения делового сезона, когда ажиотаж будет готов вновь расти. To the moon, что называется.
В июле ажиотаж вокруг ИИ в России оставался на стабильно высоком уровне, индекс хайпа @anti_agi AI-HI вырос на 9% до 768 пунктов, но не превысил апрельского максимума в 782 пункта. Интересно, как скажется на индексе выход в августе долгожданного (но не оправдавшего ожиданий) GPT-5.
За AI-хайп в России продолжили отвечать СМИ: количество публикаций с упоминанием того или иного AI-сервиса выросло до рекордных значений и составило почти 48 тысяч. Для сравнения, в январе 2023 года, в самом начале ажиотажа вокруг ChatGPT, их было всего 4400. Кстати, ежемесячное количество постов, связанных с AI-сервисами в Telegram выросло за тот же период менее заметно – с 19 до 119 тысяч, то есть в шесть раз, а не в 11, как у СМИ. Еще менее подвержены ажиотажу сами пользователи – число поисковых запросов в Яндексе с упоминанием конкретных AI-сервисов выросло за эти два с половиной года чуть больше, чем вчетверо – с 1,4 до 5,8 млн.
В рейтинге AI-сервисов от @anti_agi сохраняется стабильность – в десятке только два заметных изменения. Падение GigaChat со 2 на 5 место правильнее было бы назвать возвращением после июньского взлета, вызванного новостями, привязанными к ЦИПР и ПМЭФ, состоявшимся в июне. А взлет на 8 позиций сервиса Grok из второй десятки на 6 место обусловлен несколькими факторами: в начале июля разгорелся скандал с шовинистскими высказываниями этого чатбота, а затем вышел Grok 4, в котором позже был запущен визуальный AI-компаньон в виде гиперсексуальной аниме-девушки и чрезмерно агрессивной панды. Grok выбил из топ-10 Qwen, но он остался в непосредственной близости – на 11 месте.
Поскольку в июле не было событий, равных по медийному воздействию ЦИПРу или ПМЭФу, корпоративный индекс AI-хайпа AI-HI-COPR снизился с рекордных июньских позиций, но при этом остался на уровне выше предыдущих максимумов – 634 пункта (в предыдущие два с половиной года он не превышал 500 пунктов.
В рейтинге Яндекс вновь обогнал Сбер по упоминаемости в связи с искусственным интеллектом. За весну и лето 2025 года это уже третья смена лидера. Самые же значительные изменения – взлет Мегафона с последнего, 10-го, на шестое место и падение NtechLab’а на три позиции с 5 на 8 место рейтинга. VK поменялся местами с МТС, заняв привычное третье место и оттеснив соперника на четвертое. Пятое место по упоминаемости в СМИ и Telegram в связи с ИИ вместо NtechLab’а занял ВТБ. Ростелеком остался на седьмом месте, а замыкают таблицу билайн и Т-банк.
20:49 07-10-2025
Claude приглянулся Межделмашу
Anthropic и IBM заключили партнёрство и будут внедрять Claude в экосистему IBM. Цель очевидна: дать действительно крупному бизнесу доступ к Claude не как к отдельному чату, а как к встроенному инструменту внутри привычных IBM-платформ, включая их облачные и гибридные системы.
И это знаковое событие не только для Anthropic — десятилетиями IBM строит закрытую, вертикально интегрированную систему, где железо, софт и даже OS от IBM работают, в основном, только друг с другом. Мейнфреймы вроде z17 (на которых сидит весь банковский сектор США) сочетают железо на базе IBM POWER с проприетарной ОС z/OS, создавая изолированную «доверенную вселенную», способную обрабатывать сотни миллионов зашифрованных транзакций в день без выхода за пределы «IBM-загона». Теперь в эту тоталитарную экосистему встраивают ИИ — не как внешний облачный API, а как компонент, интегрированный в стек IBM Z.
Anthropic здесь выступает поставщиком модели, а IBM — каналом до клиентов, особенно в консервативных отраслях вроде банков или госсектора, где важны контроль и безопасность данных.
Это партнёрство — попытка обойти доминирование Microsoft (с OpenAI) и Google, предложив большому бизнесу альтернативу, где Anthropic отвечает за качество модели, а IBM — за интеграцию и доверие со стороны корпоративных заказчиков.
P.S. Ждём IBM среди инвесторов Anthropic, если их там ещё нет.
@anti_agi
18:53 07-10-2025
Про консультанта и пастуха
Все уже в курсе вчерашней «комедИИ»: Deloitte умудрилась сгенерировать целый официальный отчёт для австралийского правительства в ChatGPT — и, похоже, даже не удосужилась его прочитать, не то что проверить. В итоге в документе за, примерно, $440 000‼️ оказались ссылки на научные статьи, которые существовали разве что в мечтах самого ИИ. Разумеется, деньги пришлось вернуть, а репутацию — слегка подпортить.
Но пока все смеялись над «галлюцинациями», мимо почти прошла куда более значимая новость: в тот же самый день Deloitte и Anthropic объявили о масштабном партнёрстве. Теперь Claude, который, как везде напирает Anthropic, наполненный «ответственностью» и элайментом, будет обслуживать почти 500 000 сотрудников Deloitte по всему миру.
Deloitte создаст Claude Center of Excellence со специалистами, которые будут разрабатывать методологию внедрения ИИ в бизнес-процессы, а также отвечать за техподдержку. Для разных групп сотрудников также разработают отдельных агентов на базе Claude.
P.S. После каждой истории про консалтеров вспоминаю анекдот, к которому отсылка в заге.
P.S. P.S. Ждём коллаб Деловых Решений и Технологий с отечественными разработчиками ИИ.
@anti_agi
18:14 07-10-2025
Пост удален
11:13 07-10-2025
⚡️ Мы снова решили рассказать не про деньги, не про железо и даже не про ИИ — а про людей. Потому что, как оказалось, за всеми этими нейросетями, серверами и стратегиями роста всё ещё стоят… ну, вы поняли — живые люди. С эмоциями, мечтами и, иногда, с резюме в кармане.
По данным сразу четырёх собеседников @anti_agi, технический директор, вице-президент по рекламе и ИИ в VK Антон Фролов покидает компанию.
И да — он не уходит в одиночку. Часть команды, судя по всему, тоже решила, что «развитие внутри компании» — это не только про повышение KPI, но и про смену локации.
Куда, спросите вы. Дадим подсказку: 4 буквы, первая "С", последняя "р".
Рынок ИИ России вырос в 2024 году на 28,4% до 1,15 трлн руб. ($13,1 млрд)
Это следует из отчета «Индекс ИИ» аналитической группы МФТИ. Основными сегментами стали обработка естественного языка (61,3%), а также анализ данных (33,6%). Это обусловлено ростом выручки Яндекса, Авито и ВК.
Российский венчурный рынок начал постепенно восстанавливаться после падения 2022 года. Всего в 2024 году в ИИ проинвестировали 38 сделок на сумму $39 млн, когда как годом ранее — на $10 млн. Рост продолжился и в I полугодии 2025-го: состоялась 21 сделка на $29 млн.
Число сделок по слиянию и поглощению ИИ стартапов достигло 11-ти на сумму $33 млн против $148 млн в 2023 году. В I полугодии 2025 года состоялось 10 сделок M&A на $38 млн. Отмечается, что рынок восстанавливается, однако стоимость компаний заметно падает.
Кроме того, в 2024 году общий объем финансирования ИИ со стороны государства составил 7,6 млрд руб. Для сравнения: федеральная программа «Цифровое государственное управление» получила 78,79 млрд, а «Информационная структура» — 20,06 млрд руб. При этом с 2020 года финансирование ИИ выросло примерно в три раза, однако с 2022-го года оно перестало расти и остается постоянным — 7,6 млрд. Авторы отчета отмечают, это противоречит мировому тренду по повышение финансирования отрасли.
16:15 06-10-2025
И на улицу AMD пришел праздник
Хайп вокруг ИИ, а также подписание всяческих соглашений, до последнего времени были в основном вокруг одного производителя чипов — NVIDIA. Но теперь золотой долларовый дождь прольётся, возможно, и на их конкурента.
AMD и OpenAI объявили о стратегическом партнёрстве: OpenAI планирует развернуть до 6 гигаватт компьюта на базе ИИ-ускорителей AMD Instinct. Первый этап предусматривает развёртывание 1 гигаватта с использованием будущих AMD Instinct MI450, выход на рынок которых запланирован на вторую половину 2026 года.
🐷 Важной частью сделки стало предоставление OpenAI опциона (warrant) на покупку до 160 миллионов акций AMD, что составляет примерно 10% акционерного капитала компании. Опцион выдан по символической цене 1 цент за акцию и будет вестинговаться по мере достижения технических и коммерческих вех — от первого гигаватта мощностей до полных 6 гигаватт, а также при выполнении определённых целей по цене акций и масштабированию инфраструктуры. Такой шаг обеспечивает глубокое стратегическое выравнивание интересов обеих сторон.
AMD ожидает, что это партнёрство принесёт компании десятки миллиардов долларов годовой выручки, а общий объём доходов от OpenAI и других клиентов в результате этой сделки может превысить $100 миллиардов.
Это сотрудничество выгодно обеим сторонам. С одной стороны, укрепляет позиции AMD как одного из главных конкурентов NVIDIA на рынке ИИ-чипов. С другой, даёт OpenAI возможность диверсифицировать источники вычислительных мощностей, ускоряя разработку и развёртывание передовых ИИ-моделей для глобального использования.
@anti_agi
16:04 04-10-2025
Политику генерации видео в Sora пересмотрят из-за правообладателей
Не успели мы написать о том, какие риски несёт за собой новый продукт OpenAI, как Сэм «Зря быканул» Альтман, уже дал заднюю. Чувствуем сдающие нервы: заметка о грядущих обновлениях вышла в 4 часа утра 😁
Альтман ожидаемо пообещал ввести новые меры, чтобы правообладатели получили больше контроля над созданием персонажей и визуальных образов. Заодно OpenAI планирует ввести систему роялти — для тех, кто всё же разрешит использовать свои материалы в Sora.
«Мы получаем много отзывов от правообладателей, которые в восторге от этого нового вида "интерактивного фанфита" и считают, что такой формат взаимодействия принесёт им много пользы, но при этом хотят иметь возможность указывать, как можно использовать их персонажей (в том числе не использовать вовсе)».
При этом Альтман подчёркивает: OpenAI надо «каким-то образом зарабатывать на создании видео» — отсюда и родилась идея с системой роялти. Убивать дойную корову компания не собирается 🐷
А что касается правил... Для их формирования придётся действовать методом проб и ошибок. Мол, это похоже на первые дни существования ChatGPT. Нужно найти схему, которая устроит всех. Но кажется мне, что без очередных судов дело не обойдётся.
@anti_agi
19:08 03-10-2025
Sora на пике популярности — и это грозит OpenAI новыми иска...
Пишут, что при определённых условиях Sora может добавлять к видео даже оригинальную музыку. Про полное копирование голосов актёров и стиля анимации вообще молчу.
Ох, чувствую, Альтман ещё пожалеет о своих попытках создать целую ленту из нейрослопа.
Ну а пока — держите лучше примеры того, за что OpenAI придётся нервно оправдываться в суде.
@anti_agi
18:31 03-10-2025
Sora на пике популярности — и это грозит OpenAI новыми исками от правообладателей
Дискуссии о особенностях авторского права для нейросетей идут уже давно. Генераторы текста и медиаконтента поглощают тонны материалов под копирайтом, и потом ожидаемо выдают результаты, схожие с оригиналом. Но OpenAI с релизом Sora 2 превзошли сами себя.
Пользователи заметили, что видеогенератор может чуть ли не покадрово повторять геймплей Cyberpunk 2077 и мультсериалов вроде «Рик и Морти». И кажется, что здесь Сэм Альтман действительно выстрелил себе в ногу.
Генерации пестрят откровенными копирками известных образов. Даже в новых видео звучат мотивы из известных саундтреков к фильмам. Думается мне, что за того же Марио Nintendo не постесняется устроить OpenAI такую встряску, какой компания не видела уже давно.
И знаете, я буду на стороне правообладателей. Одно дело, учить модель на лучших образцах искусства, чтобы она создавала что-то новое. Совсем другое — поддерживать пользователей в плагиате ради брейнрот-контента. Никакой ценности такой продукт не несёт, а ущерб правообладателям наносит.
Думаю, что скоро OpenAI будет вынуждена ввести жёсткие фильтры на генерацию видео. Ну а пока приложение Sora заняло первое место в рейтинге бесплатных приложений американского App Store, опередив Google Gemini и ChatGPT.
Интересно, как скоро с таким же бардаком столкнётся проект AI-Netflix при поддержке Amazon? Ох уж эта свобода творчества.
@anti_agi
16:11 03-10-2025
💻 Huawei решили воспользоваться ситуацией
Huawei планирует нарастить выпуск своих передовых ИИ-ускорителей. В 2026 году компания намерена произвести около 600 000 флагманских ускорителей Ascend 910C, а общий выпуск кристаллов для всей линейки Ascend планируется увеличить до 1,6 миллиона штук. Основной фокус в текущих планах компании сосредоточен на модели 910C и перспективных разработках серии 950.
Американские санкции, лишившие Huawei доступа к передовым производственным мощностям TSMC, вынудили компанию переориентироваться на SMIC. Это создаёт технологические сложности, но одновременно стимулирует развитие национальной полупроводниковой отрасли.
Ситуация усугубляется ухудшением позиций NVIDIA на китайском рынке. Продажи специально разработанного для Китая чипа H20 практически прекратились, против компании инициировано антимонопольное расследование, а китайские власти рекомендуют местным IT-гигантам ограничить закупки некоторых решений NVIDIA. Образовавшийся рыночный вакуум создаёт идеальные условия для экспансии Huawei.
Технологии и дорожная карта
Huawei открыто признаёт, что её текущие чипы, включая модели 910B и 910C, по производительности на уровне одного чипа уступают флагманским продуктам NVIDIA, таким как H100. Это отставание усугубляет и отсутствие доступа к современным техпроцессам.
В ответ компания предпринимает два стратегических шага:
▪️ Впервые опубликована детальная дорожная карта развития AI-чипов до 2028 года, включающая выпуск моделей Ascend 950PR и 950DT в 2026 году, Ascend 960 в 2027 и Ascend 970 в 2028 году, с обещанием удваивать вычислительную мощность с каждым поколением.
▪️ Чтобы компенсировать отставание на уровне отдельного чипа Huawei делает ставку на масштабирование и межкристалльные соединения .
Стратегия предполагает объединение десятков тысяч чипов в кластеры с помощью собственной технологии interconnect UnifiedBus (Linggu) и архитектуры SuperPod. Компания заявляет, что системы типа Atlas 950 SuperCluster способны объединять более 500 000 чипов и по совокупной мощности могут превосходить будущие разработки NVIDIA.
@anti_agi
16:28 02-10-2025
Даже Google и Amazon ходят на поклон к Хуангу
Свободный денежный поток NVIDIA, который к 2027 году может достичь $148 млрд, превращает компанию Дженсена Хуанга в своего рода «центральный банк» ИИ-экономики. За последние месяцы NVIDIA инвестировала:
▪️ $100 млрд в OpenAI
▪️ $5 млрд в Intel
▪️ Сотни миллионов — в стартапы вроде CoreWeave и Nscale
А также начала выкупать невостребованные GPU у облачных провайдеров. Эти сделки не только стимулируют спрос на чипы Nvidia, но и формируют беспрецедентное влияние на всю ИИ-инфраструктуру.
Однако такая агрессивная стратегия вызывает тревогу не только у конкурентов.
Google и Amazon, несмотря на разработку собственных ИИ-чипов (TPU, Trainium), по-прежнему зависят от NVIDIA и вынуждены заранее информировать Хуанга о своих планах — чтобы не нарушить хрупкий баланс отношений. При этом инвестиции NVIDIA в OpenAI создают дополнительный стимул для гигантов ускорить переход на альтернативные архитектуры: ведь OpenAI планирует сдавать избыточные вычислительные мощности в аренду, напрямую конкурируя с AWS и Google Cloud.
Внутри Nvidia царит «здоровая паранойя»: руководство боится сценария, при котором прорыв в ИИ произойдёт без участия их чипов. Тем не менее, несмотря на появление альтернатив, экосистема Nvidia — от CUDA до высокоскоростных сетей — остаётся практически непреодолимым барьером для конкурентов.
Как отмечает профессор Гарварда Дэвид Йоффе:
«Если бы я был на месте Google или Amazon, я бы постарался ещё больше ускорить — сильнее, чем сейчас — свои усилия по созданию архитектуры, альтернативной Nvidia»
— но пока это легче сказать, чем сделать.
Telegram запустит в Казахстане ИИ-лабораторию, рассказал Павел Дуров на форуме Digital Bridge в Астане. Он отмечает, что лаборатория будет использоваться для создания технологии, которая совместит в себе блокчейн и нейросети:
«Эта технология позволит более одному миллиарду человек использовать функции ИИ, которые будут генерироваться децентрализированной компьютерной системой в частном порядке».
Основатель Telegram собирает в одном месте, кажется весь хайп. Для полноты картины, лаборатория должна будет заняться еще квантовыми чипами.
Год назад в Казахстане открылся первый региональный офис Telegram. А недавно Дуров посетил частную школу для одаренных учеников, попечителем которой он является (в прошлом году он пожертвовал $350 тыс. на обучение 12 перспективных подростков).
Ранее Дуров посещал Казахстан в июне 2024 года — тогда регулятор страны одобрил торги Toncoin на лицензированных платформах. По словам основателя Telegram, Казахстан привлекает международные компании и технологические стартапы, благодаря политике, благоприятной для бизнеса, и налогам.
#читаем_ленты_новостей_за_вас
11:52 02-10-2025
Tinker, Tailor, Soldier, Sailor
Tinker — первый (и долгожданный) продукт стартапа Миры Мурати Thinking Machines. К счастью, это не yet another LLM, а облачный API для файнтюнинга LLM.
Идея в том, что разработчики пишут код обучения, а всё «тяжёлое» — распределение ресурсов, восстановление сбоев и управление железом — берет на себя инфраструктура компании. Пользователю доступен набор низкоуровневых примитивов, из которых можно собрать собственный пайплайн.
Сейчас поддерживаются LoRA-тюны для Llama 3 (кроме 405B) и Qwen 3, причём доступны и базовые версии моделей. Согласно исследованию Thinking Machines LoRA показывает сравнимое качество с полным тюном (SFT) на небольших датасетах, при этом требуют на 30% меньше вычислений и позволяют экономить при массовом обучении. Для гурманов есть библиотека Tinker Cookbook с готовыми реализациями алгоритмов, включая RLHF, Multi-Agent или Tool Use.
Пока что API работает в приватной бете, доступ по заявкам. Первое время сервис будет бесплатным.
Следующий шаг очевиден — запуск API для инференса, чтобы обученные модели можно было сразу использовать в продакшене.
@anti_agi
21:02 01-10-2025
Цукерберг укрепляет свои полупроводниковые амбиции
Meta* приобретает стартап Rivos. Он разрабатывает серверные чипы на архитектуре RISC-V. Ключевой элемент платформы — Data Parallel Accelerator (DPA), GPGPU-ускоритель, совмещённый с CPU на одном кристалле.
💻 Rivos заявляет, что их чип оптимизирован для энергоэффективной работы с LLM и способен покрывать весь цикл — от обучения до инференса. Сделка должна снизить зависимость Meta* от NVIDIA, на чьи ускорители корпорация ежегодно тратит миллиарды долларов.
💻 Rivos был основан в 2021 году в и успел привлечь порядка $250 млн инвестиций, а его оценка доходила до $2 млрд. Команда — из бывших инженеров Intel, AMD и Google. Помимо железа, Rivos развивает программный стек для запуска ИИ-моделей в дата-центрах, а также работает над совместимостью с привычными фреймворками.
💻 Сделка с Rivos — не первая попытка Meta усилить свои разработки в области чипов. Ранее компания вела переговоры о покупке южнокорейского стартапа FuriosaAI, о котором писал выше. Однако та сделка не состоялась: FuriosaAI отклонила предложение Meta на сумму около $800 млн.
TL;DR Стоит отметить, что о значимых успехах собственных чипов Meta* — MTIA (Meta* Training and Inference Accelerator) — на рынке практически не слышно. Именно поэтому приобретение Rivos выглядит как попытка ускорить разработку конкурентоспособной ИИ-инфраструктуры и снизить зависимость от Nvidia.
@anti_agi
*признана экстремистской и запрещена в России
18:11 01-10-2025
Многополярный ИИ-мир ☣️
Видимо, не только Китай хочет преодолеть монополию NVIDIA. Южнокорейские стартапы тоже стремятся потеснить Хуанга с пьедестала, особенно в области ИИ-инференса. FuriosaAI и Rebellions стали новыми главными игроками этой гонки.
▪️ Стартап FuriosaAI представил сервер NXT RNGD для частных облаков и локальных дата-центров. Его ускоритель использует 5-нм техпроцесс TSMC. Он обеспечивает производительность на уровне 512 TFLOPS для вычислений в формате FP8. Каждая карта оснащена 48 ГБ памяти HBM3. Сервер NXT RNGD объединяет восемь таких карт. Их общий объём памяти достигает 384 ГБ. Потребление всей системы составляет около 3 кВт.
▪️ Их конкурент, Rebellions, разработал ускоритель REBEL-Quad для масштабных задач. Чип сделан по 4-нм технологии Samsung. Он использует чиплетную архитектуру с четырьмя ASIC-ядрами. Объём памяти составляет 144 ГБ HBM3E. Rebellions уже привлекла значительные инвестиции от Arm и Samsung Ventures.
TL;DR Мы приходим к похожей на нулевые ситуации: десяток разработчиков GPU соревновались в стандартах и доле рынка. С той лишь разницей, что не было монополиста, который помогал писать весь софт 10 лет под себя. А корейцы тем временем делают ставку на энергоэффективность и низкую стоимость владения. Жаль, что мы можем только наблюдать, как рынок ИИ-ускорителей становится многополярным.
@anti_agi
17:04 01-10-2025
Smart Engines готовится выйти на рынки Ирана и Пакистана
Исследователи компании собрали отдельный датасет MIDV-UP из более чем 9 тысяч изображений c документами Пакистана и Ирана. За счёт этого удалось реализовать анализ записей на урду и персидском (фарси) — оба языка используют модифицированный арабский алфавит и отличаются сложными лигатурами.
Результаты работы представили на Международной конференции по анализу и распознаванию документов (ICDAR) в Китае. Исследование вышло в подборке Document Analysis and Recognition – ICDAR 2025 (pp.605-619).
В Smart Engines отмечают, что открыли для себя выход на рынки с совокупным населением свыше 330 млн человек. Хоть и конкретных соглашений с бизнесом пока нет. Сейчас компания также работает c партнёрами в ОАЭ, Турции, Армении, США и Казахстане.
Новые регионы хороши своей специфичностью. В странах Глобального Юга часто не хватает своих технологий и компетенций, а выход западных вендоров на них бывает затруднён. Тут-то наш бизнес и может получить новые каналы сбыта.
Исключительно внутренние разработки сложно окупить. При этом отечественные системы компьютерного зрения вполне имеют международный потенциал: вспомните кейс VisionLabs и её конкуренцию с западными исследователями на их же рынках.
Я общался с основателем VisionLabs Александром Ханиным ещё в начале 2022 года, перед известными событиями и окончательным слиянием с MTS AI. Международных амбиций тогда хватало. Кадры в VisionLabs активно привлекали через саммиты, вроде Machines Can See.
Речь в команде шла не просто о распознавании лиц, а о работе с ИИ-"железом", различной аналитикой и даже платёжными системами. С тех пор произошло много всего. Но в начале 2023 года компания вышла на рынок Индии, а этой весной отчиталась о запуске распознавания дипфейков в банках России, Казахстана, Узбекистана и Кыргызстана.
Отечественные вендоры упрямо продолжают пробивать себе дорогу на новые рынки. А мы здесь можем только пожелать им удачи. Талант не искусственный — его в бенчмарках не накрутить! 🤖
@anti_agi
12:12 01-10-2025
Компьютерное зрение помогло найти более тысячи пропавших животных в Подмосковье
Об этом рассказали в NTechLab, технологическом партнёре «Ростеха». Их сервис с конца 2024 года стал доступен на портале Госуслуг Московской области, за это время его использовали более 1,3 тысячи раз.
Алгоритм может найти питомца, сравнивая его изображения с карточками в государственной базе данных. Также можно уточнить параметры поиска по полу, возрасту, породе и окрасу, или уточнив, что у потерянного любимца был чип.
Теперь эксперимент планируют распространить на ещё один регион, но подробности пока не раскрывают. А мы заметим, что очень ждём запуска новых опций, связанных с домашними питомцами, у «Авито» — они уже работали с таким направлением вместе со студентами на летней школе AIRI.
Я бы сделал здесь ставку на распознавание породы по фото или видео. Такие сервисы в зарубежном сегменте существуют уже давно, но их интеграцию в формат классифайда я пока не припомню. А ведь датасеты и кейсы применения подобных инструментов уже есть.
@anti_agi
18:26 30-09-2025
«Сбер» открыл доступ к моделям Giga-Embeddings и Kandinsky Video Lite
Giga-Embeddings позволяет переводить информацию в векторные представления, эмбеддинги нужны для работы RAG-систем. Kandinsky Video Lite умеет генерировать короткие видео длительностью до 10 секунд. Отдельно опубликовали Flash-версию со скоростью генерации в 6 раз выше базовой.
Отмечают, что даже Lite-версия «Кандинского» обходит гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B. Ну и «особое внимание при обучении Kandinsky Video Lite было уделено пониманию отечественного культурного кода».
Giga-Embeddings и Kandinsky Video Lite уже доступны на Hugging Face (1,2). Генерация эмбеддингов доступна по лицензии MIT, работа с видео пока под Apache 2.0. Но ещё не вечер...
@anti_agi
17:44 30-09-2025
Стало скучно? Попробуйте воссоздать архитектуру трансформера в Minecraft
Видимо, с таким ходом мысли пользователь sammyuri решил запустить полноценную SLM-модель в игре. Внешние инструменты не понадобились: всю систему он воспроизвёл из обычных кубов в "ванильной" версии.
Модель CraftGPT на 5 млн параметров , запущенная в таком виде, ограничена контекстным окном в 64 токена. На создание трансформера ушло почти 440 млн блоков (!) Автор умудрился собрать конструкцию из 1020×260×1656 блоков на специально оптимизированном сервере.
То есть это не просто имитация нейросети: автор реально взял заранее подготовленные веса, загрузил их в редстоун-ROM, сделал блоки для умножений/сумм/нелинейностей — и модель работает.
На "чистой" версии игры один ответ может генерироваться до 10 лет реального времени. Но со специальной утилитой время сокращается до примерно 2 часов. Вся инструкция по сборке лежит на GitHub.
Компьютерные системы в Minecraft создают уже давно. Ну и с простыми нейросетками пользователи тоже игрались: например, с помощью свёрточной сети научили компьютер угадывать числа, написанные от руки.
Лучший коммент под видео:
imagine the existential horror of finding out you're a minecraft build
@anti_agi
12:11 30-09-2025
Вайб-воркинг — теперь и в офисе
Microsoft наконец-то добав...
Забавно, что при этом мы до сих пор не увидели даже намёка на собственные офисные пакеты в ChatGPT и Grok. А ведь инсайды были. Пока на западном рынке старый вендор остаётся на пике прогресса.
У нас же ситуация интереснее. «Яндекс» постепенно добавляет ИИ-возможности в свои «Документы» и развивает агента в «Браузере». «Сбер» на днях порадовал нас генератором презентаций: теперь создавать по промту можно не только текстовые документы.
Интересно посмотреть, как сложится баланс сил на российском рынке.
@anti_agi
12:11 30-09-2025
Вайб-воркинг — теперь и в офисе
Microsoft наконец-то добавила агентский режим в Word и Excel — по запросу можно генерировать целые таблицы и документы. Форматирование и прочие нюансы оформления прилагаются. Работают агентские фичи на базе Microsoft 365 Copilot, их также раскатят на обычного чат-бота.
В Microsoft подчёркивают, что их агент can “speak Excel” natively на базе последних моделей OpenAI с ризонингом. Поэтому можно попросить бота, например, проанализировать финансовую отчётность, сопоставить разные цифры и вывести результат в виде новой таблицы или документа.
Агентский режим уже доступен в веб-версии для пользователей Microsoft 365 Copilot и обладателей личной или семейной подписки на Microsoft 365.
@anti_agi
10:26 30-09-2025
Ну теперь точно заменит❓
Anthropic выпустила модель Claude Sonnet 4.5. Это лучшая в мире модель для программирования и отлично подходит для создания сложных агентов (с). Модель превосходит предыдущие версии, в том числе Opus 4,1.
По словам Anthropic, Sonnet 4,5:
1️⃣ точнее следует инструкциям
2️⃣ у неё улучшено планирование
3️⃣ умнее распределяет задачи
4️⃣может работать автономно 30 часов подряд‼️и сохраняет ясность и фокус на протяжении всего времени.
В общем, идём тестировать.
@anti_agi
19:13 26-09-2025
Раскрыт главный секрет китайского технологического успеха! Записываем, пока не удалили...
@anti_agi
18:03 26-09-2025
Ультимативный брейнрот
Пока мы жалуемся на засилье ИИ-контента в соцсетях, Meta* предлагает решить вопрос элегантно — создать целую площадку с исключительно сгенерированным контентом. И её уже можно пощупать своими руками. Познакомьтесь с лентой Vibes в приложении Meta* AI!
Для генерации используются технологии Midjourney и Black Forest Labs, дальше разработчики планируют перейти на полностью свои модели. Контент можно создавать с нуля, делать ремиксы и так далее. Формат: вертикальные видео до 16 секунд.
По целевой аудитории есть вопросы. ИИ-контент может хорошо залетать в чарты, смешиваясь с обычными постами. Либо же создавая отдельные тренды: привет, Тралалело Тралала и прочее безумие из TikTok. Но кому на полном серьёзе нужен исключительно искусственный щитпост?
Пока звучит скорее как социальный эксперимент. Осталось только добавить агентных контент-мейкеров со своим стилем и "личностью" и посмотреть, какой контент будет лучше заходить особо заинтересованным массам.
* Meta признана в России экстремистской организацией и запрещена
@anti_agi
18:03 26-09-2025
«Т-Технологии» опубликовали крупнейший датасет для ре...
Важный UPD по T-ECD: «Т-Технологии» сменили лицензию с Apache 2.0 на Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0).
Коммерческое использование датасета T-ECD теперь запрещено.
При использовании датасета для рекомендательных систем в e-com об этом нужно обязательно упомянуть в своём продукте. Распространять ПО на основе можно только под той же лицензией (то есть со всеми исходниками и без коммерции).
Но! Если вы скачали T-ECD до смены лицензии, то на него распространяются условия Apache 2.0. Упомянуть датасет в исходниках нужно, но во всём остальном — полная свобода. Пожелаем компании удачи отыскать нарушителей, которые скачают датасет после смены лицензии.
@anti_agi
10:08 26-09-2025
«Т-Технологии» опубликовали крупнейший датасет для рекомендательных систем в e-com
T-ECD ( (T-Tech E-commerce Cross-Domain Dataset) собран на основе анонимизированных действий 44 млн уникальных пользователей сервисов Город: Шопинг и Супермаркеты, а также рекламной платформы «Т-Банка», 30 млн товаров и более 135 млрд взаимодействий.
В компании отмечают, что ключевыми отличиями датасета стали кросс-доменность и универсальность для решения разных типов задач. Бенчмарк состоит из пяти взаимосвязанных и полностью анонизимированных источников данных:
▪️ истории покупок по транзакциям;
▪️ чеков;
▪️ отзывов;
▪️ взаимодействия с рекомендациями по товарам повседневного спроса (FMCG) и непродовольственных товаров (non-FMCG): бытовой техники, одежды, электроники, косметики;
▪️ истории активаций специальных предложений и кэшбэков.
Все источники данных можно использовать как самостоятельные датасеты, так и связывать их по ключам пользователей, товаров или брендов магазинов, что позволяет строить полные профили поведения и анализировать сложные сценарии для персонализации.
✔️ Датасет подходит для большинства типов рекомендательных задач: рекомендации одного следующего объекта (next-item), следующей корзины (next-basket), следующей сессии (session-based), общих топ-N рекомендаций и других типов задач.
Данные собраны с глубиной от 1 года до 3,5 лет, что позволяет анализировать как краткосрочные, так и долгосрочные предпочтения пользователей, динамику их изменения, а также сезонность и тренды.
Датасет содержит информацию по признакам пользователей и товаров, явную (explicit) и неявную (implicit) обратную связь пользователей. Сюда входят в том числе просмотры, что отличает T-ECD от академических датасетов, где часто учитывают только содержательные действия пользователей: клики, покупки, лайки и другие.
ℹ️ На втором месте по размерам в e-com сейчас датасет Criteo-1TB, на третьем — Amazon Reviews. Но у первого нет cемантического смысла признаков, срез данных статичен. Amazon Reviews содержит много новых пользователей и продуктов без достаточной истории рейтингов, отзывы не отражают поведения пользователей.
При этом в рекомендательных системах сложился очевидный тренд — переход на трансформерную архитектуру резкое увеличение количества обучающих данных и количества параметров в моделях. Поэтому без качественных датасетов с большим количеством доменов тут не обойтись.
Датасет T-ECD уже доступен на Hugging Face под лицензией Apache 2.0. Напомним, что ранее свой датасет для рекомендательных систем опубликовал и «Яндекс» — Yambda-5B.
@anti_agi
19:53 25-09-2025
GigaChat научился создавать презентации по промту
Новая функция доступна в разделе «GIGA Проекты». Чат-бот генерирует общую структуру текстом, после чего создаёт базовый визуал. Затем презентацию можно выгрузить в классическом формате PPTX или PDF, либо же отредактировать прямо в веб-версии.
Перед генерацией можно выбрать количество слайдов (до 10) и тон выступления: от креативного до экспертного. Каких-то чудес ждать не стоит, но общий костяк для презентации создать вполне реально. Подбирает даже картинки в стиль.
С проверкой фактуры как обычно. Про запуск продаж умного кольца Sber чат-бот пока не знает, либо же не считает нужным упоминать его по теме. Такой скромняга!
А ведь мы говорили о планах «Сбера» по запуску функции ещё летом. Ошиблись, правда, на пару месяцев, но с кем не бывает. Теперь ждём генерацию таблиц и графиков? Умный офис по-русски сам себя не сделает...
@anti_agi
16:06 25-09-2025
МТС прирастает ЦОДами
Облачная дочка МТС — MWS планирует в 2026 году расширить свой ЦОД Greenbush новым модулем. Компания называет его "ИИ-ЦОД", т.к. вместо стандартных 40 киловатт планируется выделять до 105 киловатт на стойку, правда будет их всего 12.
Учитывая, что стандартный сервер с 8 картами H100 потребляет около 8 киловатт, то выглядит вполне реализуемо. Вендоров не раскрывают, но если нужны ИИ-сервера с SXM-ускорителями NVIDIA и NVlink, то без параллельного импорта не обойтись. Российские производители просто не могут предложить ничего, кроме серверов с PCIe-картами.
Под какие цели? Возможно, под те самые 10% ИИ-рынка, которые дочка дочки — MWS AI планирует занять к 2028 году.
Интересно, что кто-то начал проектировать энерголинии под "взрослые" ИИ-нагрузки. С другой стороны, даже до суперкомпьютера Grom, запущенного в 2021 году, этому "ИИ ЦОДу" далеко.
@anti_agi
16:05 25-09-2025
InvestGPT
По мере того как искусственный интеллект становится все более доступным, всё большее число частных инвесторов обращаются к чат-ботам, таким как ChatGPT и Gemini, за советами по выбору акций.
По данным Reuters, по крайней мере каждый десятый розничный инвестор уже использует ИИ-ботов для принятия инвестиционных решений, что способствует стремительному росту рынка робо-консультантов.
Интернет с ИИ демократизировали доступ к сложному финансовому анализу, который раньше был доступен профи. Теперь любой пользователь может в реальном времени отслеживать котировки акций, получать аналитические обзоры и строить портфели на основе ИИ-рекомендаций. Такая доступность информации и инструментов значительно снижает барьеры для входа на фондовый рынок, особенно для начинающих инвесторов.
В результате наблюдается бум в секторе робо-консультирования, где компании активно интегрируют ИИ-технологии в свои платформы, чтобы удовлетворить растущий спрос. Хотя такие инструменты предлагают удобство и скорость, эксперты предупреждают о рисках чрезмерного доверия к алгоритмам без понимания фундаментальных основ инвестирования.
По забавному совпадению хитрован Кантор поднимал недавно похожий вопрос — что мешает MLщикам торговать на бирже.
@anti_agi
19:18 24-09-2025
Не только на Китай надежда
РСК и «ХайТэк» представили российскую систему для ИИ — LinQ HPC. "Это решение кардинально отличается от существующих на рынке продуктов, которые зависят от зарубежных технологий и могут содержать скрытые уязвимости". Хотя вендор CPU не указан, интересно, почему? Возможно, потому что это И....л? 😉
Производительность системы:
▪️ Базовый элемент — тензорный процессор (TPU) LinQ H, производительность — до 24 TOPS. Доступны только целочисленные операции INT8.
▪️ Ускоритель— карта LinQ HPQ содержит четыре процессора LinQ H с 96 TOPS.
▪️ Серверный узел — один блок LinQ HPS с 10 ускорителями LinQ HPQ обещает до 960 TOPS.
▪️ Вся система — LinQ HPC из двух LinQ HPS, где пиковая теоретическая производительность достигает 1920 TOPS.
LinQ HPC оснащена 1280 ГБ памяти DDR4 ECC. По словам РСК, это позволяет запускать более 100 моделей (каких?) одновременно. Задержка при обработке модели ResNet-50 (CNN для классификации изображений) составляет 2,3 мс, а после оптимизации может быть снижена до 1,5 мс. Обещают, что система поддерживает популярные фреймворки для ИИ — TensorFlow и PyTorch.
Лучше, чем ничего, но хотелось бы больше конкретных кейсов, где можно применять LinQ HPC, а также бенчмарков, сравнения хотя бы с другими TPU.
P.S. LinQ, ранее известный как IVA TPU, представили в далеком 2018 году, тогда это был макет на базе FPGA Xlilnx Virtex. Были периодические заходы в инфополе о производительности, но, фактически, сервер от РСК — первый продукт для конечного потребителя с LinQ.
@anti_agi
13:45 24-09-2025
Удивительно, но никакого мошенничества
Epoch AI решили проверить, не обманывают ли нас ИИ-лабы, когда сообщают свои результаты на бенчмарке GPQA Diamond. Например, используют ли команды уловки вроде черри пиков, чтобы искусственно завысить показатели.
Они сравнили официальные данные компаний с собственными независимыми оценками для топовых моделей.
Удивитесь, но результаты показали: расхождения между отчётами лаб и Epoch оказались минимальны. Все различия укладываются в пределы статпогрешности. А значит, явных признаков манипуляций не обнаружено.
Yandex B2B Tech обещает принести нам будущее с ИИ-сотрудниками
«Российские компании уже тратят на функции техподдержки, юрслужбы, бухгалтерии и HR более 3 триллионов в год, при этом в некоторых сферах сотрудников по-прежнему не хватает». Что делать? «Яндекс» и другие ИИ-компании предлагают создавать агентов, которые смогут взять на себя задачи рядовых сотрудников: от аналитика комплаенс-рисков до бухгалтера.
«Яндекс» уже обещает предоставить для платформу для их запуска. Да, технология ИИ-агентов ещё сырая, но "продавцы лопат" стимулируют активный спрос на неё. Реальную же пользу таких "ИИ-сотрудников" ещё только предстоит оценить — над практикой применения до сих пор ломают голову в Anthropic и OpenAI.
Собрали главные анонсы с сегодняшней Yandex Neuro Scale:
Конструктор ИИ-агентов. Компания обновила свою AI Studio: теперь клиенты могут собирать агентские системы на основе развёрнутых в облаке генеративных моделей. За счёт low-code инструментов можно составлять конкретные сценарии и даже разделять задачи для отдельных агентов.
Подключать агентов к внешним сервисам предлагают по протоколу MCP. ИИ-системы уже могут запрашивать информацию о контрагентах в сервисе «Контур.Фокус» и получить данные из системы amoCRM. Вскоре пользователи смогут подключить Вики, Трекер и другие корпоративные сервисы «Яндекса».
Вспомнил про историю с кражей данных из почты через ChatGPT. В «Яндексе» в ответ сообщили, что на их платформе можно настроить доступы к конфиденциальным данным с помощью сервиса IAM. Агента также можно обязать уточнять у пользователя разрешения на действия.
Готовые ИИ-ассистенты. Бизнесу предложат уже настроенных агентов — например, Нейроюриста. Он даёт заключения со ссылками на актуальные нормы права и судебную практику, и при ответе на запрос может учитывать контекст из документов пользователя.
Спросил, откуда агент берёт информацию, и кто будет нести ответственность за возможные последствия ошибок?
«В основе Нейроюриста лежит дообученная на юридических данных YandexGPT 5 Pro и RAG-технология, за счет чего поиск информации производится строго по базе знаний сервиса, а не из интернета. База знаний постоянно обновляется и состоит из данных самых востребованных российских справочно-правовых систем и юридических документов».
Финальное решение о качестве ответа нейросети и его полезности принимает сам пользователь.
В общем, работу такой бот у вас пока не отнимет. Кто ещё появится в линейке "ИИ-сотрудников", пока не говорят. Ассистенты с агентскими фичами также появились в рамках самой платформы Yandex Cloud — для лёгкой настройки процессов в облаке.
Обновлённый ассистент в SourceCraft. Как мы уже писали в профильном канале, для разработчиков запустили агентский режим. Он работает в формате ансамбля моделей, где под задачу подбирают наиболее оптимальную конфигурацию. Из-за этого нам пока не смогли раскрыть размер контекстного окна системы. Также добавили новые инструменты безопасности и навигацию по коду.
В компании также сообщили о запуске новой зоны доступности на базе нового дата-центра во Владимирской области (более 40 МВт, как и в первом). Она должна обеспечить минимальную задержку передачи данных до соседней зоны (менее 1 мс), общая ёмкость канала достигает 25,6 Тб/с.
P.S. Всё больше игроков на облачном рынке приходят к формату платформы для быстрого запуска ИИ-ассистентов с помощью low-code инструментов. «Яндекс» здесь пока один из передовиков. Но более чем уверен, что дальше мы увидим целый бум "конструкторов" на базе открытых моделей.
Не одними интеграторами живы. Зачем покупать кастомное решение под ключ, если его можно будет собрать из кубиков своими руками? Кто знает: возможно, и эту задачу со временем возьмут на себя специализированные ИИ-агенты...
19:36 23-09-2025
Ну и заканчивая день на чем-то более веселом, один из миллиона мемов, посвящённых отношениям Oracle, NVIDIA и OpenAI.
@anti_agi
19:36 23-09-2025
ИИ: беспрецедентные потребности в💻 и 🐷
Согласно анализу консалтеров из Bain, спрос на вычислительные мощности для ИИ растет более чем в два раза быстрее закона Мура. К 2030 году глобальные вычислительные потребности могут достичь 200 гигаватт, при этом только США накинут половину — 100 гигаватт новых мощностей. Это создаст колоссальную нагрузку на электрическую сеть.
🐷 Экономические вызовы и дефицит финансирования
Чтобы удовлетворить спрос потребуется строительство дата-центров стоимостью около $500 миллиардов ежегодно, что соответствует необходимости генерировать $2 триллиона годовой выручки. Даже при полном переводе корпоративных ИТ-бюджетов в облако и реинвестировании всей ожидаемой экономии от внедрения ИИ (около 20% от бюджетов продаж, маркетинга, поддержки клиентов и R&B) в строительство новых дата-центров, финансовый разрыв составит около $800 миллиардов. Это ставит под вопрос экономическую устойчивость текущих темпов роста без кардинальных изменений в подходах к монетизации ИИ.
👁 Потенциальные технологические решения
Изменить траекторию развития могут несколько ключевых факторов: алгоритмические прорывы (как это произошло с архитектурой трансформеров, лежащих в основе всех современных LLM), технологические инновации (включая квантовые вычисления, хотя их массовое применение ожидается не ранее чем через 10-15 лет), специализированные ASIC-чипы для обучения и инференса моделей, а также ограничения в цепочках поставок. Особенно критичными являются дефицит электроэнергии, нехватка строительных мощностей и ограниченное предложение GPU и оборудования для дата-центров, где увеличение энергоснабжения может занять четыре года и более из-за регуляторных ограничений.
# Без государства никуда
Помимо всех вышеперечисленных факторов, Bain выделяет еще один. А именно — господдержку. Без нее прогресс может замедлиться, частный сектор не сможет бесконечно наращивать инвестиции. В итоге ИИ все же становится еще одним полем геополитики, а не песочницей частных игроков.
@anti_agi
16:12 23-09-2025
Почему умные ассистенты почти не меняются
Мы много ругаем ИИ-хайп, и, разумеется, за дело. А люди, тем временем, пользуются новыми технологиями в самом очевидном виде: через умных ассистентов. Используют их по тем же сценариям, что и 10 лет назад — чтобы узнать погоду, поставить таймер или включить музыку.
Годы прогресса и технологические революции будто бы прошли зря. Говорящий компьютер, даже освоившись в человеческих интерфейсах, выполняет только самые простые задачи.
Почему так происходит? Да всё просто: обещанную революцию не смогли принести сами лидеры рынка. В умных ТВ и колонках ИИ присутствует в рудиментарном виде: может ответить на какие-то вопросы или ткнуть нужную кнопку в меню. Но многосоставные действия добавляют постольку-поскольку.
27% пользователей жалуются на то, что ИИ банально не понимает их запросы. Из-за этого люди не доверяют ассистентам важные задачи: куда уж ему читать письма и ставить в задачи календарь. Как бы правильно музыку включил и не натыкал чего лишнего.
Обещанные агентские фичи за последний год недалеко ушли от первого превью Operator от OpenAI. Мы помним, как мобильного агента ещё в январе показали в Perplexity. Но кто им пользуется теперь? Такие сервисы работают слишком медленно или часто ошибаются, чтобы быть действительно полезными.
Ещё хуже становится, когда мы вспоминаем про уязвимости. Современные LLM до сих пор можно "уболтать" на любое действие. А когда ИИ-ассистент получает доступ к почте, календарю и другим сервисам... Злоумышленники могут захватить целый набор инструментов через MCP через джейлбрейк-промт: например, его можно кинуть на почту.
Всё ли так плохо? На самом деле нет. Даже на нашем рынке видно, как ассистенты становятся умнее. В браузере они строят план задачи и активно осваивают новые страницы. В телевизорах и колонках — учатся ходить за покупками. Но без доработки напильником не один из сценариев не обходится.
Новое поколение ассистентов формируется на базе ChatGPT, Perplexity и других, замечает Денис Филиппов, CEO MWS AI (входит в МТС Web Services). В них появляется память, поддержка длинного контекста и возможность создания фоновых задач. Это открывает новую плоскость в возможностях для взаимодействия.
К тому же, выросло качество базовых технологий, замечает Андрей Рыбинцев, управляющий директор по ИИ в «Авито». Согласно независимому бенчмарку Artificial Analysis Intelligence Index, оценивающему модели по восьми направлениям (знания, математика, программирование, научные рассуждения и другие), результат OpenAI вырос с 11 баллов у GPT-3.5 до 68 у GPT-5. Это означает увеличение интеллектуальных способностей в шесть раз за два года.
Tl;DR Нужно признать: ИИ может раскрыться по-новому только в рамках экосистем. Даже OpenAI, презентуя Operator в начале года, говорила о сотрудничестве с OpenTable, StubHub, Instacart, DoorDash и Uber. У нас бренды другие, но суть та же — помощники не могут работать качественно без прямых интеграций в сервисы.
Доступного AGI на нашем веку уже вряд ли дождёмся... Придётся работать с тем, что есть.
@anti_agi
12:37 23-09-2025
ИИ станет безопаснее❓
ФСТЭК планирует до конца 2025 года представить проект стандарта по безопасной разработке систем искусственного интеллекта. Этот документ дополнит действующие правила длябезопасного софта. Инициативу анонсировал первый заместитель директора службы Виталий Лютиков.
Говорят, что стандарт необходим из-за уникальных рисков ИИ. Существующие нормы, например, приказ ФСТЭК №117 (мы о нём писали), лишь обозначают общие требования. Детальный стандарт должен объяснить конкретные меры безопасности для всего жизненного цикла ИИ. Он установит правила сбора, хранения и разметки данных, а также обеспечения их конфиденциальности.
Требования затронут разработчиков ИИ для государственного сектора. Правда в перспективе на этот стандарт могут "добровольно" перейти и коммерческие компании.
@anti_agi
12:37 23-09-2025
«Алиса» приходит в мессенджеры
Свершилось: всего спустя два года после того, как «Сбер» добавил GigaChat в Telegram, там же появилась «Алиса». Вернее не так: сегодня её запустили в благословенном мессенджере MAX, бот в «телеге» станет доступен завтра с 10 утра мск.
Работает чат-бот на базе YandexGPT 5.1 Pro. Можно использовать режим рассуждений, работать с картинками и генерировать их самим. Поиск в интернете тоже работает, как надо.
Напомним, что сейчас в Telegram также доступны чат-боты Perplexity и Grok, правда, в довольно кастрированном виде. Полной интеграции Grok, которую обещали выкатить летом, мы от Дурова так и не дождались, увы.
@anti_agi
20:18 22-09-2025
$100 миллиардов и 10 гигаватт
Семён Альтман продолжает повышать ставки: OpenAI и NVIDIA объявили о заключении стратегического партнерства, на развертывание инфраструктуры, нет, ИНФРАСТРУКТУРЫ для ИИ мощностью не менее 10 гигаватт‼️
Это уже даже не эксафлопсы, потому что счёт идёт на миллионы GPU.
NVIDIA намерена инвестировать в OpenAI до 100 миллиардов долларов США. Инвестиции будут идти поэтапно, после ввода в эксплуатацию каждого гигаватта компьюта.
Первая фаза проекта начнет работать во второй половине 2026 года на основе новой платформы NVIDIA — Vera Rubin.
Компании давно работают в тесном контакте. Как мы помним, капитан Хуанг лично привозил DGX-сервера от NVIDIA в офис OpenAI ещё когда в кресле CEO был Маск.
Кроме того, это гарантия будущего для самой NVIDIA: крупнейший трендсеттер в ИИ продолжит использовать CUDA-код, продолжит оптимизировать инференс и обучение своих ИИ-моделей под софтверную экосистему CUDA, продолжит покупать лопаты GPU NVIDIA.
Как отмечают в OpenAI, соглашение дополняет существующую работу OpenAI с другими партнерами, такими как Microsoft и Oracle, и является ключевым шагом на пути к цели OpenAI — созданию AGI.
@anti_agi
20:18 22-09-2025
Кажется, сегодня выйдет Qwen3-Omni. Разработчики уже создали спейс.
Предыдущая версия — Qwen2.5-Omni — стала важной вехой среди open-weight LLM. В отличие от традиционных подходов, которые обрабатывают различные модальности как изолированные системы, Qwen2.5-Omni объединила текстовую, визуальную, аудио- и видеоинформацию в единую согласованную архитектуру.
@anti_agi
17:23 22-09-2025
Все ИИ-модели врут. А те, что говорят обратное, врут в два раза больше
Чем ближе агентское будущее, тем больше нас беспокоит возможная злонамеренность LLM. Современный ИИ часто преследует собственные цели при выполнении задач. Более того: он готов прибегать к "схематозу".
Простой пример: вы биржевой брокер, и ваша цель — максимизировать прибыль. Лучший способ здесь, увы, это нарушать закон. Но делать этого нельзя, поэтому при желании заработать придётся заметать следы.
Схожую модель поведения могут применять и ИИ-модели. И речь не только о попытках LLM сделать вид, будто она выполнила поставленную ей задачу (хотя это не так).
Отлавливать тягу к схемам нужно ещё на стадии элаймента (выравнивания). Поэтому исследователи из OpenAI совместно с Apollo Research предложили новый подход для создания действительно безопасных моделей. Систему предложили научить размышлять о правилах безопасности перед тем, как действовать. Затем результаты проверяют в специальных средах, где в задаче есть подвох (нужно нарушить правило).
Методику назвали Deliberative Alignment, она позволяет снизить готовность "читерить" до доли процента. Но даже при использовании такого подхода модель во многих случаях понимает, что её тестируют, и действует соответствующе. Эффект добросовестности также может откатиться назад, если продолжить тренировку LLM на общие способности.
Наличие у ИИ определённой воли — не новость. Мы уже писали о том, как Claude от Anthropic в экспериментах активно "стучал" компетентным органам, если подозревал пользователей в нарушении закона. А Grok Илона Маска уже не раз бунтовал против своего создателя из-за попыток продавить его моральные границы.
Теперь, когда в руки ИИ-агентов попадает всё больше инструментов, относиться к такому поведению легкомысленно больше нельзя. А что, если модель попадёт под воздействие промт-инъекции, и осознает свои ошибки уже постфактум? Представьте, как ИИ-сотрудник начнёт отрицать произошедшее, чтобы избежать последствий.
Одно дело следить за поведением человека. Совсем другое — пытаться заглянуть в голову существу, лишь имитирующему наш образ мышления.
@anti_agi
14:01 22-09-2025
ИИ — локомотив экономики
Помните новость о том, что ИИ забустил продажи магнитной ленты? Оказалось, что внезапное возрождение переживает и сектор жёстких дисков. Два крупнейших производителя, Western Digital и Seagate, сообщили о росте выручки на 30% по итогам последних кварталов.
Причина очевидна: ИИ-модели требуют огромных объемов данных для обучения, и эти массивы не удаляются после работы, а сохраняются как ценный актив.
💻 За последний квартал Western Digital поставила накопителей общим объемом 190 экзабайт — на 32% больше, чем годом ранее, а Seagate показала рост в 45% в экзабайтах.
Основная причина успеха жестких дисков — стоимость за единицу емкости. В то время как твердотельные накопители (SSD) обеспечивают высокую скорость, они слишком дороги для хранения петабайтов и экзабайтов данных, необходимых для обучения ИИ. Жесткие диски стали фундаментом для хранения дата-сетов.
Кроме того, ИИ не только потребляет существующие данные, но и генерирует новые: тексты, изображения, видео. Например, всего за три месяца с мая, когда был запущен сервис Google Flow, его пользователи создали 100 млн ‼️ видеороликов, которые тоже нужно где-то хранить.
В результате, 90% выручки Western Digital в последнем квартале пришлось на крупных облачных провайдеров, таких как Amazon Web Services и Microsoft Azure, которые закупают десятки миллионов дисков ежеквартально. Спрос превышает предложение, что привело к заключению долгосрочных контрактов на поставку продукции на год и более — практики, которая ранее была редкостью, а цены в этих контрактах теперь фиксируются заранее.
Аналитики Gartner прогнозируют, что мировая выручка от продажи жестких дисков к концу года достигнет около $24 млрд — вдвое больше, чем в 2023 году. Производители уже переходят на передовую технологию магнитной записи с подогревом (HAMR), которая позволит выпускать накопители емкостью 30 Тбайт и выше. При этом жесткие диски остаются доминирующим решением в дата-центрах, на них по-прежнему приходится 80–90% всех объемов хранилищ.
🐷 Для двух компаний, составляющих почти мировую дуополию, ИИ стал мощнейшим рычагом влияния на ключевых клиентов, и их валовая прибыль за последние два года почти удвоилась, достигнув почти 40%.
@anti_agi
17:13 20-09-2025
💻 There has never been a better time to have a problem
Новая рекламная кампания Claude всколыхнула интернет. В кои-то веки ИИ-стартап не пытается продать нам идею мира, где люди могут отдать всю жизнь на аутсорс.
Кругом проблемы? И чёрт с ним. Anthropic прямым текстом призывает — «Продолжайте создавать, исследовать, учиться и разрабатывать. Продолжайте думать».
Герои нового ролика почти не смотрят на свои гаджеты. Вместо этого они занимаются делами мира физического: путешествуют, ставят эксперименты и создают искусство. Компьютер же выступает в роли тихого ассистента на фоне.
@anti_agi
19:13 19-09-2025
Доброй пятницы! И хороших выходных
@anti_agi
16:53 19-09-2025
Созданные ИИ вирусы уже становятся эффективнее натуральных
Исследователи из Стэнфорда смогли сгенерировать геном новых бактериофагов — они поражают бактериальные клетки. Конкретно взяли вариацию ΦX174, она опасна для бактерии E. coli (она же кишечная палочка).
Используя уже существующие модели Evo 1 и 2, учёные дообучили их на «последовательностях, характерными для ΦX174». В итоге ИИ сгенерировал набор из 302 кандидатов, 285 из которых смогли создать полные геномы. Из них 16 могли подавить рост E. coli.
В отличие от своего естественного аналога, синтетические бактериофаги смогли полностью уничтожить инфекционный потенциал кишечной палочки. Предварительно вирус внедрили в клетки E. coli — пока он не может атаковать бактерию самостоятельно. Но это только пока...
Tl;DR В перспективе синтезированные вирусы могут использовать для более эффективной борьбы с бактериальными инфекциями. Но, учитывая возможность дообучить модель для атаки на полезные бактерии, звоночек, конечно, тревожный.
@anti_agi
16:49 19-09-2025
Бренд OpenAI, который мы потеряли
К счастью
Тут коллеги обратили внимание, что дизайн-студия Area выложила результаты двухнедельного спринта. Они проводили его для Альтмана еще в январе 2023, то есть сразу после выхода ChatGPT. Драфты доступны по ссылке.
Вот благодаря таким ребятам можно понять, что студия Лебедева ещё ничего.
@anti_agi
12:30 19-09-2025
Google не первый
Пока мы спали, Google, вслед за Яндексом с его Алисой (сам не верю), интегрировал Gemini в Chrome, представляя это, разумеется, как крупнейшее обновление в истории браузера.
✔️ Пока правда это просто кнопка Gemini в интерфейсе Chrome, с помощью которой можно задать вопрос о содержимом сайта, суммаризовать инфу. Можно даже попросить достать инфу с нескольких открытых вкладок. Обновление уже доступно для пользователей на Windows и Mac в США, а в ближайшие недели будет развернуто для мобильных устройств и корпоративного сектора.
В ближайшие месяцы Google планирует внедрить в Chrome агентные возможности, включая бронь в барбершопе, заказ продуктов, планирование поездок и другие бытовые и очевидные сценарии. Пользователь сможет просто ввести запрос, а ИИ-агент будет действовать самостоятельно.
🐷 Для безопасных транзакций Google пару дней назад анонсировал протокол Agent Payments Protocol (AP2), разработанный совместно с более чем 60 компаниями, включая American Express, Mastercard и PayPal, чтобы обеспечить авторизацию, аутентификацию и подотчетность платежей, инициированных агентами .
Теперь ИИ, вроде как, помогает идентифицировать мошеннические сайты и фишинговые атаки с помощью обновленной модели Gemini Nano, упрощает управление паролями, позволяя одним кликом изменять скомпрометированные пароли на поддерживаемых сайтах.
Кроме того, Google глубоко интегрирует Gemini со своими сервисами, такими как календарь, карты, YouTube.
В общем, если вы в Штатах, то в Chrome у вас появилась КНОПКА с Gemini. Спасибо, Сундар.
@anti_agi
16:11 18-09-2025
Ирония судьбы в M&A
В 2005 году Пол Отеллини, тогдашний CEO Intel, предложил совету директоров купить NVIDIA за $20 млрд, предвидя потенциал графических чипов за пределами игр.
Но совет, сомневаясь в цене и способности Intel интегрировать стартап, отверг его прозорливую идею — решение, которое стоило компании лидерства и, возможно, места на рынке чипов.
Спустя двадцать лет, в 2025 году, история совершила ироничный поворот: NVIDIA, ставшая триллионным гигантом, вкладывает $5 млрд в Intel, чтобы совместно разрабатывать чипы для ПК и дата-центров.
Роль изменилась кардинально: теперь уже NVIDIA поддерживает своего бывшего потенциального покупателя. Отеллини, не доживший до этого момента, оказался прав, зря совет директоров его не послушал.
@anti_agi
12:36 18-09-2025
Практика — критерий вычислительной истинны
Как уже говорили, Управление кибербезопасности Китая (Cyberspace Administration of China, CAC) запретило ведущим технологическим компаниям страны приобретать ИИ-ускорители от NVIDIA. Формально — по соображениям безопасности, но очевидно, что КПК перешла от общих заявлений к конкретным действиям и теперь не совсем мягко подталкивает крупный бизнес к технологическому суверенитету.
Следом, по случайному совпадению, государственная телекоммуникационная компания China Unicom заявила о запуске крупного центра обработки данных в городе Синин, который полностью работает на отечественных чипах. Хотя это позиционируется как ЦОД, фактически выглядит как масштабный полигон для тестирования локальных GPU, CPU, TPU и других PU.
🐷 Стоимость проекта — 390 миллионов долларов
💻 Мощность — 3,579 петафлопс с использованием почти 23,000 отечественных чипов
↗️ После завершения строительства планируемая мощность — 20,000 петафлопс. Правда это потребует ± ещё 100 000 чипов, но когда Китай это останавливало?
Около 72% чипов в новом ЦОД от T-Head, дочки Alibaba, остальные поставщики — MetaX, Biren Tech и Zhonghao Xinying. Планируются дополнительные закупки у Tecorigin, Moore Threads и Enflame. То есть никто не уйдет обиженным, и у китайских ИИ-компаний будет возможность выбирать сердцем не по красивым презентациям (а китайцы отлично переняли стилёк Apple).
P.S. На протяжении последних пяти лет Китай не участвует в глобальном рейтинге суперкомпьютеров TOP500. Отчасти это связано с санкциями, которые (не) мешают импортировать необходимые чипы, а отчасти — с ожиданием, пока собственные разработчики чипов достигнут нужного уровня. Публичный запуск нового центра в Синине — это прямой ответ на внешнее давление. Он должен продемонстрировать, что китайские технологии готовы конкурировать с такими компаниями, как NVIDIA, и уже сейчас соответствуют государственным требованиям о закупке более 50% чипов для искусственного интеллекта на внутреннем рынке.
@anti_agi
11:43 18-09-2025
🤖 AID от @anti_agi
Как известно, чтобы казаться умнее, чем ты есть, надо надеть очки. А чтобы обрести в глазах окружающих «сверхинтеллект» — надо надеть умные очки, решил Марк Цукерберг. Он так и сказал:
«Очки — идеальный форм-фактор для персонального суперинтеллекта»,
представляя новую пару умных очков Ray-Ban Display, на этот раз со встроенным в правую линзу дисплеем для приложений, оповещений и подсказок. Очки управляются браслетом Meta Neural Band, распознающим едва заметные жесты руки, который был представлен в прошлом году. Очки по $800 поступят в продажу с 30 сентября. Ее умные очки Ray-Ban проданы миллионами пар, и Meta (запрещена в России и только тут за экстремизм) стремится закрепить успех.
💻 Nvidia снова лишилась китайского рынка — но на этот раз уже по вине китайского, а не американского правительства. Управление киберпространства Китая запретило компаниям, включая ByteDance и Alibaba, закупать ИИ-чипы Nvidia и потребовало прекратить тестирование и заказы сервера Nvidia RTX Pro 6000D, разработанного специально для китайского рынка. В августе это были рекомендации, теперь прямой запрет. Хуанг заявил, что разочарован этим, но «есть более масштабные планы взаимодействия между Китаем и США, и я терпеливо к этому отношусь».
ℹ️Nvidia стала разменной монетой в переговорах между странами, но видимо, Хуанг надеется, что рано или поздно переговоры закончатся, и все вернется на круги своя.
Пока же, запрет Nvidia способствовал росту акций китайского техносектора. Индекс Hang Seng Tech вырос в среду на 4,2%, а в четверг еще на 2%. Акции китайского чип-мейкера SMIC выросли на 8,3%, бумаги Hua Hong Semiconductor подскочили на 13%. Акции Alibaba и Baidu, которые разрабатывают собственные альтернативы импортным чипам, также выросли.
💻 Между тем, Huawei представила новую технологию SuperPod, которая способна поддерживать соединение до 15 488 графических карт с чипами Ascend. Компания добавила, что теперь управляет суперкластером, насчитывающим около 1 миллиона графических карт. ℹ️ На сколько надо делить эти заявления, мы не можем сказать, но напомним, что DeepSeek так и не выпустил R2, который пытается обучить на китайских чипах вместо Nvidia.
💻 А американский конкурент Nvidia, стартап Groq поднял $750 млн по оценке $6,9 млрд (пост-мани). О привлечении нового раунда говорилось еще в июле, но тогда сообщалось, что планируется привлечь около $600 млн при оценке почти $6 млрд. До этого Groq привлекал деньги год назад - $640 млн при оценке в $2,8 млрд.
Чипы Groq — это не GPU, а LPU (языковые процессоры), а свое оборудование Groq называет «движком инференса» — специализированными компьютерами, оптимизированными для быстрого и эффективного запуска AI-моделей. Основатель Groq, Джонатан Росс, работал в Google над чипом Tensor Processing Unit (TPU), обеспечивающим сейчас работу ИИ-сервисов Google Cloud.
▪️Рейтинговое агентство Moody’s изменило прогноз рейтинга Oracle со стабильного на негативный из-за рисков, которые несет громадный контракт с OpenAI на $300 млрд. Один из основных рисков — «контрагентский», связанный с тем, что Oracle сложил все яйца в одну корзину под названием OpenAI.
18:52 16-09-2025
Партнёрские интеграции или SOTA с нуля?
Иногда сдаются даже лучшие. После долгих попыток создать свою foundation model, Apple пришла к сторонним вендорам, чтобы оживить Siri. «Пересадку мозга» начали с ChatGPT. Теперь говорят, что компания готовится использовать для своего главного ИИ-бренда модель Gemini от Google.
Работать мультмодальная LLM будет на серверах Apple, пока компания тихо продолжит эксперименты. Такой прогноз дали в конце августа. На последней презентации об ИИ-фишках почти не говорили, но есть ощущение, что от мультивендорности Apple отказываться не собирается.
Пользователи уже оценили возможности интеграции ChatGPT в iOS: особенно автоматизацию через «Команды». Представьте, какой потенциал может выйти из Siri с возможностью переключать модели? И пусть кто-то после этого назовёт iOS закрытой и негибкой системой...
Шутки-шутками, а практика понятная. Разработка фундаментальных моделей с нуля — это капиталоёмкий проект стоимостью в миллиарды долларов, верно замечает Денис Филиппов, CEO MWS AI (входит в МТС Web Services). Просто создать LLM или другую state-of-the-art модель мало — чтобы держаться в лидерах, придётся постоянно инвестировать.
В таком сценарии партнёрские решения или адаптация open source позволяют сэкономить значительные ресурсы, сохраняя гибкость в выборе. Поэтому адаптацией партнёрских продуктов и игрой с open source занимаются даже лидеры рынка: посмотрите на Microsoft с её попытками усидеть на всех стульях после размолвки с OpenAI.
Apple здесь показывает продуманную стратегию: если собственная разработка окажется успешной, компания будет использовать её. Если нет – у компании будет готовая альтернатива с гарантированным качеством, замечает Филиппов. Но это не значит, что нужно совсем отказаться от своих разработок. Будучи ведомым, теряешь и тех, кто готов работать над инновациями: лучшие разработчики из Apple уходят всё активнее.
Критически важно развивать внутреннюю экспертизу и контролировать весь стек, отмечает Андрей Рыбинцев, управляющий директор по ИИ в «Авито». Одной из альтернатив партнёрских интеграций становится создание своих форков open source — с доработкой под платформу. Такую стратегию выбрали в «Авито» с их моделями A-Vibe и A-Vision.
Под своим брендом — доработанный Qwen (а до этого Mistral 7B). За счёт ручной оптимизации добились заметной экономии: если бы запускали те же фичи на DeepSeek, пришлось бы использовать в 20-30 раз больше серверов. А доработанный open source на 21 машине принёс 700 млн рублей выручки уже в первый год.
Фундаментальные модели постепенно становятся базовой инфраструктурой (commodities) — как когда-то электричество. Поэтому внимание бизнеса всё больше смещается в сторону практических кейсов, считает Рыбинцев.
Tl;DR Apple своей экономией хвастаться не с руки. Пока компания обкатывает типовые сценарии с помощью партнёров, внимательно следя за рынком. А когда все шишки будут набиты, можно будет вывести и свою SOTA. Чтобы маленькими шажками, но всё же сделать Siri great again...
А может, хватит и сторонних интеграций. В конце концов, компания так и не стала заменять Google в качестве основной поисковой системы на iOS. Возможно, Apple так и продолжит собирать сливки с конечного продукта, получая быстрые улучшения при минимальных издержках за счёт партнёров.
А мы и не осуждаем. Так, тихо посмеиваемся в сторону единственных и неповторимых...