июль | 2025
7 исследований июля: образование, здоровье и звук как новый интерфейс
Рассказываем о самых важных исследованиях и отчётах июля — от агентных ИИ-диагностов и глобальных метрик здоровья до «чат-поиска» новостей, культуры звука и голоса, а также новых правил для университетов, школ и самой экономики ИИ.
01. Врач-оркестр: Microsoft учит ИИ лечить (и экономить)
Microsoft заглядывает в ближайшее будущее медицинской диагностики, которое определит, сколько вы заплатите за анализы, сколько проведёте в очереди и как быстро услышите верный диагноз. В Microsoft AI собрали SDBench — «испытательный полигон» из 304 реальных клинических разборов, но с важным отличием: как в жизни, каждый шаг стоит времени и денег. Оценивают не угадывание болезни, а $ per correct Dx — сколько долларов уходит на получение правильного диагноза, когда врач (или ИИ) по очереди: задаёт вопросы → назначает анализы → делает вывод. Поверх базовых моделей авторы запустили MAI-DxO — «оркестратор», то есть набор скоординированных ИИ-ролей: одна генерирует гипотезы, другая выбирает тесты, третья спорит с дорогими процедурами, четвёртая следит за экономией, пятая идёт по чек-листу. И в этой постановке ИИ становится и точнее, и дешевле.

Как делали исследование: каждое дело превратили в цепочку «визитов»; цены брали по американским тарифам. Верность диагноза проверял «LM-судья» — ещё одна модель, выставляющая оценку по рубрике (ядро болезни, причина, локализация, специфика, полнота). Там, где текст может быть двусмысленным, измеряли согласие с врачами; зачёт ставили при 4 баллах из 5 и выше. Врачи-участники (n=21) дали 19,9 % точных диагнозов при $2963 на случай; GPT-4o — 49,3 % при $2745; o3 — 78,6 % при $7850 (дорого, но чаще назначает уместные тесты). С MAI-DxO поверх o3 получили 81,9 % за $4735; в «бюджетном режиме» — 79,9 % за $2396; ансамбль моделей поднял планку до 85,5 % за $7184. Результат удержался и на скрытой проверке. Показательный эпизод: при отравлении базовая модель «зацепилась» за неверную гипотезу и «сожгла» $3431; оркестратор уточнил источник (санитайзер для рук) → назначил один целевой анализ → попал в диагноз за $795. Для полноты авторы сравнили ИИ и с другими топ-моделями (OpenAI, Gemini, Claude, Grok, DeepSeek, Llama).

Если это подтвердится в реальной практике, клиника сдвинется от «чат-ботов» к агентным оркестраторам с логикой бюджета: сортировка пациентов и приём начнут чаще попадать в правильный диагноз при меньших тратах на тесты; страховщики и регуляторы получат прозрачную метрику «доллар за верный диагноз» и «чёрный ящик» откроется журналом шагов; обучение медиков уйдёт от разрозненных задачек к симуляторам последовательного мышления. Но рамки важны: кейсы NEJM — это сложная «академическая» подборка (не ясно, как модель поведёт себя на повседневных простых пациентах), цены — про США и не учитывают логистику, ожидание и инвазивность; врачи работали без консилиумов; а оценка «LM-судьи», хотя и близка к врачебной, всё равно требует испытаний на реальных исходах. Иначе говоря: потенциал большой — но прежде чем менять протоколы, нужны проспективные клинические проверки.
02. Опять про будущее ИИ
В ближайшие 1–2 года «умные» функции войдут почти во все сервисы — от банка до навигатора, влияя на цены, приватность и качество решений вокруг нас. Artificial Intelligence Index 2025 (Stanford HAI) фиксирует: запуск ответов модели (инференс) подешевел примерно в 280 раз до ~$0,07 за 1 млн токенов. Значит, ИИ станет массовой «подкладкой» цифровой жизни, но пока бизнес видит скромную отдачу (экономия операционных затрат чаще <10% и рост выручки <5%), поэтому борьба идёт не за «самый большой ИИ», а за баланс цены и пользы при соблюдении правил безопасности.

Если верить выводам авторов, нас ждёт больше локального ИИ на устройствах с помощью NPU (встроенных нейропроцессоров) и рост роли SLM — небольших специализированных моделей, которые работают быстрее и дешевле, чем «гиганты». В интерфейсах станет больше «поясняющих» режимов и меток ответственности, а в контенте — водяных знаков подлинности (невидимых отметок, указывающих на синтетическое происхождение текста/изображения). Конкуренцию выиграют экосистемы, умеющие аккуратно смешивать реальные и синтетические данные (данные, сгенерированные ИИ для обучения) без деградации качества моделей.
03. Диагноз человечеству от ВОЗ
Ежегодный отчёт World health statistics 2025 показывает тревожную развилку: доля семей, чьи «расходы из кармана» на медицину съедают >10% бюджета, держится на уровне 13,5%, а в 2019 году из-за медплатежей в крайнюю бедность скатились 344 млн человек. При этом после двух десятилетий прогресса здоровые годы жизни (HALE — ожидаемая продолжительность здоровой жизни) просели на 1,5 года, до 61,9. Иными словами, всеобщее покрытие услугами (UHC — universal health coverage) растёт слишком медленно, а ценник и доступность лечения бьют по домохозяйствам.

В 2000–2019 HALE вырос на 5,4 года, но в 2019–2021 упал до 61,9 — из-за COVID и косвенных эффектов; дополнительно своё внесли психические расстройства (~–0,12 года). Мир не успевает по целям ООН: материнская смертность — 197 на 100 000 (далеко от цели <70 к 2030), детская — U5MR 37 на 1000 (смерти до 5 лет) и NMR 17 на 1000 (смерти новорождённых), с огромными разрывами между регионами. Преждевременная смертность от незаразных болезней (инфаркт, инсульт, рак, диабет) почти не снижается: чтобы выполнить цель «–⅓ к 2030», нужен среднегодовой темп снижения ~2,7%, а реально лишь ~0,5–1,3%. ДТП уносят 1,18 млн жизней в год (самые высокие показатели в Африке и бедных странах), суициды — 727 тыс., максимум убийств — в Америке. С загрязнением воздуха связано с 6,7 млн смертей (2019), проблемы воды и санитарии (WASH) — с 1,4 млн. ВИЧ-заболеваемость с 2010 снизилась на 48%, туберкулёз уходит вниз, малярия с 2015 растёт; устойчивость микробов к антибиотикам — нарастающая угроза. Из инициативы ВОЗ «Три миллиарда» (ещё +1 млрд людей со здоровой жизнью; ещё +1 млрд с UHC; ещё +1 млрд защищены от чрезвычайных ситуаций) перевыполнен только первый блок; по UHC к 2025 прибавка лишь ~+500 млн при цели +1 млрд, защита от ЧС — ~+697 млн.

Часть данных запаздывает (особенно 2021–2023), встречается смешение причин смерти в пандемию, качество национальных регистров разнится; прогнозы чувствительны к политике и экономике. Это глобальная панорама — для действий её нужно дробить на локальные срезы. Но общий сигнал ясен: без ускорения UHC, сокращения неравенств и инвестиций в первичную помощь мы потеряем ещё годы здоровой жизни, а миллионы семей продолжат переплачивать за базовую медицину.
04. Не читал, но осуждаю
Digital News Report 2025 фиксирует: лента в соцсетях и короткое видео становятся главным «входом» в новостную повестку, а первые ИИ-чатботы уже выступают источником новостей (в среднем у 7% аудитории и у 15% младше 25 лет). Доверие к медиа держится лишь вокруг ~40%, при этом именно инфлюенсеры и национальные политики названы главными источниками потенциальной дезинформации. Платить за новости готова ограниченная группа — в среднем 18% из 20 стран.

Новости всё чаще приходят через платформы — Facebook (36% используют для новостей еженедельно), YouTube (30%), Instagram/WhatsApp (по 19%), TikTok (16%), X (бывший Twitter) (12%). Потребление видео выросло до 72% еженедельно; соц-видео — до 65% (с 52% в 2020). Беспокойство о том, как отличить правду от лжи, испытывают 58% респондентов (в Африке и США — до 73%). В такой среде аудитория ждёт от ИИ в редакции «быстрее и дешевле», но опасается непрозрачности и ошибок, поэтому рабочая стратегия для изданий — видео-first продукты, пакеты/бандлы подписок и «человек в контуре» при использовании ИИ (редактор проверяет, объясняет, берёт ответственность).

Если верить авторам исследования, медиа-экосистема станет ещё более платформенной: выиграют видео-редакции и создатели, кто умеет работать с TikTok/YouTube и чат-поиском, а также бренды с прозрачными стандартами модерации; проиграют «текст по умолчанию» и одиночные paywall-модели. Но отчёта есть важные ограничения: это онлайн-опрос, а значит он плохо «видит» людей без стабильного интернета, пожилых и менее обеспеченных. В ряде стран (Индия, Кения, Нигерия, ЮАР) в выборку попали главным образом англоязычные пользователи 18–50 лет — это не вся аудитория страны. Выборка не случайная, поэтому небольшие различия (на 1–2 процентных пункта) не стоит считать настоящим сдвигом. И ещё: некоторые разделы делались при поддержке отраслевых партнёров (включая платформы), это важно помнить. Но общий сигнал понятен: новости всё больше приходят через видео и соцсети, искусственный интеллект становится новым «входом» к новостям, а доверие к источникам нужно переосмысливать и заново выстраивать.
Звук уже стал повседневным интерфейсом — от голосовых ассистентов и коротких видео до подкастов и уведомлений. Если вы делаете продукт, медиа или исследование, академический сборник Listening in: Perspectives on Sound, Voice, and (Popular) Music Studies поможет слышать контекст: где звук «резонирует» (вызывает отклик), как голос упакован в культурные и гендерные коды, и что именно навязывают нам платформы. Иными словами, это инструкция, как не промахнуться с тоном, голосом и аудио-UX.

Внутри — пять секций о разных аспектах работы со звуком: RESONATING (почему одни звуки «принимаются», другие — нет), HEARING (полевая акустика и «саундмэппинг» собора; попытка «услышать» даже статичные изображения), PERFORMING (импровизация и исторические практики, чтобы понять смысл исполнения), GENDERING (как голос конструирует и оспаривает гендер — от «Волшебной флейты» до панка и сообщества хиджр), DIGITALIZING (как смартфонные интерфейсы, Spotify и голосовые ассистенты кодируют поведение; что такое «фан-труд» K-pop — вклад фанатов в промо и производство контента).

Исследователи прогнозируют: голосовые продукты уйдут от «универсального» тембра к инклюзивным и ситуативным голосам; метрики «нравится/не нравится» заменятся на измерение резонанса и доверия; медиа и бренды начнут проектировать аудио вместе с фанатскими сообществами (ко-создание), а не поверх них. Выиграют те, кто проектирует контекст и отношения вокруг звука. Ограничения: главы неоднородны и локальны (часть — студенческие кейсы), это интерпретации, а не строгие причинные доказательства; данных мало для «панорамной статистики»; результаты нужно проверять на ваших аудиториях и сценариях. Но если вы никогда не думали о звуке как о социальном интерфейсе, эта работа — классная точка входа в предмет.
06. Университет будущего
Если выводы EDUCAUSE Horizon Report 2025 сбудутся, нас ждут вузы, где ИИ встроен в учебный процесс по правилам: у каждого инструмента — понятные границы применения, у каждого задания — прозрачные критерии, а ваши дипломные компетенции фиксируются не только оценками, но и цифровыми бейджами (малые электронные сертификаты навыков) и CLR (Comprehensive Learner Record — «сквозное портфолио» достижений). Курсы станут более смешанными (офлайн+онлайн), появится микрообучение (короткие модули вместо длинных лекций), а в LMS (Learning Management System — цифровой «дневник» курса) поселятся AI-ассистенты с human-in-the-loop.

По мнению авторов отчета, в большинстве вузов появятся реестры «одобренных ИИ» (каталог проверенных инструментов и допусков), курсы начнут проектировать «под навыки», а не только «под часы», а в резюме студентов приживутся бейджи/CLR (машиночитаемые доказательства конкретных умений). ИТ-службы уйдут от «запрета по умолчанию» к гибкому управлению ИИ, а преподаватели получат короткие апгрейд-программы по GenAI вместо разрозненных мастер-классов. Одновременно усилится защита от атак на EdTech-периметр (всё, что соединяет учебные сервисы и данные студентов), а в интерфейсах курсов роль ассистента возьмут AI-агенты — но с логированием действий и понятной «кнопкой доступа» к человеку. На рынке выиграют вузы с быстрым «governance-контуром» и центрами поддержки преподавания; проиграют те, кто делает ставку на «тотальный запрет» или на единственного поставщика ИИ-решений.

Если вы студент — ждите больше ИИ-инструментов рядом с курсами и больше ответственности за проверку фактов. Если вы преподаватель — готовьтесь к коротким, но регулярным апгрейдам по GenAI и к ясным правилам работы с ИИ в заданиях и оценивании. Если вы руководите программой — без AI-governance, кибергигиены и критической цифровой грамотности устойчивости не будет, даже если инструменты «самые новые».
Спецвыпуск научного журнала Educational Technology & Society показывает: если школы и университеты встроят ИИ с умной педагогикой, средний ученик будет учиться заметно лучше (средний эффект g≈0,57–0,69: результаты сдвигаются с «середины» группы к верхним ~70–76-м процентилям).

Редакторы собрали 11 рецензированных исследований из 53 поданных про GenAI в образовании — от школы (K-12) до университета. Две мета-аналитические работы нашли устойчивый «средний+» положительный эффект: по суммарным учебным результатам улучшения идут сразу по трём блокам: когнитивному (знания и умения, g≈0,60), поведенческому (учебная активность, g≈0,70) и аффективному (мотивация/уверенность, g≈0,48). Полевые эксперименты показывают, что ИИ особенно полезен, когда его оборачивают рефлексией и структурированной обратной связью.

По мнению авторов, учебные курсы массово перейдут к схеме «Human-GenAI симбиоз» (человек + ИИ вместе): для программирования — GenAI-debugging (отладка кода с ИИ), для письма — «ИИ как редактор и тренер», для аргументации — ИИ-собеседник, который возражает и просит обосновать. Школы и вузы начнут стандартизировать оценивание, чтобы не завышать результаты «домашними» тестами, и заведут learning analytics (учебная аналитика: безопасный анализ логов взаимодействия с ИИ, чтобы понимать, что реально помогает). На смену узким «проверялкам грамматики» придут агентные ИИ-помощники, а в программах появятся отдельные модули по критической цифровой грамотности (как проверять факты, распознавать ошибки и «галлюцинации» ИИ).

Правда, пока эффекты разношерстны: исследования короткие, выборки часто маленькие, много квази-экспериментов (переносимость на другие школы/курсы ограничена). Там, где используют авторские тесты, эффект нередко выше, чем на стандартизированных измерителях — значит, часть «успеха» может быть связана со способом оценивания. В программировании влияние на computational thinking (компьютерное мышление — умение декомпозировать задачи, абстрагировать и моделировать) пока неоднозначно.
Made on
Tilda