OpenAI та Anthropic у медицині: ризики галюцинацій ШІ

OpenAI поступово впроваджує функцію ChatGPT Health. Користувачі можуть ставити запитання про своє здоров'я. Система має окрему пам'ять для медичних даних. За бажанням можна підключити інформацію з електронних медичних карток або фітнес-додатків.
OpenAI

Diogen.uk — аналітичне медіа про міжнародні події.
Проводимо глибокий розбір фактів, контекстів і наслідків.

Порівнюємо наративи США, Європи, України та Китаю.
Викриваємо маніпуляції й показуємо причинно-наслідкові зв’язки.
Даємо виважені висновки та практичні інсайти.


На порталі представлені статті ЗМІ з усього світу. Позиції деяких медіа не збігаються з думкою редакції

[ai-summary]

OpenAI та Anthropic оголосили про запуск медичних продуктів на основі штучного інтелекту. Проте жодна компанія не надає даних про точність діагностичних рекомендацій. Google уникає цього ринку — компанія вже зазнала репутаційних втрат через проєкти з медичними даними. Експерти попереджають: помилки ШІ у медицині коштуватимуть значно дорожче, ніж у пошукових системах.


Ринок медичного штучного інтелекту оцінюють у 20,9 мільярда доларів станом на 2024 рік. До 2030-го прогнозують зростання до 148,4 мільярда. Ці цифри пояснюють, чому OpenAI та Anthropic поспішають зайняти нішу. Але чи готові їхні технології до роботи з людським здоров’ям?

Генеративний штучний інтелект справді має потенціал революціонізувати медицину. Він може аналізувати симптоми, пропонувати діагнози, писати документацію. Водночас ці системи мають критичну ваду — галюцинації. Чат-боти впевнено видають неправдиву інформацію. У пошуковій системі це дратує. У лікарні — може вбити.

ChatGPT Health: що пропонує OpenAI


OpenAI поступово впроваджує функцію ChatGPT Health. Користувачі можуть ставити запитання про своє здоров’я. Система має окрему пам’ять для медичних даних. За бажанням можна підключити інформацію з електронних медичних карток або фітнес-додатків.

Компанія наголошує: продукт “не призначений для діагностики”. Це важливе застереження. Але чи зупиняє воно людей? Ні. За даними OpenAI, понад 230 мільйонів користувачів щотижня запитують чат-бота про здоров’я. Це більше, ніж населення Німеччини, Франції та Іспанії разом узятих.

Паралельно OpenAI запустила ChatGPT for Health care — версію для клініцистів. Її тестують у провідних медичних закладах США: дитячій лікарні Бостона та онкологічному центрі Меморіал Слоун-Кеттерінг. Останній — один із найбільших онкоцентрів світу, заснований ще 1884 року. Якщо щось піде не так, репутаційні втрати будуть колосальними.

Anthropic та Claude для лікарів


Anthropic обрала інший шлях. Компанія зосередилася на корпоративних клієнтах і має в цьому сегменті більший успіх, ніж OpenAI. Її медичний продукт — спеціальна версія чат-бота Claude, орієнтована на лікарів.

Візуально система виглядає як звичайний Claude. Різниця — у навчальних даних. Бота тренували на базах діагностичних кодів, інформації про медичні заклади та наукових статтях з PubMed. Мета — допомогти лікарям із діагностикою та підготовкою авторизаційних документів.

Anthropic похвалилася цікавою статистикою. Звичайна споживча версія Claude правильно називає коди ICD-10 у 75% випадків. ICD-10 — це Міжнародна класифікація хвороб десятого перегляду, стандарт Всесвітньої організації охорони здоров’я. Лікарська версія Claude, навчена на цих кодах, показує точність 99,8%. Вражаюче, правда?

Але зачекайте. Знати коди — це одне. Ставити діагнози — зовсім інше.

Проблема точності діагностики


Яка точність Claude при визначенні діагнозу? Це питання видається ключовим. На жаль, Anthropic не може дати чіткої відповіді. Компанія надала лише непрямі показники.

Найпотужніша модель Claude Opus 4.5 досягла 92,3% точності на тесті MedCalc. Звучить непогано. Але цей тест перевіряє лише медичні розрахунки — дозування ліків та лабораторні показники. Він не оцінює здатність ставити діагнози.

Інший показник — 61,3% на тесті MedAgentBench. Цей бенчмарк вимірює, чи може ШІ виконувати клінічні завдання в симульованій системі електронних медичних записів. 61,3% — це, скажімо прямо, тривожно низький результат. Уявіть лікаря, який помиляється у двох випадках із п’яти.

Anthropic має одну перевагу. За даними компанії Scale, нещодавно придбаної Meta, моделі Anthropic чесніші за конкурентів. Вони частіше визнають невизначеність, замість того щоб вигадувати відповіді. Це важливо. Але недостатньо.

OpenAI теж не надає конкретних цифр про галюцинації у медичних сценаріях. Речниця компанії заявила, що моделі стали “надійнішими та точнішими” порівняно з попередніми версіями. Без конкретики такі заяви — порожній звук.

Чому Google уникає медичного ринку


Google має чат-бота Gemini — одного з найпопулярніших і найздатніших на ринку. Чому компанія не поспішає в медичну сферу? Відповідь проста: вона вже обпеклася.

Між 2008 і 2011 роками Google намагалася створити систему персональних медичних записів під назвою Google Health. Ідея була амбітна: зібрати медичні дані людини від різних лікарів та лікарень в одному місці. Проєкт провалився.

Технічні труднощі — лише частина проблеми. Медичні системи різних закладів несумісні між собою, об’єднати їх надзвичайно складно. Але головна перешкода виявилася психологічною. Люди не хотіли довіряти свої медичні дані компанії, яка заробляє на рекламі та постійно збирає персональну інформацію.

2018 року закрили ще один проєкт — систему раннього попередження про гостру ниркову недостатність, розроблену лабораторією DeepMind. З’ясувалося, що для роботи системи використали понад мільйон записів британських пацієнтів. Скандал був гучним.

Криза довіри до технологічних гігантів


2019 року газета The Wall Street Journal розкрила ще одну ініціативу Google — проєкт Nightingale. Компанія отримала доступ до медичних записів мільйонів американських пацієнтів. Знову скандал. Знову підірвана довіра.

Цікавий парадокс: проблеми Google не були пов’язані з помилками системи. Жодних неправильних діагнозів, жодних збоїв у роботі. Репутацію зруйнувало саме сприйняття компанії як ненадійної.

Для OpenAI та Anthropic ставки ще вищі. Якщо Google критикували за збір даних, то нові гравці можуть зіткнутися з реальними медичними помилками. ChatGPT чи Claude помиляються — і лікар ухвалює неправильне рішення. Наслідки можуть бути фатальними.

За даними досліджень Джона Гопкінса, медичні помилки займають третє місце серед причин смерті в США — понад 250 тисяч випадків щороку. Додати до цієї статистики помилки штучного інтелекту — перспектива, м’яко кажучи, тривожна.

Що чекає ШІ у медицині


Даріо Амодеї, генеральний директор Anthropic, торкнувся цієї теми під час презентації минулого тижня. Він визнав: визначення “безпеки” розширюється з виходом на нові ринки, зокрема медичний. “Охорона здоров’я — це саме та сфера, де ви не хочете, щоб модель вигадувала,” — заявив він. “Це погано.”


Гуманоїдні роботи демонструють бойові навички

2026-01-20

Заява слушна. Але компанія не надала жодних даних, які б її підкріпили. Слова без цифр — це маркетинг, а не наука.

Компанії зі штучного інтелекту давно уникають розмов про частоту помилок своїх систем. Причина зрозуміла: такі дані показали б, наскільки складною залишається проблема галюцинацій. Натомість вони публікують результати бенчмарків — наприклад, як добре їхні моделі складають медичний ліцензійний іспит.

Але скласти іспит і лікувати пацієнта — різні речі. Для побудови довіри серед лікарів та пацієнтів потрібна прозорість щодо реальної надійності. Поки що її немає.

Європейський Союз уже працює над регуляцією медичного ШІ в межах Акту про штучний інтелект. Медичні застосування класифікують як “високоризикові” з відповідними вимогами до прозорості та тестування. США поки що відстають у регулюванні.

Ринок медичного ШІ зростатиме — це неминуче. Питання в тому, чи встигнуть регулятори та самі компанії забезпечити безпеку раніше, ніж станеться перша гучна трагедія. Історія Google показує: втрачену довіру повернути майже неможливо. А якщо йдеться про людські життя, ціна помилки несумісна з “бета-тестуванням на живих користувачах”.

За матеріалами:


 
Japan Times

Карні вказав Трампу: Канада оплатила міст Горді Хоу

Карні вказав Трампу: Канада оплатила міст Горді Хоу

Трамп хоче заблокувати міст Горді Хоу: Канада відповіла

Трамп хоче заблокувати міст Горді Хоу: Канада відповіла

Тайвань відкинув вимогу США щодо переміщення виробництва чипів

Тайвань відкинув вимогу США щодо переміщення виробництва чипів

Alibaba RynnBrain: китайський ШІ для робототехніки вийшов ринок

Alibaba RynnBrain: китайський ШІ для робототехніки вийшов ринок

Справа Епштейна: російський слід та зв’язки з кремлем

Справа Епштейна: російський слід та зв’язки з кремлем

Фронт і тил: суспільний розрив загрожує єдності України

Фронт і тил: суспільний розрив загрожує єдності України

Трамп хоче миру до літа: чого боїться Київ

Трамп хоче миру до літа: чого боїться Київ

FCC дозволила подвоїти супутники Starlink

FCC дозволила подвоїти супутники Starlink

Штучний інтелект штурмує індустрію інтимних товарів

Штучний інтелект штурмує індустрію інтимних товарів

Німецький середній бізнес. Криза зміщується на захід

Німецький середній бізнес. Криза зміщується на захід

Німеччина готується до нападу росії на НАТО за два роки

Німеччина готується до нападу росії на НАТО за два роки

Diogen.uk — це незалежна українська аналітична платформа, яка агрегує, перекладає, переосмислює та порівнює новини з усього світу. Мета сайту — виявлення смислів, психологічних впливів та інформаційних конфліктів, прихованих у потоках щоденних новин.

DIOGEN© Усі права захищено
Київ вул. Автозаводська 2
admin@diogen.uk

🇺🇸 ЕКОНОМІКА ПІВНІЧНОЇ АМЕРИКИ 🌎

Порівняння США з Канадою та Мексикою • 2024-2025

🇺🇸 ВВП США
$30,6 трлн
2025 рік
🇨🇦 ВВП Канади
$2,39 трлн
9-та економіка світу
🇲🇽 ВВП Мексики
$1,86 трлн
13-та економіка світу
🇺🇸↔️🇨🇦 Торгівля США — Канада
Загальна торгівля 2024
$903 млрд
Експорт США до Канади
$350 млрд
Дефіцит США
-$63,3 млрд
Експорт США → Канада $348,5 млрд
45%
Імпорт США ← Канада $422 млрд
55%
🇺🇸↔️🇲🇽 Торгівля США — Мексика
Загальна торгівля 2024
$930 млрд
Експорт США до Мексики
$334 млрд
Дефіцит США
-$171,8 млрд
Експорт США → Мексика $334 млрд
40%
Імпорт США ← Мексика $505,5 млрд
60%
📊 Ключові економічні показники
Показник
🇺🇸 США
🇨🇦 Канада
🇲🇽 Мексика
ВВП (2025)
$30,6 трлн
$2,39 трлн
$1,86 трлн
Зростання ВВП
+2,0%
+1,5%
+0,7%
Безробіття
4,1%
6,5%
2,5%
Інфляція (2025)
2,7%
2,1%
3,7%
Населення
335 млн
40 млн
132 млн
📜 Угода USMCA (з 2020 року)
Загальна торгівля
$1,93 трлн
Населення зони
510+ млн
Частка світового ВВП
~30%
Перегляд угоди
Липень 2026
Найбільша зона вільної торгівлі у світі. З 2020 року внутрішня торгівля зросла на 37%. США підтримує профіцит послуг з обома партнерами.
📉 Дефіцит торгового балансу США (2024)
🇲🇽 Мексика — 2-й найбільший дефіцит -$171,8 млрд
58% від дефіциту з Китаєм
🇨🇦 Канада — 10-й найбільший дефіцит -$63,3 млрд
21%
🇨🇳 Китай — найбільший дефіцит (порівняння) -$295,4 млрд
100% (базовий рівень)
🇨🇦 Головний експорт Канади до США
Сира нафта та газ (63% енергоімпорту США), автозапчастини, деревина, алюміній, золото, калій
🇲🇽 Головний експорт Мексики до США
Автомобілі та запчастини, електроніка, медичне обладнання, сільгосппродукція, пиво, авокадо
💡 Ключовий висновок
Мексика вперше випередила Китай і стала №1 торговим партнером США у 2024 році з товарообігом $930 млрд. Разом Канада і Мексика формують 30% світової економіки у межах USMCA. Перегляд угоди у липні 2026 визначить майбутнє північноамериканської інтеграції.
Джерела: U.S. Census Bureau, BEA, Statistics Canada, INEGI, IMF, USTR • Лютий 2026
Увімкнути сповіщення OK Ні, дякую