Данные – это не все

Китай и США сделали ставку на военные приложения ИИ. Причина этого кажется очевидной и политикам, и военным. Все они повторяют мантру из книги «Супердержавы ИИ» Кай-Фу Ли: «В век ИИ, когда данные — это новая нефть, Китай — новая Саудовская Аравия». Но реальность гораздо сложнее. Все далеко не так просто в обретении военного превосходства в ИИ-системах.

Новый отчет CSET https://cset.georgetown.edu/research/messier-than-oil-assessing-data-advantage-in-military-ai/ не открывает новых истин, а всего лишь резюмирует – объемы данных имеют такое же значение для обретения военного преимущества, как объемы производимого страной мусора.

1.  Объемы необработанных данных вообще не о чем не говорят.

2.  Ценность имеют лишь очищенные, преобразованные, маркированные данные, оптимизированные для обучения конкретными алгоритмами машинного обучения.

3.  Коммерческие данные из п. 2, хотя и полезны, но мало актуальны для военного оперативного ИИ. Данные подбираются под конкретные задачи, а ценность коммерческих данных и моделей машинного обучения для военных приложений крайне мала.

4.  Синтетическая генерация данных (типа той, что делал DeepMind для триумфа AlphaZero в настольных играх), будучи сделана с умом, в тысячу крат ценнее, чем горы данных, произведенных 1.4 миллиардом китайцев, звонящих по телефонам и оплачивающих покупки онлайн.

Автор публикации

не в сети 2 дня

Платформа НТИ

Комментарии: 1Публикации: 318Регистрация: 27-07-2020

Добавить комментарий

Авторизация
*
*
Регистрация
*
*
*
Пароль не введен
Генерация пароля