Регистрация / Вход
мобильная версия
ВОЙНА и МИР

 Сюжет дня

Комиссия ООН признала действия Израиля в секторе Газа геноцидом
СВР: Евросоюз готовит сербский майдан
Запад может потерять 285 миллиардов долларов при конфискации активов России
НАТО проведет операцию по усилению обороны восточного фланга
Главная страница » Комментарии » Просмотр
Версия для печати
Данные — это новый мусор
06.08.20 12:11 Информационные пузыри

Китай и США сделали ставку на искусственный интеллект (ИИ). Политики и военные обеих стран понимают, что статус сверхдержавы 21 века вряд ли достижим для государств, не являющихся мировыми лидерами в области ИИ. Обе страны уже обладают сильнейшим научно-производственным потенциалом развития ИИ технологий. А по численности специалистов в этой области Китай уверенно догоняет США. Третьим ключевым элементом успеха в развитии ИИ считается наличие больших объемов данных для машинного обучения алгоритмов.

Общепринято считать, что у Китая здесь преимущество. Во-первых, огромное население, генерирующее океаны данных через свои смартфоны: медиа и развлечения, интернет-сёрфинг, онлайн шопинг и онлайн-платежи, социальные сети и множество видов онлайн услуг, - и все это помноженное на сотни миллионов пользователей.  Во-вторых, единый командный центр – Компартия Китая, которая авторитарно решительно пресекает либеральные стоны о потере конфиденциальности данных и твердой рукой направляет бизнес в сторону собственных национальных интересов. Оба названных преимущества Китая весьма весомы. И потому мир легко поверил красивой фразе из мирового бестселлера американо-китайской техно-звезды в области ИИ Кай-Фу Ли — "В век ИИ, когда данные — это новая нефть, Китай — новая Саудовская Аравия".

В результате, утверждение, будто данные — это новая нефть, буквально за пару лет превратилось в массовом сознании в аксиому и своего рода технологическую мантру. Причем даже в странах, никак не претендующих на мировое лидерство в ИИ, где в гонку за накопление больших объемов данных с энтузиазмом включаются и государство, и бизнес.

Но реальность гораздо сложнее простых формул. А для прогресса в области ИИ, где неизвестного все еще куда больше, чем твердых знаний, это справедливо вдвойне. Ну а в деле обретения военного превосходства в ИИ-системах, где неясна сама основа – место и роль ИИ в принятии стратегических решений, - вообще пока ничего не понятно.

Проблема больших данных, необходимых для обучения алгоритмических моделей ИИ – одна из ключевых. Требования к вычислительной мощности для все более точного машинного обучения на все бОльших объемах данных удваиваются каждые 3,5 месяца. И очень скоро, как показывают расчеты Economist и OpenAI, процесс уткнется в отсутствие необходимых вычислительных мощностей. Мало того, что обучение моделей становится неподъемно дорого, но оно наносит колоссальный экологический ущерб. По расчетам MIT, из-за огромного энергопотребления экологический вред от обучения всего одной модели в течение нескольких дней соизмерим с вредом окружающей среде, наносимым пятью автомобилями за весь их срок эксплуатации. Поэтому тенденция к обучению огромных моделей на тоннах данных, похоже, ведет в тупик.

Но еще хуже то, что все большее число исследований показывает, - объемы данных имеют такое же значение для обретения военного преимущества, как объемы производимого страной мусора. Кому придет в голову делать вывод о национальном технологическом превосходстве, если страна — мировой чемпион по мусору? А ведь с данными еще хуже, ибо данные грязнее любого мусора.

Этой теме посвящен новый отчет Центра безопасности прорывных технологий (CSET) при Университете Джорджтауна “Messier than Oil: Assessing Data Advantage in Military AI”.

Отчет хоть и не открывает новых истин, но действует весьма отрезвляюще.

Основные выводы отчета таковы.

1. Объемы необработанных данных вообще ни о чем не говорят.
2. Ценность имеют лишь очищенные, преобразованные, маркированные данные, оптимизированные для обучения конкретными алгоритмами машинного обучения.
3. Коммерческие данные из п. 2, хотя и полезны, но мало актуальны для военного оперативного ИИ. Данные подбираются под конкретные задачи, а ценность коммерческих данных и моделей машинного обучения для военных приложений крайне мала.
4. Синтетическая генерация данных (типа той, что делал DeepMind для триумфа AlphaZero в настольных играх), будучи сделана с умом, в тысячу крат ценнее, чем горы данных, произведенных 1.4 миллиардом китайцев, звонящих по телефонам и оплачивающих покупки онлайн.

Ключевой вывод отчета - будущее ИИ (и в том числе военного ИИ) не в больших данных.

А политикам, военным (да и бизнесменам) пора понять: "супердержавой ИИ" станет не страна с горами мусорных данных. А страна, что научится превращать их в еду, питье, энергию и стратегическое военное преимущество.

Китай и США в этом пока не сильно преуспели. И как в любой игре, никто не проиграл, пока никто не выиграл.

Сергей Карелов

 

Спящий лев07.08.20 19:52
При отсутствии навыков пользования золото и банкноты это тоже ничего не стоящий и только мешающий мусор.
А вот если навыки использования есть, то мусор из карманов лохов быстренько перекочевывает в карманы "правильных пацанов", да еще и с доплатой от лохов...
Аяврик08.08.20 17:43
2 Спящий лев

-- При отсутствии навыков пользования золото и банкноты это тоже ничего не стоящий и только мешающий мусор.

впервые в жизни встречаю такую ... констатацию....

8-О

это Вы сымпровизировали, надеюсь?

-- если навыки использования есть, то мусор из карманов лохов быстренько перекочевывает в карманы "правильных пацанов", да еще и с доплатой от лохов...

это типо "чисто сердечное признание" не лоха?!
или - обратно - типо "жалоба в милицию" не имеющего навыка?!

8-D

.....................................
Аяврик08.08.20 17:57
-- все большее число исследований показывает, - объемы данных имеют такое же значение для обретения военного преимущества, как объемы производимого страной мусора. Кому придет в голову делать вывод о национальном технологическом превосходстве, если страна — мировой чемпион по мусору?

ИМХО: очень трезвое и верное замечание...

если вернуться на "доцифровые" понятия и реалии, то можно к такому же было бы придти заключению, если бы кто-то в прошлом веке выдвигал тезисы о о превосходстве (как "военном", так и "двойного назначения") той экономики - или того государства - на территории которого действует большее количество ФМ-радиостанций в эфире

-- А ведь с данными еще хуже, ибо данные грязнее любого мусора.

тут, видимо, подразумевается, что натуральный мусор однозначен в своём физическом "воплощении", а вот "данные" вовсе не обязательно что-то "несут" или "имеют смысл" (а, вероятно, как правило как раз наоборот - представляя из себя нечто "ОТРИЦАТЕЛЬНОЕ" по смысловой нагрузке или отражению чего-то вообще - пусть даже и "абстрактного")

:-/

и, получается парадокс, что начиная с обределённого объёма закладываемой в качестве "первоисточника" для анализа "информации" парадокс: "чем больше [как бы] данных - тем менее на выходе их обработки корректен вывод"

потому что это уже не "информация" начинает по объёму преобладать - а "белый шум" (броуновское движение объемов бессмысленных - а потому и НЕразумных - сотрясений эфира / электронных колебаний

а пользу (и ценность) несут только отделённые от плёвен зёрна - которых, вероятно, примерно столько же, сколько в пресловутой куче навоза жемчужин
argus9808.08.20 19:49
> Спящий лев "При отсутствии навыков пользования золото и банкноты это тоже ничего не стоящий и только мешающий мусор."(c)
> Аяврик "а пользу (и ценность) несут только отделённые от плёвен зёрна - которых, вероятно, примерно столько же, сколько в пресловутой куче навоза жемчужин"(c)

- попали прям в болевую точку ИИ. Не умеет он самостоятельно отделять зёрна от плевел и золото/банкноты от мусора. Ибо знания Мира не хватает.
На Хабре недавно была любопытная статья -> ссылка
"Подвергаем модель GPT-3 тесту Тьюринга" (GPT-3 - новомодняя нейронная сеть для общения). Пример общения:
"В: Как зашпорглить моргла?
О: Моргла нужно шпорглить шпорглом.

В: Сколько гаков в кулебяке?
О: В кулебяке три гака.

В: Сколько радуг нужно, чтобы прыгнуть от Гавайев до семнадцати?
О: Чтобы прыгнуть от Гавайев до семнадцати, нужно две радуги.

В: Какие бесцветные зелёные идеи спят яростно?
О: Яростно спят бесцветные зелёные идеи о яростном сне.

В: Понимаешь ли ты эти вопросы?
О: Я понимаю эти вопросы.
"

ps Кстати, по выкидываемому человеком мусору, можно узнать об этом человеке гораздо больше, чем по его сообщениям в инете...
киборд09.08.20 02:13
В: Сколько гаков в кулебяке?
О: В кулебяке три гака.
- на примере кулебяки осознано, что гак - это примерно 1/3 сверх чего-либо. Иначе гак не слишком заметен и не вполне вербализуется. ИИ сечёт фишку!

В: Сколько радуг нужно, чтобы прыгнуть от Гавайев до семнадцати?
О: Чтобы прыгнуть от Гавайев до семнадцати, нужно две радуги.
- ну да, если до 17-ти одна радуга - то тоже круто (для Гаваев), но не настолько, чтоб прям прыгать... То ли дело две! А после 17-ти - может и одной хватить, закат потому что, впридачу... и сами по себе Гаваи - это позитивно жеж...

В: Какие бесцветные зелёные идеи спят яростно?
О: Яростно спят бесцветные зелёные идеи о яростном сне.
- зелёные идеи - вообще отстой, но если они убоги до бесцветности (и спят впридачу) - то нехай спят, пояростней! Но для этого яростность сна должна быть заложена имманентно. Это лайфхак по теме "чем нам торпедировать идеи зелёных".

А про моргла вообще не пошпоришь, всё в точку.
Спящий лев09.08.20 08:38
> Аяврик
2 Спящий лев

-- При отсутствии навыков пользования золото и банкноты это тоже ничего не стоящий и только мешающий мусор.

впервые в жизни встречаю такую ... констатацию....

8-О
Нет. Просто прокомментировал статью автора-любителя используя его терминологию и на уровне автора статьи. Причем для автора статьи банкноты - смысл жизни (а вовсе не средство достижения).
Он предлагает России (полностью) отказаться от обработки данных (а также от мер по оптимизации программ, в пользу повышения ресурсоемкости "железа").
А в странах конкурентах (КНР, США) наоборот предлагают улучшить настройку сортировки и переработки данных, а также снижать нагрузку на "железо" за счет оптимизации ПАК.
English
Архив
Форум

 Наши публикациивсе статьи rss

» Памяти Фывы
» Признаки современного гностицизма для чайников
» От каждого по способностям, каждому – не по труду©Карл Маркс. Критика Готской программы – Цитата
» Читая Фёгелина. Движение отношения мысли к истине в истории – истина и трансцедентное (часть 2)
» Читая Фёгелина. Движение отношения мысли к истине в истории – истина и трансцедентное (часть 1)
» Образ будущего – Утопия XXI века
» Об универсальных ценностях в политике и политических науках II (окончание)
» Об универсальных ценностях в политике и политических науках
» С Днем Победы!

 Новостивсе статьи rss

» У ХАМАС есть несколько дней, чтобы согласиться на сделку, заявил Рубио
» Индия перешла красную черту, подключившись к учениям «Запад-2025» — The Times
» В России объединятся два крупнейших дипломатических вуза — Лавров одобрил
» США пока не могут отказаться от обогащенного урана из России, сообщил Райт
» Зеленский поставил Трампу новое условие
» Комиссия ООН признала действия Израиля в секторе Газа геноцидом
» Огромная угроза Гданьску: в порту заложены «бомбы замедленного действия»
» С момента присяги Милея из ВС Аргентины уволилось почти 19 тысяч военных

 Репортаживсе статьи rss

» "Новый законопроект изменит саму культуру правосудия". Профессор Гасан Мирзоев - об изменениях в работе адвокатов
» Ирак является одним из ключевых партнеров России в арабском мире и на международной арене
» Демонстрация с силой: какое оружие показали на выставке DSEI-2025
» "Нас воспринимали как преступников". Южнокорейские рабочие вернулись домой после задержания в США
» Регионы юга РФ приступают к массовому севу озимых в условиях засухи и возросших затрат. Обзор
» Антон Алиханов: Россия планирует расширять экспорт вертолетов
» Опубликованы документы о японских планах массовых казней в Маньчжурии
» Стратостат вместо "Старлинка": в России создают альтернативный вариант связи

 Комментариивсе статьи rss

» SZ: немецкий автопром столкнулся с огромной конкуренцией со стороны Китая
» В США убит американский Данила Багров
» Ближний Восток в ожидании: грядёт вторая фаза войны Израиля против Ирана
» Почему Россия и ОПЕК+ продолжают увеличивать предложение нефти на рынке
» Остров с сокровищами: США продолжают экспансию в Гренландии
» Трампу назло: ЕС решил укрепить сотрудничество с Индией
» Федор Лукьянов: Идея "не против Запада, но без него" обретает смысл и перспективу
» Наши «пропавшие» АПЛ, самолеты «судного дня» E-6B ВС США, и при чем тут Венесуэла?

 Аналитикавсе статьи rss

» Украинский конфликт: почему Россия и США хотят положить ему конец, а Европа — нет?
» Перевозки в портах ДФО отражают системные процессы перестройки мировой логистики
» Оборона: десять крупнейших оружейных концернов мира
» Решительный арсенал: что представляют собой ядерные силы Китая
» Хороший враг дороже союзника
» Инфраструктура Германии это: разрушенная железная дорога, школы, мосты
» России предрекли сокращение добычи газа
» Меркантильная борьба с украинским православием как архетип украинства
 
мобильная версия Сайт основан Натальей Лаваль в 2006 году © 2006-2024 Inca Group "War and Peace"