Jump to content

Эксперты по компьютерному зрению закрывают проекты из-за нехватки обучающих данных


security147

Recommended Posts

Эксперты по компьютерному зрению закрывают проекты из-за нехватки обучающих данных

09:24 / 27 Декабря, 2021 2021-12-27T10:24:35+03:00

Alexander Antipov

Решением проблемы может стать переход на использование синтетических данных.

https://www.securitylab.ru/upload/iblock/758/7580ddbb6d54d3677047b873467df421.png

Согласно новому исследованию компании Datagen, 99% команд специалистов в области компьютерного зрения столкнулись с необходимостью закрыть проекты с использованием машинного обучения из-за недостатка данных для обучения своих моделей. Более того, по той же причине все (100%) участники исследования были вынуждены отложить проекты.

Как выяснили исследователи, проблемы с обучающими данными носят самый разный характер и затрагивают команды специалистов в равной степени. Самыми главными проблемами являются недостаточная аннотация (48%), несоответствующий охват предметной области (47%) и дефицит данных (44%).

Нехватка надежных данных для обучения в конкретной предметной области усугубляется тем фактом, что в сфере компьютерного зрения не хватает четко определенных стандартов и передовых практик.

На вопрос о том, как собираются обучающие данные в их организациях, респонденты представили целую «сборную солянку» из различных источников и методологий. Синтетические или настоящие, собранные внутри организации или полученные из публичных наборов данные – как оказалось, для обучения моделей компьютерного зрения организации используют абсолютно все данные, независимо от их происхождения.

Тем не менее, команды специалистов в области компьютерного зрения, похоже, нашли решение проблемы в виде синтетических данных. 96% опрошенных уже используют синтетические данные для обучения своих моделей искусственного интеллекта. Однако качество, источник и доля используемых синтетических данных по-прежнему сильно различаются в зависимости от области, и только 6% команд в настоящее время используют исключительно синтетические данные.

Повсеместный переход на использование синтетических данных соответствует количеству новых прогнозов о том, что 2022 год станет прорывом для синтетических данных.

В online-опросе Datagen приняли участие 300 специалистов в области компьютерного зрения, представляющих 300 отдельных предприятий.


В нашем телеграм канале мы рассказываем о главных новостях из мира IT, актуальных угрозах и событиях, которые оказывают влияние на обороноспособность стран, бизнес глобальных корпораций и безопасность пользователей по всему миру. Узнай первым как выжить в цифровом кошмаре!

Adblock test (Why?)

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...