Статьи по теме computer-vision

Публикации по теме 'computer-vision'

Улучшение здоровья и безопасности в промышленных средах с помощью встроенного машинного обучения

Голова, безусловно, самый сложный орган в человеческом теле, но и самый нежный. Оценка и предотвращение рисков на рабочем месте остается первоочередным подходом к предотвращению несчастных случаев или снижению количества серьезных травм головы. Вот почему ношение каски в промышленной рабочей среде часто требуется по закону и помогает избежать серьезных несчастных случаев. В этой статье вы найдете обзор того, как определить, что все работники уважают ношение шлема с помощью модели..

Введение в Vision Transformers для понимания документов

Здесь, в Unstructured , мы используем передовые методы понимания документов, чтобы помочь специалистам по данным извлекать ключевую информацию из PDF-файлов, изображений и документов Word. Цель этой записи в блоге — предоставить обзор моделей понимания документов, лежащих в основе нашей базовой библиотеки с открытым исходным кодом. Алгоритмы понимания документов анализируют содержимое документов с помощью конвейера кодировщика-декодера, который сочетает в себе методы компьютерного..

Обнаружение объектов с помощью Amazon SageMaker | Облако AWS| Услуги машинного обучения | Душьянт Сингх |…

Обнаружение объектов с помощью сервиса машинного обучения Amazon Sagemaker. Вступление: В этой статье мы увидим, как мы можем создать наш проект обнаружения лиц и глаз для обнаружения объектов, используя библиотеку OpenCV для машинного обучения AWS и сервис Sagemaker. Вы можете разрабатывать, обучать, тестировать и развертывать проекты любого размера, не беспокоясь о вычислениях, хранении и безопасности. Предварительно: 1- Доступ к консоли Aws, 2- Библиотека OpenCV haarcascade..

Простое руководство по пользовательским преобразованиям PyTorch

Легко добавляйте пользовательские функции в конвейер преобразований PyTorch. Проблема Torchvision имеет много общих преобразований изображений в модуле torchvision.transforms. Стандартный способ использования этих преобразований — в сочетании с torchvision.transforms.Compose, который позволяет последовательно складывать несколько преобразований. Например: from torchvision import transforms training_data_transformations = transforms.Compose( [..

Анонс FiftyOne 0.17 с сгруппированными наборами данных, 3D, геолокацией и пользовательскими плагинами

Voxel51 совместно с сообществом FiftyOne рады объявить о выпуске FiftyOne 0.17! Подождите, что такое FiftyOne? FiftyOne — это набор инструментов машинного обучения с открытым исходным кодом, который позволяет группам специалистов по обработке и анализу данных повышать производительность своих моделей компьютерного зрения, помогая им выбирать высококачественные наборы данных, оценивать модели, находить ошибки, визуализировать встраивания и быстрее приступать к работе. Если вам..

Топ-5 приложений ИИ в медиаиндустрии

Пять лучших приложений ИИ в медиаиндустрии Мелани Джонсон В последнее время медиаиндустрия наблюдает беспрецедентный рост приложений ИИ. К 2027 году… www.wowza.com

Разделимая по глубине свертка — В Caffe Framework ?

Свертка с глубоким разделением — в Caffe Framework? Команда Google AI разработала архитектуру MobileNet CNN, которая обеспечивает высокую точность и имеет меньшее количество MAC-адресов по сравнению с известной архитектурой, такой как VGG Net и т. д. Ключевой идеей MobileNet было использование глубинной свертки на входном слое, а затем использование точечной свертки 1x1. Этот метод обеспечивает те же выходные размеры, что и обычный уровень свертки, но с меньшим количеством параметров и..