IBM составила набор DiF для машинного обучения

02.02.2019

Распознавание лица получило широкое применение в разнообразных приложениях — от разблокирования экрана телефона до оценки эмоционального состояния и склонности к правонарушениям. Но даже лучшие из таких систем могут не справляться с простыми тестами, сталкиваясь с необычным оттенком кожи или возрастными особенностями, недостаточно представленными в тренировочном наборе данных.

Чтобы распознавание лица работало должным образом, тренировочные изображения должны обеспечивать достаточный баланс и охват. Наборы обучающих данных должны быть составлены таким образом, чтобы давать максимально полное представление о разнообразии вариаций лиц в окружающем мире.

Решить эту задачу постаралась компания IBM с набором Diversity in Faces (DiF). Основой для него послужила гигантская коллекция Flickr Creative Commons, содержащая 100 млн. изображений.

Первоначальную выборку делала система искусственного интеллекта, изолировавшая и вырезавшая все обнаруженные на снимках лица. Полученный массив был пропущен через другие обучаемые алгоритмы, отвечавшие за разнообразие представленных лиц и их описание.

Финальный DiF включает млн. лиц, каждое из которых сопровождается метаданными, описывающими такие характеристики, как расстояние между глазами, размер лба и прочее. Все эти показатели вместе, а также корреляции между ними создают «отпечаток лица», который система будет использовать, например, при сравнении двух изображений одного и того же человека.

Интересно, что для обозначения пола изображенного человека, IBM использует не двоичное число, а диапазон значений от 0 до 1. Как пол, так и возраст оценивался не только автоматически, но и с учетом субъективного мнения людей, которых просили пометить лица мужчин или женщин и предположить сколько им может быть лет.

Как указал Джон Смит (John R. Smith), руководивший работами по составлению набора DiF, даже млн. лиц не гарантирует того, что в этом массиве адекватно представлены все группы и подмножества. Это лишь конечная цель, к которой команда IBM намерена продвигаться через последующие итерации этой первой версии DiF, сообщает ko.com.ua.

Предыдущая статья

Huawei подтвердила анонс складного смартфона с поддержкой 5G на MWC 2019

Следующая статья

Илон Маск подарил миру все патенты Tesla

НОВОСТИ ПО ТЕМЕ

Пн	Вт	Ср	Чт	Пт	Сб	Вс
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28

IBM составила набор DiF для машинного обучения

LG şirkəti Red Dot Design Award 2026-da 27 mükafat qazandı

Mobil prosessor tədarüklərinin qlobal reytinqi yeniləndi

Samsung ağıllı ev üçün yeni AI cihazı Project Luna-nı göstərdi

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС

IBM составила набор DiF для машинного обучения

LG şirkəti Red Dot Design Award 2026-da 27 mükafat qazandı

Mobil prosessor tədarüklərinin qlobal reytinqi yeniləndi

Samsung ağıllı ev üçün yeni AI cihazı Project Luna-nı göstərdi

СОЦИАЛЬНЫЕ СЕТИ

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС