Оцінка Tensorflow Lite Posenet або Pose - це завдання використання моделі ML для оцінки пози людини за зображенням чи відеозаписом шляхом оцінки просторового розташування ключових суглобів тіла (ключових точок).
Оцінка пози стосується технік комп’ютерного зору, які виявляють людські фігури на зображеннях та відео, щоб можна було визначити, наприклад, де чийсь лікоть відображається на зображенні. Важливо знати той факт, що оцінка пози просто оцінює, де знаходяться ключові суглоби тіла, і не розпізнає, хто є на зображенні чи відео.
Модель PoseNet приймає оброблене зображення камери як вхідне та виводить інформацію про ключові точки. Виявлені ключові точки індексуються ідентифікатором деталі з оцінкою достовірності від 0,0 до 1,0. Оцінка достовірності вказує на ймовірність існування ключової точки в цій позиції.
Тести ефективності
Продуктивність залежить від вашого пристрою та вихідного кроку (теплові карти та вектори зсуву). Модель PoseNet відрізняється розміром зображення, що означає, що вона може передбачати пози пози в тому ж масштабі, що і вихідне зображення, незалежно від того, чи зображення зменшено. Це означає, що ви налаштовуєте модель на більш високу точність за рахунок продуктивності.
Вихідний крок визначає, наскільки вихідний показник зменшується відносно розміру вхідного зображення. Це впливає на розмір шарів та вихідні дані моделі.
Чим вище вихідний крок, тим менша роздільна здатність шарів у мережі та вихідних даних, а відповідно їх точність. У цій реалізації вихідний крок може мати значення 8, 16 або 32. Іншими словами, вихідний крок 32 призведе до найшвидшої продуктивності, але найнижчої точності, тоді як 8 призведе до найвищої точності, але найменшої продуктивності. Рекомендоване початкове значення - 16.