Я успешно делал что-то подобное в прошлом по совершенно другой причине.Вероятно, вам понадобится кто-то, кто сможет написать код, чтобы упаковать и перебрать ваш накопитель, но я выбрал следующий подход:
Преобразование всех изображений в небольшие размеры, например 800x600 или даже несколько меньше.
Преобразование небольших изображений в черно-белое с низким динамическим диапазоном: 4, 2 или даже 1 бит на пиксель.
Я использовал «ImageMagick», чтобы выполнить вышеизложенное, но инструмент не имеет значения.
Теперь запустите Fuzzy Hash для всех изображений.
Я использовал «ssdeep» и «deeptoad» для получения результатов матчей.
Концепция заключается в том, что, сначала конвертируя все изображения в небольшие варианты низкого качества, вы устраняете незначительные измененияВы не хотите быть факторами.Меньший размер также существенно снижает нагрузку на обработку нечеткого хеширования.
Оценка нечеткого хеширования пытается оценить степени соответствия.
Возможно, вам придется поиграть с параметрами, чтобы найти подходящие для вас параметры.
Обратите внимание, что в руководстве пользователя "ssdeep" приведен пример сравнения сегментов видео со ссылками на видео.Это может быть ближе к тому, что вы хотите, но я не уверен.
Удачи!