Как легко разделить фотографии, скриншоты и ненужные изображения? - Фотопедия
0 голосов
/ 10 апреля 2019

У меня +120.000 изображений, скопированных из множества резервных копий телефонов и компьютеров.

В этом стеке у меня есть реальные фотографии и скриншоты, которые я хочу сохранить, а также количество «нежелательных изображений» (почти половина всех изображений), как правило, небольших размеров, таких как значки, логотипы, внутренние программные растровые изображения , сетки, рекламные баннеры, некачественные мемы и т. д.

Существует ли программное обеспечение, способное распознавать эти "ненужные" изображения и перемещать их в другую папку, чтобы просмотреть их перед удалением?

(это предварительный шаг перед обработкой дублированных изображений, неудачных, повторной сортировкой остальных ...)

Ответы [ 3 ]

4 голосов
/ 11 апреля 2019

Поскольку вы уже заявляете, что будете проходить снимки как минимум в два прохода, я не буду слишком сильно беспокоиться о ложных срабатываниях, поскольку вы, вероятно, поймаете их позже.

небольших размеров, таких как значки, логотипы, внутренние программные растровые изображения, сетки, рекламные баннеры, мемы низкого качества и т. Д.

Вы можете использовать ExifTool для перемещения файлов. Вы сами решаете, что считать нежелательной, а затем создаете соответствующую команду, чтобы выбросить их в папки.

Лично я бы сначала переместил файлы по расширению. Затем выполните сортировку по дате и камере, поскольку изображения с одной и той же камеры и даты могут быть связаны. Тогда я бы подумал о сортировке того, что осталось по размеру изображения, но отложил это на потом, потому что сейчас я не могу вспомнить команду.

  • Расширение файла

    # Move files based on extension
    exiftool -Directory=delete -ext ico -ext gif -ext bmp -ext svg .
    
    # Easier to use native commands.
    # Following is for Linux or Mac OS.
    mkdir delete
    mv ./*.ico ./*.gif ./*.bmp ./*.svg delete/
    
  • Exif data

    # Move images that were taken with a digital camera
    exiftool -if '$model' -Directory=keep .
    
    # Can give particular cameras their own folders
    exiftool '-Directory<${Make;} ${Model;}' .
    
    # Can put images into folders based on date taken
    exiftool -d '%Y%m%d' '-Directory<${DateTimeOriginal}' .
    
    # Or both date and camera...
    exiftool -d '%Y%m%d' '-Directory<${DateTimeOriginal} - ${Make;} ${Model;}' .
    
  • Имя файла - Файлы с одинаковыми именами могут быть связаны. Например, document_page_1.tif, document_page_2.tif и т. Д.

    # I don't know the relevant command.
    # I would need to look it up.
    # An ExifTool master is invited edit...
    
  • Разрешение - Снимки экрана, как правило, имеют стандартные размеры. Вы должны учитывать историю использования компьютера, чтобы определить наиболее подходящие размеры экрана.

    # dump images into folders based on image dimensions
    exiftool '-Directory<$ImageSize' .
    

Примечание. Использование кавычек в Windows будет немного другим. Вместо одинарных кавычек, переключитесь на двойные кавычки. Также могут быть другие различия при запуске ExifTool в Windows.

2 голосов
/ 10 апреля 2019

Вообще говоря: Нет. Никакое программное обеспечение не может знать, что вы считаете или не считаете ненужным. Является ли каждая растровая графика размером ниже 128х128 пикселей? Если так, то как насчет 129x129 пикселей? Каждый PNG мусор? Каждое изображение с> 50% площади пикселя в белом мусоре? Нужно ли сбрасывать каждую фотографию, на которой нет человеческого лица?

Вы можете найти решения для всех этих проблем, но все они могут содержать ложные срабатывания, так как ни один из вышеперечисленных критериев не связан с «ненужными» изображениями. Даже я, как человек, не могу знать, что вы бы назвали «мусором» - я, безусловно, могу выучить это (либо задавая вам несколько раз, либо создав ментальный фильтр, например, с помощью упомянутых мной вопросов), но, опять же, если нет абсолютное различие (например, «весь мусор и только мусор - это PNG» или что-то в этом роде), у меня могут быть некоторые ложные срабатывания.


Вы можете отфильтровать его волнообразно: сначала отфильтруйте ниже определенного размера, который в любом случае будет бесполезным. Но после этого ... мне нужно было бы просмотреть всю коллекцию, чтобы знать, что будет дальше.

0 голосов
/ 10 апреля 2019

Вы вряд ли найдете жизнеспособное "однопроходное" решение такой проблемы, и решение будет зависеть от того, с чем именно вам придется иметь дело в коллекции.

Сколько внимания и внимания вы уделите этому процессу, будет зависеть от того, насколько критически могут быть ошибочно выбранные изображения.

  • Если на самом деле не имеет значения, если некоторые упадут, тогда вы можете двигаться быстрее и с меньшей осторожностью.
  • Если вы подозреваете, что могут быть посторонние изображения, которые важны, то вам нужно внимательно просматривать изображения, на которые влияют на каждом этапе.

Поэтапный отбор изображений, вероятно, является лучшим вариантом при использовании ряда инструментов.

Самым простым шагом может быть выявление файлов очень малого размера. Сортируйте содержимое папки по размеру файла, а затем перетащите все ниже этого порога в папку «cull-folder».

Вы можете повторить подобные отборы в зависимости от типа файла.

После этого вы можете придумать какой-нибудь сценарий или автоматизацию, если вы все еще можете обнаружить «очевидные» сбои, например, изображения без текста. [Однако программирование и настройка таких сценариев выходит за рамки этого Stack Exchange. Но инструменты распознавания изображений с открытым исходным кодом, написанные на Python, являются потенциальными вариантами изучения.]

После того, как вы исчерпали вышеперечисленные варианты, вы приступите к тщательной отбраковке, глядя на каждое изображение и говоря «да» или «нет» ему.

Для этого этапа я бы предложил такой инструмент, как Lightroom:

  • Настройте его на автоматическое продвижение после оценки
  • Импорт раздела изображений в коллекцию
  • Для каждого либо нажмите X, чтобы отклонить, либо назначьте флаг / оценку
  • Когда закончите, используйте его инструменты для фильтрации и перемещения изображений в нужное место.

[Такие варианты, как обучение ИИ, могут оказаться жизнеспособными в рамках этапа написания сценариев, прежде чем прибегнуть к чему-то вроде Lightroom, но потребуется время и вычислительная мощность, чтобы это осуществить.]

Добро пожаловать на сайт Фотопедия, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...