Прежде всего, чтобы помочь в поиске дополнительной информации, то, на что вы ссылаетесь, называется Фотограмметрия .
По одному изображению вы не можете [достоверно] измерить что-либо - невозможно определить, смотрите ли вы на фотографию фотографии (т. Е. На плоский объект, находящийся очень близко к камере).
Из 2 или более изображений вы можете восстановить некоторые или все измерения с определенной точностью (за исключением некоторых редких случаев), при условии, что у вас есть информация о соответствии , т.е. вы знаете, какие части первого изображения соответствуют к тем же частям на последующих изображениях. Требуется минимум 7 различных пунктов, 8 или более настоятельно рекомендуется.
Существуют алгоритмы для оценки соответствия, и при наличии достаточного количества изображений, которые содержат сильные отличительные признаки, результаты могут быть достаточно точными. Для получения абсолютных (в отличие от относительных) измерений камера должна быть откалибрована. Есть много способов сделать это, самый простой из которых - стрелять в калибровочную мишень известного размера.
Так как программирование вас устраивает, существуют различные фрагменты кода, которые реализуют эти методы (а также проприетарные продукты с SDK) для поиска базовой линии стерео или структуры из движения .
Наконец, если вы знаете расстояние до объекта, вы можете получить оценки размера с помощью тригонометрии (при условии, что вы знаете фокусное расстояние), см. Этот вопрос для получения более подробной информации: Как рассчитать расстояние до объекта на фото?