Что ж, формула для объектива или системы объективов (считайте объектив камеры внутри камеры или в вашем случае объектив Kinect) будет
1 / f = 1 / Источник + 1 / Размер
где f - фокусное расстояние
Dsource - расстояние от источника до объектива.
DImage - это расстояние изображения от объектива
Теперь у каждого объектива камеры есть несколько объективов, чтобы они могли фокусироваться и выводить изображение (значение Dimage) на сенсор. Таким образом, когда у вас четкое изображение, датчик находится в фокальной плоскости, а расстояние между датчиком и его ближайшим объективом - это фокусное расстояние ближайшего объектива. Просто помните, что ключ здесь - это четкое изображение.
Это теория. Теперь, если вы работаете с Kinect и вам нужны 3-мерные характеристики изображения, видимого Kinect, то я считаю, что вы должны вызвать соответствующий API для него. Причина в том, что Kinect может видеть глубину и рассчитывает все время.
Я обновлю этот пост ссылкой на API, которую можно использовать, как только я ее получу, но в то же время это даст вам возможность начать поиск.
Кроме того, эта ссылка https://www.youtube.com/watch?v=1YIvvXxsR5Y очень хорошо объясняет фокальную плоскость и фокусное расстояние, начиная примерно с 8 мин.