¿Cómo funciona la detección de profundidad en una cámara o teléfono inteligente?

En primer lugar, permítanme comenzar diciendo que el HTC One y el Lytro son tecnologías completamente diferentes.

Tecnología detrás de HTC One
Una cosa obvia es la presencia de dos cámaras. HTC dice que, aparte de la cámara principal, la otra de calidad inferior es para la “percepción de profundidad”.

Aunque no han declarado oficialmente cómo esta cámara puede trabajar hacia la percepción de profundidad, probablemente lo haga al obtener información de profundidad de imágenes estéreo. Lo que sí hace es usar la disparidad de imágenes de las dos cámaras, es decir, qué tan lejos está un objeto.

¿Cómo percibir la profundidad de dos imágenes?


Imagínese si toma dos imágenes, ligeramente compensadas entre sí como en el diagrama anterior, habrá un desplazamiento de píxeles de las imágenes de los objetos en particular en función de qué tan lejos están de la cámara. Debido al desplazamiento lateral, los objetos cercanos se desplazarán mucho en las dos imágenes, mientras que los objetos muy lejanos tendrán una posición completamente idéntica.

Según la disparidad de píxeles de las dos imágenes, se puede calcular el mapa de profundidad de toda la escena. El HTC One probablemente hace esto con las dos cámaras y almacena la información. Una vez que tenga esta información, puede usar el desenfoque selectivo como lo hace Instagram para hacer que su imagen parezca que ha sido tomada por una lente de bajo número f.

¿Cómo funciona Lytro?

Lytro es un hardware innovador de alta resistencia y es algo llamado una “Cámara LightField”. Es diferente de una cámara normal, no solo es la forma en que captura la intensidad de la imagen en el CCD, sino que también captura las direcciones de los vectores de luz que golpean el CCD. Una vez que conoce las direcciones de los vectores de luz, puede rastrear el origen de los rayos de luz individuales y, utilizando un poco de procesamiento de imágenes, se crea un campo artificial de poca profundidad.


¿Por qué no puedo tener la tecnología Lytro en mi teléfono?

Aunque Lytro parece engañosamente simple, hay una capa de matrices de microlentes sobre el sensor CCD. La matriz de microlentes es la responsable de detectar los vectores de luz.


Las microlentes deben ser tan pequeñas que debería haber una sobre cada píxel. Las matrices CCD de teléfonos inteligentes son mucho más pequeñas que el CCD Lytro. En este punto, es posible que las Microlentes de alto rendimiento no se puedan hacer tan pequeñas para ser compatibles con los pequeños sensores CCD de los teléfonos inteligentes, por lo que se deben utilizar métodos alternativos como el HTC One.

La mayoría de las cámaras detectan el enfoque, no la profundidad. Las cámaras modernas enfocan usando contraste, ya sea fuera del sensor, detección de fase (contraste vertical) o detección de fase de punto de cruce (tanto vertical como horizontal. La detección de fase en cualquier forma es frecuente en las cámaras dSLR donde la imagen se envía a un sistema de enfoque separado. prevalece en las cámaras de video y otros sistemas de cámara que ven la imagen desde el sensor en lugar de usar un visor óptico. Algunas cámaras dSLR avanzadas usan detección de fase y contraste, lo que permite un enfoque continuo en modo de video o cuando el obturador está abierto.

La detección de fase es actualmente superior (más rápida y precisa) a la detección de contraste. La detección de fase detecta si un objeto está enfocado o no, y también si el objeto está más cerca o más alejado del foco de la lente actual. Los métodos de contraste del sensor pueden determinar si un objeto está enfocado o no, pero no la dirección. Por lo tanto, es necesario que la cámara cambie la configuración del objetivo y luego determine si el contraste mejora o empeora. El muestreo continúa hasta que se logra el enfoque.

La profundidad se establece a través de la abertura en el diafragma de la lente (la abertura). Las aberturas grandes permiten que la luz se difunda a través de la lente, por lo que la profundidad de campo es poco profunda. Una abertura pequeña permite una luz menos dispersa, por lo que la profundidad de campo es profunda. Con aberturas muy pequeñas no se requiere lente (como en una cámara estenopeica).

Las cámaras del telémetro se enfocan manualmente. Se presenta una ayuda óptica en forma de imagen dividida para permitir una mayor precisión de enfoque. Todas las cámaras SLR más antiguas tenían ayudas ópticas similares cuando el enfoque era manual. Estos han sido abandonados desde que los sistemas de FA se volvieron frecuentes.

Como otros han mencionado, la cámara Lytro no tiene un plano focal tradicional, por lo que todos los rangos de enfoque se capturan simultáneamente y luego se separan para su uso a través del software.

El M8 es simple … funciona como una cámara de telémetro. En el pasado, antes de que las cámaras réflex se hicieran populares en la década de 1960, las cámaras acababan de filmar, con solo un simple visor. En la década de 1930, Leica introdujo las primeras cámaras compactas orientadas a profesionales, utilizando películas de película de 35 mm en lugar de 120 o una película de rollo similar. Al ser una cámara pequeña de mano, los usuarios tenían menos tiempo para meterse con el enfoque y todo, y comenzar a incluir dispositivos de detección de alcance, como los utilizados en mapeo y topografía, en la cámara. Muy pronto, estos se integraron en la cámara.

Un telémetro funciona a través de la idea de paralaje: la misma imagen vista desde dos puntos diferentes se verá diferente, y esas diferencias se pueden analizar para conocer la tercera dimensión. Una cámara de telémetro utilizaba un divisor de haz para alinear las imágenes de ambos visores … ambas imágenes superpuestas en su vista, y el foco de la lente se acopló a este mecanismo (Leica realmente tenía una patente crítica sobre esto), de modo que el foco estaba calibrado contra el telémetro. Durante décadas, las cámaras de telémetro se consideraron más precisas en el enfoque que las cámaras réflex o las cámaras de visión.

Entonces, el M8 hace esto, aunque sin una gran precisión (la distancia entre los dos visores o sensores afecta la precisión del rango), pero con la ventaja del procesamiento moderno de señales digitales. Entonces, ambas imágenes llegaron a un programa de computadora que compara la vista de la cámara secundaria con la de la primaria, y puede juzgar la distancia.

Piense en esto … también popular hoy en día, las cámaras de video 3D. Si HTC hubiera puesto una segunda cámara combinada junto a la primera, horizontalmente en lugar de verticalmente, podrían haber entregado video en 3D como algunas de las cámaras 3D de consumo. “3D”, por supuesto, significa estereoscópico … ves una representación de 3 espacios, pero precisa con solo un punto de vista (el 3D verdadero se movería contigo).

Lytro es completamente diferente, es lo que ellos llaman un campo de luz o una cámara pleóptica. Las cámaras normales graban píxeles … un píxel es un único punto de luz, que tendrá un valor de amplitud para cualquier punto. Las cámaras plenopticas enfocan su imagen en una variedad de microlentes, cada una de las cuales cubrirá solo un pequeño número de píxeles en un sensor. Esto se puede utilizar para registrar no solo la amplitud, sino también la información del vector en el punto focal, la dirección de los bits de luz individuales. Esto se puede usar para calcular la imagen de cosas que no estaban enfocadas en el plano focal … y así cambiar el enfoque después de la toma, que es lo más importante que vende Lytro.

En primer lugar, diré que en comparación con casi cualquier otra cámara, Lytro es un equipo radicalmente diferente.

En general, la mayoría de las cámaras de alta gama utilizan una combinación de técnicas para determinar la distancia desde el sensor hasta el sujeto. Las cámaras de teléfonos inteligentes en su mayor parte utilizan una técnica conocida como enfoque de contraste. Esto altera la distancia focal de la lente hasta que se elimina un contraste máximo entre las diferentes áreas de brillo del sensor. La distancia a la que se enfoca la lente es la distancia del sujeto al sensor.

More Interesting

¿Debo construir una solución de software para los gobiernos antes de obtener una carta de intención o después?

¿Cómo pueden las organizaciones fomentar la innovación?

¿Por qué la mayoría de las organizaciones industriales de I + D no logran innovar?

¿Hay alguna evidencia para apoyar la innovación de Jan Sloot?

Si una persona promedio del siglo XXI viajara a la era anterior a la invención del fuego, ¿qué descubrimientos / inventos podría haber hecho?

¿Cuáles son algunas ideas innovadoras para los zapatos de rastreo GPS?

¿Cómo hicieron los chinos un progreso fenomenal en la tecnología de la aviación? ¿Serán capaces de superar la superioridad tecnológica de Estados Unidos en un futuro próximo?

¿La revisión por pares aplasta la innovación novedosa?

¿Por qué las facultades de medicina en la India no tienen muchos innovadores, ya que están en IIT y IISC?

¿Por qué no vemos muchos emprendedores o las ideas innovadoras que surgen de la India, aunque tiene una inmensa cantidad de talento?

¿Cuáles son algunas ideas innovadoras / formas en que podemos lograr una India desarrollada?

¿Cuáles son algunas soluciones innovadoras para el problema actual que están teniendo los Juegos Olímpicos?

¿Por qué no hay programas de televisión enfocados en el emprendimiento y la innovación en la India (como Dragon's den & Shark tank)?

¿Con qué frecuencia las empresas tienen una estrategia de diseño?

¿Cuáles son los inventos de ingeniería recientes?