Una cámara inteligente impulsada por IA logra imágenes que preservan la privacidad al registrar solo objetos de interés mientras no ve a los demás

Las cámaras digitales se han incorporado ampliamente a nuestra sociedad durante los últimos diez años. Ahora se emplean ampliamente en reconocimiento facial, teléfonos móviles, vigilancia de seguridad y automóviles sin conductor. Sin embargo, las enormes cantidades de datos visuales producidos a través de estas fotos generan una creciente preocupación con respecto a la protección de la privacidad. Algunos enfoques existentes abordan estas preocupaciones mediante el uso de técnicas para ocultar información confidencial de las fotos obtenidas, como el desenfoque o el cifrado de imágenes. Sin embargo, dado que las fotografías sin procesar ya se toman antes del procesamiento digital para ocultar o cifrar información confidencial, estas soluciones aún corren el riesgo de exponer datos confidenciales. Además, estos métodos utilizan más energía cuando se calculan. Otros intentos de resolver este problema incluyen el uso de cámaras especializadas para reducir la calidad de la imagen y enmascarar información personal identificable. Sin embargo, estos métodos pierden la calidad de imagen general de todos los objetos interesantes, lo cual no es deseable, y todavía están abiertos a ataques viciosos para recuperar los datos confidenciales registrados.

Un equipo de investigación de UCLA facilitó el desarrollo de un tipo de generador de imágenes fundamentalmente nuevo creado por IA. Su trabajo sobre un paradigma novedoso para imágenes que preservan la privacidad también se destacó en un artículo reciente publicado en eLight. Este diseño de cámara inteligente captura solo los elementos necesarios mientras elimina instantáneamente los tipos de objetos no deseados de las fotos sin necesidad de procesamiento digital. El diseño comprende una serie de superficies transmisivas, cada una compuesta por decenas de miles de patrones de difracción a escala de longitud de onda. El aprendizaje profundo se utiliza para modificar la fase de los haces ópticos transmitidos en estas superficies transmisivas, lo que permite que la cámara solo capture clases específicas de objetos deseados mientras borra el resto. Después del entrenamiento, las capas se producen y combinan en tres dimensiones para crear la cámara inteligente. Cuando los elementos de entrada de las clases de objetos de destino se encuentran frente a él después de que se haya ensamblado, crean fotos de alta calidad en la salida de la cámara. Otros objetos que pertenecen a clases no deseadas se borran ópticamente, lo que da como resultado la formación de patrones no informativos y de baja intensidad que se asemejan al ruido aleatorio.

Esta cámara diseñada por IA nunca captura imágenes directas de clases de objetos indeseables, ya que sus características se eliminan en la salida de la cámara debido a la difracción de la luz. Como resultado, la privacidad está protegida en la mayor medida posible, e incluso si un ataque malicioso obtiene acceso a las fotos grabadas de la cámara, nunca podrá recuperar los datos. Dado que las fotografías no deseadas no se graban, esta función reduce la carga de almacenamiento y transmisión de datos de las cámaras. Con fines de demostración experimental, el equipo de estudio de la UCLA diseñó esta cámara especial de datos específicos para obtener una imagen específica y selectiva de una sola clase de números escritos a mano. Esto fue hecho a través de la impresión 3D. Se utilizaron ondas de terahercios para probar esta cámara impresa en 3D iluminando números garabateados. La cámara inteligente fue efectiva al generar imágenes selectivas de los elementos de entrada para un cierto número mientras eliminaba instantáneamente todos los demás dígitos de escritura de la salida, produciendo características similares a ruido de baja intensidad. Esto se logró adhiriéndose a los principios fundamentales de diseño del dispositivo. Al elegir fotografiar un tipo de artículos de moda y omitir otras categorías de la salida, los investigadores también exhibieron otra variación del mismo sistema de cámara específico de clase. El diseño de la cámara también se probó en escenarios de iluminación desafiantes que no formaban parte de su entrenamiento. Los resultados demostraron cuán resistente es esta cámara inteligente a los cambios de iluminación.

Fuente: https://elight.springeropen.com/track/pdf/10.1186/s43593-022-00021-3.pdf

Esta cámara basada en IA también se puede usar para crear cámaras de encriptación, lo que agrega una capa adicional de seguridad y protección de la privacidad además de las imágenes específicas de la clase de datos. Dicha cámara optimiza una transformación lineal elegida para los objetos objetivo de interés gracias al uso de capas de difracción optimizadas por IA en su construcción. La imagen original de los objetos de destino solo puede ser recuperada por personas con acceso a la clave de descifrado. Por otro lado, el conocimiento de las otras cosas no deseadas se destruye permanentemente porque la cámara diseñada por IA las borra ópticamente en la salida. Como resultado, otros objetos no deseados solo producirán características no identificables similares a ruidos cuando se aplique la clave de descifrado a las fotos capturadas. Esta cámara inteligente funciona a la velocidad de la luz y no requiere ninguna fuente de alimentación externa para su procesamiento, excepto la luz que la ilumina. Como resultado, es rápido, eficiente en cuanto a datos y energía, lo que lo hace ideal para aplicaciones de imágenes específicas de tareas, preocupadas por la privacidad y limitadas en términos de energía. Los futuros sistemas de imágenes que utilizan órdenes de magnitud menores de potencia informática y de transmisión de datos pueden inspirarse en las ideas fundamentales de este diseño de cámara difractiva.

This Article is written as a research summary article by Marktechpost Staff based on the research paper 'To image, or not to image: class-specifc difractive cameras with all-optical erasure of undesired objects'. All Credit For This Research Goes To Researchers on This Project. Check out the paper and reference article 1 and article 2.

Please Don't Forget To Join Our ML Subreddit


Khushboo Gupta es pasante de consultoría en MarktechPost. Actualmente está cursando su B.Tech en el Instituto Indio de Tecnología (IIT), Goa. Le apasionan los campos del aprendizaje automático, el procesamiento del lenguaje natural y el desarrollo web. Le gusta aprender más sobre el campo técnico al participar en varios desafíos.


¿Que te ha parecido?

Deja un comentario