Estoy tratando de entender la digitalización de sonido e imágenes. Hasta donde yo sé, ambos necesitan convertir la señal analógica en señal digital. Ambos deberían usar muestreo y cuantización.

  • Sonido: tenemos amplitudes en el eje yy tiempo en el eje x. ¿Qué hay en los ejes x e y durante la digitalización de imágenes?

  • ¿Cuál es el tipo de estándar de frecuencia de muestreo para la digitalización de imágenes? Se utiliza a 44 kHz para CD (digitalización de sonido). ¿Cómo se usa exactamente la frecuencia de muestreo para las imágenes?

  • Cuantización: Sonido: utilizamos la profundidad de bits, lo que significa niveles de amplitud. Imagen: también utilizamos la profundidad de bits, pero ¿cuántas intensidades podemos reconocer? (¿es verdad?)

  • ¿Cuáles son otras diferencias entre la digitalización de sonido e imagen?

0
Sirdhemond 11 feb. 2020 a las 19:30

2 respuestas

La mejor respuesta

La adquisición de imágenes se puede resumir como un muestreo espacial y pasos de conversión / cuantificación. El muestreo espacial en (x, y) se debe al tamaño del píxel. Los datos (en el tercer eje, z) son el número de electrones generados por el efecto fotoeléctrico en el chip. Estos electrones se convierten a ADU (unidad digital analógica) y luego a bits. Lo que se cuantifica es la intensidad de la luz en el nivel de grises, por ejemplo, los datos en 8 bits darían 2 ^ 8 = 256 niveles de gris.

Una imagen pierde información tanto por el muestreo espacial (resolución) como por la cuantización de la intensidad (niveles de gris).

A menos que esté hablando de videos, las imágenes no tendrán muestreo en unidades de Hz (1 / tiempo) sino en 1 / distancia. Lo importante es verificar el teorema de Shannon-Nyquist para evitar aliasing. Las frecuencias espaciales que puede obtener dependen directamente del diseño óptico. El tamaño de píxel debe elegirse respectivamente para este diseño para evitar el alias.

EDITAR : en el ejemplo a continuación tracé una función seno (franjas blancas / negras). En la parte izquierda, la señal se muestrea correctamente, a la derecha se submuestrea por un factor de 4. Es la misma señal, pero debido a los píxeles más grandes (muestreo más pequeño) se obtiene un alias de sus datos. Aquí las rayas son horizontales, pero también tiene el mismo efecto para las verticales.

enter image description here

1
Romain F 11 feb. 2020 a las 18:36

No existe un estándar común para el eje espacial para el muestreo de imágenes. Un sensor o cámara de 20 megapíxeles producirá imágenes con una resolución espacial completamente diferente en píxeles por mm o ángulo de visión de píxeles por grado que un sensor o cámara de 2 megapíxeles. Estas imágenes normalmente se redimensionarán a otra resolución estándar no común para su visualización (72 ppi, 300 ppi, "Retina", SD / HDTV, CCIR-601, "4k", etc.)

Para el audio, 48k comienza a ser más común que 44.1ksps. (en iPhones, etc.)

("Lo bueno de los estándares es que hay tantos")

La escala de amplitud en formato sin formato tampoco tiene un estándar único. Cuando se convierte o se vuelve a cuantificar en formato de almacenamiento, las cuantificaciones de 8 bits, 10 bits y 12 bits son las más comunes para las separaciones de color RGB. (Formatos JPEG, PNG, etc.)

Los formatos de canal son diferentes entre audio e imagen. X, Y, donde X es tiempo e Y es amplitud, solo es bueno para audio mono. El estéreo generalmente necesita T, L, R para los canales de tiempo, izquierdo y derecho. Las imágenes suelen estar en X, Y, R, G, B o tensores de 5 dimensiones, donde X, Y son coordenadas de ubicación espacial y RGB son intensidades de color en esa ubicación. Las intensidades de la imagen pueden estar algo relacionadas (dependiendo de las correcciones gamma, etc.) con el número de fotones incidentes por duración del obturador en ciertos rangos de frecuencia EM visibles por ángulo sólido incidente con alguna lente.

Un filtro de paso bajo para audio y un filtro Bayer para imágenes se usan comúnmente para acercar la señal a la limitación de banda para que se pueda muestrear con menos ruido de alias / artefactos.

0
hotpaw2 11 feb. 2020 a las 18:15