______________________________________________________
Tarea 1
Unidad 5 Procesamiento de imágenes
En el procesamiento digital de imágenes se distinguen dos
niveles principales de manera general:
Procesamiento de imágenes a bajo nivel
Muy poco uso de conocimiento respecto al contenido de las
imágenes.
Comúnmente se reconoce una secuencia de cuatro para el
procesamiento a bajo nivel: adquisición de la imagen, pre-procesamiento,
segmentación de la imagen, descripción y clasificación de objetos.
Entendimiento de imágenes a alto nivel
Existe la capacidad de realizar toma de decisiones respecto
al contenido de las imágenes.
El procesamiento de imágenes está dado por un conjunto de
operaciones llevadas a cabo sobre las imágenes a fin de realizar mediciones
cuantitativas para poder describirlas.
Una característica es un atributo usado para hacer
decisiones respecto a objetos en la imagen. Algunos atributos son naturales y
se definen mediante la apariencia visual de la imagen, los artificiales, son el
resultado de operaciones realizadas a la imagen.
Una imagen f(x,y) está dada por sus coordenadas espaciales y
su brillo, y es representada matemáticamente en una matriz.
Las herramientas para la adquisición de imágenes transforman
la imagen visual de un objeto físico y sus características intrínsecas en un
conjunto de datos digitalizados, usados para procesarla.
El procesamiento digital de imágenes tiene diversas
aplicaciones y problemas:
Representación
Transformación
Modelado
Restauración
Reconstrucción
Análisis
Comprensión de datos
Se define como ruido cualquier entidad en las imágenes,
datos o resultados intermedios que no son interesantes para la computación que
se pretende llevar a cabo.
Las técnicas de filtraje son transformaciones de la imagen
píxel a píxel, que dependen de los niveles de gris de los píxeles vecinos en la
imagen original. El proceso de filtraje se realiza utilizando matrices
denominadas máscaras, que son aplicadas sobre la imagen. Los filtros sirven
para suavizar o realzar detalles de la imagen, o minimizar efectos de ruido.
Filtro gaussiano. Este filtro implementa máscaras que
intentan imitar la forma de una gaussiana: G(x,y) = e - (x + y)² / 2σ², donde
x, y son las coordenadas de la imagen y sigma una desviación estándar de la
probabilidad de distribución asociada.
Filtro mediana (rango de vecindades). El objetivo del filtro
mediana es reducir el empañamiento de los bordes. Este filtro reemplaza el
píxel actualmente analizado en la imagen por la mediana del brillo con respecto
a los vecinos más cercanos.
Filtro de suavizado direccional (preservación de bordes). La
eliminación de ruido mediante suavizado distorsiona la información con respecto
a los bordes. Que se calcula en varias direcciones según la ecuación:
I’ (x,y) = 1/Nθ(k,l)∈EθΣΣ I(x-k, y-l).
Filtro de suavizado conservador. Esta técnica de reducción
del nivel de ruido emplea un algoritmo de filtración simple y rápido que
sacrifica su poder de eliminación de ruido a cambio de preservar el detalle
espacial de la frecuencia en una imagen, removiendo píxeles aislados con un
valor muy alto o muy bajo.
Realce de contraste. Tiene como objetivo mejorar la calidad
de las imágenes bajo ciertos criterios subjetivos del ojo humano. El contraste
entre dos objetos se puede definir como la razón entre sus niveles de gris
medios. La manipulación de contraste consiste en una transferencia radiométrica
en cada píxel.
Filtro paso bajo es empleado para remover ruido de alta
frecuencia espacial en una imagen digital. La reducción del ruido mediante el
filtro de paso bajo se lleva a cabo mediante una cancelación de las variaciones
más rápidas entre píxel y píxel.
Filtro paso alto opera mediante el análisis de los valores
de cada píxel y cambiando estos de acuerdo a los valores de los píxeles
vecinos. El filtro paso alto realza detalles de la imagen.
Filtro SUSAN (Smallest Univalue Segment Assimilating
Nucleus). Preserva la estructura de la imagen alisando únicamente sobre los
píxeles que se encuentran dentro de la región del píxel analizado (píxel
central). Este filtro integra los mejores aspectos de los métodos de reducción
de ruidos existentes incluyendo la preservación de bordes.
En el análisis de objetos dentro de las imágenes resulta esencial
distinguir entre el objeto de interés y el resto de la imagen. Una de las
técnicas más conocidas es la segmentación mediante la detección de
bordes.
La detección de bordes es la aplicación de un algoritmo con
esté proposito que dará como resultado un contorno. Su objetivo es obtener
imágenes cuya salida muestre píxeles de mayor intensidad en los valores que
detecten transiciones cercanas.
Alguno de los algoritmos de detección de bordes más comunes
son:
Técnicas basadas en el gradiente: Operador de Roberts,
Operador de Sobel, Operador de Prewitt, Operador Isotrópico.
Operadores basados en cruces por cero: Operador de
Marr-Hildreth, Detector de Canny.
Los operadores basados en el gradiente son píxeles con un
alto gradiente. Un rápido índice de cambio de intensidad dada por el ángulo del
vector gradiente puede observarse en los píxeles de los bordes.
Un píxel de borde se describe por: Intensidad del borde
(magnitud del gradiente) y dirección del borde (ánglo del gradiente).
Operador de Roberts. Utiliza las direcciones diagonales para
calcular el vector gradiente mediante máscaras.
Operador de Sobel. Calcula la magnitud del gradiente
mediante: M√ sx² + sy²
Operador de Prewitt. Expande la definición del gradiente en
una máscara de 3x3 para se más inmune al ruido, utiliza la misma ecuación que
Sobel, pero con constante c = 1.
Operador Isotrópico. Intenta llegar a un equilibrio entre
operador Prewitt y Sobel. Prewitt proporciona detección para bordes verticales
y horizontales, y Sobel detección de bordes diagonales.
5.2.Visión por computadora
La visión es un medio para un fin – conocer el mundo
observándolo – la visión artificial tiene como medio para adquirir el
conocimiento un instrumento de cómputo. El tema de visión artificial es
extenso: los asuntos tales como la restauración de imágenes, mejoramiento de
imagen, inspección visual automatizada, visión robótica, escenas
tridimensionales, y percepción y cognición visual todas forman parte del
término “Visión artificial”.
Los primeros experimentos de cómputo para desarrollar
sistemas artificiales para la visión de máquinas comenzaron con amplia variedad
en grados de complejidad, han sido usados en muchas áreas diversas tales como
ofimática, medicina, detección remota por satélite, y en el mundo
industrializado y militar. Los usos han sido muchos y variados.
A la visión artificial le compete estudiar la estructura
física tridimensional del mundo para el análisis automático de imágenes.
Las imágenes son imágenes digitales: son representaciones
discretas (es decir, ellas tienen valores distintos en los puntos regularmente
muestreados) y son representaciones cuantificadas (es decir, cada valor es un
valor del número entero).
La visión artificial incluye muchas técnicas que son útiles
para si mismas. Más significativamente, sin embargo, la visión artificial se
refiere al procesamiento de imágenes, estas imágenes son solamente la materia
prima de una ciencia mucho más amplia, la misma que se esfuerza en última
instancia para emular las capacidades perceptivas del hombre, y para verter una
luz sobre la manera por la cual él logra su interacción adaptativa y robusta
con su ambiente.
5.3.Animación por computadora
La animación es la simulación de un movimiento, creada por
una serie de imágenes o cuadros.
La animación por computadora se puede definir como un
formato de presentación
de información digital en movimiento a través de una
secuencia de imágenes o cuadros creadas o generadas por la computadora.
Características de la Animación 3D
La animación por computadora permite crear escenar
“realmente” tridimensionales, en una escena animada por computadora es posible
cambiar el ángulo de la cámara y ver otra parte de la escena. Se pueden
reutilizar partes de la animación por separado.
Una animación se ve más realista si variamos el peso y el
tamaño de los objetos. Para cambiar el peso es necesario cambiar el tiempo que
tarda en moverse. Mientras más pesado su masa es mayor y es necesario aplicar
mayor fuerza para moverlo.
Es necesario pensar en la forma como se moverán los objetos.
Cada movimiento se realiza por una razón. Es necesario conocer las formas en
que actúan los cuerpos.
En la animación en tres dimensiones debe considerarse la
forma en que se detiene los cuerpos. Al animar a un personaje es conveniente
que si se va a detener, alguna parte de su cuerpo se siga moviendo ligeramente,
como la cabeza o un brazo.
Hay tres fases que componen una acción: La anticipación de
la acción, la acción en sí y la reacción a la acción.
Técnicas de animación
La animación en acetatos (cel animation), la animación
basada en cuadros (flipbook animation) y la animación en sprite.
Animación Basada en Cuadros
Para hacer una secuencia, se van filmando las imágenes
cuadro por cuadro y luego estos se unen para formar la animación. Es posible
formar bibliotecas de movimientos de cada parte del cuerpo de la animación para
de esta forma combinarlas y hacer animaciones diferentes.
Animación Basada en Sprites
Se refiere a animaciones de objetos sobre fondos estáticos,
es decir, lo que cambia son los personajes.
Key Framming
Se refiere a establecer posiciones en puntos específicos de
tiempo en una animación y la parte intermedia la obtiene la computadora por
medio de interpolación matemática.
Rotoscopiado
Se obtienen la posición y el ángulo de los puntos clave de
imágenes reales y se trata de hacer converger los modelos en computadora con
ellos.
Motion Control
Consiste en obtener posiciones clave de manera automática a
partir de un actor real por medio de dispositivos que se conectan a su cuerpo.
Wavelets
Significa “pequeñas ondulaciones”. Esta técnica permite que
en una sola imagen se compriman una gran cantidad de datos para que al
acercarse a ella, se vayan viendo los detalles.
Técnicas de Pixar
El proceso que utiliza Pixar [12] para crear sus animaciones
se compone de cuatro etapas principales: Desarrollo (crear el guión de la
historia), preproducción (se direccionan los retos técnicos), producción
(creación de la película) y post producción (pulir los últimos detalles).
CONCLUSION........
El procesamiento de imágenes está dado por un conjunto de
operaciones llevadas a cabo sobre las imágenes a fin de realizar mediciones
cuantitativas para poder describirlas.
Una característica es un atributo usado para hacer
decisiones respecto a objetos en la imagen. Algunos atributos son naturales y
se definen mediante la apariencia visual de la imagen, los artificiales, son el
resultado de operaciones realizadas a la imagen.
Una imagen f(x,y) está dada por sus coordenadas espaciales y
su brillo, y es representada matemáticamente en una matriz.
Se define como ruido cualquier entidad en las imágenes,
datos o resultados intermedios que no son interesantes para la computación que
se pretende llevar a cabo.
La visión es un medio para un fin – conocer el mundo
observándolo – la visión artificial tiene como medio para adquirir el
conocimiento un instrumento de cómputo. El tema de visión artificial es
extenso: los asuntos tales como la restauración de imágenes, mejoramiento de
imagen, inspección visual automatizada, visión robótica, escenas
tridimensionales, y percepción y cognición visual todas forman parte del
término “Visión artificial”.
BIBLIOGRAFIA......
No hay comentarios:
Publicar un comentario