Para quaisquer dúvidas sobre o assunto, informações sobre estágios ou bolsas de Desenvolvimento Tecnológico, ou sobre Parcerias e Consultorias na área de Imagens, escreva para : mpa@cbpf.br
A imagem ao lado apresenta, de forma esquemática, as definições
básicas dada a "Imagem" e as suas áreas correlatas. Uma discussão sobre a
definição da palavra imagem pode ser encontrada aqui.
Processamento de Dados: É
toda vez que partimos de uma informação, sob a forma de dados (por exemplo
números em planilha eletrônica) e obtemos uma nova informação, através de
um processamento automático. | |
Mas enfim, o que é uma
Imagem? Podemos de forma simplificada, dizer que uma imagem é um suporte
bi(tri)-dimensional para que efetuemos uma troca de informação. A imagem
que você vê ao ler este texto carrega no seu interior uma série de
informações (desde cores, intensidades de luz, até informações sobre visão
por computador) . Existem imagens de diversas origens: óticas, de
radares, magnéticas, infra-vermelhas, etc.
Quando falamos em Computação Gráfica ou em Processamento de Imagens, podemos dizer que a imagem é a materialização dos processos de cálculo e geração destas imagens. Uma imagem digital (2D) é
composta por pixels ("picture - elements") que, em seu caso mais
comum, representam a intensidade luminosa no ponto. A estes valores
associamos tabelas de
cores (LUT) ou níveis de cinza. No caso ao lado podemos ver
esquematicamente ampliado uma imagem digital e podemos dizer que
valores perto de zero significam a cor preta, e valores
perto de 255 significam a cor
branca. | |
Etapas de um Processamento de Digital de Imagens -
1
Nas 4 próximas transparências pretendemos mostrar, de forma básica, a evolução do tratamento da informação em um processo de visão por computador. Vamos partir de uma cena real e mostrar o caminho necessário para o tratamento da informação até chegarmos na possibilidade de tomarmos uma decisão. Pode-se considerar que em uma cena real a quantidade de informação existente é da ordem de 10 elevada a 10 potência. A câmera de vídeo adquire esta imagem e transforma a intensidade luminosa em sinal analógico de vídeo. Esta nova representação da "mesma" informação consiste em uma quantidade de informação de 10 elevado a 8 potência. Para saber mais detalhes sobre a representação de um sistema de processamento, veja no artigo aqui. | |
Etapas de um
Processamento de Digital de Imagens - 2
O sinal analógico é adquirido através de "placas de aquisição de imagens" e é convertido em sinal digital. Nos casos mais simples a intensidade luminosa é representada em uma escala de 256 níveis de cinza (8 bits). Existem hoje câmeras de maior precisão para a representação da intensidade luminosa de uma imagem. A partir desta aquisição a imagem é constituída de um "array" de pixels organizados sob a forma de uma matriz. Outros dispositivos podem ser utilizados na aquisição de uma imagem. O Scanner é um dispositivo clássico que não adquire a imagem a partir de um " sinal de vídeo" e sim diretamente da cena real (página a ser digitalizada). Existem 10^6 quantidades de informações nesta representação. A partir desta imagem digital realizamos a tarefa mais "complexa" nos passos iniciais de todo processo de Análise da Imagem: A separação dos Objetos. O leitor deve atentar para a subjetividade da palavra "objeto" neste ponto do processamento. Esta etapa é conhecida como "SEGMENTAÇÃO DA IMAGEM" onde os objetos são isolados do "resto" da imagem. A complexidade neste processo é muito grande. Esta área é em si só uma grande área de pesquisa em processamento e visão computacional. Podemos considerar que existem 10^4 quantidades de informações nesta representação da imagem original. | |
Etapas de um Processamento de Digital de Imagens -
3 Após isolarmos os "objetos" entramos em uma fase de extração das características dos mesmos. Identificamos os objetos e associamos a eles um número identificador (label). Por exemplo, na imagem ao lado o objeto preto "sol", recebe o número 1, o "homem" o número 2 e a "casa" o número 3. Não se esqueça que até este instante o objeto "sol" não existe como "SOL", ele nada mais é que um aglomerado de pixels, dentro de uma região contígua de mesma luminância. Para todos os "objetos" numerados devemos identificar e medir alguns parâmetros, como: D (Diâmetro), A (Área), T (Topologia), P (Perímetro). Estes valores serão diferentes em função do objeto tratado. Esta técnica é conhecida como "feature extraction". Note que uma boa escolha dos parâmetros será fundamental para que possamos em seguida identificar os objetos. A partir destes parâmetros
devemos identificar em uma "base de dados" o objeto que mais se aproxima
destes parâmetros. No caso ao lado podemos dizer que o objeto "Homem", da
Base de Dados, foi associado ao label número 2; o objeto "Sol" foi
associado ao label número 1 e finalmente o objeto "Casa" foi associado ao
número 3. Você deve mais uma vez atentar para a complexidade de tal Base
de Dados. Muito do esforço em pesquisa em Visão computacional está voltado
para esta "Base de Dados" e em como organizar este reconhecimento do
objeto. Podemos supor, neste momento, que a quantidade de informação
presente na "imagem" e de 1000. | |
Etapas de um
Processamento de Digital de Imagens - 4 Finalmente podemos tomar decisões binárias (baseadas em respostas de 2 estados: S/N). Como as colocadas por questões simples e objetivas: "Está sol?". Se o objeto que eu observo na imagem é um sol, provavelmente a resposta para a pergunta é "SIM". E o objeto SOL me faz concluir que ele não é a LUA. Enfim, existem inúmeros procedimentos de análise e reconhecimento envolvido na construção deste processo de Visão. As complexidades são imensas e muito associadas ao tipo de informação que queremos tratar. Podemos neste momento realizar uma analise quantitativa da imagem, como vamos descrever nas transparências abaixo. A análise quantitativa é a análise que normalmente interessa quando aplicamos a ferramenta "TRATAMENTO DA IMAGEM' a um fenômeno físico, pois estamos buscando caracterizar o fenômeno usando a imagem como meio de aquisição de dados.. | |
Visão por Computador - Necessidades para
a aplicação em ambientes de Pesquisa. Quando
agora falamos em usar a metodologia descrita acima como ferramenta e
desenvolver algoritmos de reconhecimento como ponto de pesquisa em
"Analise de Imagens", devemos ter em mente os nossos objetivos, i.e., os
objetivos voltados ao "o que estudar no fenômeno
físico?". É muito comum que realizemos ações fora da imagem, i.e., no próprio objeto. Podemos em Medicina colocar ou adicionar um colorante químico que realce certas células em detrimento de outras, e assim melhorar o contraste da imagem (pensando na separação das células como objetos) para a fase de segmentação. | |
Identificação
de Objetos Na imagem ao lado apresentamos um exemplo de aplicação de medidas quantitativas em uma imagem granular. A imagem já esta tratada e "labelizada". A imagem original não é apresentada nesta figura. Os resultados obtidos são
apresentados em uma tabela abaixo: Para cada um 13 objetos foram medidos
Área e o Centro de Gravidade (X,Y). A maior célula é a célula 5 com 4274
pixels de área. | |
SVH - Sistema de Visão Humana -
(números)
Aqui fazemos uma rápida parada para apresentar números do Sistema de Visão Humana. O cérebro apresenta uma biblioteca de imagens da ordem de 60 mil imagens e o olho é capaz de diferenciar até 64 níveis de cinza. O Cerebelo Humano representa a informação em diferentes níveis e já é considerado por muitos como uma "maquina" especializada em reconhecimento humano. No entanto é fácil verificar que a "Base deDados" dependerá da quantidade de conhecimento adquirido pelo ser humano. Existem hoje diversas
pesquisas onde o objetivo é criar uma máquina especializada em reconhecer, independentemente da aplicação do sistema
visual, exatamente como o Sistema Visual Humano.
| |
Reconhecimento
- Conc. Básicos Em um ambiente de reconhecimento automático devemos nos preocupar em separar (identificar) objetos. Um sistema de reconhecimento deverá ser capaz de, em função dos objetos apresentado em sua entrada, dizer qual é a sua classe na saída. Por exemplo se apresentarmos um quadrado a este sistema de reconhecimento ele deverá nos apontar como saída a Classe C1 (classe dos quadrados). O mesmo procedimento deverá acontecer para as outras formas geométricas do esquema ao lado. Uma classe "Desconhecido" é identificada quando um objeto que não tem classe definida é apresentado. Existem normalmente duas fases em ambiente de reconhecimento: A fase de aprendizado e a fase de reconhecimento propriamente dita. Durante a fase de aprendizado devemos acertar alguns parâmetros no Sistema de Reconhecimento. Para cada objeto apresentado verificamos se ele corresponde a classe correta e acertamos, corrigindo os valores dos "Parâmetros de Ajuste para Aprendizado". As redes Neurais são um sistema de reconhecimento eficiente, capaz de reconhecer com relativa eficácia objetos, mesmo com ligeiras diferenças. Para saber mais sobre redes Neurais veja a pagina do Laboratório de Processamento de Sinais da UFRJ. | |
Reconhecimento - Conc. Básicos 2.
Na realidade em um sistema de reconhecimento tentamos montar um espaço de medidas como o exemplificado ao lado. Neste exemplo estamos interessados em identificar a forma Circulo e a fórmula Retângulo. Existem diversas formas de fazer esta identificação. O objetivo aqui é apenas exemplificar uma destas formas. Usamos para tal os parâmetros "Área" e "Perímetro" e montamos um espaço de medidas 2D com as medidas de cada um dos objetos. Repare que existe uma reta que separa os dois objetos caiando um limite decisório entre os dois objetos. É claro que este sistemas de reconhecimento não é o mais eficiente e dependerá evidentemente da Área dos objetos apresentados na imagem. Porem ele é independente da rotação que o objeto (Quadrado) sofra na imagem. Outro aspecto importante é que não discutimos aqui. é como é realizado o cálculo do perímetro. Este é normalmente realizado usando filtros de detecção de borda e contando os pixels detectados. O resultado é dado em número de pixels. | |
Considerações
Finais
Se você chegou até aqui,
espero que você agora entenda um pouco melhor os conceitos básicos em
visão por
computador. |