Câmera acoplada ao óculos |
Dispositivo israelense ajuda deficientes visuais a ler
John Markoff
Em Jerusalém
OrCam/The New York Times
Uma câmera é conectada por um cabo fino a um computador portátil projetado para caber no bolso de uma calça; esse sistema é acoplado aos óculos do usuário por meio de um pequeno ímã e lê em voz alta as
palavras ou descreve os objetos apontados.
Liat Negrin, uma israelense que tem deficiência visual desde a infância, entrou recentemente em um supermercado aqui de Jerusalém, pegou uma lata de legumes e leu com facilidade seu rótulo utilizando uma câmera simples e discreta que foi conectada a seus óculos.
Liat, que tem coloboma – uma má-formação congênita que perfura a estrutura do olho e atinge cerca de 1 em cada 10 mil pessoas –, é funcionária da OrCam, uma start-up israelense que desenvolveu um sistema baseado em uma câmera e que visa a permitir que deficientes visuais sejam capazes de “ler” de maneira simples e fácil e de se movimentar livremente por todos os lugares.
Até o momento, os aparelhos de leitura para deficientes visuais e cegos disponíveis no mercado eram dispositivos incômodos, capazes de reconhecer textos apenas em ambientes controlados ou, mais recentemente, por meio de aplicativos usados por smartphones, que são dotados de recursos limitados.
Por outro lado, o dispositivo da OrCam é formado por uma pequena câmera que pode ser usada da mesma maneira que o Google Glass. Essa câmera é conectada por um cabo fino a um computador portátil projetado para caber no bolso do usuário e esse sistema é acoplado aos óculos do usuário por meio de um pequeno ímã – e lê em voz alta as palavras ou descreve os objetos apontados pelo usuário. O aparelho também é equipado com um alto-falante de condução óssea que facilita o entendimento do que é dito.
O sistema foi criado para reconhecer e reproduzir “textos em estado selvagem”, termo usado para descrever artigos de jornais, assim como números de ônibus e objetos tão diversos quanto monumentos, semáforos ou os rostos de amigos.
Atualmente, o aparelho reconhece textos em inglês e, a partir desta semana, ele será comercializado pelo site da OrCam por US$ 2.500, preço que corresponde ao custo aproximado de um aparelho auditivo de médio porte. Até o momento, esse é o único dispositivo produzido pela empresa privada a fazer parte do boom do setor de alta tecnologia de Israel.
O aparelho é bem diferente de outra tecnologia que foi desenvolvida para devolver parte da visão a pessoas cegas, como o sistema de retina artificial batizado de Argus II, fabricado pela Second Sight Medical Products. Esse sistema, que foi aprovado pela Food and Drug Administration (FDA) em fevereiro deste ano, permite que os sinais visuais contornem a retina danificada e sejam transmitidos diretamente para o cérebro.
O dispositivo da OrCam também é drasticamente diferente do Google Glass, que também oferece ao usuário uma câmera, mas que é projetado para pessoas cuja visão é normal e possui um sistema limitado de reconhecimento visual e de processamento local.
A OrCam foi fundada há vários anos por Amnon Shashua, um conhecido pesquisador que também é professor de ciência da computação na Universidade Hebraica de Israel. A empresa utiliza algoritmos de visão computacional, criados por Shashuae em parceria com outro membro do corpo docente da universidade, Shai Shalev-Shwartz, e com um de seus ex-alunos de pós-graduação, Yonatan Wexler.
“O que é notável é que o dispositivo aprende com o usuário a reconhecer um novo objeto”, disse Tomaso Poggio, cientista da computação do MIT que é especialista em visão por computador e com quem o Dr. Shashua estudou durante sua pós-graduação. “O aparelho é mais complexo do que parece e, falando como especialista, eu acho que ele é realmente impressionante”.
Esse avanço é resultado tanto do rápido progresso do poder de processamento dos computadores que, atualmente, podem ser carregados confortavelmente no bolso dos usuários, quanto do algoritmo de visão por computador, desenvolvido pelos cientistas.
Em um nível tecnológico mais amplo, o sistema da OrCam é representativo de uma vasta gama de rápidas melhorias que estão sendo desenvolvidas no campo da inteligência artificial, em especial na área de sistemas de visão destinados à indústria, bem como no setor de veículos autônomos. (antes de criar a OrCam, o Dr. Shashua havia fundado a Mobileye, uma empresa que fornece câmeras capazes de reconhecer objetos como pedestres e ciclistas para a indústria automobilística e que conseguem manter um carro em movimento em sua pista.)
Atualmente, a tecnologia de reconhecimento de voz é usada rotineiramente por dezenas de milhões de pessoas nos iPhones e nos smartphones equipados com o sistema operacional Android. Além disso, o processamento de linguagem natural está possibilitando que os sistemas de computador “leiam” documentos, o que está tendo um impacto significativo na área jurídica e em outros setores.
Hoje existem pelo menos seis sistemas concorrentes na área de visão por computador. Por exemplo: os pesquisadores do Google e de outros países começaram a usar sistemas conhecidos como técnicas de
“aprendizagem profunda”, que tentam imitar os sistemas de visão biológicos. No entanto, esses sistemas exigem poderosos recursos de processamento para poderem proporcionar um reconhecimento preciso.
Por outro lado, a técnica da OrCam, que foi descrita em um documento técnico de 2011 pelos pesquisadores da Universidade Hebraica, oferece um razoável equilíbrio entre a precisão do reconhecimento de textos e objetos e a velocidade com que isso ocorre. Essa técnica, conhecida como Shareboost, distingue-se pelo fato de que, à medida que o número de objetos que o sistema precisa reconhecer aumenta, o sistema minimiza a quantidade de energia de processamento adicional necessária
para realizar essa tarefa.
“Os desafios são enormes”, disse Wexler, coautor do estudo e vice-presidente de pesquisa e desenvolvimento da OrCam. “As pessoas que têm visão deficiente continuarão a ter uma visão deficiente. Mas queremos aproveitar a tecnologia para poder ajudá-los”.
Além disso, o sistema OrCam foi projetado para funcionar com um sistema de controle mínimo, ou seja, com uma interface de usuário bem simples de usar. Para reconhecer um objeto ou texto, o usuário simplesmente aponta seu dedo para ele e, em seguida, o dispositivo interpreta a cena.
O sistema reconhece um conjunto de objetos pré-armazenados e permite que o usuário amplie sua biblioteca – adicionando, por exemplo, o texto de um rótulo ou de um cartaz, ou um semáforo ou placa de rua – simplesmente agitando a mão ou o objeto diante do campo de visão da câmera.
Segundo o Dr. Shashua, um dos principais desafios do aparelho é possibilitar o rápido reconhecimento óptico de caracteres em variadas condições de iluminação, bem como em superfícies flexíveis.
“Os leitores profissionais de caracteres óticos de hoje funcionam muito bem quando a imagem é boa, mas temos desafios adicionais pela frente: temos que possibilitar a leitura de textos em superfícies flexíveis, como um jornal, por exemplo”, disse ele.
Embora o sistema possa ser utilizado por cegos, a OrCam planeja inicialmente vender o dispositivo para residentes dos Estados Unidos que tenham deficiência visual, o que significa que sua visão não pode ser adequadamente corrigida pelo uso de óculos.
Nos Estados Unidos, 21,2 milhões de pessoas com idade superior a 18 anos têm algum tipo de deficiência visual, o que inclui doenças relacionadas à idade avançada, doenças em geral e más-formações congênitas, de acordo com a Pesquisa Nacional de Saúde realizada em 2011 pelo Centro Nacional de Estatísticas de Saúde dos EUA. A OrCam disse que, no mundo inteiro, existem 342 milhões de adultos com deficiência visual significativa, e que 52 milhões dessas pessoas pertencem à classe média.
Comentários