-faSkany i-

1/

La comunicación entre el hombre y el computador

Por: JESUS A. MOTTA M.*


'os simuladores de vuelo son buenos ejemplos de sistemas donde ^L)e 1 computador elabora un mundo copiado sobre el mundo real: crean sonidos, fuerzas y movimientos análogos a los que se perciben en un avión en vuelo; paralelamente supercomputadores crean imágenes tales como se las vería desde la cabina del piloto. Es particularmente difícil crear un ambiente visual que semeje uno real, pero los computadores de hoy lo hacen virtuosamente.

For qué limitar las capacidades de simulación de los computadores a la creación de los paisajes, que vería un piloto7 Las máquinas capaces de simular las sensaciones de un piloto no podrían crear ambientes familiares y facilitar el estudio de los problemas científicos? No podrían crear ambientes de comunicación más naturales que el teclado? Dicho de otra forma, los computadores no podrían engendrar “realidades artificiales” con las cuales los usuarios interactuarían?.

Numerosos ingenieros responden con un si categórico a esta última pregunta. Prototipos de realidades artificiales mas complejas que los vuelos simulados, así como sistemas de comunicación (las interfaces Hombre-Máquina) que permitirán a los supercomputadores adaptarse a los modos de comunicación humanos como el tacto, gestos, palabra y un cierto tipo de “contacto ocular*. Los supercomputadores de la próxima generación

Profesor Titular de la Universidad Surcolombiana de Neiva DEA Universidad de París Investigador del Proyecto Diseño de Una Red de Computadores Comunicados por Satélite.

íl ¿UíiiüWs» ■

sintetizarán imágenes más realistas, que permitirán en el sentido etimológico del término, una manipulación de las imágenes de síntesis asi producidas. KI usuario recibirá estímulos táctiles de intensidad variable. Además, captadores determinarán permanentemente la posición de la cabeza del usuario y seguirán los movimientos de sus ojos; programas de reconocimiento de la palabra interpretarán mensajes vocales de los usuarios.

Gracias a estas realidades artificiales, los supercomputadores serán a la vez más simples y más “familiares”. Los sistemas de entrada/salida perfeccionados serán a los científicos e ingenieros, lo t|ue una matriz electrónica como Lotus I -2-^, es hoy en día a los empleados de los servicios administrativos, comerciantes y financistas.

La realización de sistemas de comunicación entre el usuario y el computador es uno de losgrandes retos para el diseñador de computadores. I!n el curso de los últimos años el costo del material a disminuido considerablemente lo mismo que el costo del software más lentamente; se ha mejorado y se mejora aún las técnicas que maximizan la eficiencia de los computadores y minimizan la utilización de la memoria, falta opTnnizar la eficiencia del usuario.

La investigación científica, lia demandado a la industria informática materiales siempre máseficacesen razón de sus inmensas necesidades fli culos, con los nuevos supercom| dores las necesidades van sin di cambiar. I loy en día, uno de los computadores más ráp CRAY-2, efectúa un m de operaciones en pu flotante por segundo computadores personales efectúan de 1.000 a 10.000 operaciones en punto flotante por segu ndo) los próximos com -putadores CRAY (utilizando la técnica del arseniuro de Galii previstas para el año próximo veces más rápidos que el CRA tencia de terminalesy estacionesde trabajo que


asocian ambientes gráficos a los supercomputadores, aumenta igualmente: la sociedad Stellar Computer por ejemplo, anunció en enero de 1988 una estación de trabajo que efectuará en promedio 50 millones de operaciones en punto flotante por segundo.

¿Cómo esta potencia de cálculo adquirida por los computadores transformará la interacción entre el usurario y el computador? El aumento de la velocidad del cálculo es una ventaja intrínseca, porque reduce y suprime el tiempo de espera de los resultados, pero conceptualmente no ayuda mucho a resolver los problemas del usuario.

¿Cómo funciona hoy un supercompulador? Durante una larga fase de preparación, el usuario define el problema y provee los parámetros a una terminal que somete el problema a una forma comprensible por el computador; después la máquina toma algunos segundos, horas o muchos días y el usuario no puede ni interrumpir ni modificar ios cálculos. Si el cálculo indica que es preciso cambiar algunos parámetros, el proceso debe reiniciarse.

La elaboración de realidades artificiales, prefiguradas por los vuelos simulados, cambiará el modo de utilización de los supercomputadores. Gracias a las realidades artificiales, los usuarios, se comunicarán con el computador de manera intuitiva, directa y más intensamente que en el pasado. El objetivo a largo plazo en este campo de la investigación, es la realización de un ambiente artificial que parezca tan “real” como la realidad que él describe.

Tres cualidades caracterizan las realidades artificiales; la apariencia visual, el comportamiento y las posibilidades de interacción. Cuanto más la apariencia visual es realista, mejor el usuario interpreta la información que le provee el computador. De otra parte, las imágenes representan objetos reales, por ejemplo estructuras de edificios, aviones o abstracciones como las estructuras de fluidos. Esas imágenes son realistas, si se comportan como los objetos o abstracciones que representan. La modelización de esos comportamientos que impone la resolución en tiempo real de grandes sistemas de ecuaciones consumen una muy voluminosa potencia de cálculo. En fin, las interacciones entre el usuario y las realidades artificiales deben parecerse a las interacciones entre el usuario y el mundo tridimensional real: en ese mundo, nos desplazamos, designamos y tomamos objetos, hablamos, y observamos el ambiente según puntos de vista diferentes.

" «fflMiíro

Hoy la interacción con las realidades artificiales es menos evolucionada que las otras dos cualidades y las técnicas ya comercializadas de visua-lización y de manipulación tridimensional son todavía insuficientes. ¿Cuáles equipos entonces diseñar?.

Examinemos un periférico de salida típico: la pantalla.

Las estaciones de trabajo que manejan los supercomputadores están generalmente equipados de un monitor en color de 48 centímetros; para un observador situado a 50 centímetros de la pantalla, el despliegue ocupa en el campo visual, 37 grados horizontal mente y 28 grados vertical mente. Es poco, porque el campo visual cuando la cabeza está inmóvil se extiende sobre 180 grados horizontalmente y sobre ISO grados verticalmente. Sistemas de despliegue que llenan completamente el campo visual dan al observador la impresión de estar presente dentro de la imagen. Es el caso de los sistemas cinematográficos con pantalla gigante. Proyectado sobre pantalla gigante el despliegue de un computador, podría dar al usuario una sensación de realidad artificial.

Así ocupen una pequeña o gran parte, del campo visual, las imágenes serán precisas solamente si su número de pixels (elemento de imagen) es superior al actualmente utilizado.

Los pixeles son los “puntos” luminosos producidos por los tubos catódicos y que constituyen las imágenes.

Hoy las estaciones de trabajo despliegan un millón de pixeles en promedio, organizados en una red rectangular de 1.280 x 1.024 pixels. A distancia normal de una pantalla,cada pixel ocupa dos minutos de ángulo del campo visual, pero el ojo humano distingue detalles que ocupan solamente un minuto de ángulo.

Algunos monitores en color de 50 centímetros de lado despliegan cuatro millones de pixeles (2.000 x 2.000); pero para un observador situado a 60 centímetros de la pantalla, cada pixel ocupa ahora 1.4 minutos de ángulo.

¿Cómo se puede aumentar el realismo de las imágenes? Por ejemplo con los anteojos de despliegue que producen una sensación de profundidad a la manera de anteojos estereoscópicos, donde cada ojo recibe una vista --

ligeramente desplazada de ta misma imagen. Otros fenómenos psico-fisiológicos como el paralaje acentúan esta impresión: es suficiente, programar un desplazamiento aparente del plano de atrás cuando el observador cambia de posición al mirar un mismo objeto. ¿Cómo saber ahora, si el observador de desplaza? Por ejemplo con la ayuda de un captador registrando la posición y orientación de la cabeza. Como el captador puede reconocer los movimientos importantes de la cabeza, se puede dar al usuario ¡a impresión de barrer todo un panorama volviendo la cabeza; se despliegan así mismo imágenes diferentes según la dirección en la cual el observador mira.

Los primeros anteojos de despliegue ideados por Ivan Sutherland en los años 60, tenían tubos catódicos miniatura y un sistema mecánico que indicaba al computador la posición y orientación de la cabeza.

Dotados de pantalla en cristal liquido, muy ligeros y de captadores electrónicos, los anteojos actuales son mucho más potentes. El dispositivo, más evolucionado, hace más que crear realidades artificiales: Las organiza. En el Centro de Investigación Ames de la Nasa, se ha construido un dispositivo a los ocupantes de estaciones especiales; el astronauta verá con susanteojos loque verá un robot que trabaje en el exterior de la estación: cuando él vuelva la cabeza las cámaras de] robot se volverán simultáneamente. El captador electrónico (rolhemus) que registra la posición y la orientación de la cabeza es un constituyente importante de numerosos dispositivos de comunicación con los computadores. Construido por la Sociedad Mcdonne] Douglas, este captador transmite las informaciones medidas emitiendo impulsos electromagnéticos; tiene tres antenas de emisión y tres antenas de recepción perpendiculares según los ejes de un sistema de coordenadas cartesianas.

El emisor es un cubo de cinco centímetros de lado, que se le debe colocar a menos de 1.5 metros del receptor; emite secuencias de tres impulsos sucesivos (uno por antena). Estos impulsos crean una corriente eléctrica en las bobinas del receptor (un cubo de 2 centímetros de lado) colocado sobre el objeto el cual se le desea seguir sus movimientos. La intensidad de la corriente depende a la vez de la distancia entre el receptor y el emisor y de la orientación de las bobinas del receptor con relación a la del emisor. El computador calcula la posición tridimensional del receptor analizando los nueve valores de corriente producidas por los tres impulsos sucesivos. En el dispositivo actual, donde esos trenes de impulsos son repetidos en promedio 40 veces por segundo, los movimientos determinados son todavía un poco bruscos. Se obtendrá una regularización cuando el captador emita 60 trenes de impulsos por segundo.

Instalado sobre los anteojos de la Nasa el captador Polhemus produciría una excelente realidad artificial...si los movimientos de los ojos no fueran independientes del movimiento de la cabeza. También para seguir la mirada, se han reutilizado los detectores de movimiento oculares que sirven para estudiar la lectura y mas generalmente, la visión. Esos detectores emiten rayos luminosos que son reflejados por la córnea. De la dirección de la luz reflejada, se deduce la dirección de la mirada.

Los detectores de movimientos oculares son todavía poco utilizados en informática. Algunos de ellos adaptables a anteojos cuestan algunos millones de pesos pero no son tan precisos. Un dispositivo más perfeccionado proyecta un rayo minúsculo de luz infrarroja sobre la córnea y detecta la luz reflejada por una cámara de televisión gran angular colocada en promedio a una metro del usuario; ¡a cámara está permanentemente orientada hacia el ojo, siguiendo los movimientos importantes de la cabeza, pero no puede seguir los movimientos muy rápidos... cuando se estornuda por ejemplo.

Las pantallas gigantes, los anteojos de despliegue, los captadores de posicion y los detectores de movimientos oculares mejoran la credibilidad de las realidades artificiales y amplían el campo visual permitiendo el despliegue de detalles en el centro del campo visual. Se les utiliza para desplazar imágenes “reales” como en el casco de la Nasa o en imágenes de síntesis creadas por un supercomputador. ¿Cómo reaccionará el usuario a ésas imágenes? La mayor parte de los dispositivos interactivos actuales son limitados a dos dimensiones. Los resultados tridimensionales de simulación por ejemplo, se obtienen en sistemas de dos dimensiones utilizando un ratón o dispositivo similar. El control de tres ejes es todavía incipiente. ¿Es posible un dispositivo interactivo que posea la maestría, la precisión y la agilidad de una mano humana7 Un dispositivo así ya existe: es una mano humana equipada de un captador Polhemus y de un guante especial que registra los movimientos de la mano y de los dedos.

Este “guante numérico” ha sido concebido en la sociedad VPL Research. Contiene fibras ópticas insertadas entre dos tejidos que cubren cada dedo: las dos extremidades de cada fibra están unidas a una tarjeta de interface

- affls«ral-

situada cerca del puño. En cada extremidad de la fibra, un diodo lumi-nescente emite luz que recorre ¡a fibra y es captada en la otra extremidad por un fototransistor que transforma la señal luminosa que recibe en una señal eléctrica que luego es transmitida del puño al terminal por un hilo eléctrico.

Normalmente las fibras ópticas transmiten la luz aun cuando sean dobladas, pero las del guante numérico tienen una particularidad: una parte de la luz se escapa a las articulaciones cuando un dedo se pliega o cuando el usuario acerca su pulgar a los otros dedos. Cuanto más importante es el movimiento, más débil es la cantidad de luz transmitida a lo largo de los dedos.

Asociado a un captor Polhemus colocado sobre el dorso de la mano, el guante numérico ofrece interesantes posibilidades. En el centro de Investigación Ames, se utiliza el guante conjuntamente con los anteojos provistos para la estación espacial, un día, según la Nasa, un robot que trabaja en el exterior de la estación podrá efectuar maniobras complejas y reparaciones reproduciendo los movimientos de la manode un astronauta que permanezca en la nave. De otra parte se adaptan actualmente los principios del guante numérico para aplicarlos a todo el cuerpo humano.

TECNOLOGIA


Un dispositivo tan complejo como el guante numérico no es una panacea, pero sería muy útil en un caso al menos en el cual no se piensa mucho: numerosas ecuaciones científicas confiadas a los supercompu-tadores sirven para modelar sistemas que son más fáciles de manipular directamente que registrando sobre un teclado. De otra manera, las realidades artificiales pueden ajustar un elemento táctil a sistemas que de ordinario no son manipulados concretamente. Imaginemos por ejemplo, un bioquímico estudiando dos moléculas: una enzima y el sustrato sobre el cual actúa, se conocen las estructuras de !a enzima y del sustrato que se han visualizado en una pantalla del computador entre una parte de la enzima y otra del sustrato. A través del guante numérico se pueden manipular las dos moléculas como dos trozos de un rompecabezas y ver cuáles zonas encajan bien.

Imaginemos ahora, que se puede palpar la enzima, sentir sus hendiduras, sus salientes, sus partes lisas y sus rugosidades,que se pueda explorar con el dedo la parte activa de la enzima trayendo fuertemente el sustrato, que se puede retirar el sustrato de la parte activa y “sentir” la atracción

-mmm.1-

de las fuerzas interatómicas. Para obtener tales efectos, se estudian los mecanismos de retroacción desencadenados por sensaciones táctiles diversas.

Tres técnicas de retroacción táctil podrían ser implementadas con el guante numérico, una de ellas ya utilizada en un aparato destinado a los ciegos: pequeños solenoides llevan hiios metálicos colocados contra la piel. Este dispositivo es desafortunadamente muy estorboso, porque cada elemento tiene cerca de un centímetro. Pero, se podrían adoptar cristales piezo-eléctricos ul guante numérico: esos cristales vibrarían cuando fueren excitados por una corriente eléctrica y el cerebro interpretaría su vibración como una presión.

La sensación de fuerza es más difícil a dar en un guante que una sensación táctil, pero las aleaciones de memoria son prometedoras. Desde 1968, un equipo de la Universidad de Chapel Hill, había adaptado a las necesidades de la informática un aparato de telemanipulación, del tipo utilizado para recoger los materiales radioactivos. Hoy el sistema más eficaz es la empuñadura del Instituto Americano de la Salud: está inspirada en los bastones utilizados en los aparatos de juegos. Es una simple T rígida de ocho centímetros de diámetro donde cada una de las tres extremidades está unida a una armazón por tres hilos tendidos; los nueve hilos están unidos a captadores de tensión y a motores esclavos. Cuando el usuario, manipula la empuñadura, el computador registra los movimientos de la mano gracias a los captadores y produce en reacción una fuerza y un par de torsión en virtud de los motores esclavos.

¿Qué otras interacciones con un computador se podrían imaginar?

En numerosos casos, la palabra o los gestos son más prácticos que las manipulaciones no verbales de imágenes simbólicas. Los dispositivos de reconocimiento de la palabra, están más avanzados que los otros dispositivos de realidades artificiales. En MIT se ha demostrado desde hace más de 10 años las posibilidades de reconocimiento de la palabra en las interacciones usuario-computador. Hoy en día, máquinas que poseen vocabulario de mucha centenas de palabras son corrientemente utilizados en los campos donde las dos manos del usuario están generalmente ocupadas.

El centro de Investigación Thomas Watson de IBM ha presentado recientemente un sistema experimental que reconoce 20.000 palabras (en promedio 98% del vocabulario más común del habla inglesa); además su máquina interpreta frases fonéticamente complejas, por ejemplo, write Mrs Wright a letter right away.

Las técnicas de reconocimiento de los gestos han aparecido porque se ha necesitado resolver problemas novedosos y difíciles. Es preciso que los sistemas aprendan cuando hay ambigüedad en una serie de gestos y a discernir el fin de un comando, del inicio del siguiente. En el Centro de investigación de I.B.M se ha construido un sistema que reconoce gestos en dos dimensiones, realizado gracias a un dispositivo de posicionamiento que se parece al lápiz gráfico. Asociado a una tableta, este sistema permite al usuario, hacer la suma de dos grupos de números encerrándolos sobre la tableta gráfica y adicionando el signo +.

Las realidades artificiales están en pleno desarrollo, pero es difícil asociarlas a las máquinas ya desarrolladas. Cuando ese paso sea salvado, su costo no será un obstáculo; un guante numérico no cuesta más de $2.500.000,oo mientras que un CRAYX-MP cuesta más de $ 600.000.oo.

El esfuerzo de programación y de investigación emprendido sobre los sistemas de comunicación evolucionados representará sin duda la parte más costosa de su realización. ¿La ventaja que aportarán las realidades artificiales justificará esta inversión?

A priori, parece que los computadores dotados de tales sistemas, deberían ser más rápidos, más didácticos y más fáciles de programar que los sistemas tradicionales, pero es difícil cuantificar esta intuición.

¿Cuál es el valor exactos de las realidades artificiales? Se ignora, pero hace 20 años James Batter anotaba que ciertos estudiantes que estudiaban las representaciones gráficas de campos vectoriales en dos dimensiones parecían comprender mejor los conceptos representados cuando se les hacia “sentirlos”. Se utilizaba para esto, un dispositivo simple de aplicación de fuerza en dos dimensiones.

Experiencias como ¡a anterior nos ilustra el tipo de investigaciones a acometer con el fin de determinar si las ventajas que nos prometen las realidades artificiales no son simplemente ilusiones.

CIDEC - USCO 89