in

El reconocimiento de voz es el futuro (Microsoft)

Todo sobre el iPhone 3GS

A pesar de que la explosión de las pantallas táctiles haya sido generada por el éxito irrefutable del iPhone en todas sus variaciones, el gigante de Redmond ha estado trabajando duro para incorporar esa capacidad a sus productos, más específicamente hablando, en el Zune HD y en Windows 7. Sin embargo, en Microsoft creen que la siguiente interfaz por excelencia será algo que hasta ahora ha tenido una existencia bastante difícil: El reconocimiento de voz. Llegará un momento en que dejaremos de lado ratones y teclados, para dedicarnos a hablar frente al ordenador y obtener del mismo respuestas tan eficientes como las que logramos con las interfaces actuales. ¿Será cierto?

Cada vez son más los dispositivos móviles y los ordenadores que incorporan capacidad táctil. La idea de "tocar la pantalla" tuvo su época oscura y de rechazo frente a alternativas más económicas y amigables como el ratón, pero se necesitaba algo que volviera a colocar a esa tecnología en el primer plano. Ese algo resultó ser el iPhone de Apple, y desde entonces es algo casi inconcebible encontrar a un móvil que no posea alguna forma de touchscreen, por más limitada que sea. Este resurgimiento del concepto táctil fue adoptado por diferentes fabricantes, tanto de software como de hardware, y Microsoft se encuentra en esa lista. Sólo basta con ver lo que han logrado con el Zune HD para comprender que el gigante de Redmond ha recibido el mensaje. Lo mismo puede decirse sobre Windows 7, completamente compatible con multitouch y vendido junto con ordenadores que poseen esa capacidad. Pero Microsoft piensa que las interfaces pueden ser llevadas más allá, al punto de hacerlas desaparecer. ¿Cómo? Adoptando a nada menos que el reconocimiento de voz.

Debo admitir que los ejemplos de reconocimiento de voz que he visto (y escuchado) rozaban lo patético en el mejor de los casos. No he conocido a un solo usuario dispuesto a realizar ejercicios de media hora frente a un micrófono para que el ordenador "reconozca" los patrones de voz y los asocie a palabras. Incluso Microsoft ha tenido sus momentos de pesadilla implementando este tipo de reconocimiento en Windows Vista (nadie puede olvidar el vídeo que está más arriba), pero en Redmond creen que será sin lugar a dudas, la interfaz del futuro. Según palabras de Zig Serafin, "La voz es el nuevo ‘touch’. Es la evolución natural de teclados y pantallas táctiles. Hoy en día, el habla se está convirtiendo en una parte esperada de nuestra experiencia diaria a través de una variedad de dispositivos.".

Obviamente hay que reconocer que, más allá de las dificultades técnicas que el reconocimiento de voz ha tenido hasta ahora, su potencial sigue siendo enorme. Una mayor velocidad de ingreso de datos sería el más pequeño de los beneficios. Con un reconocimiento de voz eficiente se podría lograr que un preocupante grupo de incautos deje de enviar mensajes de texto mientras conduce, al mismo tiempo que se podría expandir las capacidades de interacción para aquellos que sufren una discapacidad física que les impide utilizar las interfaces actuales. Microsoft trabaja en el reconocimiento de voz desde hace una década, pero tampoco es el único en ello. Google ya ha implementado su propio sistema en Android, y Apple comienza a explorar el potencial de la voz en su iPhone, por lo que es probable que nos encontremos ante una nueva carrera tecnológica de aquí a un par de años.

Reportar

¿Qué te pareció?

Escrito por Lisandro Pardo

18 Comments

Leave a Reply
  1. Claramente és el futuro, pero ya se ve, aun le faltan años de investigación. Una pena.

    Espero al menos llegar a vivirlo (vivirlo plenamente claro) y poder "hablar" con mi ordenador, GPS, mobil o lo que hayan inventado en un futuro.

    Aunque, por otro lado, creo que a la tecnologia tactil le falta aun mucho por investigar (quiero entrar a internet pulsando en la pantalla de mi ordenador! xD)

  2. Siempre el reconocimiento de voz será algo difícil de manejar por diversas razones como el tono de nuestra voz según el ánimo que tenemos y creo que lo más dificil imagino que será entender a una voz dentro del ruido ambiental que siempre existe… pero igual estoy seguro que se podrá lograr más o menos pronto

  3. Definitivamente pienso sera un complemento importante mas no reemplazo total de nuestros perifericos porque jugar seria desastrozo…dispara no espera ya no disparez…XD

    Seria interesante como complemento como dando ordenes verbales a tus juegos en modo guerra creo ya hay un juego asi…

    Lo que yo espero es un evolucion del teclado para que funcione como este y pero dentro de una gran pantalla tactil situada donde tienes tu teclado y activar el modo teclas cuando lo necesites y que funcione a su vez como una gran pantalla tactil sin necesida de estar acercandote a tu monitor..como la pantalla tactil de una portatil pero gigante..

    Si deseas dar ordenes por voz fail aprietas un boton y activas o desactivas el reconocimiento de voz para que tu carro se active por voz en el momento que lo necesites y por ejemplo al cerrar las puertas se active automaticamente este reconocimiento y cuando regreses solo se abre con tu voz…

  4. ESTA INFORMACION NO ESTA COMPLETA, EXISTE EL DRAGON NATURALLY SPEAKING DESDE HACE MUCHISIMO TIEMPO Y LA ULTIMA VERSION ME FUNCIONA A 99%, LO CUAL ES MUCHISIMO MEJOR QUE EL TECLADO

  5. Hola, mi nombre es Fran y, debido a una distrofia muscular que tengo, uso como ayuda el Dragon Naturally Speaking en su versión décima. Es muy bueno, incluso va bien sin entrenamiento, que se hace en cinco minutos perfectamente. También sirve para mover el ratón y hacer clic.

    No obstante, a mi parecer, el futuro está en lograr el control del ratón con el movimiento de la pupila y el párpado. Sería mucho más rápido y efectivo pero, por desgracia, eso sí que está en pañales. Un abrazo

  6. La investigacion sobre reconocimiento de voz tiene muchisimo mas tiempo, yo llegue a utilizar el Dragon Naturally Speaking hace 9 años y la verdad es que funcionaba excelente y el entrenamiento no fue para nada engorroso, aprox 10 minutos leyendo diversos textos. Creo que el reto en este apartado es precisamente lo que comentaban sobre vencer las dificultades que presenta el ruido ambiental ya que provoca que estos sistemas se "confundan" facilmente. Tambien considero que mas que un reemplazo pueden ser un gran COMPLEMENTO a un sistema tradicional (teclado y mouse) o un touch ya que de sustituirle creo que perderiamos cierta privacidad en nuestro trabajo, imaginemos por ejemplo en la oficina quien este manejando los numeros de la empresa o redactando los nombres de los proximos despedidos o peor aun en nuestra casa al querer accesar a internet y tener que decirle a la computadora "Abrir Firefox, Entrar a triple w punto mi pagina favorita de porno punto com"

  7. @Cienfuegos :Definitivamente pienso sera un complemento importante mas no reemplazo total de nuestros perifericos porque jugar seria desastrozo…dispara no espera ya no disparez…

    jajjajaja muy bueno el chistorin… corre, corre, corre maldicion… dispara, dispara y corre! (terminariamos todos sudados despues de 5min)

  8. el unico pero que le veo al uso cotidiano de la voz en la pc es que si quisiera navegar en paginas porno todos a mi alrededor se darian cuenta de lo que ago ~.~

  9. OS/2 Merlin 4.0 Ya incluía reconocimiento de voz (sí, en los tiempos de Windows 95)

    IBM ViaVoice y Dragon NaturallySpeaking tambien llevan años entre nosotros. Yo usé el Dragon 7.0 y funciona igual de bien que el reconocimiento de voz de Windows Vista. Sí, necesita entrenamiento, pero vale la pena.

    No obstante por la noche no puedes hacer ruido, si tienes un micrófono en la mesa ocupa espacio, si está integrado será más difícil que te oiga bien, y si te pones auriculares con micro es incómodo a la larga…

    Se ha de mejorar la precisión en los micrófonos integrados, lejos del locutor, y ahí entonces es cuando despegará, eso combinado con reconocimiento de gestos (como pantalla multitáctil pero sin tocarla), del tipo Minority Report. De hecho esa tecnología combinada de gestos y reconocimiento de voz ya la está desarrollando Microsoft con Project Natal para 360, y no me extrañaría nada que la aplicara a los ordenadores…

  10. Y como sabrá el reconocedor de voz si me refiero a una baca (de un coche) o a una vaca (con v de vaca xD).

    ¿Va a necesitar esperar a que la tecnología sea tan inteligente como la mente humana? Si es así no creo que dependamos única y exclusivamente de esta tecnología hasta que no pasen 30 años o más.

  11. Se que lo ideal seria que la computadora tenga la suficiente inteligencia artificial como para que puedas decirle absolutamente todo lo que quieras hacer y lo haga correctamente, pero pues por algo se empieza.
    Cuando pueda usar el photoshop sin usar el teclado, raton, lapiz digital y demas se podra decir que hemos llegado a ese dia 😛

  12. La verdad es que yo he usado el Dragon Naturally Speaking version 10, y flipo con lo que leo aquí, que me digais que cómo invento rudimentario no esta mal pase, pero vamos, que eso de que es la panacea ni de lejos, prefiero escribir a tener que estar todo el rato borrando muchas cosas que no entiende, porque cómo dice el artículo "No he conocido a un solo usuario dispuesto a realizar ejercicios de media hora frente a un micrófono para que el ordenador "reconozca" los patrones de voz y los asocie a palabras". Por no hablar de cómo se raya al intentar navegar el dichoso programita.

  13. Hola,
    Algun experto me puede ayudar a buscar un traductor inteligente o algo parecido,para facilitar el estudio del ingles?Que opciones hay en esta clase de tecnologia?Por favor ayudenme con esto!!

    Gracias,

    Sandro0235

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Trajes espaciales inteligentes

Barcelona contará con nuevo superordenador