Categories: CloudSaaS

Google actualiza la API de Cloud Speech

La API de Google Cloud Speech, que desde su lanzamiento en 2016 ha permitido a los desarrolladores utilizar los servicios de Google para transcribir palabras habladas a texto ha recibido hoy una importante actualización.

La novedad más interesante de la API es la adición de soporte para 30 nuevos idiomas, que se suman a los 89 lenguajes que ya entendía el servicio, incluyendo múltiples variantes regionales del inglés, español y árabe. En la lista de estos nuevos idiomas encontramos el bengalí, letón y suahili. Según Google, los nuevos lenguajes incorporados a la API de Cloud Speech son hablados por alrededor de 1.000 millones de personas.

Además, Google también ha introducido algunas características principales nuevas. Entre ellos está el soporte a las marcas de tiempo a nivel de palabra, informa TechCrunch. La idea es etiquetar cada palabra con su marca de tiempo para que los desarrolladores puedan, por ejemplo, permitir fácilmente a sus usuarios oír como sonaba una palabra dada.

Esto es especialmente interesante para los servicios de transcripción y traducción supervisados por humanos que utilizan esta API para acelerar sus flujos de trabajo. “Tener la habilidad de mapear el audio al texto con marcas de tiempo reduce significativamente el tiempo transcurrido en la revisión de las transcripciones”, explica el cofundador de Happy Scribe, André Bastie, cuya compañía utiliza Cloud Speech para su servicio de transcripción de entrevistas.

También aumenta el tiempo de los archivos que los desarrolladores pueden subir al servicio, que pasa de los 80 minutos de la versión anterior hasta a 3 horas de duración. Los desarrolladores también pueden solicitar una extensión de cuota para cargar archivos aún más largos. Al igual que hasta ahora, los desarrolladores pueden obtener 60 minutos de procesamiento de audio gratuito a través de la API de voz y facturar 0,006 dólares cada 15 segundos adicionales.

Juan Miguel Revilla

Periodista y profesor, ha ejercido como redactor y editor en medios de información política y cultural. Desde 2012 trabaja en el campo de las nuevas tecnologías. Actualmente es redactor de Itespresso.

Recent Posts

Google paga 5.000 millones de dólares para resolver una demanda colectiva

Los usuarios denunciaban que la compañía los había rastreado incluso cuando usaban el modo privado…

11 meses ago

Las pymes valencianas pueden optar a ayudas de 5,5 millones de euros por proyectos de I+D

El Instituto Valenciano de Competitividad Empresarial financiará aquellas iniciativas que puedan solucionar incertidumbres científicas o…

11 meses ago

La guerra entre Israel y Gaza no acobarda a los inversores extranjeros de startups

Solo en el cuarto trimestre las empresas emergentes del país han levantado 1.500 millones de…

11 meses ago

Navarra ya cuenta con más de 80 startups

La región tiene 13 scaleups y destaca por sus empresas emergentes de salud y agrotech.

11 meses ago

Las startups valencianas progresaron adecuadamente en 2023

Valencia ha atraído en el primer semestre del año 30 millones de euros de inversión…

11 meses ago

El New York Times acusa a Open AI y Microsoft de infringir sus derechos de autor

El diario estadounidense demanda a las dos compañías tecnológicas por haber usado sus contenidos para…

11 meses ago