Google ha aumentado sus capacidades de reconocimiento óptico de caracteres (OCR) con la compra de reCAPTCHA, una compañía que se originó en un proyecto de investigación de la Universidad Canrney Mellon y protege a 100.000 sitios web del spam y el fraude mediante imágenes distorsionadas que se supone que una máquina no puede comprender.
Desde Google explican que Captcha está diseñado para el ojo humano con el objetivo de impedir que programas maliciosos consigan millones de cuentas de correo electrónico para enviar spam. Un detalle que desvela Google es que la mayoría de los Captchas que ofrece la compañía proceden de periódicos y libros viejos escaneados. Por lo tanto para los ordenadores es difícil reconocer estas palabras porque la tinta y el papel se han degradado con el tiempo, de forma que la tecnología de la compañía también se puede utilizar para mejorar procesos de OCR para convertir imágenes escaneadas en texto plano.
La tecnología se puede utilizar para proyectos de escaneo de textos a gran escala como Google Books y Google News Archive Search. Tener la versión en texto de un documento es importante porque el texto plano se puede buscar, exportar a dispositivos móviles y mostrar visualmente a usuarios incapacitados.
Con la compra Google afirma que no sólo incrementará la protección ante el fraude y el spam de los productos de la compañía, sino que también mejorará el proceso de escaneado de sus libros y periódicos.
Los usuarios denunciaban que la compañía los había rastreado incluso cuando usaban el modo privado…
El Instituto Valenciano de Competitividad Empresarial financiará aquellas iniciativas que puedan solucionar incertidumbres científicas o…
Solo en el cuarto trimestre las empresas emergentes del país han levantado 1.500 millones de…
La región tiene 13 scaleups y destaca por sus empresas emergentes de salud y agrotech.
Valencia ha atraído en el primer semestre del año 30 millones de euros de inversión…
El diario estadounidense demanda a las dos compañías tecnológicas por haber usado sus contenidos para…