Los centros de datos de Google, al igual que los de otras grandes compañías, usan métodos ingeniosos y de su propia cosecha para lidiar con el problema de las ingentes cantidades de datos.
En el caso de Google, nos encontramos con MapReduce, sistema que le permite manejar datos de todo tipo en un complejo proceso dividido en otros más pequeños distribuidos entre una ingente cantidad de ordenadores.
MapReduce se basa en 2 pasos fundamentales:
-Mapeado: en éste una computadora principal evalúa una petición y la divide en subproblemas que asigna a otros ordenadores, y así sucesivamente. Luego se graba la información y se mantiene en los discos duros de los ordenadores finales en vez de centralizarlos.
-Reducción: aquí, otros ordenadores “operarios” cogen la información de los anteriores y la ordenan en un formato que permita resolver la petición.
Al final obtenemos un “conjunto de datos sobre tus datos” que se ha generado específicamente para responder a una petición.
Pero ésta es la manera en la que maneja los datos de sus servicios. Para indexar internet, Google está desarrollando y refinando continuamente nuevas tecnologías de búsqueda. Tenéis más información sobre los algoritmos que utilizan aquí.
Supongo que tratar con una cantidad tan inmensa de datos debe ser complicado y Google lo hace de maravilla, pero la verdad es que a veces creo que mi primo de 3 años podría darme resultados mejores o por lo menos con mucho más sentido. Si no, probad a poner algo y darle a “Voy a tener suerte”, la necesitarás.— :Dani Burón [Wired]
Los usuarios denunciaban que la compañía los había rastreado incluso cuando usaban el modo privado…
El Instituto Valenciano de Competitividad Empresarial financiará aquellas iniciativas que puedan solucionar incertidumbres científicas o…
Solo en el cuarto trimestre las empresas emergentes del país han levantado 1.500 millones de…
La región tiene 13 scaleups y destaca por sus empresas emergentes de salud y agrotech.
Valencia ha atraído en el primer semestre del año 30 millones de euros de inversión…
El diario estadounidense demanda a las dos compañías tecnológicas por haber usado sus contenidos para…