08 agosto 2006

Google libera cantidades masivas de datos

Google distribuirá 6 DVDs con un billón de palabras rastreadas de la WWW
Según comentan tanto Ricardo Galli como en el blog Dirson, ayer se produjo un relevante comunicado por parte de Google Research, en el que se anuncia que donarán a la comunidad una importante colección de registros, procedentes de las búsquedas que los usuarios efectúan en el popular buscador.


El conocimiento será liberado, tal y como comentan en Dirson, en forma de seis DVDs, que contendrán 1.011.582.453.213 palabras (más de un billón), dentro de ellas hay más de mil millones de secuencias de cinco vocablos que se repiten más de 40 veces (de gran utilidad para los analistas del lenguaje humano), y existen más de 13 millones de palabras únicas.

Los filólogos y los eruditos del lenguage estarán hoy, sin lugar a dudas, de enhorabuena. Y es que somos muy distintos no sólo hablando y escribiendo, sino buscando.



Enviado por Hispasec Sistemas a las 12:21 | Comentarios (0) | Trackbacks (0) | Enlace permanente | English version
Comentarios
No hay ningún comentario.
Trackbacks
Por favor envía los trackbacks a: http://www.hispasec.nospam/corporate/noticias/124/tbZ3ping
Reemplazando "nospam" por "com"
No hay trackbacks.
Enviar un comentario