Base de datos Cassandra

cassandra database 480x372 Base de datos Cassandra

Migración de grandes hacia Cassandra db

Por la red ha saltado la alarma ya que Twitter pretende migrar al sistema de base de datos Cassandra, hasta la fecha los de Twitter confiaban en la base de datos mysql con un complejo sistema de Twitter.

No es la primera compañía que migra hacia Cassandra tras la adquisición de MySQL por Oracle, un movimiento que no ha sido del agrado de prácticamente ningún desarrollador, además con estos movimientos tan sólo acrecentamos el temor de que Oracle acabe ahorcando el proyecto libre MySQL en favor de sus sistemas de bases de datos de pago.

La base de datos Cassandra fue liberada por Facebook en el año 2008, en la actualidad es usada por servicios web de alto tránsito y de alta actividad en cuanto a base de datos se refiere, nombres como Rackspace, Digg, Facebook, Cisco, etc son algunas de las compañías que ya trabajan bajo Cassandra el echo de que muchas redes sociales de gran renombre la utilicen es garantía de su funcionalidad pues bien es sabido que tanto Twitter como Facebook y Digg son las aplicaciones web que mueven un mayor volumen de registros de bases de datos.

Características destacadas de Cassandra

Cassandra DB dispone de algunas características muy interesantes entre las que destacamos:

Tolerancia a fallos

Los datos son replicados en múltiples nodos de forma que si falla uno el sistema es capaz de leer los datos desde cualquier otro nodo sin problema alguno sin ningún tipo de downtime o tiempo de espera, elevando así el tiempo de operatividad muy por encima de MySQL.

Descentralización de los datos

Todos los clusters que conforman una base de datos disponen de la misma información por lo que los datos están replicados y se encuentran en todos los puntos aportando toda la ventaja que implica la descentralización de los datos.

Modelo de datos avanzado

Cassandra dispone de lo que se denomina un Rich Data Model es decir un sistema eficiente y simple para la ejecución de consultas a la base e datos.

Elasticidad

Te permite leer y escribir simultáneamente sin interrupciones.

Requerimientos de Cassandra

Servidor Apache, 1Gb. de mínimo de memoria RAM bajo entornos virtualizados, si el hardware es dedicado debería ser superior a 4Gb. de todas formas es habitual encontrarse cluster con 16 y 32 Gb. de memoria RAM.

A nivel de CPU Cassandra trabaja de forma excelente con sistemas multi-núcleo así que a mayor número de cores, mayor rendimiento. Así pues si precisas de un gran rendimiento, no te cortes y tira por sistemas de cuatro u ocho núcleos.

Capacidad de disco, ideal 2 discos por cada cluster, en uno se almacena el llamado CommitLogDirectory o fichero de registro de activicidad (log) y en el otro los datos o DataFileDirectories.

Sistema operativo, lo mejor un sistema operativo de 64bits, a mayor estabilidad mejor rendimiento. Por supuesto, Unix o Linux, incluído Mac OSX.

Enlace: http://incubator.apache.org/cassandra/

Iconos para páginas web

iconos web 480x284 Iconos para páginas web

Hoy os traemos una fuente de inspiración para la realización de iconos, en especial nos han agradado su colección de iconos para el diseño de páginas web, la dirección principal de la página web es:

http://graphicriver.net/

Y la dirección donde puedes encontrar los iconos como el que te mostramos en la captura es:

http://graphicriver.net/user/ckng/portfolio

En esta web además de iconos podrás encontrar multitud de gráficos vectoriales, fotos y más cosas, todo a un precio más que competitivo y si no quiere adquirir ninguno pues ya saber afila tu programa de dibujo vectorial y a dibujar.

Por cierto, ¿qué programas prefieres de dibujo vectorial y bajo que entorno?

Nosotros utilizamos InkScape bajo Linux Ubuntu y también bajo Mac, Vosotros?

Hemerotecas de prensa española

Hoy nos hemos dispuesto a revisar diferentes hemerotecas de los medios españoles más conocidos, descubriendo tras ello una realidad asombrosa, un medio, La Vanguardia destaca mucho sobre resto, por su cantidad de contenidos, por la excelente aplicación web y por descubrir una nueva vía de monetización con la venta de contenidos reimpreso.

Así pues vamos a revisar algunas de las hemerotecas de los medios más prestigiosos de la actualidad Española.

La hemeroteca de La Vanguardia

La Vanguardia es el periódico que situa el listón en lo más alto en cuanto a funcionalidad y prestaciones de su aplicación web Hemeroteca, si bien consideramos esta herramienta recargada en exceso pasándole factura en cuanto a claridad y facilidad de uso por parte del usuario no avezado en la red de redes, cuando quizá es este usuario uno de sus principales target, los nostálgicos además de historiadores e investigadores.

Conserva todo su contenido en papel de forma prácticamente íntegra desde el año 1881, es decir ¡desde el siglo XIX! Gracias a esta aplicación online no sólo podrás encontrar la portada de La Vanguardia para un determinado día síno la práctica totalidad de la edición, eso sí a excepción de los días que caigan en lunes y se encuentre comprendidos entre los años 1920 y 1982 pues este es un período en el cual La Vanguardia no se publicaba los lunes.

La aplicación online de la vaguardia además permite realizar búsquedas por palabras claves, es gracias a esta lógica herramienta donde se puede extraer un mayor provecho a la herramienta dándole un sentido más enfocado a la investigación.

Con el objeto de realizar una prueba y a modo de reseña rápida os contaremos que hemos realizado multitud de búsquedas, la mayoría de ellas nostálgicas, fechas especiales por su contenido, y algunas con un marcado espíritu investigador, por ejemplo y ateniéndonos a la temática general de este blog, hemos buscado “Internet”

Si quieres puedes acompañarnos en la búsqueda clickando aquí: Internet en la hemeroteca de La Vanguardia (Se abrirá en una ventana nueva)

La aplicación nos data la primera noticia que se publicó en este medio conteniendo la palabra “internet” el 19 de diciembre de 1999.

hemeroteca lavanguardia 01 300x196 Hemerotecas de prensa española

Es destacable lo tardío de la primera aparición de la palabra internet en este medio español pues internet se creo en 1969 y comenzó a difundirse ampliamente con la llegada de la WEB o WWW allá por 1969, justos 30 años antes de esta primera aparición en un medio Español.

La aparición en sí no es realmente una noticia en sí, es una publicidad del fabricante de ordenadores Compaq, hoy absorbido o englobado por el gigante HP.

La calidad de ejemplar que nos muestra la aplicación web de la hemeroteca en pantalla no es muy buena, a decir verdad es realmente mala, pero esto se debe más al tipo de impresión que  utiliza la prensa que no a una digitalización defectuosa, ya que la prensa imprime con un punto o tramado muy grande, una fotografía o imagen está conformada por pocos puntos. Si descargas el fichero en formato PDF y lo visualizas a tamaño real, es decir al 100% la calidad es considerable.

También puedes solicitar la impresión con tapa dura de todo un ejemplar o de una página concreta, esto sin lugar a dudas es un filón y un posible negocio pues no es un buen regalo regalar a tus padres y abuelos el ejemplar intacto impreso del día que nació, o bien se utilizado de forma profesional por departamentos de marketing de grandes empresas donde gracias a la fabulosa herramienta que representa la hemeroteca de  La Vanguardia pueden realizar fenomenales clippings de prensa.

Hemeroteca del Mundo

En otros hemerotecas, como la de El Mundo, cuya interficie es mucho más cutre salchichera, más aún cuando se trata de un medio un tanto diestro y por tanto capitalitoso, en esta ocasión hemos encontrado la primera noticia con el término internet fechada en un todavía más cercano 2007… dios mío!  ¿Una noticia sin valor alguno, algo sobre unos tal Beckham y tan próxima a la actualidad?

Definitivamente El mundo no debe tener digitalizado todo su contenido pues parece que su publicación más antigua es de 1994 y a nivel de interactividad con el usuario debería mejorar y mucho su sistema de hemeroteca. Si necesitan un consultor de internet para enderezar semejante entuero… ¡que nos llamen!

También nos extraña que te hagan elegir entre la versión digital y la impresa… ¿Por qué? No debería ser el mismo contenido, diferente continente?

Par mayor desastre de esta publicación el formato no es original, es decir no está digitalizado como en el caso de La Vanguardia, donde puedes acceder al contenido tal cual fue impreso si no que es una transcripción pobre y sin fotografías de las noticias acaecidas en ese día.

Aquí os dejamos una captura del acceso a la hemeroteca:

hemeroteca elmundo 01 300x189 Hemerotecas de prensa española

Hemeroteca del El periódico de Catalunya

hemeroteca elperiodico 01 300x173 Hemerotecas de prensa española

Tan sólo un selector de fechas, tan sólo desde septiembre del 2006. Además los contenidos ofrecidos no son los originales como en el caso de La Vanguardia donde han realizado la ardua y costosa tarea de conseguir un ejemplar para cada día desde 1881 y digitalizarlo. El periódico muestra la noticia como cualquier otro medio de internet.

Tras desarrollar este artículo no cabe duda alguna que la apuesta que ha realizado La Vanguardia es toda una proeza y una referencia absoluta en cuanto a medios españoles se refiere. Un 10 para La Vanguardia, el resto de medios analizados no consigue ni un aprobado simplón.

Resaltamos que que El Periódico utiliza una interficie que no funciona bien bajo el navegador Safari en un ordenador Mac.

La hemeroteca de El País

El País nos presenta una propuesta similar aunque con mucho menos contenido, sólo desde 1976 y sin el buscador por frases a la ofrecida por La Vanguardia.

hemeroteca elpais 01 300x199 Hemerotecas de prensa española

Disponemos de un selector de fechas a través de las cuales podemos acceder a la versión digita de su correspondiente diario en papel de cualquier edición posterior a 1976. Si bien no todas las ediciones se encuentran en formato PDF descargable el entorno está bastante más pulido que los pobres casos del El Periódico y El Mundo.

La hemeroteca del ABC

Este otro medio español cuenta con un archivo que alcanza como máximo el año 1995 no pudiendo consultar noticias anteriores a esa fecha.

hemeroteca abc 01 294x300 Hemerotecas de prensa española

La aplicación web de hemeroteca de La Vanguardia cuenta con selectores de fecha y el típico buscador con palabras claves, típico porque debería estar habilitado en todas las hemerotecas aunque en la práctica esto no es así. Si bien el buscador de contenidos de ABC data como inserción de la palabra “internet” más reciente una noticia cercana, concretamente en el 2007.

El archivo que te ofrece no es visual ni permite descarga en PDF es una base de datos de noticias al uso, al igual que el resultado obtenido por El Periódico y El Mundo y que dista mucho del resultado ideal.

El posicionamiento en Google de la palabra hemeroteca

Como si Google fuese un experto en la materia, o bien porque salvajemente y debido al intenso uso al que sometemos la casi totalidad de internautas españoles le cedemos nuestro conocimiento a base de click, Google situa la hemeroteca de La Vanguardia como el primer resultado entre sus búsquedas naturales. Resultado que también ocupa este medio como resultado de pago o enlace patrocinado. Sin aparentemente a fecha de hoy aparecer ningún otro medio.

La segunda opción es la del medio El Mundo si bien la usabilidad y funcionalidad de la hemeroteca del mundo dista y mucho de la ofrecida por La Vanguardia.

Enlaces:

Hemeroteca de La Vanguardia: http://hemeroteca.lavanguardia.es/

Hemeroteca de El Mundo: http://www.elmundo.es/hemeroteca/

Hemeroteca de El Periódico de Catalunya: http://www.elperiodico.com/archivo.asp

Hemeroteca de El País: http://www.elpais.com/archivo/hemeroteca.html

Hemeroteca de ABC: http://www.abc.es/hemeroteca/

Antivirus gratis para PC

senyal de virus Antivirus gratis para PC

Hasta hace unos poco utilizábamos ClamWin en las máquinas Windows de la oficina y en la de familiares y amigos, si bien en más de una ocasión este antivirus gratuito ha demostrado no dar la talla tras acabar colándose algún que otro virus a más de un conocido ahora nos ha tocado investigar nuevas y diferentes opciones.

Estamos probando con mucho mayor éxito el Avira Antivir Personal. Si bien este antivirus no es compatible con Windows 2003 Server, a diferencia del ClamWin, parece funcionar sin mayores problemas tanto en XP como vista y el nuevo Windows 7

Avira Antivir Personal

antivirus gratis Antivirus gratis para PC

Es un antivirus de origen ruso, aunque lo puedes descargar en inglés, ClamWin se encuentra en Español, es una pega, pero tampoco se deben realizar demasiadas cosas en cuanto a configuración por lo que aquellos que andáis flojos de inglés no debéis tener excesivo miedo, podéis descargarlo desde:

http://www.free-av.com/en/trialpay_download/1/avira_antivir_personal__free_antivirus.html

Atentos pues se descarga en un fichero con extensión .exe lo que en determinados entornos, sobre todo bajo entornos corporativos o en servidores muy protegidos será un auténtico coñazo descargarlo, pues al detectar un .exe se niegan en redondo a decargar. Esto nos ha pasado en el servidor web de un cliente al que le llevamos el mantenimiento web, no hemos sido capaces de descargarlo en un Windows 2003 Server sin comprometer la seguridad del servidor, finalmente optamos por bajarlo en otra máquina, comprimir los 32 Mb. que pesa y subirlo al servidor mediante FTP, todo un despiste por parte de los creadores de este antivirus gratuito. Si bien lamentablemente este antivirus gratis parece no funcionar en ningún Windows Server.

Lo hemos testeado bajo Windows XP y Vista y aquí se que funciona y de forma muy óptima, así que usuarios de Windows ya sabéis, ahorrad y comprad un Mac que no son tan caros… bromas a parte, a instalarlo!

Actualizando a Ubuntu 9.10 Karmic Koala

Posted November 15th, 2009 in Distribuciones Linux, No se que, Sistemas operativos, linux, ubuntu by dedavid

Línea de tiempo de Ubuntu Karmic Koala

Línea de tiempo de Ubuntu Karmic Koala

La instalación el día de su salida nos ha dado algunos problemillas, suponemos que la saturación de servidores debido a que todo el mundo debe estar tirando de ellos era el causante de que no funcionase todo lo fino a lo que nos tienen acostumbrados la gente de Canonical.

Una vez comienza la descarga, existen varias fases la primera, algo extraña con un indicador de descarga pequeño que nos informa que se están descargando dos archivos, tarda bastante.

Al rato aparece un nuevo diálogo donde ya te informa de los diferentes pasos que se van a suceder.

  • Preparación de la actualización: Aquí te informará que va deshabilitar los repositorios no oficiales, luego deberás reactivarlos tú de forma manual
  • Configurar nuevos canales de software: Esta operación consume bastante tiempo y te puede informar de que algunas aplicaciones han dejado de soportarse… que miedo, cruzas los dedos y continuas.
  • Obteniendo paquetes nuevos: Informa que va a tardar unas 12 horas en descargarse 1250 Mb. menos mal que tenemos 20 Mb. de ancho de banda.. Tras dejarlo bajando durante toda una noche luego te encuentras el ya típico mensaje conforme ha ocurrido un error y no se ha completado la instalación. Tras tres intentos más parece que finalmente se consigue, supongo que debe ser por que se retoma la descarga de paquetes desde el último paquete que ha bajado con éxito.
  • Instalando actualizaciones: Aquí nuevamente problemas, advertencias, posibles cambios de configuraciones, cruzas los dedos le dices que sí a todo y a instalar… en medio de la instalación nuevo mensaje de error, con un mensaje diciendo algo así como que va intentar volver al momento anterior debido a un error… pánico en la oficina! A la tercera intentona o  a la cuarta, ya he perdido la cuenta y las ganas de contar. Éxito!!!
  • Limpiando: Aquí borra paquetes y cositas que se ha bajado. Se acerca el momento.
  • Reiniciando Equipo: Pues eso a probar!

Así a simple vista y tras haber trabajado con nuestro Ubuntu como workstation durante un par de horas te contamos algunos de los cambios visibles por el usuario, las pantallas de carga han mejorado si bien falta homogeneidad y sobra el splash screen con el efecto de luz, por favor señores de Canonical  dejen el logo centrado, como al principio y a lo sumo una barra hasta la pantalla de login de usuario, lo otro es algo ortera y está como algo forzado y sobrante, la pantalla de login muestra ahora los nombres de usuarios… dios hay varios que yo no los he creado!!! obviamente son usuarios propios del sistema, rollo getmail y demás por favor no mostradlo pues esto desorienta al usuario no avanzado, por el bien de la usabilidad, y otra cosa que antes me gustaba más ¿por qué ahora mostrais el nombre de usuario? antes era un form en blanco, para mi mucho más seguro pues del hacker debe adivinar dos valores, usuario y clave, ahora tan sólo dos.

Rendimiento, ahora sí que he notado una considerable mejora en el manejo del sistema en equipo equipado con procesador Atom.

Incompatibilidades, parece que todo funciona, el servidor web, el entorno de desarrollo Eclipse, los programas de apoyo, etc.

Página 1 de 212