¿Dónde estoy?

Estás leyendo una anotación de Mpc Digital, un weblog acerca de tecnología, informática y sociedad. Al final puedes leer los comentarios de algunos lectores y dejar el tuyo. En el enlace PDM en la parte superior puedes leer más sobre este sitio y consultar el resto de anotaciones.



Se lee en 1:34 minutos aproximadamente

Reconocimiento de caracteres para evitar spam

jueves 27 de octubre de 2005 | Uncategorized | y nadie ha dicho nada

Seguramente algunas personas se preguntan en qué consiste el código antispam que mete blogger y otros sistemas de publicación, pues hoy van a poder dormir tranquilos, porque por fin en este blog (referencia internacional en cultura cibernética) lo voy a explicar.

La cosa es impedir que un ordenador spameador se dedique a llegar a los blogs y empezar a meter comentarios a diestro y siniestro con el único fin de publicitar algo que seguramente no nos interesa. Para evitar que esto ocurra, lo que hace es presentarnos una imagen de este tipo:

caracteres1

Los spameadores podrían intentar meter un programilla inteligente que analizara esa imagen y tratara de sacar el código, pero lo tienen algo complicado porque cada vez que se intenta poner un comentario, blogger cambia el formato de letra, el tamaño, el color, cuida que no tenga ningún sentido la palabra y además lo desalinea para que sea más chungo detectar el tipo de letra.

El proceso de reconocer caracteres es relativamente sencillo. Si por ejemplo blogger pusiera como código antispam algo así de simple:

caracteres2

El robot de reconocimiento de caracteres lo tendría así de sencillo:
Primero intentaría buscar en qué lugar de la imagen se encuentra el texto, inscribiéndolo en un rectángulo.

caracteres3

Luego intentaría trasladarse por ese área buscando los espacios en blanco que separan las letras.

caracteres4

Luego en cada pequeña área intentaría saber qué letra representa, según el tamaño del cuadrado donde está inscrito, hay pocas opciones, porque depende de la forma gráfica de cada letra!!
Y por último, debería pasar esa palabra ya reconocida al campo correspondiente donde debería rellenar el valor de la imagen.
¿Fácil?
Ahora vamos a intentar lo mismo con uno de los ejemplos de arriba:

caracteres5

Si intentamos hacer el mismo procedimiento…
La primera parte está fácil, lo cuadramos en un rectángulo que abarque todo el texto:

caracteres6

Hasta aquí todo va bien, pero ahora viene lo complicado…je.. ¿Dónde está el espacio entre cada letrica? Y para colmo lo pone en cursiva!!

Los programas profesionales de reconocimiento de caracteres son capaces de reconocer cursivas, pero no cuando se encuentran desalineadas respecto a la horizontal, y por supuesto cuando hay espacio de separación entre las letras!!

Vía Cecilidades

Ver reacciones en otros blogs

Sin comentarios

Los comentarios de este post en RSS
Los comentarios estan cerrados.

Referencias (Trackbacks)

Para hacer una referencia (trackback) a esta anotación usa esta URL


  • Que esté relacionado con la anotación. Aporta algo interesante a la conversación.
  • Se permiten y esperan las etiquetas XHTML usuales.
  • En concreto, un enlace se escribe así: <a href="http://www.xyz.com">texto legible xyz</a>
  • Esto es la Web, no un SMS. No escribas en "jerga SMS". Tienes todo el espacio que quieras.
  • No insultes ni utilices palabrotas. No molestes a los demás, respeta a las personas que hay al otro lado de la pantalla.
  • "Es mejor estar callado y parecer tonto, que hablar y despejar las dudas definitivamente." De Groucho Marx.
  • Hay más información sobre todo esto en la Guía para comentar en weblogs y en el Microsiervos FAQ, Normas y Consejos

Licencia Creative Commons Reconocimiento-CompartirIgual 2.5 2008 Mpc Digital, Hecho en Triana Hecho en Triana
Manifiesto por la liberación de la cultura Libre de publicidad
Otros Ad-Free Blogs | Al Azar
Perfil en econozco

36 consultas en 2.283 segundos.