¿Dónde estoy?

Estás leyendo una anotación de Mpc Digital, un weblog acerca de tecnología, informática y sociedad. Al final puedes leer los comentarios de algunos lectores y dejar el tuyo. En el enlace PDM en la parte superior puedes leer más sobre este sitio y consultar el resto de anotaciones.



Se lee en 3 minutos aproximadamente

Reconocimiento de caracteres para evitar spam

Jueves 27 de octubre de 2005 | Sin categoría | y nadie ha dicho nada

Segu­ra­mente algu­nas per­so­nas se pre­gun­tan en qué con­siste el código antis­pam que mete blog­ger y otros sis­te­mas de publi­ca­ción, pues hoy van a poder dor­mir tran­qui­los, por­que por fin en este blog (refe­ren­cia inter­na­cio­nal en cul­tura ciber­né­tica) lo voy a explicar.

La cosa es impe­dir que un orde­na­dor spa­mea­dor se dedi­que a lle­gar a los blogs y empe­zar a meter comen­ta­rios a dies­tro y sinies­tro con el único fin de publi­ci­tar algo que segu­ra­mente no nos interesa. Para evi­tar que esto ocu­rra, lo que hace es pre­sen­tar­nos una ima­gen de este tipo:

caracteres1

Los spa­mea­do­res podrían inten­tar meter un pro­gra­mi­lla inte­li­gente que ana­li­zara esa ima­gen y tra­tara de sacar el código, pero lo tie­nen algo com­pli­cado por­que cada vez que se intenta poner un comen­ta­rio, blog­ger cam­bia el for­mato de letra, el tamaño, el color, cuida que no tenga nin­gún sen­tido la pala­bra y ade­más lo des­a­li­nea para que sea más chungo detec­tar el tipo de letra.

El pro­ceso de reco­no­cer carac­te­res es rela­ti­va­mente sen­ci­llo. Si por ejem­plo blog­ger pusiera como código antis­pam algo así de simple:

caracteres2

El robot de reco­no­ci­miento de carac­te­res lo ten­dría así de sen­ci­llo:
Pri­mero inten­ta­ría bus­car en qué lugar de la ima­gen se encuen­tra el texto, ins­cri­bién­dolo en un rectángulo.

caracteres3

Luego inten­ta­ría tras­la­darse por ese área bus­cando los espa­cios en blanco que sepa­ran las letras.

caracteres4

Luego en cada pequeña área inten­ta­ría saber qué letra repre­senta, según el tamaño del cua­drado donde está ins­crito, hay pocas opcio­nes, por­que depende de la forma grá­fica de cada letra!!
Y por último, debe­ría pasar esa pala­bra ya reco­no­cida al campo corres­pon­diente donde debe­ría relle­nar el valor de la ima­gen.
¿Fácil?
Ahora vamos a inten­tar lo mismo con uno de los ejem­plos de arriba:

caracteres5

Si inten­ta­mos hacer el mismo pro­ce­di­miento…
La pri­mera parte está fácil, lo cua­dra­mos en un rec­tán­gulo que abar­que todo el texto:

caracteres6

Hasta aquí todo va bien, pero ahora viene lo complicado…je.. ¿Dónde está el espa­cio entre cada letrica? Y para colmo lo pone en cursiva!!

Los pro­gra­mas pro­fe­sio­na­les de reco­no­ci­miento de carac­te­res son capa­ces de reco­no­cer cur­si­vas, pero no cuando se encuen­tran des­a­li­nea­das res­pecto a la hori­zon­tal, y por supuesto cuando hay espa­cio de sepa­ra­ción entre las letras!!

Vía Ceci­li­da­des


Sin comentarios

Los comentarios de este post en RSS
Los comentarios estan cerrados.

Referencias (Trackbacks)

Para hacer una referencia (trackback) a esta anotación usa esta URL


  • Que esté relacionado con la anotación. Aporta algo interesante a la conversación.
  • Se permiten y esperan las etiquetas XHTML usuales.
  • En concreto, un enlace se escribe así: <a href="http://www.xyz.com">texto legible xyz</a>
  • Esto es la Web, no un SMS. No escribas en "jerga SMS". Tienes todo el espacio que quieras.
  • No insultes ni utilices palabrotas. No molestes a los demás, respeta a las personas que hay al otro lado de la pantalla.
  • "Es mejor estar callado y parecer tonto, que hablar y despejar las dudas definitivamente." De Groucho Marx.
  • Hay más información sobre todo esto en la Guía para comentar en weblogs y en el Microsiervos FAQ, Normas y Consejos

Licencia Creative Commons Reconocimiento-CompartirIgual 2.5 2010 Mpc Digital, Hecho en Triana Hecho en Triana
Manifiesto por la liberación de la cultura Libre de publicidad

39 consultas en 0,946 segundos.