Estaba descansando un día viernes después de la celebración del cumpleaños de un compañero del trabajo cuando mi jefe llega y me dice «Búsqueda fonética», mi primera reacción fue » D: , ya claro» y aqui me encuentro, buscando lo que más pueda sobre búsqueda fonética, algo tan nuevo para mí, quizás no tan nuevo para usted o quizás desconocido pero es algo interesante. La aplicación de búsqueda fonética es en registro de marcas, en el caso de yo tener una nueva marca que quiera registrar por Propiedad Intelectual debo saber primero si ya pertenece a otras marcas, en algunos lugares del mundo (México) creo es el primer paso mientras en Ecuador van a implementar (desconozco aún el asunto, el texto es para introducir al contexto).
Empecé a investigar, no hallaba mucha información en español y peor en inglés (preguntas en stackoverflow ), mientras buscaba una duda apareció, ¿Debo buscar en audio o texto?, luego recordé que sería una aplicación web en la que el usuario deberá buscar para saber si su posible marca está registrada o no
Ya dejaré el bla bla bla y entraré a lo técnico, ¿Qué es búsqueda fonética? Wikipedia lo define como un método de reconocimiento de discurso y se enfoca en el audio, es una entrada my vaga de pocas líneas. Una definicón más agradable es de Answers: «Método para localizar información en un archivo en la que un algoritmo es usado para localizar combinaciones de caracteres que suenan similiares (audio) <<o se leen similares, esto lo añadí>> para una combinación específica»
A continuación un pequeño ejemplo ilustrativo sobre los resultados que debería obtener al buscar:
Marcas registradas
- La casa del Detergete.
- Mi Segunda casa.
- La casa del Carburador.
- La casa del Pañal.
- Jardín Feliz.
- Helados Patito.
Búsqueda:
- Casa
Resultados:
- La casa del Detergete.
- Mi Segunda casa.
- La casa del Carburador.
- La casa del Pañal.
Buscando en la web encontré sobre el diseño de un sistema llamado BUFON (Búsqueda fonética, a Nathalie y a mí nos pareció gracioso, yo imagino un payaso). BUFON se integra con otros sistemas además de ser propietario para algún instituto de propiedad intelectual, lo analicé para introducirme en el tema. Lei sobre Solr y Lucen hasta que caí en manos de Open Search Server, apenas lo ví me pareció interesante y a mi jefe le agradó, la documentación es muy pobre así que por ahora está descartado.
Al tiempo en que estoy escribiento esta entrada, probaré son Sphynx, un full-text search engine. Veremos que tal me va y compartiré mi experiencia con Sphynx.
Le agradezco señor lector si leyó toda la entrada o se interesó. Entraré en más detalles en una próxima entrada sobre algoritmos relacionados a Búsqueda Fonética.
P.D.: Considero que estoy aprendiendo a escribir, en especial en un sentido en el que debo aprender a expresar el tecnicismo de una manera que el cliente entienda. Pronto habrá la siguiente parte de búsqueda fonética.