¿Sabes por qué es bueno registrarte?
¿Sabes por qué es bueno registrarte?
Un problema que hemos tenido todos, al menos una o dos veces en nuestra vida profesional, ha sido la necesidad de pasar información desde un formato PDF a un formato Excel o Word. A Word, generalmente es más sencillo, porque no solemos tener tablas, que por lo general, son las que terminan de hacer imposible el cambio de formato. Bien, he conseguido una herramienta que nos permite hacer esto sin problema, al menos eso dicen los que la distribuyen.
La gente de http://www.investintech.com/ me ha pasado una licencia de su software Able2Extract PDF Converter 9 para que la testee y eso es lo que vamos a ver, si hace o no, lo que dicen.
Interface: Able2Extract PDF Converter 9.
Antes de nada, nos hemos bajado la versión de prueba de la aplicación y la he instalado con el número de serie que nos proporciona el fabricante.
La apariencia de la aplicación es de ser una herramienta muy intuitiva. Tiene un menú en la parte superior en el que se activan o desactivan las opciones, según avanzamos en el proceso.
El idioma es Inglés por defecto y no se puede cambiar.
Usabilidad de la herramienta es muy sencilla y podemos decir que el trabajo se realizaría de la siguiente forma:
La licencia que me han dado no es profesional, de forma que me ha sido imposible probar que tal funciona el OCR, así que no puedo deciros si es o no posible obtener datos, desde en formato Office desde un documento escaneado o una imagen.
Para las pruebas, he utilizado 2 documentos. Un .pdf para pasar a Word365 en el que hay insertado texto, imágenes, formas y listas. Hay textos con negrita, subrayado y sin estilos. Tamaño, 2 páginas. El aspecto es el siguiente:
El otro documento es un .pdf con tablas de Excel. La apariencia real en Excel es la siguiente:
Pero, al convertirlo a pdf han resultado dos páginas, que son las siguientes:
Como podéis observar en ninguna de las dos pruebas que vamos a hacer, se lo estamos poniendo fácil.
1ª. Prueba:
El resultado sorprendentemente ha sido realmente bueno. Ha discriminado correctamente entre los diferentes tipos de textos, niveles de lista y formas insertadas. También claro está las imágenes.
No se ha descolocado ninguna parte del contenido. Os enseño cómo ha quedado:
Únicamente no ha puesto correctamente las viñetas de las listas. Un mal menor, ya que siempre que se utiliza esta técnica, hay un trabajo posterior de revisión y corrección.
2ª. Prueba:
El resultado en este caso, es distinto del anterior. Aunque la obtención de la información buena. Hay un trabajo de re-estructuración de las tablas. Cuando tenemos celdas combinadas la aplicación se hace un poco de lío. No obstante, no es un gran problema.
Hay que tener en cuenta que cuando hacemos este trabajo, contamos con el original, de forma que modificar nuestra hoja Excel para cambiar la apariencia y lograr un resultado parecido al documento desde el que partimos, no es difícil.
Evidenemente, en la transformación, no hay fórmulas dentro de las celdas ya que en el PDF, no se distinguen. Sólo contiene información final. Los datos son bastante de salida en excel son bastante buenos, ya que no he detectado ningún error. Lo que si que cambia es la disposición de las tablas, pero es un mal menor. Os adjunto pantallazo de cómo ha quedado:
Como es evidente y en vista de los resultados, no puedo dejar de recomendaros que utilicéis esta aplicación. Able2Extract PDF Converter 9, ya que funciona mucho mejor que otras aplicaciones que existen en el mercado.
Si la versión profesional funciona tan bien como esta, y el OCR nos permite obtener la información de fotografías e imágenes como lo hace desde los PDF, seguro que la compra de la licencia será una muy buena inversión para cualquier empresa.
Consigue las últimas actualizaciones por email »
Añadir nuevo comentario