Closed

Proceso de Digitalización

This project received 11 bids from talented freelancers with an average bid price of $2117 USD.

Get free quotes for a project like this
Employer working
Project Budget
$1500 - $3000 USD
Total Bids
11
Project Description

Se requiere un proceso que digitalice un documento PDF o una Imagen a texto XHTML , resultado que será consumido en un proyecto mayor; debe mantener el formato y estructura del documento original en la medida de lo posible.

El proceso debe tener la siguiente funcionalidad:

• El proceso tendrá como entrada un archivo PDF o una carpeta de imágenes numeradas, los cuales serán considerados como documentos, y debe devolver como resultado un texto en formato XHTML

• Los estilos del resultado XHTML deben estar generados en un documento a parte, en formato CSS

• El proceso debe ser construido en lenguaje JAVA como una librería, la cual será utilizada en una implementación posterior

• Almacenar toda la información obtenida de la digitalización en una base de datos relacional PostgreSQL

• Deberá tener soporte para documentos con varias columnas de contenido (principalmente 2) y presentar el formato resultante en una sola columna

• Mantener sobre todo formatos de textos, fuentes, etc. (tamaño, fuente, negrita, cursiva)

• Mantener formato y posición de imágenes y tablas en el documento resultante, las imágenes serán almacenadas en disco

SUBMIT DATE

LAST UPDATED

Looking to make some money?

  • Set your budget and the timeframe
  • Outline your proposal
  • Get paid for your work

Hire Freelancers who also bid on this project

    • Forbes
    • The New York Times
    • Time
    • Wall Street Journal
    • Times Online