Hago una aplicación que puede leer PDF usando pdfminer.
ingrese la descripción de la imagen aquí
La aplicación está bien cuando se desarrolla.
Después de eso, empaqueto en un archivo .exe usando pyinstaller. Pero el resultado de lectura no es lo mismo que en desarrollo.
En detalle, no puede leer ** LTText LTTextBoxHorizontal por lo que no puedo obtener el texto extraído.
Cualquiera que sepa sobre este problema, por favor ayúdeme.


Registros en desarrollo Registros en desarrollo

Registros después de hacer pyinstaller

Logs after I do pyinstaller

Python 3.9.1
Pyinstaller 4.2
pdfminer.six==20201018
six==1.15.0
Command: pyinstaller --onefile file.py

Fuente relacionada:

 for index, page in pdf_object:
            # TODO: Only read last page - maybe change if PDF file change
            if index == number_of_page - 1:
                # read the page into a layout object
                self.interpreter.process_page(page)
                layout = self.device.get_result()
                print("Size of this page (%d, %d)" % (layout.x1, layout.y1))
                print("len = %d" % len(layout._objs))
                self.parse_obj(layout._objs)


def parse_obj(self, lt_objs):
    # loop over the object list
    print("Go loop")
    print(lt_objs)
    i = 0
    for obj in lt_objs:
        i += 1
        print("In loop %d" % i)
0
Pham Hung 22 ene. 2021 a las 13:15

1 respuesta

La mejor respuesta

El propietario de Pyinstaller lib me acaba de responder. Se solucionó agregando --additional-hooks-dir.

Consulte aquí para obtener más detalles.

Tal vez lo arreglen en pyinstaller para admitir pdfminer también en la próxima versión.

0
Pham Hung 2 feb. 2021 a las 03:54