Portable Document Format (PDF) es un estándar abierto para el intercambio electrónico de documentos mantenido por la Organización Internacional de Normalización (ISO). Las preguntas pueden ser sobre la creación, lectura, edición de archivos PDF utilizando diferentes idiomas.

pdf...

full_text = '' i=0 while i<pdf_reader.getNumPages(): pageinfo = pdf_reader.getPage(i) text += str(pageinfo.extractText()) print(pageinfo.extractText()) i = i + 1 Estoy intentando extraer todo el texto de un archivo PDF, puedo extraer todos los textos mediante el bucle for. Sin emba....
6 ago. 2020 a las 07:11
Entonces, estoy tratando de combinar varios archivos (PDF e imágenes) usando solo Python. Hasta ahora se las arregló para hacerlo con archivos PDF e imágenes "JPG". Sin embargo, cada vez que intento convertir imágenes "PNG" a PDF usando PIL, aparece un error que dice "ValueError: no se puede guardar....
5 ago. 2020 a las 00:34
Por favor, no use "tika" como respuesta. Ya probé las respuestas de esta pregunta: ¿Cómo extraer texto de un archivo PDF?Tengo este archivo PDF, https://drive.google. com / file / d / 1aUfQAlvq5hA9kz2c9CyJADiY3KpY3-Vn / view? usp = sharing, y me gustaría copiar el texto. import PyPDF2 pdfFileObje....
30 jul. 2020 a las 17:40
Estoy tratando de mostrar una celda de tabla tachada. He probado decenas de enfoques diferentes. Mi mejor solución fue usar cuatro gradientes lineales, uno para cada esquina (porque no hay soporte para fondos transparentes). El problema aquí es que tengo que especificar la altura de la celda de ....
29 jul. 2020 a las 12:49
Estoy tratando de hacer un sitio web de páginas Github. Tengo una imagen de mi informe en mi página. Quiero poder hacer clic en la imagen y abrir el PDF en una nueva pestaña. ¿Como podría hacerlo? ¿Es esto correcto? <a href="/uploads/ReportBlank.pdf"><img src="images/report_placeholder.png"/></a> ....
23 jul. 2020 a las 16:51
Estoy tratando de extraer todos los enlaces PDF en esta página. Mi código es : import requests from bs4 import BeautifulSoup from pprint import pprint base_url = 'https://usda.library.cornell.edu' url = 'https://usda.library.cornell.edu/concern/publications/3t945q76s?locale=en#release-items' soup....
21 jul. 2020 a las 18:15
Actualmente, estoy desarrollando mi sitio web personal usando vuejs y me encuentro con un error cuando intento abrir mi currículum en otra ventana haciendo clic en un botón. Lo que sucede es que, cuando hago clic en el botón correspondiente, en lugar de abrir el pdf, vuelve a mostrar la página de in....
19 jul. 2020 a las 05:50
Actualmente estoy tratando de descargar algunos archivos pdf de http://annualreports.com/Company/abercrombie-fitch y tengo problemas para descargar el Informe anual de 2019. Actualmente estoy usando response = urllib2.urlopen("http://annualreports.com" + link) file = open(name, 'wb') file.write(resp....
15 jul. 2020 a las 21:13
Actualmente estoy trabajando en un proyecto desactualizado que firma PDF / A y trató de actualizar sus dependencias. El relevante aquí es co.lowagie.itext que actualicé de 1.4 a 5.5.13.1. Mucho ha cambiado porque se eliminó la función PdfSignatureAppearance.setCrypto(). Implementé la corrección en t....
15 jul. 2020 a las 10:53
Estoy raspando un sitio web al que se puede acceder desde este enlace, usando Beautiful Soup. La idea es descargar todos los href que contienen la cadena .pdf utilizando el módulo get. El siguiente código demostró el procedimiento y funciona según lo previsto: filename = 'new_name.pdf' url_to_downlo....
11 jul. 2020 a las 10:57
Consulte este PDF. Es un formulario PDF que se puede completar y quería saber si hay alguna forma de que este pdf se pueda completar automáticamente, si tengo los datos para completar en cada cuadro en formato Excel. Sé que la mayoría de los PDF están en formato binario, pero hay alguna forma de sab....
6 jul. 2020 a las 19:24
Estoy tratando de desarrollar un código frontend que le pide al usuario que proporcione un pdf y luego internamente (en el navegador de los usuarios) produce una matriz de png (a través de datos a url) donde cada entrada en la matriz corresponde a una página en el pdf: Dat [0] = png de la página 1 ....
5 jul. 2020 a las 21:02
Estoy tratando de producir la salida pdf de Rmarkdown. La función RankAggreg () (del paquete RankAggreg) ejecuta varias iteraciones durante el análisis que también se imprimen en mi salida en pdf. ¿Alguien tiene idea de cómo puedo evitar que la iteración se imprima en mi salida pdf? He intentado usa....
3 jul. 2020 a las 13:38
Simplemente tratando de convertir un .docx a un .pdf Me cuelga un aviso de "Archivo en uso" de que tengo el archivo bloqueado para editarlo cuando se ejecuta doc = word.Documents.Open (in_file) . Si copio / pego el archivo .docx original en la misma carpeta (y ajusto los archivos de entrada / salid....
26 jun. 2020 a las 17:49
Estoy usando PDFBox para leer campos específicos en un documento pdf. En realidad, puedo obtener toda la información que quiero con un pdf que contiene solo una página. El PDF tiene campos con nombres específicos y puedo obtener todos los campos e insertarlos en una base de datos. Yo uso este código....
25 jun. 2020 a las 23:40
Usando PdfSharp.NET, me gustaría cargar un archivo PDF existente y cambiar todos los elementos con un determinado color a un color diferente. La intuición me dice que requeriría recorrer cada elemento en un documento PDF y luego cambiar el atributo de color, pero no puedo encontrar dónde recorrer to....
23 jun. 2020 a las 17:23
Dado un archivo PDF existente con páginas que están en orientación vertical, ¿cómo puedo procesar el archivo mediante programación (con .NET) para generar un nuevo archivo con el mismo contenido en páginas con orientación horizontal. Las nuevas páginas deberían aprovechar al máximo el ancho de paisa....
23 jun. 2020 a las 12:30
Estoy usando AutoMailMerge y estoy tratando de agregar un JavaScript para verificar si un valor de campo es "1" y luego insertar la imagen en el campo de imagen. var f = this.getField("Image1_af_image"); if (f.value == "1") { f.buttonImportIcon("C:/Users/EslamSamy/Desktop/MEWA Project/Files/Circles/....
18 jun. 2020 a las 15:28
Estoy usando pytesseract para OCR en imágenes. Tengo una declaración pdf que tiene 3-4 páginas de largo. Necesito una forma de convertirlos en múltiples imágenes .jpg / .png y OCR en estas imágenes una por una. A partir de ahora, estoy convirtiendo una sola página en imagen y luego ejecuto text=str(....
17 jun. 2020 a las 15:36
Estoy desarrollando una interfaz de usuario que interactúa con un servicio de fondo existente. La interfaz de usuario debe realizar una llamada al servidor de fondo para obtener un archivo PDF que se mostrará en la página existente o en una nueva pestaña. He probado todas las opciones que he visto e....
12 jun. 2020 a las 14:57
¿Hay alguna forma de agregar la opción de pantalla completa al PDF que se incrusta con iframe? <iframe src="http://www.web.com/test.pdf"></iframe> ....
11 jun. 2020 a las 20:35
Soy un programador novato y necesito ayuda con los usos de xxx.find ... Resumen Estoy haciendo un proyecto de automatización web con selenio. El objetivo principal de este proyecto de Python es Paso 1 . Para iniciar sesión en el sitio web de LMS de mi escuela automáticamente con el nombre de usua....
31 may. 2020 a las 20:58
Tengo esta url del servidor https: //xxxx.pdf20200529 ". ¿Cómo puedo cargarlo como pdf en mi aplicación flutter? Utilizo este plugin, pero no pasó nada. Código OpenFile.open(value); // value is https://xxxx.pdf20200529 Editar generatePDF(dynamic value) async { final filename = value.subst....
29 may. 2020 a las 17:49
El problema: Necesito descargar un archivo PDF de mi servidor pero obtengo "No file" o un archivo vacío Detalles: Aquí está mi código del lado del servidor: let fileBuffered = ''; // authentication for downloading a file from Dropbox API to my server const dropbox = dropboxV2Api.authenticat....
29 may. 2020 a las 00:01
Intenté usar la biblioteca PDF para Flutter usando el paquete aquí La idea es crear algo como this: que es el ejemplo en la página del paquete. El problema es que si ejecuto el ejemplo de demostración allí, funciona exactamente como el ejemplo, lo cual está bien. ejemplo de demostración Pero si cre....
27 may. 2020 a las 02:05