El propósito principal de XPath es abordar partes de un documento XML. También proporciona servicios básicos para la manipulación de cadenas, números y booleanos. XPath utiliza una sintaxis compacta que no es XML. XPath opera en la estructura abstracta y lógica de un documento XML, en lugar de su sintaxis de superficie.

Más sobre xpath...

Tomé algunas materias de codificación en la universidad y estoy tratando de analizar estadísticas de tenis aprendiendo selenio, que es completamente nuevo para mí. La página que estoy usando está aquí (https://www.atptour .com/en/scores/results-archive?year=2021) y estoy siguiendo una guía de este ....
Estoy tratando de crear una cuenta en Walmart usando Selenium Python. Abrí con éxito https://www.walmart.com/ y fui con éxito a crear una cuenta debajo de la pestaña Iniciar sesión. Además, también ingresé con éxito los detalles de Nombre, Apellido, Dirección de correo electrónico y Contraseña. ....
Estoy tratando de presionar un elemento <a class="clean" href="url"> con python selenium con la condición de que algunos elementos tengan un cierto valor. Esos elementos son <div data-passendheid="Correct"> con el valor 'Correcto', <path stroke-width="11"> con el valor '11' y span in <span class="j....
10 ene. 2022 a las 16:19
Becarios, Estoy haciendo webscraping y necesito descargar varios archivos PDF del sitio web www1.hkexnews.hk. Sin embargo, encontré un problema al tratar de hacer que mi Selenium chromedriver marque la casilla que aparece cada vez que uno quiere descargar un PDF en dicho sitio web. El código se eje....
10 ene. 2022 a las 10:34
Estoy trabajando en un script para recopilar información de Newegg para observar los cambios en los precios de las tarjetas gráficas a lo largo del tiempo. Actualmente, mi secuencia de comandos abrirá una búsqueda de Newegg en RTX 3080 a través de Chromedriver y luego hará clic en el enlace de Tarj....
¿Cómo hago clic en este botón específico en selenio en C#? Probé la etiqueta a pero no funciona <a class="btn-primary" href="http://myjunkyard.co.za/confirm" itemprop="url" style="font-family: 'Helvetica Neue',Helvetica,Arial,sans-serif; box-sizing: border-box; font-size: 16px; color: #FFF; text-dec....
9 ene. 2022 a las 12:21
Hojas de cálculo de Google tiene una función genial llamada importxml. Le permite extraer datos de fuentes web públicas, p. el título de una URL. Puede escribir una expresión XPath, p. //title/text() y encontrará todas las ocurrencias de algún valor y las mostrará en su Hoja de Google como filas ....
Tengo un problema al seleccionar un elemento al subir el domo HTML con WebdriverIO. Nota: es fácil seleccionar el título por texto y la etiqueta h1 o por nombre de clase, pero no quiero hacer eso. En cambio, me gustaría que la etiqueta iframe sea mi punto de partida y seleccionarla mediante el text....
7 ene. 2022 a las 21:38
Tengo el siguiente xml. <root> <h> <seg> <hfield1>hA</hfield1> <hfield2>h1</hfield2> </seg> <seg> <hfield1>hB</hfield1> <hfield2>h2</hfield2> </seg> </h> <i> <iseg> <ifield1>i1</ifield1> </iseg> <iseg> <ifield1>i2</ifield1> ....
7 ene. 2022 a las 15:01
Estoy creando un bot de Instagram, pero no sé cómo navegar a la siguiente publicación. Esto es lo que probé #Attempt 1 next_button = driver.find_element_by_class_name('wpO6b ') next_button.click() #Attempt 2 _next = driver.find_element_by_class_name('coreSpriteRightPaginationArrow').click() Nin....
7 ene. 2022 a las 14:50
Quiero hacer clic en este botón. Mi intento anterior con XPATH fue exitoso, pero ahora no puedo hacer clic con XPATH. XPATH: /html/body/div[1]/div/div[1]/div/div[3]/div/div/div[2]/div/div/div[1]/div[1]/div/div/div/div/div[1]/div/div[5]/div/div[2]/div[1] Tengo una pregunta. ¿Qué camino debo elegir....
7 ene. 2022 a las 11:20
Necesito consultar documentos XML utilizando expresiones XPath en una aplicación Java. Creé las siguientes clases, que aceptan un archivo (ubicación del documento XML en un disco duro local) y un XPath import java.util.ArrayList; import java.util.Iterator; import java.util.List; import javax.xml.X....
7 ene. 2022 a las 04:02
Tengo un XML del que estoy tratando de obtener una suma. El número es 0 o 1 y quiero obtener una suma de todos los números. El XML tiene este aspecto: <alerts> <alert1>0</alert1> <alert2>1</alert2> <alert3>1</alert3> <alert4>0</alert4> </alerts> Mi código actual (incorrecto) se ve....
6 ene. 2022 a las 03:24
¿Cómo puedo implementar una selección basada en la selección de los primeros 3n+1 elementos de una etiqueta en su ruta? Por ejemplo, digamos que tengo el siguiente xpath: //div[@class='ResultsSectionContainer-sc-gdhf14-0 kteggz']/div[@class='Wrapper-sc-11673k2-0 gIBPSk']//div/div/a Tomado de esta ....
6 ene. 2022 a las 01:07
Estoy tratando de crear un xpath de una casilla de verificación que solo tiene una etiqueta como identificador único. El Id o los valores dados cambian cuando se crea un nuevo elemento de casilla de verificación. <li> <input type="checkbox" value="f052503c-28c2-4b2d-8bd3-0ef6cc0e563a" id="f052503....
5 ene. 2022 a las 21:12
Estoy enfrentando un problema interesante con mi caso de uso de ** Web Scraping **. Necesito obtener las ** reseñas de Google Maps ** más recientes. Quiero ordenar las reseñas por fecha más reciente. Y todos los tutoriales que estoy viendo están en inglés, pero en mi idioma nativo la interfaz de....
5 ene. 2022 a las 11:16
Mi B3 es CULP. Es un símbolo de cotización. Se supone que este XML de importación obtiene el número de rendimiento de dividendos anual que es 5.76%, pero en su lugar aparece un error que dice "el contenido importado está vacío". Obtener el rendimiento de dividendo anual funciona cuando no intento ....
4 ene. 2022 a las 23:23
Cuando voy a la dirección web en el código, no obtengo el contenido de la sección "Sinónimos". Hace la selección, pero la toma como una lista y no genera el contenido del texto. synonyms= [] driver= webdriver.Chrome() url = "https://pubchem.ncbi.nlm.nih.gov/compound/71308229" driver.get(url) synony....
4 ene. 2022 a las 22:08
Estoy tratando de encontrar la expresión XPath correcta para obtener solo las URL de todos mis documentos, cualquiera que sea la etiqueta. Estoy intentando con este: <urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://url </loc> <lastmod>2019-08-07T15:01:5....
4 ene. 2022 a las 19:19
Un documento tiene varias etiquetas <div class="ok">. Puedo seleccionarlos todos con "//*[@class="ok"]" (no tengo que especificar div, porque solo las etiquetas div tienen esta clase). Obtengo una lista de 6 nodos que coinciden con esto. Ahora necesito ya sea para probar cada nodo para ver si inc....
4 ene. 2022 a las 07:54
Intento actualizar mi código para usar "driver.find_element(By.XPATH..." en lugar de "driver.find_elements_by_xpath(...", pero sigo recibiendo el siguiente error cuando envío claves: selenium.common.exceptions.ElementNotInteractableException: Message: element not interactable Aquí está mi código: d....
4 ene. 2022 a las 00:21
Cualquiera tiene una solución para ubicar un botón en una página web con una ventana emergente superpuesta como en el siguiente ejemplo: from selenium import webdriver driver = webdriver.Firefox(executable_path=r'./geckodriver') driver.get("https://www.academics.de/") #after waiting for a while the ....
3 ene. 2022 a las 23:21
Hice un script en python y selenium que realiza una búsqueda en youtube. Cuando está completamente cargado, solo puedo recuperar todos los títulos de los resultados. ¿Hay alguna línea de código que pueda integrar para obtener la publicación de la fecha también? Este es mi código: def youTube(): ....
¿Cómo puedo abordar un elemento con XPath que el selector no está por encima de él (pero en el mismo nivel)? P.ej. Quiero tener el valor del artículo con el nombre B. No estoy seguro de hacerlo porque el nombre y el valor no están en una relación de padres. <root> <item> <name>A</name> ....
3 ene. 2022 a las 14:33
Tengo una lista de entradas / bibl, cada una con un elemento secundario / date @ when = "YEAR". Estoy tratando de generar solo la primera instancia de cada año. `<listBibl> <bibl> <date when="1746"/> </bibl> <bibl> <date when="174....
2 ene. 2022 a las 20:55