Estoy tratando de raspar una página de revisión de Flipkart

https://www.flipkart.com/reviews/b9ec5c5c-3814-40ef-8f73-84f253ee09ce

Estoy usando python, beautifulsoup y selenium. A continuación se muestra el código

options = webdriver.ChromeOptions()
options.add_argument('--ignore-certificate-errors')
driver = webdriver.Chrome(executable_path='D:\ESS\Intern-Shubham\chromedriver.exe',options=options)
driver.get('https://www.flipkart.com/reviews/b9ec5c5c-3814-40ef-8f73-84f253ee09ce')
time.sleep(20)
WebDriverWait(driver,
delay).until(EC.presence_of_element_located(driver.find_elements_by_class_name('_3t4Eas')))
print('Page is ready!')

No importa cuánto retraso esté agregando, la revisión real no se ha cargado en la página, a continuación se muestra el fragmento de la revisión que se carga después de un tiempo. ingrese la descripción de la imagen aquí

Cualquier sugerencia de pistas sería útil.

1
xxx 22 ene. 2021 a las 10:25

1 respuesta

La mejor respuesta

Importar por.

from selenium.webdriver.common.by import By

WebDriverWait(driver,
              20).until(EC.presence_of_element_located((By.CLASS_NAME,'_3t4Eas')))
print('Page is ready!')

Su localizador está mal, ahora puede eliminar time.sleep ()

Debe pasar una tupla con estrategia de localizador y localizador, no elemento

1
PDHide 1 feb. 2021 a las 17:30