Usas wildcards

$x('/') <- Trae todo el documento porque representa la raíz de nuestro el html$x('/*') <- * después de / pide que traiga todos los nodos que están debajo de / (* es el primer wildcard)$x('/html/*') <- Trae todos los nodos que están inmediatamente después de html$x('//*') <- // es la expresión para saltar todos los niveles y con el * en todas las direcciones. Trae todos los nodos y todos los atributos de estos nodos.$x('//span[@class="text]/@*') <- Trae todos los span, que tengan como clase “text”, con @* trae todos los atributos. Dicho de otra forma, trae todos los atributos de todos los nodos de tipo span de clase “text”.$x('/html/body//div/@*') <- Todos los atributos (usando @*) de todos los div (usando //div) que están después de body$x('//span[@class="text" and @itemprop="text"]/node()') <- Trae todos los spam que sean de clase “text” que tengan un atributo @itemprop “text” y de ahí (usando node()) traer todo lo que esté dentro de los spam que cumplen las condiciones