Xpathの基本

基礎編

XPathではXML文章をツリーとして捉えることで、要素や属性の位置を指定することができます。

『@』表記に関して
classのような要素に紐づく属性を『@』で表します。

//を用いて途中までのパスを省略することができる。

/html/body/div/span[@class='regular_price']
//span[@class='regular_price']

containsは、指定する文字列が含まれている要素を取得します。

<img class="large_image">
<img class="small_image">
<img class="thumbnail">

contains関数は、第1引数文字列内に、第2引数文字列が含まれているかどうかを調べる

//img[contains(@class, 'image')]

実際に確認してみる。 f:id:yukking3:20180602231911p:plain