当前位置:首页 > 开发 > 编程语言 > 蜘蛛爬虫 > 正文

爬虫获取email

发表于: 2011-09-14   作者:cfyme   来源:转载   浏览:
摘要:  /**  * 爬虫获取email  * @throws Exception  */ public static void getMails_1() throws Exception {   URL url = new URL("http://www.blogjava.net/gml520/archive/2009/

 /**
  * 爬虫获取email
  * @throws Exception
  */
 public static void getMails_1() throws Exception {

  URL url = new URL("http://www.blogjava.net/gml520/archive/2009/05/20/271691.html");
  
  URLConnection conn = url.openConnection();
  
  BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream(),"UTF-8"));
  
  String line = null;

  String mailreg = "\\w+@\\w+(\\.\\w+)+";

  Pattern p = Pattern.compile(mailreg);

  while (null != (line = br.readLine())) {
  // System.out.println(line);
   Matcher m = p.matcher(line);

   while (m.find()) {
    System.out.println(m.group());
   }
  }
 }

爬虫获取email

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号