当前位置:首页 > 开发 > 编程语言 > 蜘蛛爬虫 > 正文

爬虫获取email

发表于: 2011-09-14   作者:cfyme   来源:转载   浏览次数:
摘要:  /**  * 爬虫获取email  * @throws Exception  */ public static void getMails_1() throws Exception {   URL url = new URL("http://www.blogjava.net/gml520/archive/2009/

 /**
  * 爬虫获取email
  * @throws Exception
  */
 public static void getMails_1() throws Exception {

  URL url = new URL("http://www.blogjava.net/gml520/archive/2009/05/20/271691.html");
  
  URLConnection conn = url.openConnection();
  
  BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream(),"UTF-8"));
  
  String line = null;

  String mailreg = "\\w+@\\w+(\\.\\w+)+";

  Pattern p = Pattern.compile(mailreg);

  while (null != (line = br.readLine())) {
  // System.out.println(line);
   Matcher m = p.matcher(line);

   while (m.find()) {
    System.out.println(m.group());
   }
  }
 }

爬虫获取email

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
首先打开校园网(以我的学校为例"http://www.zhbit.com/") 现在我们需要获取上图红色框框的数据并输
将SQL获取的信息传递到Email中 最近在为公司财务开发一个邮件通知时遇到了一个技术问题。原来我设计
  最近在为公司财务开发一个邮件通知时遇到了一个技术问题。原来我设计SSIS的是每天将ERP系统支付
最近发现python的爬虫比较容易实现,我是python零基础,就疯狂的搜索资料,实现一下简单的爬虫,首
无聊的元旦,用Java实现QQ空间备份器时分析了如何进行模块爬取实际地址中的需要信息的感悟,与图解步
菜鸟HtmlAgilityPack初体验。。。弱弱的代码。。。 Html Agility Pack是一个开源项目,为网页提供了
菜鸟HtmlAgilityPack初体验。。。弱弱的代码。。。 Html Agility Pack是一个开源项目,为网页提供了
一个朋友需要这个美女图片网站的所有图片,并按网站上的栏目、套图分类下载到本地,于是就有了此脚
DNS即域名系统,一般都清楚是用来进行域名解析的,domain<--->ip,我也是。 不过最近仔细看了
这次去杭州参加阿里巴巴的离线大数据处理暑期课,得到一个思路。 之前一直纠结于没有数据要怎么训练
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号