当前位置:首页 > 开发 > 编程语言 > 编程 > 正文

比 StringTokenizer 更加优化的字符串分割

发表于: 2014-10-11   作者:annan211   来源:转载   浏览次数:
摘要:   上篇文中说到,StringTokenizer 是相对比较快的字符分割方法,split和正则表达式 是java 建议的使用方法,subString 在原始字符串很大,切割操作又被高频使用的情况下很容易出现 内存溢出的情况。但是 substring 确实执行的很快,字符串操作中 还有其他方法比如 indexOf 执行的也非常高效,我们是不是可以自己组合,使用高效方法同时避免内存溢出。实例

  上篇文中说到,StringTokenizer 是相对比较快的字符分割方法,split和正则表达式 是java 建议的使用方法,subString 在原始字符串很大,切割操作又被高频使用的情况下很容易出现 内存溢出的情况。但是 substring 确实执行的很快,字符串操作中 还有其他方法比如 indexOf 执行的也非常高效,我们是不是可以自己组合,使用高效方法同时避免内存溢出。实例代码仍然采用 前一篇文中的代码。




 

package String;

import java.util.StringTokenizer;

public class StringTokenizerDemo {

	public static void main(String[] args) {

		StringBuffer sb = new StringBuffer();
		for(int i=0;i<10000;i++){
			sb.append(i);
			sb.append(";");
		}
		long begin = System.currentTimeMillis();
//		StringTokenizerDemo.split(sb.toString());// 15665
		StringTokenizerDemo.token(sb.toString());//6679
		System.out.println(System.currentTimeMillis()-begin);
	}

	public static void split(String str){
		for(int i=0;i<10000;i++){
			str.split(";");
		}
	}

	public static void token(String str){
		StringTokenizer st = new StringTokenizer(str,";");
		for(int i=0;i<10000;i++){
			while(st.hasMoreTokens()){
				st.nextToken();
			}
					}
	}

}

   


上面这段代码,使用原始的 split方法  耗时 15665, 使用StringTokenizer 耗时 多集中在 58,如果处理得当,我们可以试试 我们自己的组合方法(index和substirng) 看下面代码。



package String;

import java.util.StringTokenizer;

public class StringTokenizerDemo {

	public static void main(String[] args) {

		StringBuffer sb = new StringBuffer();
		for(int i=0;i<10000;i++){
			sb.append("sb-"+i);
			sb.append(";");
		}
		long begin = System.currentTimeMillis();
//		StringTokenizerDemo.split(sb.toString());// 15665
		StringTokenizerDemo.token(sb.toString());//58
//		StringTokenizerDemo.indexSubstring(sb.toString());//56
		System.out.println(System.currentTimeMillis()-begin);
	}

	public static void indexSubstring(String str){
		for(int i=0;i<10000;i++){
			while(true){
				int index = str.indexOf(";");
				if(index<0)
					break;
				System.out.println(str.substring(0, index));
				str = str.substring(index+1);
			}
		}
	}

	public static void split(String str){
		for(int i=0;i<10000;i++){
			System.out.println(str.split(";")[i]);
		}
	}

	public static void token(String str){
		StringTokenizer st = new StringTokenizer(str,";");
		for(int i=0;i<10000;i++){
			while(st.hasMoreTokens()){
				System.out.println(st.nextToken());
			}
		}
	}

}




多执行几次,你会发现 组合使用的方法  甚至比 StringTokenizer 还要快,多集中在 55-56,组合方式 避免了内存溢出 和 空间浪费,是高频调用的良方。

比 StringTokenizer 更加优化的字符串分割

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
引: StringTokenizer 存在于 java.util. StringTokenizer 包中,是一个用来分隔String的应用类,相
项目中遇到的一个关于字符串拼接,分割,遍历输出的问题,做个简单的记录,以备后用。 首先是增加页
起因:前段时间写命令行解析函数(字符串分割比较通用的例子),没有经过深入思考和分析引起了程序
<?php //分割与组合字符串 //emplode()和implode()函数的优点,对于分隔符固定的字符串,使用起
oracle部分: 定义类型(用于字符串分割): create or replace TYPE "STR_SPLIT" IS TABLE OF VARC
在数据库编程中,很多朋友会碰到分割字符串的需求,一般都是分割成一列多行模式,但也有时会需要分
C语言的库函数中,没有类似java中String类的split方法,可以把一个长字符串分割为字符串数组。不过
1.s:generator标签概述 属性名 是否必须 类型 说明 converter False org.apache.struts2.util.Iterat
在java中,经常会对字符串进行分割,使用split方法把字符串按照指定的分割符进行分割,然后返回字符串
这几天开始重新学习Java,在课程最后有一道题要求找出设备名称,题目如下: 1.编写程序,将字符串“
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号