当前位置:首页 > 开发 > 编程语言 > Java > 正文

java 敏感字过滤

发表于: 2015-03-26   作者:annan211   来源:转载   浏览次数:
摘要: /** * * @param src 要过滤的语句 */ @Override public Set<String> checkSensitiveWords(String src) { if(AppUtils.isBlank(src)){ return null; } // 把数据库
 /**
     * 
     * @param src 要过滤的语句
     */
	@Override
	public Set<String> checkSensitiveWords(String src) {
		if(AppUtils.isBlank(src)){
			return null;
		}
                // 把数据库中的敏感字 塑造成list集合
		 List<String> sensitiveWordList = sensitiveWordDao.getWords(sortId, nsortId, subNsortId);
		 Map<Character,List<String>> wordMap=new HashMap<Character,List<String>>();
	        for (String s:sensitiveWordList){
	            char c=s.charAt(0);
	            List<String> strs=wordMap.get(c);
	            if (strs==null){
	                strs=new ArrayList<String>();
	                wordMap.put(c,strs);
	            }
	            strs.add(s);
	        }
	        String temp=null;
	        String find;
	        char c;
	        Set<String> findwords = new HashSet<String>();
	        for (int i=0;i<src.length();i++){
	        		c=src.charAt(i);
	             	find=null;
	            if (wordMap.containsKey(c)){
	                List<String> words=wordMap.get(c);
	                for (String s:words){
	                    temp=src.substring(i,(s.length()<=(src.length()-i))?i+s.length():i);
	                    if (s.equals(temp)){
	                        find=s;
	                        break;
	                    }
	                }
	            }
	            if (find!=null && findwords.size()<=10){           	
	            	findwords.add(find);
	                i+=(find.length()-1);  
	            }
	        }  
	        
		return findwords;
	}

java 敏感字过滤

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
以下是一个java实现这个功能的小例题:(经测可以能过) 两个个文件words.properties和KeyWordFilter.
敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前
敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前
敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前
参考网上的一篇博客改写的 测了几次,这个比上一个 http://360193550.iteye.com/blog/1856753好用。
参考网上的一篇博客改写的 测了几次,这个比上一个 http://360193550.iteye.com/blog/1856753好用。
使用原理: 先把资源文件中的敏感词加读出来拼接成正则表达式,然后放到Pattern中,用Matcher m = pa
使用原理: 先把资源文件中的敏感词加读出来拼接成正则表达式,然后放到Pattern中,用Matcher m = pa
1.DFA算法 DFA算法的原理可以参考 这里,简单来说就是通过Map构造出一颗敏感词树,树的每一条由根节
DFA简介 在实现文字过滤的算法中,DFA是唯一比较好的实现算法。DFA即Deterministic Finite Automato
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号