当前位置:首页 > 开发 > 编程语言 > 编程 > 正文

深度优先遍历字典树(统计单词出现的个数)

发表于: 2012-11-23   作者:128kj   来源:转载   浏览:
摘要: 例:给出一个字符文本,每行一个字符串,统计不同的字符串出现的百分比,最后按ASCII排序输出不同字符串和出现的百分比。 分析:对输入字符串建立字典树,在叶子结点记录该字符串出现的次数。这样的话,最后DFS搜索就可以查找每个字符串出现的次数。 样例: Sample Input Red Alder Ash Aspen Basswood Ash Beech Yellow B
例:给出一个字符文本,每行一个字符串,统计不同的字符串出现的百分比,最后按ASCII排序输出不同字符串和出现的百分比。

分析:对输入字符串建立字典树,在叶子结点记录该字符串出现的次数。这样的话,最后DFS搜索就可以查找每个字符串出现的次数。
样例:
Sample Input

Red Alder
Ash
Aspen
Basswood
Ash
Beech
Yellow Birch
Ash
Cherry
Cottonwood
Ash
Cypress
Red Elm
Gum
Hackberry
White Oak
Hickory
Pecan
Hard Maple
White Oak
Soft Maple
Red Oak
Red Oak
White Oak
Poplan
Sassafras
Sycamore
Black Walnut
Willow
exit

Sample Output

Ash 13.7931
Aspen 3.4483
Basswood 3.4483
Beech 3.4483
Black Walnut 3.4483
Cherry 3.4483
Cottonwood 3.4483
Cypress 3.4483
Gum 3.4483
Hackberry 3.4483
Hard Maple 3.4483
Hickory 3.4483
Pecan 3.4483
Poplan 3.4483
Red Alder 3.4483
Red Elm 3.4483
Red Oak 6.8966
Sassafras 3.4483
Soft Maple 3.4483
Sycamore 3.4483
White Oak 10.3448
Willow 3.4483
Yellow Birch 3.4483

import java.util.Scanner;
import java.text.DecimalFormat; 

class Trie{ //字典树
    Trie next[] = new Trie[128];//所有儿子节点
    int cnt;/* 用于记录单词出现的次数,若cnt大于0,说明  
                 从根节点到此节点的父节点构成了一个单词,这个  
                 单词的次数就是cnt */  
    public Trie(){
        cnt = 0;
    }
} 
 
public class Main{ 
    Trie root = new Trie();
    String res;
    int all = 0;
    DecimalFormat a = new DecimalFormat("0.0000");
    void solve() {
        Scanner  cin = new Scanner(System.in);
      
        String input;
        while(cin.hasNext()){//用所有字符串,构造字典树
            input = cin.nextLine();
           // if(input.equals("exit")) break;
            insert(input.toCharArray());
        }
        res = "";
        dfs(root);//深度优先搜索字典树
    }
    void insert(char[] str){//将一个字符串插入字典树
        int len = str.length;
        int k = 0, t;
        Trie p = root;
        while(k!=len){
            t = str[k++];
            if(p.next[t] == null) p.next[t] = new Trie();
            p = p.next[t];
        }
        p.cnt++;//字符串的最后一个节点,根节点到此节点构成了一个单词,此单词的个数加1
        all++;//字符串总数加1
    }
     
    void dfs(Trie p){
        if(p.cnt!=0) System.out.println(res + " " + a.format(p.cnt*100.0/all));
        for(int i=0;i< 128;i++){//遍历p的所有儿子节点(邻接点)
            if(p.next[i] != null){
                res+=(char)i;
                dfs(p.next[i]);
                res = res.substring(0, res.length()-1);//恢复现场
            }
        }
    }
    public static void main(String[] args) {
        Main test = new Main();
         test.solve();
    }
}


源码:

深度优先遍历字典树(统计单词出现的个数)

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
在编程生活中,我们总会遇见属性结构,这几天刚好需要对树形结构操作,就记录下自己的操作方式以及
首先给出trie树的原理:trie树是以空间换取时间,利用字符串的公共前缀来降低查询开销。举个例子:ad
Linux环境:CentOs6.4 Hadoop版本:hadoop-0.20.2 内容:统计hadoop\bin下的所有文件中单词出现的个
/* * Copyright (c) 2013, 烟台大学计算机学院 * All rights reserved. * 作 者:王颖 * 完成日期:
问题及代码: /* *Copyright (c)2014,烟台大学计算机与控制工程学院 *All rights reserved. *文件名
申明 本文的目地是对算法导论中深度优先的内容做一笔记,整体更像该章节的剪辑以及总结。 简介 与图
Trie,又称字典树、单词查找树,是一种树形结构,用于保存大量的字符串。它的优点是:利用字符串的公
/* *程序的版权和版本声明部分: *Copyright(c)2013,烟台大学计算机学院学生 *All rights reserv
和树的遍历相似,若从图中某顶点出发访遍图中每个顶点,且每个顶点仅访问一次,此过程称为图的遍历(
在编程生活中,我们总会遇见属性结构,这几天刚好需要对树形结构操作,就记录下自己的操作方式以及
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号