批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

请问批处理可以统计词频吗?
4字一行,只统计4字词组出现的频率。
如:

一丘之貉
一丝不挂
一丝不苟
一事无成
一亲对老
一分身又
一叶知秋
一叶知秋
一叶障目
一叶障目
一往无前
一往无前
一往无前

实现如下:

一丘之貉 1
一丝不挂 1
一丝不苟 1
一事无成 1
一亲对老 1
一分身又 1
一叶知秋 2
一叶障目 2
一往无前 3

解决代码

@echo off & setlocal enabledelayedexpansion
for /f "delims=" %%a in ('type "测试.txt"') do set /a "#%%a#+=1"
for /f "tokens=1* delims=#=" %%a in ('set #') do echo %%a %%b
pause

win7以上系统

powershell -c "gc '测试.txt'|group $_|%%{$_.name+' '+$_.count}"
pause

到此这篇关于批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)的文章就介绍到这了,更多相关bat统计词频内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

你可能感兴趣的