![]() |
(中英文)词频统计工具,可以统计一批Word文档(.doc;.docx)、网页文件(.htm;.html)或文本文件(.txt)中所有中英文单词出现的总次数,或分别在各文件中出现的频率。 统计结果可以按出现次数排序输出为Excel表格、网页表格或Word表格文档。
统计方式包括:
可以选择只统中文词汇、英语词汇或标点符号。支持自定义词汇库(例如一些品牌名词,如“京东”“南极人”等会被分开成几个单词的非标准词通过添加到词库实现准确统计)。
![]() |
![]() |
下载词频统计工具3.75 |
词汇提取工具(词汇表生成工具),可以将一个或多个Word文档(.doc;.docx)、网页文件(.htm;.html)或文本文件(.txt)中所有(中文或英文)单词提出来形成词汇表。
输出结果排除重复单词,也可做为词汇表去重工具使用。
统计一批文件中汉字出现次数的工具。
文档重复内容查找工具:
可以对Word文档(*.doc;*.docx)、文本文件、PDF文件(*.pdf)、网页文件等多种格式文档进行重复文字查找、分析。
![]() |
![]() |
重复内容查找工具使用帮助、常见问题 |
分析某个文档是否有和其它一批文档中存在相同内容的工具。
根据指定的标准(重复内容的长度、次数),判断出某个文档是否和指定目录下的哪些文档存在重复内容。例如,我们可以设定标准,如果两个文档之间有2条以上超过100个字的内容雷同,即认为这两个文档存在重复内容。“文档查重工具”可以按此类标准找出某个目录下的一批文档中,哪些文档和比较文档存在内容雷同。
可以对Word文档(*.doc;*.docx)、文本文件、PDF文件(*.pdf)、网页文件等多种格式文档进行重复文字查找、分析。
文档重复内容查找工具和文档查重工具的主要区别:两个工具的目标不同,文档重复内容查找工具主要是目标是解决“重复内容是什么”, 文档查重工具主要是目标是解决“和哪些文档有重复”。