|
彭氏数据文件分类与过滤
彭氏数据文件分类管理器
彭氏数据文件分类与过滤
这是一款有创意的文件分类工具,能够按关键词或文件扩展名对文件分类或过滤。如果按关键词:先在一个文本文件中设定相对目录名称,如'relativeDir',并在其下设定关键词,如'excel'。接着启动程序选择一个源目录和目标目录,如'd:/sourceDir' 和 'd:/targetDir',然后程序以此文本文件作为模板对文件分类。只要文件名含有关键词'excel',该文件就被放到'd:/targetDir/relativeDir/'目录中。如果按文件扩展名:复制或移动指定类型的文件。
特点:不需安装、使用简单、大部分功能免费、完美解决带连接文件夹(如“.files”、“_files”等)的HTML文件、安全可靠、支持多种操作系统(windows/linux/unix/mac等)
使用前请仔细阅读help目录下的帮助文件。
- 一,安装运行与卸载
- (i)安装“Java运行时环境(Java Runtime Environment)标准版”:
- (ii)安装本程序:
- (iii)运行本程序:
- 程序启动较慢,请耐心等待!
1,windows 或 mac平台,双击fileCategorizerFilter.jar即可。
2,windows控制台,假设你将下载的压缩包解压缩到c:\fileCategorizerFilter文件夹下,输入命令“java -jar c:\fileCategorizerFilter\fileCategorizerFilter.jar”即可。
3,linux/unix控制台,假设你将下载的压缩包解压缩到:/usr/local/fileCategorizerFilter文件夹下,输入命令“java -jar /usr/local/fileCategorizerFilter/fileCategorizerFilter.jar”即可。
- (iv)卸载:
- 二,注册说明
- 本程序没有使用时间的限制,但未注册版本的某些功能被限制---不能处理HTML文件对应的连接文件夹(如“.files”、“_files”、“-files”),不能删除已处理的源文件和空目录,这可能会导致程序运行效率不高。
有两种途径可以获得注册:1,购买。2,向作者提供有价值的目录关键词模板并被作者采用。
购买请访问购买
- 三,设置目录
- 源目录:要进行处理的源文件目录。为了便于你快速掌握,本程序附带了文件样例,它们放在file-sample文件夹下。
目标目录:文件被处理后存放的目录。
删除已处理的源文件和源目录中空文件夹:
如果勾选,将移动源目录中的符合条件的文件到目标目录并删除源目录中的所有空文件夹。
如果不勾选将复制源目录中的符合条件的文件到目标目录。
- 四,设置任务
- (一)按模板分类
- 本程序附带了一些模板样例,它们被放在xml-template文件夹下。
你也可以参照如下样本test.xml用文本编辑器或XML编辑工具编写模板。
<?xml version="1.0" encoding="utf-8"?>
<pengsdata>
<dir name="windows" >
<dir name="windows98">
<keyword name="win|98"
priority="5"/>
<keyword name="windows 98"
priority="10"/>
</dir>
<dir name="windows2000">
<keyword name="win|2000"
priority="5"/>
<keyword name="windows 2000"
priority="10"/>
</dir>
<keyword name="windows"
priority="-1"/>
<keyword name="win"
priority="-10" description="windows"/>
</dir>
<dir name="office">
<dir name="office2000">
<dir name="word2000">
<keyword
name="word|2000" priority="80"/>
<keyword
name="word 2000" priority="100"/>
</dir>
<keyword name="office|2000"
priority="50"/>
<keyword name="office-2000"
priority="60"/>
<keyword name="office 2000"
priority="65"/>
</dir>
<keyword name="office"
priority="-1"/>
</dir>
</pengsdata>
|
下面是如何编写模板的说明:
<?xml version="1.0" encoding="utf-8"?>:XML文件声明,必需。encoding指定编码,应该保持与你系统的编码一致(简体中文平台编码为GBK,繁体为Big5)。通过程序菜单中的“工具”-“我的系统编码”可以得到你的系统编码。
<pengsdata>:指定根目录,必需。
<dir name="">:指定目录名称,必需,name属性必需且不能为空。
其子元素可以为keyword或dir。dir元素间的关系对应于目录间的关系。
<keyword name="" priority="" description=""/>:指定关键词,必需。
keyword元素不能有子元素。
name和priority属性必需且不能为空,description属性可选。
name属性的值为一个或多个关键词(各关键词间用"|"分开,逻辑关系为"与",
表示文件名称必须同时包含全部关键词),不区分大小写。
priority属性的值指定keyword的优先级,必须为整数。请将其值设定在-30到100之间,以便与他人共享。
程序按keyword元素的priority属性值由高到低的顺序,
将源文件名称与keyword元素的name属性值进行比对:
如果源文件名称包含该name属性值,停止比对并将该源文件归类到其父元素dir表示的目录中;
否则,继续将该源文件名称与下一个keyword元素的name属性值进行比对。
例如(模板文件就是上面的text.xml,假设位于d:\),
源目录:c:\abc\def
目标目录:d:\xyz
检查文本文件内容是否有关键词,如无列出但不处理:不勾选
检查关键词优先级是否正确:不勾选
关键词优先级必须大于:-1
模板文件路径:d:\test.xml
假设源目录存在如下文件:c:\abc\def\gh\how install office 2000 on windows
2000.txt
操作结果:d:\xyz\office\office 2000\how install office 2000 on windows 2000.txt
说明:
任务参数“检查文本文件内容是否有关键词,如无列出但不处理”如果被勾选,将检查“c:\abc\def\gh\how install office 2000 on windows 2000.txt”文件的内容前20行中是否有关键词“office 2000”。如果没有,将不会移动或复制该文件,只是在程序窗口列出该文件。只有扩展名为txt/htm/html的文件才被认为是文本文件。程序只检查文件内容的前20行。
任务参数“检查关键词优先级是否正确”如果勾选,将检查目录关键词模板中的所有关键词,优先级设置不正确的关键词将显示在程序窗口。你应该在第一次使用一个模板文件的时候勾选该选项。
任务参数“关键词优先级必须大于”在这里被设置为-1,下面三个keyword元素将会被忽略:
<keyword name="windows" priority="-1"/>
<keyword name="win" priority="-10"/>
<keyword name="office" priority="-1"/>
任务参数“模板文件路径”可以是一个或多个模板文件。
(二)复制或移动指定类型文件并保持路径
- 例如,
源目录:c:\abc\def
目标目录:d:\xyz
任务参数:txt|htm|html
假设源目录存在如下文件:c:\abc\def\gh\test.txt;c:\abc\def\pq\test.htm
操作结果:d:\xyz\abc\def\gh\test.txt和d:\xyz\abc\def\pq\test.htm
说明:
任务参数必须是文件扩展名,如果有多个用"|"分开。
(三)按文件类型分类
- 例如,
源目录:c:\abc\def
目标目录:d:\xyz
任务参数:处理这些类型
任务参数:txt|htm|html
假设源目录存在如下文件:c:\abc\def\gh\test.txt;c:\abc\def\pq\test.htm
操作结果:d:\xyz\txt\test.txt和d:\xyz\htm\test.htm
说明:
任务参数必须是文件扩展名,如果有多个用"|"分开。如果包括全部文件扩展名用"*"。
彭氏数据文件分类管理器
这是一款真正简单而又神奇的工具,它根据文件名称对文件自动分类。所有你要做的就是选择源目录和目标目录,然后点击开始。假设有以下四个文件:Excel_Services_Architecture.txt;Word_Viewer.pdf;Excel_2003_Reference.html;Word_97_Annoyances.txt。本工具将创建两个名为‘excel’和‘word’的目录,然后将Excel_Services_Architecture.txt, Excel_2003_Reference.html放入‘excel’目录,另两个文件放入‘word’目录中。
特点:免费;无须安装;容易使用;安全可靠;完美解决带连接文件夹(如“.files”、“_files”等)的HTML文件;支持多种操作系统(windows/linux/unix/mac等)
- 安装运行与卸载
- (i)安装“Java运行时环境(Java Runtime Environment)标准版”:
- (ii)安装本程序:
- (iii)运行本程序:
- 程序启动较慢,请耐心等待!
1,windows 或 mac平台,双击fileClassificationManager.jar即可。
2,windows控制台,假设你将下载的压缩包解压缩到c:\fileClassificationManager文件夹下,输入命令“java -jar c:\fileClassificationManager\fileClassificationManager.jar”即可。
3,linux/unix控制台,假设你将下载的压缩包解压缩到:/usr/local/fileClassificationManager文件夹下,输入命令“java -jar /usr/local/fileClassificationManager/fileClassificationManager.jar”即可。
- (iv)卸载:
- 源目录:
- 要进行处理的源文件目录。源文件数不能超过500个。为了便于你快速掌握,本程序附带了文件样例,它们放在file-sample文件夹下。
- 目标目录:
- 删除已处理的源文件和源目录中空文件夹:
-
如果勾选,将移动源目录中的符合条件的文件到目标目录并删除源目录中的所有空文件夹。
如果不勾选将复制源目录中的符合条件的文件到目标目录。
- 相似性:
-
假设源目录存在如下四个文件:Excel_Services_Architecture.txt;Excel_2003_Viewer.pdf;Excel_2003_Reference.html;Excel_97_Annoyances.txt。
如果滑块在左边,四个文件会归类到同一个目录中,因为他们含有同一关键词“excel”。如果滑块在右边,Excel_2003_Viewer.pdf和Excel_2003_Reference.html会被归类到同一目录中,因为他们含有同一关键词“excel_2003”;Excel_Services_Architecture.txt和Excel_97_Annoyances.txt将被归类到另一目录中。
技术支持与反馈:
如果你有任何疑问或意见建议,欢迎你和作者联系:
wenmingpeng@gmail.com; pengwenming@hotmail.com;
wenming_peng@yahoo.com
|