|
說明 |
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件 支持UTF-8多种编码 可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。 可设置提取文件的间隔,避免下载网页过快,服务器不响应
提供多种查找、获取信息的方式: 提取文件中全部email邮件地址 提取文件中全部互联网址(无参数) 提取文件中全部互联网址(带参数) 提取HTML文件中body的文本内容 提取HTML文件中title与body的文本内容 提取HTML文件中textarea的文本内容 提取HTML网页的显示文本内容 提取DOC/RTF等文件中全部文本内容 并可自定义正则表达式获取信息 |
|
|
|
檔案列表 |
檔名 : Fire_GetTxt.rar 下載數:526
檔案大小:11178632 Bytes 上傳時間:2011-02-22 17:44

--
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件
|
|
需要下载安装 .net framework 2.0框架
|
liunu [2011-02-22 17:49]
|
|
微软官方下载: http://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe
|
|