3,360
个编辑
更改
→设置
==简介==
这是一个提取江苏工商新公司名称的工具。
==功能==
指定一个起始编号,依次检查后续编号的有效性。
获取有效编号对应的公司名称。
需要支持多个帐号轮换登陆。
需要识别图像验证码。
需要支持多个初始编号。
需要处理验证码识别失败的情况
需要处理登陆状态过期的情况
需要处理帐号禁用的情况。
==使用==
先安装软件
然后用您的用户和密码登陆软件,
然后把我们发给您的"辅助配置"压缩包里的文件解压到c:\output,
然后修改用户列表文件里的用户和帐号,
然后修改初始编号中的初始编号,
然后点击开始提取就可以了。
==设置==
探测步长=20
测试模式=0
工作目录
工作目录指定了软件的工作目录,
软件会从这个工作目录中读取相应的配置文件。
软件也会把输出结果写到这个工作目录。
工作目录中的文件组织结构如下
过滤词汇.txt
图像识别.lib
图像识别.txt
子配置目录(例如0000 0001 0002)
[[image:SuZhouGongShangXinGongSiJianSuoGongJu_Setting.png]]
子配置目录中的关键文件如下
初始编号.txt
用户清单.txt
[[image:SuZhouGongShangXinGongSiJianSuoGongJu_Setting_Sub.png]]
用户清单.txt
这是一个纯文本文件,
每行是一个用户信息,
一行内容的前面是用户名,后面是密码,中间是英文的逗号。
初始编号.txt
这也是一个文本文件。
文件里面就是初始编号。
软件在启动的时候会从这个文件读取初始编号,
在退出的时候,会把最后有效编号的下一个编号保存在这个文件里。
这样确保用户之需要设置一次,就可以反复运行。
图像识别.lib
帐号登录的时候,有验证码。
这个模块是验证码识别库。
使用识别库,只是构建识别库的时候付费一次,以后就可以不用另外付费,识别验证码了。
不象在线打码的识别机制,每次识别一个图片都要钱。
长期而言是非常合算的。
图像识别.txt
这个文件包含了图像识别库的密码。
这个是为了避免别人直接使用你的识别库的一个保护。
这个密码是生成识别库的人员提供的。
探测步长
这个参数指定了一个帐号探测多少个号码。
软件内部的探测逻辑如下:
假设初始值为1,探测步长为20,那么
第一次探测,1,2..20,发现有效编号是1,5,10,那么把有效编号的公司名字记录下来,然后把初始值调整为11
第二次探测,11,12...30,发现有效编号是14,17,18,那么把有效编号对应的公司名字记录下来,然后把初始值调整为19
.....
探测步长有两个用途:
一个是为了避免因为某个编号是无效编号,从而倒是软件反复检查这个编号;
一个是为了提升处理的效率,一次性的连续探测多个编号比每次只处理一个编号效率高。
测试模式
当测试模式为1的时候,处理使用一个帐号处理一组编号就会停止下来。
当测试模式为0的时候,软件会一直处理下去,直到用户点击停止。
这个模式是为了方便调试程序。
==说明==
帐号越多越好。越多帐号,单位时间里,每个帐号处理的编号就越少,从而导致帐号被封的几率就越低。