苏州工商新公司检索工具

来自JsRobot
Storm讨论 | 贡献2016年9月2日 (五) 04:30的版本

跳转至: 导航搜索

简介

    这是一个提取江苏工商新公司名称的工具。

功能

    指定一个其实编号,依次检查后续编号的有效性。
    获取有效编号对应的公司名称。
    需要支持多个帐号轮换登陆。
    需要识别图像验证码。

使用

设置

    用户清单=c:\output\用户清单.txt
    初始编号=c:\output\初始编号.txt
    图像识别文件=c:\output\tzgsj_gov.lib
    图像识别密码=123
    探测步长=20
    测试模式=0
    用户清单
    指定了包含用户和密码的文件所在的位置。
    这是一个纯文本文件,
    每行是一个用户信息,
    一行内容的前面是用户名,后面是密码,中间是英文的逗号。
 
    初始编号
    这也是一个文本文件。
    文件里面就是初始编号。
    软件在启动的时候会从这个文件读取初始编号,
    在退出的时候,会把最后有效编号的下一个编号保存在这个文件里。
    这样确保用户之需要设置一次,就可以反复运行。

    图像识别文件
    帐号登录的时候,有验证码。
    这个模块是验证码识别库。
    使用识别库,只是构建识别库的时候付费一次,以后就可以不用另外付费,识别验证码了。
    不象在线打码的识别机制,每次识别一个图片都要钱。
    长期而言是非常合算的。
    图像识别密码
    图像识别库的密码。
    这个是为了避免别人直接使用你的识别库的一个保护。
    这个密码是生成识别库的人员提供的。
    探测步长
    这个参数指定了一个帐号探测多少个号码。
    软件内部的探测逻辑如下:
    假设初始值为1,探测步长为20,那么
    第一次探测,1,2..20,发现有效编号是1,5,10,那么把有效编号的公司名字记录下来,然后把初始值调整为11
    第二次探测,11,12...30,发现有效编号是14,17,18,那么把有效编号对应的公司名字记录下来,然后把初始值调整为19
    .....
    探测步长有两个用途:
    一个是为了避免因为某个编号是无效编号,从而倒是软件反复检查这个编号;
    一个是为了提升处理的效率,一次性的连续探测多个编号比每次只处理一个编号效率高。
    
    测试模式
    当测试模式为1的时候,处理使用一个帐号处理一组编号就会停止下来。
    当测试模式为0的时候,软件会一直处理下去,直到用户点击停止。
    这个模式是为了方便调试程序。

说明

    帐号越多越好。越多帐号,单位时间里,每个帐号处理的编号就越少,从而导致帐号被封的几率就越低。