“苏州工商新公司检索工具”的版本间的差异

来自JsRobot
跳转至: 导航搜索
使用
设置
第16行: 第16行:
  
 
==设置==
 
==设置==
     用户清单=c:\output\用户清单.txt
+
     工作目录=c:\output
    初始编号=c:\output\初始编号.txt
+
    图像识别文件=c:\output\tzgsj_gov.lib
+
    图像识别密码=123
+
 
     探测步长=20
 
     探测步长=20
 
     测试模式=0
 
     测试模式=0
  
     用户清单
+
    工作目录
     指定了包含用户和密码的文件所在的位置。
+
    工作目录指定了软件的工作目录,
 +
    软件会从这个工作目录中读取相应的配置文件。
 +
    软件也会把输出结果写到这个工作目录。
 +
 
 +
    工作目录中的文件组织结构如下
 +
    过滤词汇.txt
 +
    图像识别.lib
 +
    图像识别.txt
 +
    子配置目录(例如0000 0001 0002)
 +
 
 +
    子配置目录中的关键文件如下
 +
    初始编号.txt
 +
     用户清单.txt
 +
   
 +
 
 +
     用户清单.txt
 
     这是一个纯文本文件,
 
     这是一个纯文本文件,
 
     每行是一个用户信息,
 
     每行是一个用户信息,
 
     一行内容的前面是用户名,后面是密码,中间是英文的逗号。
 
     一行内容的前面是用户名,后面是密码,中间是英文的逗号。
 
    
 
    
     初始编号
+
     初始编号.txt
 
     这也是一个文本文件。
 
     这也是一个文本文件。
 
     文件里面就是初始编号。
 
     文件里面就是初始编号。
第36行: 第48行:
 
     这样确保用户之需要设置一次,就可以反复运行。
 
     这样确保用户之需要设置一次,就可以反复运行。
 
   
 
   
     图像识别文件
+
     图像识别.lib
 
     帐号登录的时候,有验证码。
 
     帐号登录的时候,有验证码。
 
     这个模块是验证码识别库。
 
     这个模块是验证码识别库。
第43行: 第55行:
 
     长期而言是非常合算的。
 
     长期而言是非常合算的。
  
     图像识别密码
+
     图像识别.txt
     图像识别库的密码。
+
     这个文件包含了图像识别库的密码。
 
     这个是为了避免别人直接使用你的识别库的一个保护。
 
     这个是为了避免别人直接使用你的识别库的一个保护。
 
     这个密码是生成识别库的人员提供的。
 
     这个密码是生成识别库的人员提供的。

2016年9月3日 (六) 04:52的版本

简介

    这是一个提取江苏工商新公司名称的工具。

功能

    指定一个其实编号,依次检查后续编号的有效性。
    获取有效编号对应的公司名称。
    需要支持多个帐号轮换登陆。
    需要识别图像验证码。

使用

    先安装软件
    然后用您的用户和密码登陆软件,
    然后把我们发给您的"辅助配置"压缩包里的文件解压到c:\output,
    然后修改用户列表文件里的用户和帐号,
    然后修改初始编号中的初始编号,
    然后点击开始提取就可以了。

设置

    工作目录=c:\output
    探测步长=20
    测试模式=0
    工作目录
    工作目录指定了软件的工作目录,
    软件会从这个工作目录中读取相应的配置文件。
    软件也会把输出结果写到这个工作目录。
    工作目录中的文件组织结构如下
    过滤词汇.txt
    图像识别.lib
    图像识别.txt
    子配置目录(例如0000 0001 0002)
    子配置目录中的关键文件如下
    初始编号.txt
    用户清单.txt
   
    用户清单.txt
    这是一个纯文本文件,
    每行是一个用户信息,
    一行内容的前面是用户名,后面是密码,中间是英文的逗号。
 
    初始编号.txt
    这也是一个文本文件。
    文件里面就是初始编号。
    软件在启动的时候会从这个文件读取初始编号,
    在退出的时候,会把最后有效编号的下一个编号保存在这个文件里。
    这样确保用户之需要设置一次,就可以反复运行。

    图像识别.lib
    帐号登录的时候,有验证码。
    这个模块是验证码识别库。
    使用识别库,只是构建识别库的时候付费一次,以后就可以不用另外付费,识别验证码了。
    不象在线打码的识别机制,每次识别一个图片都要钱。
    长期而言是非常合算的。
    图像识别.txt
    这个文件包含了图像识别库的密码。
    这个是为了避免别人直接使用你的识别库的一个保护。
    这个密码是生成识别库的人员提供的。
    探测步长
    这个参数指定了一个帐号探测多少个号码。
    软件内部的探测逻辑如下:
    假设初始值为1,探测步长为20,那么
    第一次探测,1,2..20,发现有效编号是1,5,10,那么把有效编号的公司名字记录下来,然后把初始值调整为11
    第二次探测,11,12...30,发现有效编号是14,17,18,那么把有效编号对应的公司名字记录下来,然后把初始值调整为19
    .....
    探测步长有两个用途:
    一个是为了避免因为某个编号是无效编号,从而倒是软件反复检查这个编号;
    一个是为了提升处理的效率,一次性的连续探测多个编号比每次只处理一个编号效率高。
    
    测试模式
    当测试模式为1的时候,处理使用一个帐号处理一组编号就会停止下来。
    当测试模式为0的时候,软件会一直处理下去,直到用户点击停止。
    这个模式是为了方便调试程序。

说明

    帐号越多越好。越多帐号,单位时间里,每个帐号处理的编号就越少,从而导致帐号被封的几率就越低。