“苏州工商新公司检索工具”的版本间的差异
来自JsRobot
(→设置) |
(→设置) |
||
第34行: | 第34行: | ||
这个是为了避免别人直接使用你的识别库的一个保护。 | 这个是为了避免别人直接使用你的识别库的一个保护。 | ||
这个密码是生成识别库的人员提供的。 | 这个密码是生成识别库的人员提供的。 | ||
+ | |||
+ | 探测步长 | ||
+ | 这个参数指定了一个帐号探测多少个号码。 | ||
+ | 软件内部的探测逻辑如下: | ||
+ | 假设初始值为1,探测步长为20,那么 | ||
+ | 第一次探测,1,2..20,发现有效编号是1,5,10,那么把有效编号的公司名字记录下来,然后把初始值调整为11 | ||
+ | 第二次探测,11,12...30,发现有效编号是14,17,18,那么把有效编号对应的公司名字记录下来,然后把初始值调整为19 | ||
+ | ..... | ||
+ | 探测步长有两个用途: | ||
+ | 一个是为了避免因为某个编号是无效编号,从而倒是软件反复检查这个编号; | ||
+ | 一个是为了提升处理的效率,一次性的连续探测多个编号比每次只处理一个编号效率高。 | ||
+ | |||
+ | 测试模式 | ||
+ | 当测试模式为1的时候,处理使用一个帐号处理一组编号就会停止下来。 | ||
+ | 当测试模式为0的时候,软件会一直处理下去,直到用户点击停止。 | ||
+ | 这个模式是为了方便调试程序。 |
2016年9月2日 (五) 04:26的版本
简介
这是一个提取江苏工商新公司名称的工具。
使用
设置
用户清单=c:\output\用户清单.txt 初始编号=c:\output\初始编号.txt 图像识别文件=c:\output\tzgsj_gov.lib 图像识别密码=123 探测步长=20 测试模式=0
用户清单 指定了包含用户和密码的文件所在的位置。 这是一个纯文本文件, 每行是一个用户信息, 一行内容的前面是用户名,后面是密码,中间是英文的逗号。 初始编号 这也是一个文本文件。 文件里面就是初始编号。 软件在启动的时候会从这个文件读取初始编号, 在退出的时候,会把最后有效编号的下一个编号保存在这个文件里。 这样确保用户之需要设置一次,就可以反复运行。 图像识别文件 帐号登录的时候,有验证码。 这个模块是验证码识别库。 使用识别库,只是构建识别库的时候付费一次,以后就可以不用另外付费,识别验证码了。 不象在线打码的识别机制,每次识别一个图片都要钱。 长期而言是非常合算的。
图像识别密码 图像识别库的密码。 这个是为了避免别人直接使用你的识别库的一个保护。 这个密码是生成识别库的人员提供的。
探测步长 这个参数指定了一个帐号探测多少个号码。 软件内部的探测逻辑如下: 假设初始值为1,探测步长为20,那么 第一次探测,1,2..20,发现有效编号是1,5,10,那么把有效编号的公司名字记录下来,然后把初始值调整为11 第二次探测,11,12...30,发现有效编号是14,17,18,那么把有效编号对应的公司名字记录下来,然后把初始值调整为19 ..... 探测步长有两个用途: 一个是为了避免因为某个编号是无效编号,从而倒是软件反复检查这个编号; 一个是为了提升处理的效率,一次性的连续探测多个编号比每次只处理一个编号效率高。 测试模式 当测试模式为1的时候,处理使用一个帐号处理一组编号就会停止下来。 当测试模式为0的时候,软件会一直处理下去,直到用户点击停止。 这个模式是为了方便调试程序。