“OpenLaw法律文书采集”的版本间的差异

来自JsRobot
跳转至: 导航搜索
展示
输入
第31行: 第31行:
 
==功能==
 
==功能==
 
===输入===
 
===输入===
 +
    默认网址
 +
 
===输出===
 
===输出===
 
===处理===
 
===处理===
 
==其他==
 
==其他==

2016年1月25日 (一) 12:23的版本

摘要

     这个工具解决OpenLaw的法律文书采集问题。

展示

     20160125 openlaw ui.gif
     20160125 openlaw dir.gif
     20160125 openlaw data.gif

背景

     OpenLaw 开放法律联盟,2014年成立于上海。是一个面向律师、法官、检察官、法学教师、学者、学生以及从事法律相关的工作人员的 NGO 开放型组织,OpenLaw 的用户被视为法律技术和知识的源泉,共同分享法律专业知识以及智慧和经验成果。
     OpenLaw是获取法律方面的资料的一个最有效的途径。

需求

     字段列表
     案由,标题,法院,类型,程序,案号,判决时间,审判长,审判员,书记员,原告,被告,上诉人,被上诉人,再申请人,被申请人,第三人,申诉人,被申诉人,赔偿请求人,义务机关,公诉机关,复议人,追加人,申请执行人,被执行人,原告委托人,原告代理人,原告律师,原告律师事务所,被告委托人,被告代理人,被告律师,被告律师事务所,涉及法律法规,判决内容
     位置信息

20160120 openlaw xuqiu 000.jpg

     特殊要求
     涉及相关人物时,多个用‘,’因为逗号隔开,相关人物可能为公司
     大数据问题
     大量访问的时候,网站会提示验证码,会封IP。

20160120 openlaw xuqiu 001.jpg

      显示的不完整
      有些页面,只显示到100页,需要处理这个问题
      采集难度很高
      客户已经找了4个采集人员做,都没有做下来。

功能

输入

    默认网址

输出

处理

其他