查看“OpenLaw法律文书采集”的源代码
←
OpenLaw法律文书采集
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
==摘要== 这个工具解决OpenLaw的法律文书采集问题。 ==展示== [[image:20160125_openlaw_ui.gif]] [[image:20160125_openlaw_dir.gif]] [[image:20160125_openlaw_data.gif]] ==背景== OpenLaw 开放法律联盟,2014年成立于上海。是一个面向律师、法官、检察官、法学教师、学者、学生以及从事法律相关的工作人员的 NGO 开放型组织,OpenLaw 的用户被视为法律技术和知识的源泉,共同分享法律专业知识以及智慧和经验成果。 OpenLaw是获取法律方面的资料的一个最有效的途径。 ==需求== 字段列表 案由,标题,法院,类型,程序,案号,判决时间,审判长,审判员,书记员,原告,被告,上诉人,被上诉人,再申请人,被申请人,第三人,申诉人,被申诉人,赔偿请求人,义务机关,公诉机关,复议人,追加人,申请执行人,被执行人,原告委托人,原告代理人,原告律师,原告律师事务所,被告委托人,被告代理人,被告律师,被告律师事务所,涉及法律法规,判决内容 位置信息 [[image:20160120_openlaw_xuqiu_000.jpg]] 特殊要求 涉及相关人物时,多个用‘,’因为逗号隔开,相关人物可能为公司 大数据问题 大量访问的时候,网站会提示验证码,会封IP。 [[image:20160120_openlaw_xuqiu_001.jpg]] 显示的不完整 有些页面,只显示到100页,需要处理这个问题 采集难度很高 客户已经找了4个采集人员做,都没有做下来。 ==功能== ===输入=== 默认网址 ===输出=== 输出内容 案件信息 案件编号.htm 案件编号.txt 数据文件.csv 数据文件的字段列表如下 网址,编号,案由,标题,法院,类型,程序,案号,判决时间,审判长,审判员,书记员,原告,被告,罪犯,上诉人,被上诉人,再申请人,被申请人,第三人,申诉人,被申诉人,赔偿请求人,义务机关,公诉机关,复议人,追加人,申请执行人,被执行人,原告委托人,原告代理人,原告律师,原告律师事务所,被告委托人,被告代理人,被告律师,被告律师事务所,涉及法律法规 案件编号.htm 保存完整的网页内容 案件编号.txt 保存案件正文内容,去掉所有HTML字符 ===处理=== ==其他==
返回至
OpenLaw法律文书采集
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息