解决方案

当前位置:首页 > 解决方案 > 智慧检务 > 正文

简易模型机

时间:2024-10-30 09:58:38   来源:江苏省南京市栖霞区人民检察院南京市栖霞区检察院

[内容导读]    一、案例简介  研究大量模型后,发现很多模型均可以高度抽象,从更高维度看模型,基本就是围绕结构化数据建模,这类模型可称为简单模...

  一、案例简介

  研究大量模型后,发现很多模型均可以高度抽象,从更高维度看模型,基本就是围绕结构化数据建模,这类模型可称为简单模型;对裁判文书、案卷、外网爬取的各种音视频及文本数据等,在建模之前,通常需要将这类非结构化数据进行解析成结构化数据,这类模型可以称为中等复杂度模型;另外部分模型的数据有时空属性,尤其是空间经纬度属性,这类模型可以认为是比较复杂的模型。当将非结构化数据解析成结构化数据后,建模就很简单;如数据涉及时空属性要素的,只要再基于地图,做一些简单定制,因此,可以认为除用到空间属性要素建模外,均可以研发一个简单工具,专门用于结构化数据建模,建设简易模型就无需技术人员介入,提升了建模效率及投入产出比。

  二、案例举措

  主要做法及经过如下:

  1.本库碰撞

  1.1.相关技术

  利用Apache POI HSSF实现格式化数据文件的读取解析与导出;利用DruidDataSource与SqlSessionFactory实现多库数据源的数据库解析;利用JSON实现对数据的格式化处理;利用自适应算法实现规则的解读与计算单元的构建。

  1.2.功能使用举例

  以违规停车位模型为例:将采集到的各街道停车位数据文件传入“简易模型机-本库碰撞”,经过数据振动筛去除重复数据后,选定数据仓库中“合法停车位”,根据库中数据字段名设置与数据文件表头的对应关系,如“街道名”、“收费道路名称”、“道路朝向”、“泊位总数”,随后上传提交至功能计算单元,得到并导出线索数据。

  2.碰撞填充

  2.1相关技术

  利用Apache POI HSSF实现格式化数据文件的读取解析与导出;利用JSON实现对数据的格式化处理;利用填充算法实现规则的解读、数据填充计算单元的构建。

  2.2功能使用举例

  数据文件处理工具,当检察官取得多个数据顺序紊乱、数据内容缺失、多数据来源的数据文件时,例如嫌疑人基础信息数据文件存在社保数据缺失、邢狱数据缺失、从业数据缺失等情况,拿到了人社局数据文件、刑法执行机关数据文件、企业从业人员数据文件、重点人员管控数据文件等,人工核对工作量巨大,需要借助工具来快速解决,将主数据文件作为待填充数据文件,人社局数据文件、刑法执行机关数据文件、企业从业人员数据文件、重点人员管控数据文件作为补全来源数据,逐一传入“简易模型机-碰撞填充”功能中进行多轮次的数据填充,最终得到完整的嫌疑人信息数据文件。

  3.碰撞合并

  3.1相关技术

  利用Apache POI HSSF实现格式化数据文件的读取解析与导出;利用JSON实现对数据的格式化处理;利用合并算法实现规则的解读、数据合并计算单元的构建。

  3.2功能使用举例

  数据文件处理工具,当检察官持有若干个相同属性但部分数据字段不同的数据文件时,例如产品销售备案数据文件、产品销售许可数据文件、街道登记各企业产品销售台账等,个别重要因素相同,但具体信息内容却不同,以其中一个数据文件为基础,将其余数据文件逐一传入分轮处理,最终得到各数据因素齐全的数据文件,向简易模型机中其他功能提供数据基础。

  4.对比不同

  4.1相关技术

  利用Apache POI HSSF实现格式化数据文件的读取解析与导出;利用JSON实现对数据的格式化处理;利用对比算法实现规则的解读与计算单元的构建。

  4.2功能使用举例

  在建模中,会出现数据源不存在于系统数据仓库的情况,此时需要使用“简易模型机-对比不同”功能,需要每轮上传两个数据文件,各自经过数据振动筛去除重复数据后,以经营备案、经营许可为例,可设置“统一社会信用代码”、“企业名称”,随后上传提交至功能计算单元,得到线索数据。

  三、案例成果

  实现零代码建模、也无需编写任何公式建模,也无需“拖拉拽”,更无需绘制流程图,检察官或法官或民警等,只需“点点、选选”,就可自定义建模,对使用人没有任何门槛,最最简单易用,几乎无需任何培训,就可“傻瓜”式的批量自助建模,人人可以上手应用、快速建模,建好的模型,也能在高检院平台上快速上架;同时不仅仅用于传统意义上的建模,还可作为各类工作人员日常数据处理的工具,如数据串并、数据抽取、数据统计、数据穿透等处理分析研判。且简易模型机可与其他各类系统或平台进行嵌入,也可访问现有“数据池”;根据需要,实际部署时,根据需要增加“数据池”功能,但即使不自带“数据池”功能,也不影响各类场景应用。

  基于该简易模型机搭建了大量模型:如环境资源、食品安全、药品监管、国有财产保护、安全生产、文物监管、美瞳等医疗器械监管(被央视报道)、非标油监管、渣土监管、非法采矿、船舶污染监管、噪声污染监管、反垄断监督、反不正当竞争监督、奶油蛋糕监管、网络民宿与私人影院监管、停车行业监管、农民工工资保证金监管、环保税监督、耕地占用税监督、医保基金监督、残疾人就业保障金监督、服刑人员待遇发放监督、农村地区人员死亡后待遇领取监督、女性社保挂靠法律监督、公租房法律监督、建设工程违法分包转包挂靠监督、水资源税监督、国有土地出让金监督、城市基础设施建设维护费监督、社会保险费监督、中药老字号知识产权保护法律监督、汽车维修企业废机油监管、种子安全监管、非法占地监管、社区矫正期间再犯罪监督、实有人口数据研判等系列模型。

  多个城市公安、检察应用后,都感觉不错,可真正让“让数据好用、把数据用好;发现真问题,真解决问题”,镇江市公安局利用该模型机搭建的实有人口数据研判模型,在2022年6月1日至2023年9月15日,就通过该模型处理了117763条自主申报内容,其中已入库流动人口58327条,已入库寄住人口10053条,经民警手动确认并处理流动人口12657条;当前通过自主申报登记并生效中的出租屋4248条,流动人口47298条。

  南京栖霞区人民检察院基于简易模型机构建了大量的模型,2024年3月14日最高检到南京栖霞区人民检察院进行数字检察与模型建设应用调研,特别认可 “简易模型机”;由于人人可以快速上手、无需特别培训,就能快速应用;同时,不仅仅用于传统意义上的建模,还可作为各类工作人员日常数据处理的工具,如数据串并、数据抽取、数据统计、数据穿透等处理分析研判,对广大基层检察院、基层法院、基层公安机关、基层派出所,有广泛地适应性,且成熟稳定,成本费用低廉,投入产出比高。因此具备广泛的可复制推广性。

  责任编辑:广汉

声明:

凡文章来源标注为"智领安平行业网"的文章版权均为本站所有,如需转载请务必注明出处为"智领安平行业网",违反者本网将追究相关法律责任。非本网作品均来自互联网并标明了来源,如出现侵权行为,请立即与我们联系,待核实后,我们将立即删除,并向您致歉。

活动专题

更多

2023政法展江苏巡展

品牌推荐更多>>

Baidu
map
Baidu
map