
活动专题
时间:2023-09-07 10:51:41 来源:飞叶科技股份有限公司
[内容导读] 一、引言 在社会治理的工作中,对于社会治理风险的发现、预防一直是一个难点问题,本平台针对社会治理风险的核心要素(人、事件、企
一、引言
在社会治理的工作中,对于社会治理风险的发现、预防一直是一个难点问题,本平台针对社会治理风险的核心要素(人、事件、企业、场所等)以及业务特点,提供了社会治理风险预测预警模型的建模、训练、运行,利用大数据、人工智能的手段实现了对社会治理风险的预测预警,站在“全域治理”的高度,实现社会治理矛盾风险的超前预防,全面通过智能化的手段掌握社会动态,提升对辖区社会运行状态的掌控能力、社会治理问题的解决能力、重大事项的决策能力,从而从技术上解决社会治理风险发现难、预测难、预防难的问题,为平安社会的建设提供有力的支撑。
二、业务痛点
社会风险治理中的各类个人极端、群体性等事件,较少存在偶然性发生,事发前一定有这样或那样的事件线索内因或外因,但这些线索在未事发时很难发现。导致当前社会风险的治理手段比较单一,无法及时有效地发现苗头性、倾向性问题。而各类事件的发生通常会伴随不同领域的信息印证,由于数据壁垒和数据缺乏有效地梳理和组织,单一数据源很难判定各类重点人的行为,以及可能引发的后果,这些问题目前都缺乏有效地技术手段来解决。
三、产品目标
本平台直接从这些业务痛点出发,提供了有效地手段,能够直接对社会治理痛点、难点问题进行建模,利用模型建立起各类因子之间的关系和权重,自动运算各类风险发生的概率,对可能发生的风险及时预警,提醒相关部门及时处置,将问题解决在苗头阶段。
(一)业务建模
根据社会治理工作中的各类问题进行业务建模,将重点、难点问题数字化、模型化是本平台一个最根本的目标,本平台能够支持一系列算法模型建模例如离散神经网络、决策树、决策流、决策表等,帮助用户建立起预测预警模型,并支持设置各种运算法则建立起模型各节点之间的相互关系和影响力因子,并且通过实际案例调参,使得模型达到一个令人满意的准确率和召回率。
(二)数据治理
本平台的模型需要和数据层绑定才能运算出正确的结果,因此,对数据的准确性和规范性要求很高,同时,每个模型都会涉及到非常多的数据门类,因此,在模型挂载数据之前必须对数据进行规范化处理才能使用。
本平台的数据规范化处理分成两个部分,一是通过数据对接时候的ETL过程将数据转换成本平台能够使用的规范化数据,二是通过自然语义识别技术将各类上报事件里面的核心要素抽取出来(涉事人、企业、地址、事件类型、事件本身的风险级别等),规范化以后绑定到模型上。
四、核心技术
本平台用到的最核心两项技术是自然语义识别技术和AI模型建模技术。运用大数据+人工智能方式,充分多部门数据资源,通过全局化的顶层设计,可有效打破信息孤岛、利益壁垒、重复投资、交换机制缺乏、数据失效的问题,实现基于社会治理业务的信息按需聚合。实时、定时动态的对相关源数据进行同步、抽取、转换、清洗、过滤,并更新到主题数据库,及时实现对相关数据碰接分析,自动识别、筛选分类、智能解读,能大大降低数据应用的延迟性,提高数据的有效性和鲜活性。通过人工智能模型研判,实现对社会治理事件的自动发现、研判、预警、决策,运用预警上报、风险预测、展现、推送和发布功能,实现业务部门、平台之间的信息同步共享,从而达到及时发现、及早预防、快速处置等效果,提升发现、解决问题的效率,可节约大量人力投入。
(一)AI模型建模
模型建模的过程就是根据业务建立各种预测预警模型并训练模型使之能够得出正确的预测预警结果。预测预警模型的建立过程就是通过大量的基础数据学习,生成并利用这些预测预警模型对同类事件的严重程度和未来趋势做一个准确的判断。
建模:首先根据业务的需要以及历史案例的经验,建立预测预警模型(离散决策树的各节点以及相互之间的关系);第二对于各个节点绑定节点规则以及数据源;第三设定由子节点向其父节点计算的计算规则以及各节点之间的相互影响规则,从而形成一个完整的预测预警模型。
训练(正向学习):将所有实际案例标注后输入预测预警模型,训练得出个节点规则里各项参数的权值,并使输出的结果符合预期的定义。
调整(反向传播):当有新的案例进入时,利用预测预警模型运算看看是否符合预期,如果符合,则直接输出正确的结果不做调整,如果不符合则重新标注这个案例并根据实际情况调整模型节点和规则,再将这个案例输入预测预警模型训练,使之也能得到正确的结果同时保证以前所有案例的准确性。
(二)自然语义识别
本平台使用自然语义识别技术要解决的核心问题是从各类事件中抽取模型需要的各类指标。因此,本平台从实际工作出发,使用了下列技术并做了针对性的改进。
基于条件随机场(CRF)的分词:针对现有分词预处理方式中词性缺失的问题,使用词性词位标记方式,引入参数对重点词性进行标注。针对条件随机场,提出了一种改进的特征模板,对常用特征进行提取的同时,加入了复合一元特征信息,提高未登录词的识别能力。
基于CNN神经网络的中文语义提取:平台使用的CNN模型对于语义提取的效果优于传统的模型,主要使用问题转换法中的二值相关法结合CNN模型进行多标记语义特征提取提高准确率;改进后的CNN模型更加适合于不均衡数据的处理,宏平均F1值有了显著的提升。
基于SVM的中文文本分类:文本的自动分类是现今的研究热点,在垃圾邮件过滤,垂直搜索引擎,数字图书馆等方面都有应用。支持向量机(SVM)模型是分类算法中较为主流的模型,本平台基于分类算法中较为主流的支持向量机(SVM)模型,通过两个特征选择方法——基于有效信息比的特征选择方法,改善了类别间分类的均衡性,提高了总体分类效果;结合语言信息的层次性特点,使用了上下文词对作为新特征,对传统词汇特征加以补充,有效提高了算法有效性。
基于DBSCAN中文文本聚类:DBSCAN是一种基于密度的聚类算法,其基本假设是一个集群的密度要显著高于噪声点的密度,因此,该方法的基本思想是对于集群中的每一个点,在给定的半径范围内,其相邻点的数量必须超过预先设定的某一个阈值。该算法能有效解决基于分区和基于层次划分算法中存在的问题。
基于LSTM神经网络的中文语义分析对比:改进基于LSTM的语义解析模型,针对中文表达方式多样、语法灵活的特点,本模型引入了自然语言的句法结构,并且改进了 Decoder的解析过程,改进的Decoder可以利用知识库提高语义解析的准确率。
基于条件随机场(CRF)的人员行为预测:条件随机场(CRF)是一种基于最大熵模型和隐马尔可夫模型的判别式概率无向图学习模型,主要用于标注和切分有序数据。因为条件随机场可以直接对后验概率建模,所以它可以容纳任意的上下文信息,同时,条件随机场的特征设计灵活。
五、运用成效
本平台支持对人、事件、企业、场所等多个社会治理要素进行针对性建模。目前,本平台作为一个组件已经在浙江省上线,可由各地市使用,借助本平台开发的多个模型也作为组件(精神障碍患者全位感知模型、社区矫正人员风险全位感知模型、吸毒人员全位感知模型、失信被执行人全位感知模型、危化物流人车企三因子模型、瓶装液化气储配用预测模型、异常人员风险预警模型、流动人口预警模型)在浙江省上架并在多地使用。
例如,在X区应用精神障碍患者全位感知模型后,发现了不少精神障碍患者管理中的风险并做了有效处理。
案例一:系统发现了精神障碍患者驾驶机动车发生交通事故、家暴、扬言、自行停药等情况。2021年初,本平台通过对110警情的分析研判,发现曹X良、马X荣、王X荣等多名精神障碍患者涉及驾驶机动车、电动自行车发生交通事故的情况,事件发生频率较高。系统分析研判后,生成了精神障碍患者驾驶机动车的风险预警,并流转至“基层治理四平台”,交由区交警大队处置。随即交警部门对全区在册精神障碍患者持有机动车驾驶证的情况作了筛查统计,共发现293名,注销机动车驾驶证101本。
案例二:精神障碍患者涉家暴事件。陶X香是XX镇XX村XX自然村的精神障碍患者。系统分别于2021年6月27日和2021年7月15日获取110报警信息及区妇联家暴事件信息,反映丈夫虞X铭对患者进行家暴,甚至导致陶X香住院。系统通过随访记录发现相关部门未按精神障碍患者的管理规定对陶X香进行每三月一次随访,已触发风险预警。综合叠加上述信息后,系统自动判定风险升级并预警。预警信息流转至“基层治理四平台”,交由妇联利用心理专业知识,为陶X香进行心理疏导;由派出所民警对虞X铭进行告诫,不得再次进行家暴。
案例三:精神障碍患者从事危化工作风险事件。瓶装液化气配送工“顾X炎”是一名在册精神障碍患者。2021年10月22日系统通过随访记录发现相关部门未按精神障碍患者的管理规定对顾X炎进行每三月一次随访,属超时未进行随访,同时通过瓶装液化气的销售数据分析比对,其近期仍在从事安全风险较高的危化配送工作。系统自动判定风险并预警。预警信息流转至“基层治理四平台”,交由城管及卫健部门处置,城管责成瓶装液化气销售公司停止对其派单,卫健部门组织对该患者进行状态评估。
案例四:疑似精神障碍患者识别。2021年陆续识别陈X虎、余X忠、王X英等多名疑似精神障碍患者。例如2021年6月通过对“浙里访”、“110警情”数据中的多起欠薪事件进行数据分析、语义识别后,发现其欠薪主体均为某施工队负责人余X忠,且余X忠于5月9日曾因精神病复发被同乡张某送往上饶第三人民医院。通过与系统中在册精神障碍患者库比对后,系统判定余X忠为疑似精神障碍患者。
责任编辑:广汉
声明:
凡文章来源标注为"智领安平行业网"的文章版权均为本站所有,如需转载请务必注明出处为"智领安平行业网",违反者本网将追究相关法律责任。非本网作品均来自互联网并标明了来源,如出现侵权行为,请立即与我们联系,待核实后,我们将立即删除,并向您致歉。