首页 > 成果转化  
详细内容
   
基于内容的敏感网页识别方法(发布日期:2021-07-20)
基于内容的敏感网页识别方法
成果编号 CG383
项目名称 基于内容的敏感网页识别方法 公司名称 ******
注册时间 2014-08-28 注册资本 ¥0.00万元
注册地址
主营业务
管理团队

项目主要情况描述
技术原理简介 本发明公开一种基于内容的敏感网页识别方法,包括步骤:在给定网页的统一资源定位器的条件下,获取该网页的源码,数据分流和预处理,获取文本信息和有效图像信息;利用连续敏感文本分类器对文本信息处理,如果分类器输出结果为敏感,则处理完毕。否则利用离散敏感文本分类器对文本信息处理,如果分类器输出结果大于事先给定阈值,识别结果为敏感,则处理完毕。否则利用图像分类器对图像识别,识别结果与离散分类器输出结果融合。本发明采用连续敏感文本识别器、离散文本识别器和敏感图像识别器三者结合的方案解决现有技术的问题,本发明利用web结构信息及构造了一个图像集合识别问题来进行信息融合,提高对敏感网页的识别率。
关键技术线路 CN200610073172.7 1、一种基于内容的敏感网页识别方法,包括步骤: 预处理步骤包括: 在给定网页的统一资源定位器的条件下,获取该网页的源码,进 行数据分流和预处理,获取文本信息; 获取网页中图像部分的结构信息,挑选重要图像组成有效图像集 合; 网页敏感信息识别步骤包括: 利用连续敏感文本识别器对文本信息进行识别处理步骤; 利用离散文本识别器对文本信息进行识别步骤; 利用敏感图像识别器对图像集合的图像进行识别步骤。
是否获得国家及省市科技经费资助
资助名称 资助金额 ¥0.00万元
行业历史与前景
市场规模及增长趋势
目标市场
行业竞争对手及本公司竞争优势
业务模式
策略操作性和有效性

项目融资说明
项目计划投资总额 ¥0.00万元 新增投资额 万元
资金来源 合作方式
固定资产投资额 ¥0.00万元
流动资产投资额 ¥0.00万元
资金使用方向细目

预计收益
项目建设期

联系方式
联系人 钟悦 电话 0813-8577222
联系地址 自贡高新区南岸科技新区孵化园1号楼 传真 0813-8577200
E_mail zgkjcgjy@163.com
关于我们 | 法律申明 | 联系我们
Copyright © 2010-2021 自贡高新技术产业开发区科技服务平台  All Rights Reserved  蜀ICP备18004305号-1
主办:自贡市技术转移有限公司 技术支持:自贡市技术转移有限公司
联系电话:0813-8577222 传 真:0813-8577200 地 址:自贡高新区南岸科技新区孵化园1号楼 邮政编码:643000