文本内容非法信息语义识别_智能语义分析系统_傲盾

客户价值

01

满足政策监管要求

满足工业和信息化部对企业多种类型未备案域名监管要求,满足公安、网信办等监管部门对网页内容中的违规内容信息监管要求,防止由于违规内容未及时处置, 导致被监管部门约谈、通报批评和罚款情况出现。

02

实现企业内部合规要求

企业对接入的客户和运营的业务内容需要客观的分析和监控,通过不良信息监控系统满足企业内部对数据的可视化和个性化内部监管。如查看 IP 接入网站数量情 况、域名访问排名、数据抓包等。

03

实现统一管理和高效运维

通过部署傲盾不良信息监控系统实现企业多节点或多数中心的统一管理,减少了企业运维成本。

功能特性

违规处置
阻断违规信息
综合审核
人工审核
内容二次标注
模型更新
AI批量审核
  • 批量审核
  • 批量阻断
  • 添加信任
  • 取消信任
名单管理
  • 内容黑白名单管理
  • 用户黑白名单管理
  • IP黑白名单管理
  • 数据黑白名单管理
运营支撑
  • 权威政策下发布
  • 专属运营策略经理
  • 专家级法规解读
  • 规则策略调优
技术算法支撑
基础的NLP技术
Jieba分词
词性标注
文本正则
词向量模型
fasttext
智能识别与修正
  • 拼音特征
  • 表情符号
  • 特殊符号映射
  • 标点符号
上下文短文本语义识别
信息自动归类
检测文本类别
智能鉴黄
  • 色情传播
  • 色情挑逗
  • 低俗段子
  • 性行为
  • 低俗段子
  • ...
暴恐违禁
  • 暴力言论
  • 恐吓勒索
  • 分裂国家
  • 反动言论
  • 刀枪弹药
  • ...
政治敏感
  • 领导人
  • 英雄烈士
  • 劣迹艺人
  • 藏独港独
  • 邪教迷信
  • ...
恶意推广
  • 广告网址
  • 投资贷款
  • 涉嫌欺诈
  • 微商/招聘
  • 评价软广
  • ...
低俗辱骂
  • 脏话辱骂
  • 变种谩骂
  • 饭圈互撕
  • 禁用词
  • emoji谩骂
  • ...
低质灌水
  • 无意义中文
  • 无意义数字
  • 乱码符号
  • 低质标题
  • 重复内容
  • ...

应用场景

  • 数据中心
  • 即时通讯
  • 网站论坛
  • 视频直播

数据中心

大量不良信息集中在大型的IDC/ISP和IRCS(云业务〉接入商的数据中心,很难进行监管和控制。通过在线旁路部署实现海量流量数据采集和违规数据的拦截, 为接入商、运营商和互联网内容提供商提供一个全新的不良信息审计方案。

语义识别设备

  • 单一部署
  • 三合一部署(不良信息监控系统)

即时通讯

识别用户昵称、签名、私聊、群聊场景文本内容安全检测、有效防止恶意用户发送色情挑逗文字、广告引流、脏话辱骂等其他损害正常用户体验与企业利益的行为。

重点布控

  • 色情挑逗
  • 广告引流
  • 敏感
  • 谩骂骚扰
  • 违禁言论
  • 敏感
  • ...

网站论坛

识别用户在网站论坛中的发文、评论中的不适宜内容。网站论坛是违规内容产生的高危板块。内容区和评论区的文字内容都需要通过文本检测进行 审核过滤通过图片检测来进行安全拦截。

重点布控

  • 色情传播
  • 谩骂骚扰
  • 广告引流
  • 违禁言论
  • 暴恐言论
  • 敏感
  • 无意义灌水
  • ...

视频直播

识别视频、直播中的弹幕、用户评论,实时检测直播、点播、语音房等玩法的弹幕内容,拦截不合法信息,维护良好的用户体验,降低用户人工成本。

重点布控

  • 色情传播
  • 谩骂骚扰
  • 广告引流
  • 违禁言论
  • 暴恐言论
  • 敏感
  • 无意义灌水
  • ...

产品优势

规则灵活定制
接受灵活的规则定制,支持自定义关键词
自然语言处理
通过语义分析构建智能机器学习算法,高效过滤复杂变种文本
多维度监测
辅助监测用户IP、设备ID等多维度数据,源头保障内容安全效果
  • 涉黄-准确率97.87%
  • 涉政-准确率99.5%
  • 暴恐-准确率99.8%
  • 低俗-准确率93.57%
  • 灌水-准确率88.58%
  • 恶推-准确率88.44%
万级敏感词库数据以天级别更新
持续迭代识别新型复杂违规文本

部署方式

私有化部署
针对数据敏感性要求较高的客户,提供设备可进行私有化节点部署
API接口
提供灵活API接口接入方式,实时返回检测结果
在线检测
针对无接口开发能力用户,提供在线检测功能,实时适回检测结果

客户案例