人工智能

同盾AI技术护航网络内容安全 助力净化网络生态

内容风险的防控,又叫内容审核或内容安全,越发受到各类电商、直播、媒体等平台的重视,随着大量UGC内容的爆炸式增长,一些违规内容也随之横行,不仅为平台的营销、经营及品牌造成极大伤害,更为严重的是一些违规内容也会涉及棘手的法律问题。近年来,不乏知名电商、直播和媒体等平台因此而惨遭下架。

事实上,违规内容的处理难度远比人们想象复杂得多,违规内容的形态千变万化,包括但也不限于黄赌毒、低俗辱骂、恶意灌水、暴力恐怖、反动言论等,对各类平台的内容风险防控提出极大的挑战。

一般来讲,违规主体大致可分为非恶意违规用户、恶意违规用户和恶意违规团伙等几类。

非恶意违规的用户相对来说会更好处理,恶意违规的用户或恶意违规的团伙则相对棘手很多,因为其目的不纯粹,且还运用了大量的先进技术。所以通常会存在各种对抗的过程,除了从单元素(单纯文本/图片/语音等)展现上的变形外,甚至会有明显的迁移过程,从图文到音频视频等,甚至还有多元素的结合发送违规内容。

这里说的用户和团伙的概念都是指逻辑上的团伙,比如现实物理上的人借助上中游的黑产工具实现的批量对抗方式,在实际业务中往往也是体现出团伙的属性。特别地,"色情流"产业链、"赌博流"产业链、外挂引流、境外势力等操控的实际个人或者团伙,在进行内容发布时都会有显性或者隐性的团伙特征出现。

基于此,国内第三方智能风控与分析决策服务提供商,同盾科技打造了内容安全智能平台,内容安全智能平台是同盾反欺诈服务的核心产品之一,其中主要包括图像内容安全服务和文本内容安全服务。

同盾内容安全智能平台

同盾内容安全智能平台基于自然语言处理、语言识别、语义理解、图像分类、目标检测、深度学习等核心技术,面向银行、互金、保险、证券、互联网等客户群体,提供包括文本、图像、音频、视频等泛内容安全识别,全面提升企业智能化、批量化UGC等内容综合处理能力、为企业构建牢不可破的安全防御体系。

文本内容安全

文本安全防控体系是内容安全智能平台重要的组成部分,结合深度学习算法、政策权威指令等,能全面解决诸如跳词检测、误匹配矫正、火星文识别、组合词识别、同音词识别、形近字识别等问题。

并精准识别垃圾源头,及时主动推送风险,帮助客户防范涉政、涉黄、涉暴、垃圾广告等违规风险,提供安全保障,其优势主要体现在以下几个方面:

算法优势:针对海量的文本语料,对AI算法进行系统的训练学习,使得同盾内容安全文本的对广告、涉黄、辱骂、违禁等文本准确率和覆盖率,达到当前的业界的先进的水平。

使用机器学习和深度学习算法,进行关键词的挖掘。确保关键词及其变异体覆盖面广泛。

关键词:同盾多行业积累下的海量关键词库,这是防控体系下最重要、也是最高效的一环。由于数据量巨大,文本防控对实时响应又有极高要求,所以在基于DAT双数组结构的基础上,结合了其他算法作了定制化构建。另一方面,词库通过权威政策指令下发、新词挖掘算法等各种途径,可不断进化扩容。

使用cnn、lstm、基于注意力的attention、bert等前沿深度学习算法,对神经网络的相对调整。每一个分类都有自己对应独立的神经网络算法。从而确保每个业务和场景分类,都能满足需求。

此外,同盾文本安全防控体系还有以下特点:

1.配置灵活:基于定制化分词、感知词法分析、命名实体识别、自动摘要、关键短语提取、依存句法分析、语义距离判定、浅层情感分析等一系列自然语言处理技术,针对不同行业不同场景实现松紧相宜、灵活配置的策略体系。

2.性能卓越:可承受单日千万级数据的处理,支持数据高峰时段弹性扩容,检测结果毫秒级返回;

图像内容安全

图像作为典型的富文本承载形式,在防控上较文本也会更具挑战性。

1、图像预处理系统,包括常规格式支持及特殊格式的解码转换,如基于谷歌V8引擎的WEBP格式、标签图像TIFF格式、动态GIF格式等的支持,同时也具有图像降燥、数据增强、归一化等处理。

2、图像黑白相似样本库,通过矩阵算法生成图像sim指纹,构建高效前置索引,形成海量典型样本库,实现批量范围内特征图像及时高效防控。

3、基于tensorflow、caffe等深度技术所构建的图像深度学习平台,孵化出涵盖涉黄、暴恐、涉政治、文字广告四大类模型识别服务。其中包括大小尺度性感、儿童、成人等10余种涉黄场景;武器、血腥、游行、军装、符号等几十种细分暴恐场景;覆盖上百位重要政治人物及政治事件;通过OCR技术,精准识别包括广告、二维码在内的各种内嵌文字信息。

同盾科技的图像内容安全服务采用深度学习技术,运用了先进的GAN算法和无监督的决策边界拟合,基于强大的学习能力能有效帮助网站识别色情图片以及转化为图片的文字广告信息,防治垃圾信息传播以及潜在的诈骗风险,以减少网站内容风险和人工审核成本。同时结合同盾文本内容安全以及帐号安全保护产品,让垃圾信息无处藏身。

同盾科技内容安全服务的基础是图像识别及文本识别的人工智能技术,此技术能为图像和文本反欺诈及其他场景提供强大的深度学习算法和算力保证。经过多年的努力,同盾已完全自主具备了强大的技术能力,拥有图像识别、文本识别及语音交互的人工智能技术,沉淀了包括机器学习平台、决策引擎、流式计算平台等一系列的基础平台。

同盾科技内容安全产品通过了由中国信息通信研究院牵头组织的内容安全解决方案标准资质认证,成为首批通过认证的三家企业。

同盾内容安全智能平台目前已服务各行业大量客户,与央视网、21财经等都建立了合作关系,并获得工信部首批资质认证。同盾愿意与更多企业携手,为打造一个更加安全、健康的网络环境而努力。

希望看到您的想法,请您发表评论x