人工智能图普科技_图普科技，看人工智能如何“鉴黄”-数据分析

图谱用深度学习的技术实现了互联网图像过滤的整体解决方案，对外称识别准确率高达99.5%。

黑科技之“人工智能”：

2016年是网络直播商业化应用起步之年，第一，欧莱雅在美拍上通过巩俐等明星直播戛纳电影节；第二，小米通过直播发布了小米无人机观看总人数累计达到1092万。据艾媒咨询统计，在中国有近200家在线直播平台，包括YY、腾讯、乐视、小米等大玩家，在游戏、财经、体育等细分领域；也涌现一批垂直直播平台，以游戏为主的有斗鱼、虎牙、熊猫TV、龙珠直播等平台。除此之外，图像、文字、语音这类的开放平台，也在不断增长。

商业需求激增“鉴黄师”职业，华创证券的研究报告认为2015年直播行业具有120亿的市场规模，艾媒咨询的报告认为该市场规模约为90亿。5月份，映客、花椒、在直播、陌陌等平台的40名主播因涉黄被永久封禁，“鉴黄”势在必行。

在需求的涌现下，广州图普科技将深度学习的人工智能技术应用在图像识别上。据了解，图普科技早在2012年开始就着手研究“深度学习”技术，并与国内某知名实验室展开合作，率先推出基于图像识别技术的第三方内容审核服务，识别色情、暴恐、小广告等违规图片和视频方面。

另外，该公司用深度学习的技术实现了互联网图像过滤的整体解决方案，对外称识别准确率高达99.5%。图普科技CEO李明强认为，“鉴黄”技术或者图像识别并不是“黑科技”，因为黑科技应该是没有被预料而出现的，所以某种东西虽然有了比较大的突破的，但是黑科技大多数不是立即可以应用到人们身边的，一般而言，科技需要被应用，应该是需要与一定的上下游产业相结合，所以当很多黑科技出现的时候，只能说是这项科技在技术上有了一定的突破，但是在实际应用时还是需要配备相应的成熟的上下游产业。

1涉黄泛滥，“智能鉴黄”奈何成黑科技？

说“鉴黄黑科技”之前，我们先讨论一下“鉴黄师”的“职业化”。在互联网1.0时代，“鉴黄”工作并不显性，同样也不会应用在商业领域，追溯“鉴黄”这个职业，大概是出现在警察侦查和打击“制作、复制、贩卖、传播淫秽物品”的场景中。据媒体2004年首次报道，重庆市53岁的陈晓萍在2000年开始被安排担任“鉴黄师”——对收缴的淫秽音像制品进行鉴定。

“鉴黄”的背后是抵制与防止“淫秽物品”，在互联网高速发展的情况下，从文字到语音，从语音到影像，需要监控的网站成千上万的崛地而起，需要侦查的文字和图像内容随着技术的发展越来越隐晦和“内涵”，尤其是互联网2.0的到来，互动社区的崛起，网友的素质参差不齐，因“涉黄”被勒令关闭的网站多如牛毛。

“鉴黄”的无非两种方法，人工“鉴黄”和技术“鉴黄”，目前“鉴黄”水平较高的可以说是双管齐下，图普科技采取的方式是对问题进行分割为确定的和不确定的两部分，确定的部分交给机器，不确定的部分交给人工。

智能“鉴黄”为什么会被外界一度认为是黑科技？

首先，强大的数据库存入与提取是人脑不能实现的，判断涉黄与否，某互联网企业某职员曾对记者表示，“如果要说‘鉴黄’那些事，我可以讲三天三夜”，关于涉黄的规范文件，那是千百部“片子”才能解释的。尤其是情景复杂多变、内涵不一的性暗示内容，有着千万种不同的搭配，绝非“一日之寒”。

随着互联网的发展，内容安全成为互联网不得不面临的严峻挑战。早在2013年，全世界每天会上传超过5亿张图片、上传20万小时长的视频到互联网。但是人们每天在Instagram分享近6000万张照片，在Facebook分享近3亿张——当然，还没算上Snapchat、 Google 、 Twitter等大量产图的应用。据估计，一年后就可达到18亿，所以在三年后的今天，这个数值必然远超乎我们的想象。

确实，人们相比过去，互联网的数据每年都在爆炸式增长。IBM 的研究称,整个人类文明所获得的全部数据中, 有 90%是过去两年内产生的，等到了 2020 年,全世界所产生的数据规模将达到今天的 44 倍。

截止2015年底，人们在互联网上上传的照片已经超过9000亿张，一天上传到网上的照片数量就已经超过了18亿。

“没有大面积裸露是不是就不是黄图?也未必,如果好好的一对丝袜偏要撕出好多破洞,那就算性暗示。”映客某“鉴黄师”表示，这个场景换成文字或影像理解，人脑未必能够深刻的记住或者及时判断，但如果换成算法来判断，那就是“秒判”。

其次，这项技术号称要顶替“鉴黄师”，在一定程度上撼动了外界的看法，认为这是一项“足够犀利”的新技术，未来有望释放“鉴黄师”的巨大压力。虽然各个互联网企业都有专门的人员来做内容审核，但是无法跟上内容发展的速度，人工审核容易出现审核不及时、高成本、主观判断影响结果、人性道德等问题，并且高强度的“三班倒”工作下人工更容易导致审核效率低、误判漏判多等问题。

觉得技术“鉴黄”是一项黑科技的人还认为，技术太“强大”，解决不少麻烦。随着近几年互联网市场上交友软件以及直播视频软件的流行，UGC模式大行其道，各类不法分子将违法视频、图片资源上传至网络，内容安全成了互联网公司最基本的需求。前有百度、陌陌等因为色情问题而被处罚，后有优衣库门事件、快播、斗鱼直播、360云盘、“115网盘”、乐视网盘等事件，给互联网公司造成了不小的麻烦。

最新的图像识别机器审核是依赖于人工智能领域最新的算法:深度学习算法,通过模拟人脑神经网络，构建具有高层次表现力的模型,能够对高复杂度数据形成良好的解读。

技术“鉴黄”的出现，“火坑”中的企业可以感受到这项技术的快感，映客的相关负责人曾表示，“为了对主播监管，我们成立了800人的审核队伍。”在我们看来，专门养800人去做审核的事情，似乎已经是我们难以想象的企业行为，实际上，当直播高峰期成千上万的主播在线，可以说“鉴黄”队伍真是寡不敌众。强大之处还有“应对突发”的能力。人工智能“鉴黄”应用在直播上，可以监测每时每刻的直播内容。

“当我们把大量的色情、性感、正常的样本的属性告诉深度学习的引擎，然后让引擎不断学习，对他们正确的行为进行奖励，错误的行为进行惩罚，当然这些奖励和惩罚都是数学上的，最后空白的脑袋就会学成了一种连接的模型，这种模型就是为了鉴别色情与非色情而生的。”李明强介绍道。所以只要对机器“误判、漏判” 的内容进行惩罚，然后不断重复的训练，机器就会慢慢改正，不再出现同样的“误判、漏判”，模型就是这样被不断得迭代优化。

图普科技在深度学习方面的研究在早几年前就开始了，该公司属于第三方技术服务公司，在商业模式和盈利模式上都较为清晰，不同于腾讯优图、阿里绿网等为自己平台客户提供审核服务的局限性，既然是第三方服务机构，图普科技更重视服务的优势。

业内评价道，图普科技服务细致程度和准确度较高。资料显示，图普科技是国内最早利用人工智能算法（深度学习等）做审核服务，也是在在工程经验、服务专业度方面具有先发优势的第三方，“我们会根据不同的客户、不同的细分领域，做单独的模型调整以及算法细节的优化，专人服务对专门的客户做专业的运营。图普也是国内利用人工智能做智能审核的首倡者，很多定价的方法、归类的方法、接口返回的定义都为后来的同行做出了一定标准和规范。”李明强强调，互联网时代服务和产品是最重要的。

其次，图普科技识别接口全面，除了提供审核之外，还有包括人脸、场景、物体、车、表情、人的年龄以及服装风格等几十种识别接口，客户一次接入后，可以自行增减各种服务接口，只要一次接入，就可以满足各种需求。

不得不说，使用便捷才是真正的用户体验。“客户无需为了使用图片识别服务而绑定任何云计算平台,也可以通过图普入驻的七牛、UCloud、AWS、融云等知名平台直接调用。”李明强介绍道。

阿里绿网、腾讯优图的优势则体现在技术、品牌和业务的成熟上，相对于作为创业公司的图普科技知名度更高，在新产品的推广、普及上更容易被接受，腾讯和阿里都有自己的业务线，在成熟产品销售时，可以将新产品附加给客户使用。据李明强介绍，市场上不乏一些图像识别技术领域的同行：依图、图森、旷视科技、格灵深瞳、商汤科技等，大多数都是同为创业企业，但是产品线有所差异，主要是面向安防监控、金融、广告。

图普科技可以说是有着先天的优势，当我们都沉溺在人工智能的应用场景中，图普就开始着手研究深度学习，图普先从“鉴黄”切入人工智能商业化应用，随着互联网内容的发展以及市场的需求，图普又顺势展开在暴恐识别、图片增值、图像搜索等方面的应用，可以说在发展上成功的卡位了深度学习技术，当需求爆发它就快速卡位。

在互联网信息爆炸的当下，图像识别功能已经快速应用于各大网站及APP移动手机终端。图普科技2014年8月获北极光Pre-A轮融资数百万美元，产品在2015年4月上线后，仅1年已经和包括国家旅游局、今日头条、58同城、迅雷、酷狗、秒拍、小咖秀、唱吧、花椒直播、Bilibili、繁星网、秀色娱乐、CAMERA360、17APP、21CN、风云直播、战旗TV、糗事百科、花瓣网、微拍、妈妈网等数百家互联网企业和政企机构合作。此外，通过入驻七牛云、融云、UCloud、又拍云、AWS等云平台，间接服务了上万家客户，业务规模在快速发展中。

转载请注明：数据分析 » 人工智能图普科技_图普科技，看人工智能如何“鉴黄”