图谱用深度学习的技术实现了互联网图像过滤的整体解决方案,对外称识别准确率高达99.5%。
黑科技之“人工智能”:
2016年是网络直播商业化应用起步之年,第一,欧莱雅在美拍上通过巩俐等明星直播戛纳电影节;第二,小米通过直播发布了小米无人机观看总人数累计达到1092万。据艾媒咨询统计,在中国有近200家在线直播平台,包括YY、腾讯、乐视、小米等大玩家,在游戏、 财经、体育等细分领域;也涌现一批垂直直播平台,以游戏为主的有斗鱼、虎牙、熊猫TV、龙珠直播等平台。除此之外,图像、文字、语音这类的开放平台,也在不断增长。
商业需求激增“鉴黄师”职业,华创证券的研究报告认为2015年直播行业具有120亿的市场规模,艾媒咨询的报告认为该市场规模约为90亿。5月份,映客、花椒、在直播、陌陌等平台的40名主播因涉黄被永久封禁,“鉴黄”势在必行。
在需求的涌现下,广州图普科技将深度学习的人工智能技术应用在图像识别上。据了解,图普科技早在2012年开始就着手研究“深度学习”技术,并与国内某知名实验室展开合作,率先推出基于图像识别技术的第三方内容审核服务,识别色情、暴恐、小广告等违规图片和视频方面。
另外,该公司用深度学习的技术实现了互联网图像过滤的整体解决方案,对外称识别准确率高达99.5%。图普科技CEO李明强认为,“鉴黄”技术或者图像识别并不是“黑科技”,因为黑科技应该是没有被预料而出现的,所以某种东西虽然有了比较大的突破的,但是黑科技大多数不是立即可以应用到人们身边的,一般而言,科技需要被应用,应该是需要与一定的上下游产业相结合,所以当很多黑科技出现的时候,只能说是这项科技在技术上有了一定的突破,但是在实际应用时还是需要配备相应的成熟的上下游产业。
1涉黄泛滥,“智能鉴黄”奈何成黑科技?
说“鉴黄黑科技”之前,我们先讨论一下“鉴黄师”的“职业化”。在互联网1.0时代,“鉴黄”工作并不显性,同样也不会应用在商业领域,追溯“鉴黄”这个职业,大概是出现在警察侦查和打击“制作、复制、贩卖、传播淫秽物品”的场景中。据媒体2004年首次报道,重庆市53岁的陈晓萍在2000年开始被安排担任“鉴黄师”——对收缴的淫秽音像制品进行鉴定。
“鉴黄”的背后是抵制与防止“淫秽物品”,在互联网高速发展的情况下,从文字到语音,从语音到影像,需要监控的网站成千上万的崛地而起,需要侦查的文字和图像内容随着技术的发展越来越隐晦和“内涵”,尤其是互联网2.0的到来,互动社区的崛起,网友的素质参差不齐,因“涉黄”被勒令关闭的网站多如牛毛。
“鉴黄”的无非两种方法,人工“鉴黄”和技术“鉴黄”,目前“鉴黄”水平较高的可以说是双管齐下,图普科技采取的方式是对问题进行分割为确定的和不确定的两部分,确定的部分交给机器,不确定的部分交给人工。
智能“鉴黄”为什么会被外界一度认为是黑科技?
首先,强大的数据库存入与提取是人脑不能实现的,判断涉黄与否,某互联网企业某职员曾对记者表示,“如果要说‘鉴黄’那些事,我可以讲三天三夜”,关于涉黄的规范文件,那是千百部“片子”才能解释的。尤其是情景复杂多变、内涵不一的性暗示内容,有着千万种不同的搭配,绝非“一日之寒”。
随着互联网的发展,内容安全成为互联网不得不面临的严峻挑战。早在2013年,全世界每天会上传超过5亿张图片、上传20万小时长的视频到互联网。但是人们每天在Instagram分享近6000万张照片,在Facebook分享近3亿张——当然,还没算上Snapchat、 Google 、 Twitter等大量产图的应用。据估计,一年后就可达到18亿,所以在三年后的今天,这个数值必然远超乎我们的想象。
确实,人们相比过去,互联网的数据每年都在爆炸式增长。IBM 的研究称,整个人类文明所获得的全部数据中, 有 90%是过去两年内产生的,等到了 2020 年,全世界所产生的数据规模将达到今天的 44 倍。
截止2015年底,人们在互联网上上传的照片已经超过9000亿张,一天上传到网上的照片数量就已经超过了18亿。
“没有大面积裸露是不是就不是黄图?也未必,如果好好的一对丝袜偏要撕出好多破洞,那就算性暗示。”映客某“鉴黄师”表示,这个场景换成文字或影像理解,人脑未必能够深刻的记住或者及时判断,但如果换成算法来判断,那就是“秒判”。
其次,这项技术号称要顶替“鉴黄师”,在一定程度上撼动了外界的看法,认为这是一项“足够犀利”的新技术,未来有望释放“鉴黄师”的巨大压力。虽然各个互联网企业都有专门的人员来做内容审核,但是无法跟上内容发展的速度,人工审核容易出现审核不及时、高成本、主观判断影响结果、人性道德等问题,并且高强度的“三班倒”工作下人工更容易导致审核效率低、误判漏判多等问题。
觉得技术“鉴黄”是一项黑科技的人还认为,技术太“强大”,解决不少麻烦。随着近几年互联网市场上交友软件以及直播视频软件的流行,UGC模式大行其道,各类不法分子将违法视频、图片资源上传至网络,内容安全成了互联网公司最基本的需求。前有百度、陌陌等因为色情问题而被处罚,后有优衣库门事件、快播、斗鱼直播、360云盘、“115网盘”、乐视网盘等事件,给互联网公司造成了不小的麻烦。
最新的图像识别机器审核是依赖于人工智能领域最新的算法:深度学习算法,通过模拟人脑神经网络,构建具有高层次表现力的模型,能够对高复杂度数据形成良好的解读。
技术“鉴黄”的出现,“火坑”中的企业可以感受到这项技术的快感,映客的相关负责人曾表示,“为了对主播监管,我们成立了800人的审核队伍。”在我们看来,专门养800人去做审核的事情,似乎已经是我们难以想象的企业行为,实际上,当直播高峰期成千上万的主播在线,可以说“鉴黄”队伍真是寡不敌众。强大之处还有“应对突发”的能力。人工智能“鉴黄”应用在直播上,可以监测每时每刻的直播内容。
“没有大面积裸露是不是就不是黄图?也未必,如果好好的一对丝袜偏要撕出好多破洞,那就算性暗示。”映客某“鉴黄师”表示,这个场景换成文字或影像理解,人脑未必能够深刻的记住或者及时判断,但如果换成算法来判断,那就是“秒判”。
其次,这项技术号称要顶替“鉴黄师”,在一定程度上撼动了外界的看法,认为这是一项“足够犀利”的新技术,未来有望释放“鉴黄师”的巨大压力。虽然各个互联网企业都有专门的人员来做内容审核,但是无法跟上内容发展的速度,人工审核容易出现审核不及时、高成本、主观判断影响结果、人性道德等问题,并且高强度的“三班倒”工作下人工更容易导致审核效率低、误判漏判多等问题。
觉得技术“鉴黄”是一项黑科技的人还认为,技术太“强大”,解决不少麻烦。随着近几年互联网市场上交友软件以及直播视频软件的流行,UGC模式大行其道,各类不法分子将违法视频、图片资源上传至网络,内容安全成了互联网公司最基本的需求。前有百度、陌陌等因为色情问题而被处罚,后有优衣库门事件、快播、斗鱼直播、360云盘、“115网盘”、乐视网盘等事件,给互联网公司造成了不小的麻烦。
最新的图像识别机器审核是依赖于人工智能领域最新的算法:深度学习算法,通过模拟人脑神经网络,构建具有高层次表现力的模型,能够对高复杂度数据形成良好的解读。
技术“鉴黄”的出现,“火坑”中的企业可以感受到这项技术的快感,映客的相关负责人曾表示,“为了对主播监管,我们成立了800人的审核队伍。”在我们看来,专门养800人去做审核的事情,似乎已经是我们难以想象的企业行为,实际上,当直播高峰期成千上万的主播在线,可以说“鉴黄”队伍真是寡不敌众。强大之处还有“应对突发”的能力。人工智能“鉴黄”应用在直播上,可以监测每时每刻的直播内容。
“当我们把大量的色情、性感、正常的样本的属性告诉深度学习的引擎, 然后让引擎不断学习,对他们正确的行为进行奖励,错误的行为进行惩罚,当然这些奖励和惩罚都是数学上的,最后空白的脑袋就会学成了一种连接的模型,这种模型就是为了鉴别色情与非色情而生的。”李明强介绍道。所以只要对机器“误判、漏判” 的内容进行惩罚,然后不断重复的训练,机器就会慢慢改正,不再出现同样的“误判、漏判”,模型就是这样被不断得迭代优化。
图普科技在深度学习方面的研究在早几年前就开始了,该公司属于第三方技术服务公司,在商业模式和盈利模式上都较为清晰,不同于腾讯优图、阿里绿网等为自己平台客户提供审核服务的局限性,既然是第三方服务机构,图普科技更重视服务的优势。
业内评价道,图普科技服务细致程度和准确度较高。资料显示,图普科技是国内最早利用人工智能算法(深度学习等)做审核服务,也是在在工程经验、 服务专业度方面具有先发优势的第三方,“我们会根据不同的客户、不同的细分领域,做单独的模型调整以及算法细节的优化,专人服务对专门的客户做专业的运营。图普也是国内利用人工智能做智能审核的首倡者,很多定价的方法、归类的方法、接口返回的定义都为后来的同行做出了一定标准和规范。”李明强强调,互联网时代服务和产品是最重要的。
其次,图普科技识别接口全面,除了提供审核之外,还有包括人脸、场景、物体、车、表情、人的年龄以及服装风格等几十种识别接口,客户一次接入后,可以自行增减各种服务接口,只要一次接入,就可以满足各种需求。
不得不说,使用便捷才是真正的用户体验。“客户无需为了使用图片识别服务而绑定任何云计算平台,也可以通过 图普入驻的七牛、UCloud、AWS、融云等知名平台直接调用。”李明强介绍道。
阿里绿网、腾讯优图的优势则体现在技术、品牌和业务的成熟上,相对于作为创业公司的图普科技知名度更高,在新产品的推广、普及上更容易被接受,腾讯和阿里都有自己的业务线,在成熟产品销售时,可以将新产品附加给客户使用。据李明强介绍,市场上不乏一些图像识别技术领域的同行:依图、图森、旷视科技、格灵深瞳、商汤科技等,大多数都是同为创业企业,但是产品线有所差异,主要是面向安防监控、金融、广告。
图普科技可以说是有着先天的优势,当我们都沉溺在人工智能的应用场景中,图普就开始着手研究深度学习,图普先从“鉴黄”切入人工智能商业化应用,随着互联网内容的发展以及市场的需求,图普又顺势展开在暴恐识别、图片增值、图像搜索等方面的应用,可以说在发展上成功的卡位了深度学习技术,当需求爆发它就快速卡位。
在互联网信息爆炸的当下,图像识别功能已经快速应用于各大网站及APP移动手机终端。图普科技2014年8月获北极光Pre-A轮融资数百万美元,产品在2015年4月上线后,仅1年已经和包括国家旅游局、今日头条、58同城、迅雷、酷狗、秒拍、小咖秀、唱吧、花椒直播、Bilibili、繁星网、秀色娱乐、CAMERA360、17APP、21CN、风云直播、战旗TV、糗事百科、花瓣网、微拍、妈妈网等数百家互联网企业和政企机构合作。此外,通过入驻七牛云、融云、UCloud、又拍云、AWS等云平台,间接服务了上万家客户,业务规模在快速发展中。
转载请注明:数据分析 » 人工智能图普 科技_图普科技,看人工智能如何“鉴黄”