当前位置:首页 > 科学传播 > 科普文章

科普文章

【走访 课题组】之五——智能识别与数字安全

  • 发表日期:2013-07-30 【 【打印】【关闭】
  •  

    9月26日上午,2012年全国模式识别学术会议(CCPR 2012)接近尾声,笔者带着几分新奇感走进了会场,聆听了专家学者对模式识别领域前沿问题进行前瞻的报告。走出会议现场,报告中“Machine learning、Sparsity”等专业术语让笔者甚觉云里雾里,但“大数据”、“机器视觉”、“语言理解”等词汇却在脑海久久没有消散。会场上,恰逢模式识别国家重点实验室智能识别与数字安全团队成员黄凯奇研究员、王亮研究员,经过一番寒暄后,竟然立即得到了他们的答应,接受笔者到实验室进一步了解相关话题。于是,笔者按照预约的时间,走进了他们的工作室,感受了他们的科研生活及科研进展情况。

     

    “共同打造面向公共安全的科研平台”

     

    智能识别与数字安全团队目前有智能视频监控、生物特征识别、网络数据理解三大研究方向,由谭铁牛研究员负责整体团队建设,并分别由黄凯奇研究员、孙哲南副研究员、王亮研究员负责开展三个方向的具体研究。团队有研究员3人,副研2人,助研6人,研究生30余人。

     

    课题组成员合影造型——牛

     

    据介绍,谭铁牛研究员在1997年就放弃英国雷丁大学的终身职位,毅然回国,把自己的科研方向与国家和公共安全重大需求紧密结合,成为国内最早从事生物特征识别、智能视觉监控和多媒体数字水印研究的开拓者之一。

    黄凯奇研究员说,“2001年发生的9.11事件,如同一声春雷,引起了国际社会对反恐、防恐等公共安全问题史无前例的高度关注,基于视觉计算和智能分析的安全监控技术得到快速发展。”随着构建“和谐社会”等战略举措的实施,越来越多的安全监控摄像头被投入使用,常规视频安全监控系统以人为观察主体,已经无法处理海量视频数据。基于计算机技术的智能视频监控技术应运而生,已经成为新一代安全监控的发展方向。但目前相关核心技术主要来源于国外,严重地制约了在我国公共安全和一些重要领域的应用。

    根据社会的发展需求,谭铁牛研究员早前就做出了一个预言性的判断:建立中国公共安全科研平台是一个庞大而复杂的系统建设过程,包括资源建设、推动公共安全领域资源共享;建立健全图像处理、生物识别等基础算法库;解决平台建设中的互操作问题,制定统一技术、统一产品规范,促进公共安全技术产品实现产业化。

    据了解,为了客观评价计算机视觉、模式识别领域相关算法和最新技术的研究进展,英国牛津大学、微软剑桥研究院等计算机视觉领域的世界顶尖研究机构从2005年开始组织一年一度的计算机视觉相关算法的国际公开竞赛。比赛时,每年提供一个极具挑战的标准图像数据库,参赛者通过设计各种算法,仅根据分析图片内容来将其检测、分类,最终通过准确率、召回率、效率来一决高低。团队在2010年首次参加竞赛时,提出异构数据融合机制,突破之前主流算法的局限,分别获得目标检测项冠军和目标分类项亚军的优异成绩。在2011年的竞赛中,参赛队伍包括牛津大学、康奈尔大学、麻省理工学院、斯坦福大学以及微软研究院等在内的20多个研究团队,团队再次拿到两个项目的冠、亚军,充分展示了在该领域的研究实力。

    不仅如此,在最具挑战性的Noisy Iris Challenge Evaluation 系列国际虹膜识别算法竞赛中,团队提交的核心算法两次(2008年和2010年)以绝对优势获得第一,充分体现了课题组在虹膜识别领域的扎实基础。

    团队在多年持续研究的基础上,生物特征识别技术和智能视觉监控技术都已经比较成熟。结合这些技术优势,团队先后成功研制出具有自主知识产权的虹膜图像获取与识别技术和面向安全监控的视频内容理解平台,打破了国外技术与产品的垄断,满足了国家一些重大领域的急需。这两项成果都获得了国家相关部门及领导人的高度肯定,分别于2005年、2011年获得国家技术发明奖二等奖和国家科技进步奖二等奖。

     

    “面向安全监控的视频内容理解平台”荣获国家科技进步奖二等奖

     

    一直以来,团队核心聚焦于“公共安全”,三个研究方向虽然各有侧重,或在具体研究对象上,或在具体研究方法上存在一些不同,但其核心所指都是对数据信息的分析和处理,以达到加强公共安全的目的。可以说,三个方向侧重于三个不同的面,但其共同的目标就是推进公共安全平台的建设。

     

    “科研工作服务于国家重大需求和人民生活需要”

     

    在和团队成员的交流过程中,经世致用的科研理念让笔者感触颇深。团队成员告诉笔者,谭铁牛老师非常注重研究与国家需要相结合、研究与生活需要相结合。“十多年来,团队面向国家与公共安全的战略需求,坚持在面向安全监控的图像及视频理解的各个环节进行系统创新,不断突破复杂环境目标检测、多目标跟踪、特定目标分类识别和异常行为分析等系列关键技术以及计算机视觉算法应用瓶颈。”目前,团队的研究成果不仅在生物特征识别、智能视觉监控的理论层面解决了众多关键问题,还在国家与公共安全、城市交通管理等诸多领域实现了推广应用,并取得了显著的经济社会效益。

     

    课题组长谭铁牛研究员在十五国家科技成就展上介绍研究成果

     

    据介绍,中国的虹膜识别市场在2005年以前都被日本松下、韩国LG等大公司垄断,国外的虹膜识别产品不仅价格昂贵,并且作为安全敏感的身份认证系统在国家重要领域应用存在严重的安全隐患。因此,课题组在2006年通过技术转移成立了我国虹膜识别的民族企业——中科虹霸,目前自主知识产权的国产设备已经占据了国内虹膜识别市场80%以上的份额,彻底改变了我国虹膜识别市场被国外公司垄断的局面,相关产品在煤矿工人身份管理、监狱犯人识别与管理、银行金库门禁控制、青海玉树户籍管理、育龄妇女身份管理、军事基地等领域取得成功应用,并通过技术授权出口欧美发达国家,在司法、金融、边检等领域获得成功应用。目前团队的虹膜识别技术成功应用于五家国外银行,几十万银行高端客户可以使用虹膜识别完全取代银行卡和密码在自动提款机便捷提取现金。“每当想起每天上百万人在使用CASIA的虹膜识别技术,我们都感到科研的价值和魅力,在充满自豪感的同时也有更多的责任感和动力,因为识别性能每提高一个百分点就能为百万用户带来显著提升的便捷性和安全感,同时获得更好的自动身份认证交互体验。”

    课题组研制的智能视频监控技术被应用于北京地铁13号线上,对其40公里线路进行全程监控。据统计,该技术帮助有关部门在地铁13号线上先后抓获了3批犯罪分子,盗割电缆发案率是之前的1/8,取得了明显效果。

     

    课题组成果为2008年第29届北京奥运会保驾护航

     

    团队成果成功转化应用的另外一个典型就是服务于第29届奥运会。奥林匹克公园是北京奥运会聚焦最多的区域,鸟巢、水立方、国家体育馆、击剑馆等10个竞技场馆集中在这里。据测算,比赛期间这里的人流每天平均为15万人次,最高峰达到了26万人次。为应对这里可能出现的突发事件,北京市相关机构在奥林匹克公园周边安装了4000个进行实时监测的摄像头。然而,如何快速从4000个摄像头24小时不间断拍摄的海量图像数据中获取需要的信息成为北京市负责安全指挥的领导们面临的一道难题。瞄准这一需求,经过长期不懈的努力,团队突破了智能视频监控技术中全天候的运动目标检测、分类及行为分析等关键技术,成功开发出具有完全自主知识产权的“智能视频监控系统”,用于对突发事件进行全天候实时的检测预警。

    说及奥运,大家或许更加关注于精彩的赛事、宏大的场馆。就算是对科技有一定关注度的,或许更多也是对科技成果带来的新体验留下一些印象。从访谈中,笔者才得知了深藏着科研人员对于奥运的付出。比如,在研究初期,为了获取大量的视频数据,研究团队派出多人,分头到火车站、大学、广场等人多的场所进行视频图像的拍摄,以获取分析资料和数据。经过两个月的努力,奥林匹克公园监控系统的人群拥挤度分析及预测模型才在7月底完成。又比如,由于奥运会安全指挥中心会议频繁,领导们开会时通常会随时调用现场信号,研究人员不能自主选择系统调试的时间,只能间歇性地开展调试工作。这样,很多工作便是在指挥中心工作人员下班后的时间来完成。

    今年,伦敦奥运也已经落下帷幕。时隔一届四年,团队成员在谈及这些时,依然有一种成绩和满足感。“尽管攻坚的日子遇到了不少难题,占用了不少时间,甚至经常深夜里还在进行调试,但所有的工作向社会公众展示了高科技保平安的独特魅力,也算是自己所钻研的技术真正服务于人们的生活了。”

     

    “谁拥有了数据,谁就拥有了明天”

     

    生物特征数据是算法研究、技术测评和标准制定的基础资源,通过多年的建设与积累,团队已建立了多种特色明显、具有国际水准的大规模多模态生物特征数据库,并免费向国际同行共享,推动了生物特征识别的学科发展,同时也带动了国家标准制定和产品评测开展,并利用该数据库组织了多次算法竞赛,促进了学术交流和产业化进程,也赢得了国际学术界的高度赞誉。据介绍,团队利用自主研发的虹膜图像获取装置建成了数万人的CASIA虹膜图像数据库,其中部分已经向学术界免费共享,是世界上第一个也是目前规模最大的共享虹膜图像数据库,有100多个国家和地区的5000多个科研团队申请使用,为虹膜识别学科的繁荣和发展做出了历史性的重大贡献。

     

    课题组成员在双胞胎节上采集数据

     

    团队成员告诉笔者,数据的真实性和原始性是科学研究顺利开展、正确进行的基础,同时也对国家信息安全、媒体公信力等有着至关重要的影响。有报道曾称,本拉登曾通过网络图片隐藏发送恐怖活动指令给其部下,这对国家乃至世界的安全影响是不言而喻的。随着互联网络特别是社交网络的蓬勃发展,人们相互间传递多媒体数据空前频繁;同时这些传递数据的知识产权(版权)的保护也受到国内外更多地重视。“近些年来,我们紧跟国际前沿,对网络多媒体数据的真实性、原始性以及安全性展开了深入研究,也是国内最早开展这一方向研究的一批科研团队之一,团队成员董晶博士和王伟博士在谭老师的带领下,对网络图像的隐秘分析、篡改验证以及版权保护和认证等问题的研究已经取得了一些进展,部分研究成果已提供服务于国家安全等部门。”

    如果把摄像机看作人的眼睛,那么智能视频监控系统则可以看作人的大脑。“智能视觉监控技术作为公共安全科研平台建设的重要组成部分,运用计算机视觉的方法,在不需要人为干预情况下,通过对摄像机拍录的图像进行自动分析,实现对动态场景中目标定位、识别和跟踪,分析、判断目标行为,做到既能完成日常管理,又能在异常情况发生时及时做出反应。但是,智能视频监控技术必须借助于计算机强大的数据处理功能,对视频中的海量数据进行高速分析,过滤用户不关心的信息,仅为监控者提供有用的关键信息,海量数据处理分析是其中一个非常重要的环节。”

    如今,团队在前面十年来积累的基础上,已经着手把网络数据理解与安全作为第三个重大方向开展研究。王亮研究员于2010年被引进入所,现在主要担纲这一方向的研究,在谭老师指导下,与团队其他成员一道致力于拓展智能识别与数据安全团队的新的研究领域。

    王亮研究员告诉笔者:“其实大数据、云计算在本质上并不是现在才出现的问题,在早些年出现的网格计算等研究话题,其实质与现在是一致的。经过几年的发展,各种空间数据、报表统计数据、文字、声音、图像、超文本等各种环境和文化数据信息呈海量增加,大家希望可以更为便捷迅速的从大规模、没有关联的数据中获取我们所需的信息。这样的话,要解决相关问题就变得更为迫切了,受到学术界和社会公众更高程度的关注。”

     

    973项目“面向公共安全的社会感知数据处理”启动会现场

     

    今年2月8日,973计划项目“面向公共安全的社会感知数据处理”启动会上,谭铁牛研究员分析总结了社会感知数据的“三跨”特性:一是跨场景,视觉数据来自多个物理场景;二是跨媒体,网络数据来自多种媒体;三是跨空间,来自物理空间与网络空间的感知数据是相互交织并关联互动的。针对社会感知数据的这种复杂特性,团队在课题中凝练出了三个核心科学问题与五个子课题,化抽象为具体,力求各个击破,实现关键技术的突破,从社会感知数据中挖掘出有价值的公共安全情报,为监控预警和应急处理提供技术保障,明确地勾勒出了团队在这个研究领域的目标和方向。

    “相对来说,团队在数据分析方面还处于起步阶段,但是,这与团队已经比较成熟的生物特征识别和视频监控技术在某些方面是相通的,为这个方向的研究打下了坚实的基础。”

     

    后记:在走访的过程中,笔者感受了智能识别与数字安全团队老师、学生的个体风貌,更体会了一个团队相互鼓励、相互支持的协作精神。在问及个人成就时,孙哲南副研究员很谦逊的说道:“这完全得益于自己所在的优秀团队,谭老师着眼瞄准国际学科前沿,紧扣国家建设需要,确保了研究对我国经济建设和社会发展有重大意义。同时,团队中有王亮、凯奇等一批优秀的研究伙伴,有激情有活力,彼此年龄相仿,大家相互激励,共同成长。”对个人而言,真诚的品质会帮你结交很多知心朋友,道路会越走越宽;对一个团队而言,如果形成了真诚相助的氛围,团队的凝聚力和战斗力会得到很大的提升,也将帮助团队成员更快的成长发展。