用“自然智慧”提升“计算”
——记智能计算领域驰骋的刘静教授
■ 记者付一枫
在搜索引擎中键入你想找的内容,转瞬之间,计算机就会从海量数据中迅速锁定结果。这看似简单的键入和锁定背后,其实凝聚着计算机科学家对海量数据处理算法的不断优化。从事智能计算领域研究的西安电子科技大学刘静教授,就是这样一个专注于高性能智能优化与学习算法设计的研究者。
国家自然科学基金优秀青年科学基金获得者 刘静教授(摄影/闫毅强)
“智能计算就是秉着从大自然中获取智慧的理念,在自然界、生物界规律的启迪下,根据其原理模仿、设计求解问题、处理数据、挖掘有用信息的算法。其最具代表性的进化计算就是一类新型的全局优化算法,主要是通过向自然学习、借鉴生物进化机制来求解问题。这类算法的主要优点在于其本质上的并行性、广泛的可应用性、算法的高度稳健性和简明性,以及全局优化性。”刘静介绍说,“智能计算可靠有效,已被广泛应用到各个工程领域,并且成为大数据处理的有效途径之一。”
自2000年师从人工智能领域知名专家焦李成教授,刘静就与智能计算结下不解之缘,并逐渐开拓出自己的一片天地。2013年刘静作为第三完成人获得国家自然科学奖二等奖,2014年获得吴文俊人工智能科学技术创新二等奖,2015年获得国家自然科学基金优秀青年科学基金资助,并入选陕西省中青年科技创新领军人才。
生物学碰撞计算机科学
进化计算:“优胜劣汰”带给计算机领域的启发
“从自然界获得启发是科学研究的重要途径。人类借助生物进化的思想和原理,模拟自然界所具有的优化与学习能力,并设计出计算机可使用的优化、学习算法来解决一系列实际工程问题,这就是智能计算中进化算法的基本思路。”刘静介绍说。
进化计算是近年来信息科学、人工智能与计算机科学的热点研究领域。它是一大类借鉴生物自然选择与遗传变异机制的并行、随机、自适应、稳健的搜索算法,其核心思想源于这样的基本认识:从简单到复杂、从低级到高级的生物进化过程本身是一个自然的、并行发生的、稳健的优化过程,这一过程的目标是对环境的适应性,生物种群通过“优胜劣汰”及遗传变异来达到进化的目的。
鲜明的生物学背景是进化算法的特点之一。“现代进化论所揭示的进化机制在本质上是一种鲁棒搜索和优化过程。生物物种在进化过程中所解决的各种问题具有混沌、偶然、暂态和非线性相互作用等特点,具有这样特点的问题正是传统优化方法所难以解决的。”刘静说。
生物进化显然是一种求解优化问题的过程。给定了初始条件和环境约束,通过选择可以得到与最优解尽可能接近的表现型(表现出来的行为)。但是环境又持续不断地变化着,物种跟在环境变化的后面,不断地向一个新的最优解进化。这就是进化算法这类模拟自然进化的计算方法的思想源泉。进化算法就是基于以上思想发展起来的一类随机搜索技术,进化算法从选定的初始解出发,通过不断迭代逐步改进当前解,直至最后搜索到最优解或满意解。
“生物进化的过程不仅可以在计算机上模拟实现,同样地,计算机也可以模拟进化过程,开拓新的优化计算方法,并应用到求解实际复杂问题上。在信息爆炸的时代,如不能利用已有知识缩小搜索空间、优化搜索算法,运算的难度将难以想象。”刘静说。
生物进化系统对人工智能的理论和方法研究有极强的借鉴意义,作为一种典型的基于生物进化理论的问题求解方法,自20世纪50年代以来,进化计算就得到了较大关注。我国进化计算理论的研究主要开始于90年代。
“进化算法被广泛认为是可成功应用于计算机科学、工程技术、管理科学和社会科学等领域的一种自组织、自适应人工智能技术。”刘静介绍说,“进化算法因其特别适合于求解复杂优化问题,特别是大规模、非线性、多极值、无形式化目标函数表达、多目标的优化问题与机器学习问题的特点,得到了多学科的广泛重视。”
“简单来说,我们的工作就是要设计高效处理信息的方法,在同等计算机条件下更好、更快地处理数据,挖掘有用信息,为大数据处理提供基础。”刘静总结说。
实现三大创新
致力于“理论基础+模型构建+工程应用”
到目前为止,刘静在进化计算领域的三项主要学术创新可以概括为“一项理论,两个模型。”
第一个创新是发展进化算法的基础理论。“进化算法的数学基础还比较薄弱,此方面研究的重要问题之一就是问题难度预测——其目的就是要在不运行算法的前提下预测所求解问题对于算法的难度,并根据这些预测指标结果对算法进行改进,以实现‘极大化效益、极小化代价’的目标。”
针对此问题,刘静首次将复杂网络概念引入进化计算问题难度预测指标的设计中,进一步发展了进化算法的数学基础,建立了第一个基于复杂网络特性的难度预测指标Motif Difficulty。此指标被认为是对优化领域基础问题——问题难度预测研究方面的典型方法之一。
“该指标的建立,对去除进化算法搜索的随机性及在此基础上设计高性能进化算法,提供了有力依据和理论指导。”刘静说。
该理论创新的相关成果《网络化进化优化与学习理论基础及其应用》,因在进化算法理论基础创新上的重要贡献,获得了2014年吴文俊人工智能科学技术创新奖二等奖。
刘静的第二个创新在优化模型方面,她提出了第一个能够高效求解超过10000维函数优化问题的进化优化模型——多智能体进化优化模型。这一模型改进了传统进化算法容易陷入局部最优且计算量过大,因而难于求解大规模优化的问题的缺点。
“多智能体系统是多个智能体组成的集合,是将大而复杂的系统建设成小的、彼此互相通信和协调的、易于管理的系统。”刘静解释说,“在多智能体系统中,各智能体之间互相通信,彼此协调,并行地求解问题,因此能有效地提高问题求解的能力。”
此模型可高效求解数值优化问题、大规模约束满足问题及大规模组合优化问题,是第一种能够高效求解如此大规模优化问题的进化优化模型。在2015年度IEEE国际进化计算大会“大数据优化竞赛”上,刘静团队开发的多智能体遗传大数据优化算法荣获第一名。
第三个创新点是在学习模型方面。刘静提出了第一个能够高效处理上千万海量数据的进化学习模型——组织协同进化学习模型。“针对传统进化算法计算量大,难于高效处理大规模学习问题的状况,我们将经济学中‘组织’的概念与协同机制引入传统进化计算,利用交易代价理论引导分类器间的相互竞争与协同,以自动地建立组织结构,在此基础上形成了组织协同进化学习模型。”
该模型突破了千万级海量数据分类、万维以上大规模优化计算等关键技术,成功应用于海量数据挖掘、超大规模集成电路布图优化等问题;模型的训练时间随数据量和特征属性的增长呈近线性增长,是第一种能够高效处理如此大规模学习问题的进化学习模型。
在第二、三个创新基础上产生的学术成果,不仅发表于进化领域的国际顶级期刊,刘静还作为成果《基于自然智能的学习与优化基础理论研究》的第三完成人,获得了国家自然科学奖二等奖。
刘静的三个创新使得她在解决智能信息处理领域对高效求解大规模NP难问题取得突出进步。在算法标准测试的几个公开问题,如无约束数值优化、组合优化欺骗HIFF问题、皇后问题及数据分类等中,刘静的研究均达到国际先进水平,并已进入解决超大规模集成电路布图规划、社会网络分析等实际应用层面。
爱编程的女生
兴趣产生不可思议的能量
“我认为编程是从事智能计算领域研究的重要基础之一。大学时我就喜欢编程,不爱看小说,也不爱逛街。”刘静语气轻快,说起与编程结缘之路,她显得很兴奋。“所有设计的算法都是让计算机来执行的,而程序就是研究者与计算机的纽带、共同语言!如何将你的想法告诉计算机,就靠程序了!”
1990年,正上小学六年级的刘静收到了人生中第一台电脑——“中华学习机”。“需要上千元,父亲是一个普通蓝领,几乎花掉他大半年的工资。父亲还为我报名参加了编程培训班。”在这台电脑上,刘静开始学习了第一种编程语言——BASIC语言。
热爱与兴趣的力量随着刘静长大渐渐凸显。1996年,刘静从西安中学考入西安电子科技大学,成为计算机学院计算机软件专业的一名学生,编程也渐渐从兴趣变成她人生的方向。“大一时常常一头钻进机房,通宵编程。大二时拥有了自己的电脑,可是宿舍每晚11点熄灯,只好每周末把笨重的电脑搬到班级位于男生宿舍的科技活动室,以有更多时间开发喜爱的分形图像系统。”
刘静打开一副颜色艳丽鲜亮的蝴蝶图案,这是她当年读大学时参加挑战杯的软件作品。这是当年她们开发的软件产生的一幅分形图像,局部无限放大后依旧呈现出与大图完全相同的形状和结构。放大来看,图片的颜色多样且绚丽。“这全都是通过编程实现的,形状、颜色、纹理也不例外。虽然这是我近二十年前的工作,但现在仍是我最喜欢的工作之一,因为从它我接触到了复杂性科学,开始了我的科研人生!每当迷茫的时候,看看当年我们的‘分形’作品,就会让我更加坚定从事科研工作的初心!”
刘静读大学时参加挑战杯的分形图像作品
“我的每一天,除了吃饭睡觉,以及处理必要事项外,就都是科研时间。”如今,刘静已致力智能计算研究10余年,她的热情依旧不减,她的经历同时也生动地展现出热爱与兴趣能给一名学者带来多么不可思议的能量。
如今,智能所也因众多刘静这样热爱科研的人展现出蓬勃的活力。目前国内在进化计算方向的两位国家自然基金优秀青年科学基金获得者,一个是刘静,另一个就是她的同事公茂果教授。实验室推崇一种追求卓越的氛围,国际化的视野,助力刘静的成长。
“我们实验室在焦老师的带领下,非常注重国际交流。焦老师常说的一句话就是‘走出校门就是国门’!我们一直都以这样的标准来要求自己的科研工作。”在获得博士学位后,刘静两次获得澳大利亚国家研究基金的资助,在昆士兰大学和新南威尔士大学作博士后研究三年。刘静的科研成果得到国内外同行的广泛认可,她2015年成为进化计算领域国际顶级期刊《IEEE Trans. Evolutionary Computation》的Associate Editor。国际化视野推动了刘静所在的智能感知与图像理解教育部重点实验室的快速发展。2011年回国后,刘静就一直负责实验室的国际交流工作,先后完成了参与的欧盟“玛莉·居里计划”项目、成功申请成立了西电第一个科技部国家国际科技合作基地——智能感知与计算国际联合研究中心,以及西电第一个教育部“智能感知与计算国际合作联合实验室”。
秉承高标准、严要求的风格,刘静将对科研和教育工作的热爱和认真,传递给一批批青年学子。除承担多门留学生的纯英文授课课程外,2011年开始,刘静坚持用英文讲授“智能科学与技术”专业大三的双语基础课程——《算法设计与分析》。“这是智能科学与技术专业很重要的一门基础课程,有基础理论、也有编程实践,英文授课难度很大!但是,有难度才有挑战,才能引起学生的重视,从而提高学生水平!所以我结合中国学生的实际情况,坚持用英文授课,为学生揭开国际化交流的面纱,让它不再神秘而遥远;坚持课堂上现场跟学生一起编写算法程序,帮助学生跨越从理论算法到实践编程的鸿沟!”刘静说。
(摄影 闫毅强)
“态度决定一切!我招研究生的条件就是具有积极主动学习态度的、愿意和我一起追求卓越的学生!”在谈到学生教育时,不时发出笑声、一直语调十分轻快的刘静表情渐渐变得严肃,语速也慢下来。“我希望不仅能教给他们本领域的知识,更重要的是关注学习能力的培养。发现、分析、解决问题能力的提升将让他们受益一生。”
如今,刘静团队现有博士生6人,硕士生16人,包括来自荷兰、坦桑尼亚、也门等国家的5名留学生。“从入门手把手地教,论文无数遍的修改,连标点、空格的小问题也不放过,到能在本领域国际期刊发表学术论文,对于每个学生,这样的学习过程都将成为他人生的宝贵财富。无论做什么事,精益求精的态度是我希望我的每一位学生都能坚持的!”
2015年,刘静指导的三名研究生在IEEE国际进化计算大会“大数据优化竞赛”上荣获第一名。她所指导的硕士、博士已在SCI一区、二区期刊发表多篇学术论文。在刚毕业的2016届硕士中,刘静指导的硕士一名荣获校优秀硕士学位论文特等奖、两名荣获校优秀硕士学位论文一等奖。
“智能计算是计算机发展较新也较热的一个方向,应用前景十分广阔。随着人工智能的再次兴起以及信息技术迅速发展带来的对大数据高效处理的迫切需求,智能计算也将迎来新的发展机遇!”刘静说。下一步,她将进一步研究面向大数据优化与学习的智能体协同进化网络,发展基于复杂网络的问题难度分析模型,探索两大创新——多智能体进化优化模型及组织协同进化学习模型与复杂网络的深度结合,并将新模型用于流数据和网络数据等典型大数据处理中的优化学习问题。
“有研究者曾说过,人们对于进化算法所表现出的如此之大的热望或多或少出于这样的信念:世界就是这样的奇妙,万物就是这样的和谐。存在于我们人类进化自身的优化原理或许正是求解任何复杂优化问题所应遵循的天赐之道”,刘静说,“这种处理优化问题的仿生观点,的确已经为我们带来了与传统方法绝然不同、新颖、有趣而极具开发价值的学术思想,在这个方向上我们大有可为。”