关于我们 | 部门概况 | 学校主页 | 加入收藏 | 网站地图
新闻查询
视频新闻
您现在的位置: 网站首页 >> 人文校园 >> 工大学人

刘波:在数据海洋寻找最佳算法

字体: 2014年10月08日 浏览量:来源:广东科技报2013年12月07日第07:南粤科技精英风采 作者:记者 张建列 通讯员 詹勇 编辑:学生新闻中心 谢晓鹏

本科、硕士、博士连读,华南理工大学的博士后,现为广东工业大学自动化学院副教授。曾应香港中文大学邀请前往访问学习、获得国家留学基金委资助前往澳洲悉尼科技大学从事为期一年的联合培养博士项目、在伊利诺伊大学芝加哥分校访问。

研究领域是模式分类和数据挖掘,包括二分类问题、多分类问题、数据流问题、迁移学习问题等,并开展了统计学习策略的模型研究、核函数的选择准则、异常点侦测、数据流等算法的研究。这些研究发表在《IEEE Transactions on Neural Networks》、《IEEE Transactions on Knowledge and Data Engineering》、《模式识别与人工智能》、《SDM 2011, 2013》等国内外高水平刊物和会议上。曾获得IEEE SMC 协会与 ICMLC 颁发的优秀论文奖(排名第1);PAKDD 2013 优秀论文奖(排名第1) 等。

大数据时代离不开最优算法

“模式分类”、“数据挖掘”,这些比较专业的的词语就是刘波的科研领域。“我的研究的方向就是以数据为基础,以算法为核心,包括二分类问题、多分类问题、数据流问题、迁移学习问题等,并开展了统计学习策略的模型研究、核函数的选择准则、异常点侦测、数据流等算法的研究。”谈起自己的科研工作,刘波毫不含糊。

所谓模式分类,是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。而数据挖掘则是数据库知识发现中的一个步骤。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

刘波告诉记者,数据是源源不断的,就像河流一样。据统计,最近两年产生的数据占人类产生数据总和的80%左右,数据的产生是呈现爆炸性的。如何在海量的数据中,寻找出一些有意义的、有价值的数据非常重要,而他的研究正是海量的数据中,运用各种数学工具,优选出最佳的算法来得出数据。他举了一个例子:顾客上当当网买《线性代数》这本书籍,而顾客就会发现当当网自动推荐的与《线性代数》相关的书单。这就基于数据,按照一定的算法得出的推荐结果。

首次提出不可分区域的嵌套算法

在模式分类领域,麻省理工大学提出的一对一多分类算法的不可分区域问题。“当时有很多专家学者都提出了解决的方法,不同角度不同方向都有相关的研究结果。”刘波坦言,自己在读博士阶段就是面临这个难题,“剩下研究的点都很少了,基本被别人研究透了。”

明知难为,却坚持为之。不懈的努力让刘波灵感突现,他在国际上首次提出了解决一对一算法不可分区域的嵌套算法, 并从理论上证明了样本的可分性和提出算法的时间复杂性分析。同时,他还提出了数据流环境下,具有噪声影响的支持向量机一分类算法,该算法可以有效地消除噪声对分类平面的影响,并通过交互迭代的思想获得最优超平面,并有用预测。

除此之外,刘波还提出噪声环境下的异常点侦测算法,提出根据样本局部信息获取隶属度的方法,并把产生的隶属度融合到一分类支持向量机学习中,使得学习机器可以处理具有大量正常样本和少量异常样本的异常点侦测。 不但如此,他还提出了针对多分类问题的特征提取算法,在特征空间基于一对一策略和一对多策略构造支持向量机,并在特征空间提取样本到每个最优超平面的有向距离,该距离作为样本的新特征,用于之后的多分类问题。

分类算法有广泛的商业价值

刘波告诉记者,经过国外进行了为期一年的学术访问,了解国际最新的研究方法,结合自己以往的模式分类的基础,未来自己会把研究的重点放在推荐系统和社交网络方面,侧重算法在应用方面的研究。“比如一些手机软件会向用户推荐美食、购物等优惠信息,里面就是包含算法的运用,我们的研究目的是研究一种更好的算法,让这些推荐更准确、更加快速、更个性化,从而创造经济利润。”

而刘波所研究的针对文本环境下的快速支持向量机和迁移学习算法在此研究的基础上,与悉尼科技大学成功获得广东省国际合作项目“ 大规模Web 问答系统的关键技术研究与开发”资助。该项目开发基于互联网的问答系统,当用户输入自己感兴趣的问题后,问答系统通过语义分析给出相应的答案,在此过程中,分析用户的潜在兴趣,并相应地进行广告推荐。

刘波介绍,支持向量机分类算法具有广泛的应用范围,很多实际问题可以归结为支持向量机分类。例如,手写数字识别、语音识别、人脸识别、虹膜识别、生物信息学蛋白质分类、网页文本分类、异常点侦测、网络入侵、兴趣点侦等问题,可以产生巨大的经济效益。鉴于支持向量机分类算法具有较大的理论意义和应用范围,贝尔实验室、MIT的人工智能实验室都有杰出的科学家从事这方面的研究。同时,考虑到互联网环境下存在很多分类问题(例如:文本分类、视频分类、社交网络分类、客户兴趣侦测),新兴的商业公司,例如Google、Microsoft、Facebook都有研究人员从事分类算法的研究。同时,Netflix公司设立百万美元的奖金(Netflix prize),征集能够使其推荐系统分类推荐能力上升10%的推荐算法和架构。因此,无论在理论还是应用方面,设计支持向量机分类算法并研究其在应用环境下的算法改进,具有重要的理论意义和实用价值。

科研心得

科研需要坚持不懈

谈起与模式分类和数据挖掘结缘,刘波直言,自己是顺着求学的道路一步一步地走过来的。

“我并不是天生就是热爱,当时自己读研究生时,导师研究的就是这个领域,另外讨论班里经常举行关于模式分类领域的讲座,我觉得很好奇和有趣,于是就选择了。”

对于自己取得的科研成绩,刘波说是没想到,但这句“没想到”的背后,却凝结着他的坚持和努力。

针对麻省理工大学提出的一对一多分类算法的不可分区域问题,刘波在国际上首次提出了解决一对一算法不可分区域的嵌套算法,并从理论上证明了样本的可分性和提出算法的时间复杂性分析。“这个方法是我在公交车上想到的。”刘波表示,接触到这个难题时,也是毫无头绪。直到后来搭公交车去给学生上课时,才突然冒出了一个灵感,便立即钻进实验室,通过编程把这个想法实现出来。“我认为自己并不是最聪明的人,我能想到的东西,很多人都能想到,只是我会坚持下来,想到了便立刻去试验,加班加点把内心的想法做出实事来。”

育人心得

着重培养学生创新精神

作为教师的刘波,在教学上也同样投入了大量的精力。从国外回到广东工业大学,就立即开展培养研究生的工作。

刘波最看重学生的两样能力,一是要有自学能力,二是要拥有创新思想。“知识永远都学不完,关键是要有掌握知识的能力;同时还要有创新思想,去指导自身研究工作的开展。”刘波说,这些能力不是天生就有的,关键是要培养。比如,他会主动地布置学生看一本书,要求学生掌握关键的章节,引导学生去主动学习,提高学习的能力。“我们有些学生不敢或者不善于表达,觉得老师或者书本就是权威,老师说什么就是什么,没有自己的想法和创新力。”为此,刘波积极组织学生开展讨论班,鼓励学生把问题和想法都表达出来,引导学生去思考,逐渐培养学生自信,让学生觉得自己也有能力进行科研。

在刘波的鼓励之下,学生们独立去思考问题。其中有个学生提出网络游戏有些方面做得不好,玩家买装备没有推荐。该学生提出思考,就网络游戏购买装备等能不能结合算法做一个推荐,从而方便玩家和商家。

扫一扫
关注广东工业大学官方微信

扫一扫
关注广东工业大学官方微博

扫一扫
手机看广东工业大学新闻网

关闭

我来说两句
 友情链接

Copyright©2013 gdutnews.gdut.edu.cn All Rights Reserved 广东工业大学党委宣传部 版权所有 粤ICP备05008833号

技术支持 网络信息与现代教育技术中心 电子邮箱:xwzx@gdut.edu.cn

建议使用IE7内核以上浏览器