辜希武老师与博士生段东圣赴北京参加CASIN 2011
时间:2011-07-25



2011年7月20日至22日,由清华大学和微软亚洲研究院联合主办的社会和信息网络计算国际研讨会(International Workshop on Computational Aspects of Social and Information Networks, CASIN 2011)在北京举行。IDC实验室辜希武老师与博士生段东圣赴北京参加了本次研讨会。

研讨会囊括了社会影响和行为传播分析、社会推荐、社会关系挖掘、社会网络编码与压缩、大规模社会网络群组结构分析、新闻话题和事件挖掘等当前社会和信息网络热点议题。此次研讨会上,从事社会网络和信息网络研究的国际知名学者共聚一堂,就自己最新的研究成果进行交流。共有来自中国、美国、加拿大、韩国、日本、新加坡等近20位国际知名专家受邀参加了此次研讨会并在会上作了精彩而深入的报告。参加此次研讨会的专家有来自著名的美国斯坦福大学、伊利诺伊大学芝加哥分校、清华大学、北京大学、微软亚洲研究院、香港中文大学、复旦大学、华中科技大学、中国科学院计算技术研究所、美国雅虎纽约研究院、新加坡管理大学、韩国科学技术研究院、加拿大英属哥伦比亚大学、加拿大西蒙弗雷泽大学、美国伊利诺理工大学、日本静冈福祉大学、腾讯科技等大学及企业科研中心等学术机构。

研讨会邀请的数据挖掘领域的专家学者发表了主题报告。首先是来自美国伊利诺伊大学芝加哥分校的Philip S. Yu教授,他的报告题目《Mining Information Networks》。从总体上介绍了信息网络研究概况,并从多个方面深入的介绍了信息网络分析给数据挖掘带来的机遇和挑战,介绍了一种利用社会网络分析方法进行关联规则挖掘的新的方法,并介绍了一种网络压缩的近似算法,为大规模社会网络计算提供重要的支持。其次,多位专家就社会网络中用户之间普遍存在的影响传播现象进行了报告,做这方面报告的专家有来自香港中文大学的John C. Lui、微软亚洲研究院的Wei Chen、雅虎纽约研究院的Sharad Goel、加拿大英属哥伦比亚大学的Laks Lakshmanan等。另外,来自香港中文大学的Irwin King对社会推荐的模型和方法进行了详细的综述。最后来自加拿大西蒙弗雷泽大学的Jian Pei介绍了一种新型的基于网络编码的大规模社会网络压缩算法,并通过一些例子表明其压缩算法不仅节省空间而且会给一些分析任务带来好处。研讨会期间来自学术界、产业界的科研学者齐聚一堂,共同对于社会网络分析领域现在存在的重要问题和发展趋势进行了探讨。

研讨会于21日下午设有学生论坛,通过自主报名并经过筛选,共有来自美国、中国、韩国等10名学生在此次论坛里就自己的研究工作做了报告。做报告的学生有来自美国伊利诺伊大学香槟分校、清华大学、北京大学、韩国科学技术研究院、美国伊利诺理工大学,解放军理工大学、华中科技大学、美国明尼苏达大学、中国科学院等大学和研究机构。此次论坛还邀请了研讨会的参会专家对学生的报告进行现场评分。此次论坛中,来自美国明尼苏达双城大学的Yanhua Li、北京大学的Qingye Jiang和华中科技大学的段东圣三位学生荣获“最佳学生报告奖”。

来自IDC实验室的博士生段东圣在此次论坛做了题为“RankTopic: Ranking based Topic Modeling”的报告。报告主要讨论了一种基于排序的话题建模方法,针对传统的话题模型没有考虑文档的重要性这一先验导致的若干缺陷,该报告提出了一种利用排序结果来指导话题建模过程的方法,提出了基于排序的话题模型。利用研究利用基于话题的排序结果反过来指导话题建模过程的方法,提出基于排序的话题模型,该模型的提出即利用排序获得了更好的建模效果,可以使得排序和话题模型相互精炼,实验表明相比现有的模型,该模型具有更好的泛化性能,更好的文本聚类和分类效果,探测出的话题具有更高的可解释性。