2015年9月28日下午,新浪微博两位资深技术专家白栓虎和方群杰应邀来访并做了专题讲座。报告会在计数楼三层报告厅进行,由谭红叶老师主持,部分教师及研究生出席了本次报告会。
新浪微博数据中心运营部的方群杰经理做了题为“微博大数据的行业应用分析”。报告通过草原天路、美食地图、“冰桶挑战”信息传播等舆情分析的可视化数据产品案例,与大家分享了微博大数据在行业的解决方案和微博数据开放产品的功能,阐释了大数据及其分析技术和数据产品在互联网行业的典型应用和创新价值。
新浪微博NLP方面的资深技术专家白栓虎老师做了题为“数据抽取技术和应用”。报告主要介绍了数据抽取技术中的两种机器学习方法:远程监督学习方法和基于主题模型的半监督学习方法,以及这两种方法在广告投放、健康互助机器人领域的应用。
报告引起了与会人员的热烈反响,两位专家与师生进行了良好的互动。
方群杰个人简介:
2009年毕业于北京体育大学新闻专业,获硕士学位。目前是新浪微博数据中心高级运营经理,负责微博数据产品运营以及项目合作。
白栓虎个人简介:
1985年毕业于山西大学计算机科学系,获学士学位。1992年毕业于清华大学计算机科学与技术系获硕士学位。硕士毕业后加入电子工业部计算机与微电子发展研究中心(CCID),从事国家“中文信息处理开放平台”工作。1995年至2010年在新加坡工作,先后在苹果电脑研发中心、爱立信网络应用研究所、新加坡咨询通讯研究院等单位从事语言模型、语音关键词挖掘、人机对话系统的研发工作。2010年回国加入新浪微博。目前是新浪微博资深研究员,主要在自然语言处理、数据挖掘和推荐技术等相关领域开展技术研发。现在负责有“国家科技支撑计划”项目、国家863项目和国家自然科学基金重点项目的自然语言处理方面的课题。技术研发方面,目前已取得4项国外专利、1项中国专利,其中“中文分词和命名实体识别系统”被谷歌、微软、IBM等多家国际知名公司引用。