基本信息
- 姓名:刘学博
- 教育经历: 2012 级中山大学移动信息工程学院软件工程专业本科
- 个人博客: lufo.me
- Github: github.com/lufo816
- 电子邮件: [email protected]
- 技能:熟悉 Python,C,C++,长期使用 Linux/Unix 操作系统
实习经历
- 2015.7-2015.9:于中国科学院重庆研究院智能多媒体技术研究中心人脸识别组(云从科技研发组)实习,工作内容包括:
- 进行实验:对比不同 Alignment 算法对人脸识别性能的影响,并提出改进方案
- 完善深度学习代码:尝试将 PLDA 算法作为 loss function 写入 caffe 的源代码中.尝试设计 CNN 完成图片去模糊的工作
- 数据抓取:完成爬虫抓取百度,人人,bing 等网站的图片并进行自动筛选,部署到多台机器上,目标是抓取数十 TB 的数据,整理后将获得比现有数据集大至少一个数量级的数据集
- 2014.3-2015.7:中山大学移动信息工程学院人工智能,软件设计的教学助理
论文发表
- Xuebo Liu, Shuang Ye, Yonghao Luo, Yanghui Rao, ZhihuRank: A Topic-Sensitive Expert Finding Algorithm in Community Question Answering Websites, International Conference on Web-based Learning (ICWL) 2015
- Xin Li, Yanghui Rao, Yanjia Chen, Xuebo Liu, Huan Huang, Social Emotion Classification via Reader Perspective Weighted Model, [AAAI 16 Student Abstract](www.aaai.org/Conferences/AAAI/2016/aaai16studentcall.php)
- Shuang Ye, KaiChun Lin, XinYi Lin, XueBo Liu, Chang-Dong Wang, HanChen Yu, Schedule Management Application ‘ WiDay ’ based on SAE cloud platform, IEEE International Conference on Big Data and Cloud Computing 2015
项目经历
- 机器学习
- ZhihuRank:问答类社交网站中专家推荐创新算法,在社交类问答网站(知乎,Quora)中基于用户与问题间的主题相似度和用户间的赞同关系对每个问题推荐最适合回答这个问题的用户.算法基于 LDA 和 PageRank,从知乎上抓取了超过 20 万条答案进行实验,效果比同类算法提高 2%-10%,以第一作者完成论文并发表在 ICWL 2015
- 人脸识别系统:完成基于深度学习的人脸识别系统.使用 CNN 提取图片特征,使用联合贝叶斯完成 verification.使用 alignment 后的 CASIA Webface 进行训练,LFW 数据及上测试人脸识别的准确度超过 97%
- 语音识别系统:完成基于 GMM 和 HMM 的语音识别系统,可以识别特定的连续语音,如电话号码,单个数字的识别准确率超过 90%,电话号码的识别准确率超过 80%.使用 MFCC 作为特征,HMM 中的每个 state 使用 GMM 表示,以 word 为单位进行识别,训练数据很少,增加数据可提升效果
- TwitterRank:提取各个主题下最有影响力的 Twitter 用户,使用 LDA 算法提取主题,抓取 Twitter 上粉丝数前 100 的用户数据完成实验
- 其他
- 基于 Flask 框架的微信公众号二维码管理网站:方便微信公众号管理二维码的网站.个人负责基于 FLask 框架进行后台开发,使用 MySQL 储存数据
- 基于 webpy 框架查菜谱微信公共号:用户可在公众号中查询各种菜的做法,基于 webpy 框架进行开发,使用 MySQL 储存数据,调用聚合数据的 API 获取菜的做法,完成静态网页生成器将 json 格式的数据转化为网页推送给用户
- 最流行的知乎民间 API(Github 上有超过 500 个 stars):可以获取知乎的各种数据,使用 requests 库发送请求,使用 BeautifulSoup 对网页源码进行解析.个人负责修改 Bug,添加功能,如获取每个答案赞同人列表等