永利博彩(中国)官方网站

张梅山副教授
研究方向
自然语言处理,意见挖掘与情感分析、面向社会媒体的文本情感分析


研究内容: 自然语言处理,意见挖掘与情感分析

1.中文基础语言分析技术,包括中文分词,词性标注,句法分析等任务。如下图所示例子,给定一段原始文本“中国建筑业呈现新格局”,中文分词将句子切割成词的序列,形成“中国 建筑业 呈现 格局”;进一步词性标注为每个词标注词的属性,比如NR表示专有名词,NN表示普通名词,VV表示动词,JJ表示形容词;然后句法分析用于解析句子结构信息,比如“中国 建筑业”形成一个名词短语NP,而“呈现 格局”表示一个动词短语VP,名词短语和动词短语组合成一个句子。

代表作:

  Chinese Parsing Exploiting Characters (ACL 2013)

  Character-Level Chinese Dependency Parsing (ACL 2014)

  Transition-Based Neural Word Segmentation (ACL 2016)

  Segmenting Chinese Microtext: Joint Informal-Word Detection and Segmentation with Neural Networks (IJCAI 2017)

  A Simple and Effective Neural Model for Joint Word Segmentation and POS Tagging (TASLP 2018)

 

2. 面向社会媒体的文本情感分析。如下图所示,给定一段评论意见句,挖掘评论短语“非常满意”和“比较高”,判断其极性正面(+),然后为每个评价短语分析其意见持有者(is-from)和意见对象(is-about)以及意见原因(is-reason)

代表作:

  Neural Networks for Open Domain Targeted Sentiment (EMNLP 2015)

  Gated Neural Networks for Targeted Sentiment Analysis (AAAI 2016)

  Context-Sensitive Twitter Sentiment Classification Using Neural Network (AAAI 2016)

  Improving Twitter Sentiment Classification Using Topic-Enriched Multi-Prototype Word Embeddings (AAAI 2016)

  End-to-End Neural Opinion Extraction with A Transition-Based Model (Information Systems 2019)