微比恩 > 信息聚合 > AI不会断句?中文分词新模型帮它进步

AI不会断句?中文分词新模型帮它进步

2020-07-24 00:00:00来源: 人民网

  参观者在上海举行的2019世界人工智能大会上与一个智能机器人进行交流。   新华社记者   方喆摄   本报记者 刘园园   人工智能经常“看不懂”中文句子,让人哭笑不得。在日前举行的自然语言处理领域(NLP)顶级学术会议ACL 2020上,来自创新工场大湾区人工智能研究院的两篇论文入选。这两篇论文均聚焦自然语言处理中文分词领域。   据研究人员介绍,分词及词性标注是中文自然语言处理的基本任务,但当前没有比较好的一体化解决方案,而且中文分词普遍存在歧义和未登录词的难题。   基于此,两篇论文各自提出了键-值记忆神经网络的中文分词模型和基于双通道注意力机制的分词及词性标注模型,将外部知识(信息)融入分词及词性标注模型,剔除了分词“噪音”误导,提升了分词及词性标注效果。   中文分词主要面临歧义和未登录词两大难点   据介绍,中文分词的目的是在中文的字序列中插入分隔符,将其切分为词。例如,“我喜欢音乐”将被切分为

关注公众号
标签: AI