7、Sentence Embeddings

A SIMPLE BUT TOUGH-TO-BEAT BASELINE FOR SEN- TENCE EMBEDDINGS

论文:https://openreview.net/pdf?id=SyK00v5xx

实现:https://github.com/PrincetonML/SIF

中文文章:https://www.cnblogs.com/databingo/p/9788244.html

 

6、语法

分词: 国务院/ 总理/ 李克强/ 调研/ 上海/

词性标注: 国务院/ni 总理/n 李克强/nh 调研/v 上海/ns

命名实体识别: 国务院 (机构名) 总理李克强 (人名) 调研上海外高桥 (地名)

句法成分: 构成句子的基本成分叫做句子成分。句子成分可分为主语,谓语,宾语,表语,定语,状语,补语

依存句法分析:

关系类型 Tag Description Example
主谓关系 SBV subject-verb 我送她一束花 (我 <– 送)
动宾关系 VOB 直接宾语,verb-object 我送她一束花 (送 –> 花)
间宾关系 IOB 间接宾语,indirect-object 我送她一束花 (送 –> 她)
前置宾语 FOB 前置宾语,fronting-object 他什么书都读 (书 <– 读)
兼语 DBL double 他请我吃饭 (请 –> 我)
定中关系 ATT attribute 红苹果 (红 <– 苹果)

语义角色标注: 标注句子中某些短语为给定谓词的论元 (语义角色) ,如施事、受事、时间和地点

语义依存分析:

关系类型 Tag Description Example
施事关系 Agt Agent 我送她一束花 (我 <– 送)
当事关系 Exp Experiencer 我跑得快 (跑 –> 我)
感事关系 Aft Affection 我思念家乡 (思念 –> 我)
领事关系 Poss Possessor 他有一本好读 (他 <– 有)
受事关系 Pat Patient 他打了小明 (打 –> 小明)

 

5、《Attention is All You Need》浅读(简介+代码)

https://kexue.fm/archives/4765

 

4、contextualized embedding

representation: 上下文无关的
context representation:上下文有关

 

3、Embeddings

External data sources are not allowed for this competition. We are, though, providing a number of word embeddings along with the dataset that can be used in the models. These are as follows:

 

1、BLEU,ROUGE,METEOR,ROUGE-浅述自然语言处理机器翻译常用评价度量

https://blog.csdn.net/joshuaxx316/article/details/58696552

 

2、keras各种nlp深度学习常用组件

Deep Language Modeling for Question Answering using Keras

https://codekansas.github.io/language.html