自然语言处理
7、Sentence Embeddings
A SIMPLE BUT TOUGH-TO-BEAT BASELINE FOR SEN- TENCE EMBEDDINGS
论文:https://openreview.net/pdf?id=SyK00v5xx
实现:https://github.com/PrincetonML/SIF
中文文章:https://www.cnblogs.com/databingo/p/9788244.html
6、语法
分词: 国务院/ 总理/ 李克强/ 调研/ 上海/
词性标注: 国务院/ni 总理/n 李克强/nh 调研/v 上海/ns
命名实体识别: 国务院 (机构名) 总理李克强 (人名) 调研上海外高桥 (地名)
句法成分: 构成句子的基本成分叫做句子成分。句子成分可分为主语,谓语,宾语,表语,定语,状语,补语
依存句法分析:
关系类型 | Tag | Description | Example |
---|---|---|---|
主谓关系 | SBV | subject-verb | 我送她一束花 (我 <– 送) |
动宾关系 | VOB | 直接宾语,verb-object | 我送她一束花 (送 –> 花) |
间宾关系 | IOB | 间接宾语,indirect-object | 我送她一束花 (送 –> 她) |
前置宾语 | FOB | 前置宾语,fronting-object | 他什么书都读 (书 <– 读) |
兼语 | DBL | double | 他请我吃饭 (请 –> 我) |
定中关系 | ATT | attribute | 红苹果 (红 <– 苹果) |
语义角色标注: 标注句子中某些短语为给定谓词的论元 (语义角色) ,如施事、受事、时间和地点
语义依存分析:
关系类型 | Tag | Description | Example |
---|---|---|---|
施事关系 | Agt | Agent | 我送她一束花 (我 <– 送) |
当事关系 | Exp | Experiencer | 我跑得快 (跑 –> 我) |
感事关系 | Aft | Affection | 我思念家乡 (思念 –> 我) |
领事关系 | Poss | Possessor | 他有一本好读 (他 <– 有) |
受事关系 | Pat | Patient | 他打了小明 (打 –> 小明) |
5、《Attention is All You Need》浅读(简介+代码)
https://kexue.fm/archives/4765
4、contextualized embedding
representation: 上下文无关的
context representation:上下文有关
3、Embeddings
External data sources are not allowed for this competition. We are, though, providing a number of word embeddings along with the dataset that can be used in the models. These are as follows:
- GoogleNews-vectors-negative300 – https://code.google.com/archive/p/word2vec/
- glove.840B.300d – https://nlp.stanford.edu/projects/glove/
- paragram_300_sl999 – https://cogcomp.org/page/resource_view/106
- wiki-news-300d-1M – https://fasttext.cc/docs/en/english-vectors.html
1、BLEU,ROUGE,METEOR,ROUGE-浅述自然语言处理机器翻译常用评价度量
https://blog.csdn.net/joshuaxx316/article/details/58696552
2、keras各种nlp深度学习常用组件
Deep Language Modeling for Question Answering using Keras
https://codekansas.github.io/language.html