이 글에서는 2020 ACL에 게재된 "SciREX: A Challenge Dataset for Document-Level Information Extraction" (Sarthak jain et al) 논문을 리뷰한다. 이 논문에서는 SciREX라는 과학 논문 데이터셋을 제공하고, 이를 바탕으로 entity recognition(NER), relation extraction(RE)을 수행하는 모델을 제시한다. 위의 그림을 보면 NER과 RE의 목적을 정확하게 이해할 수 있다. 각 색깔은 문서 내에서 추출하고자 하는 entity(노란색: Task, 파란색: Dataset 등)에 해당하며 화살표는 entity간의 relation을 나타낸다. ※ Named Entity Recognition (NER): 문..