NER 2

[논문] GLiNER: Generalist Model for Named Entity Recognition usingBidirectional Transformer (NAACL 2024)

이번 글에서는 2024 NAACL에 게재된 "GLiNER: Generalist Model for Named Entity Recognition usingBidirectional Transformer" (Urchade Zaratiana, et al) 논문을 리뷰한다. GLiNER는 Bidirectional LM을 이용하여 NER을 수행한다. 중요한 점은, 추출하고자 하는 entity가 어떠한 종류이든 하나의 모델로 전부 추출해 줄 수 있다. 이전에 소개한 SciREX와 같은 대부분의 NER 논문은 사전 정의된 entity (SciREX에서는 과학 논문 내의 dataset, method 등)만을 추출할 수 있고 새로운 entity는 추출하지 못하였으나 GLiNER는 원하는 entity 종류를 입력으로 넣으면 ..

[논문] SciREX: A Challenge Dataset for Document-Level Information Extraction (ACL 2020)

이 글에서는 2020 ACL에 게재된 "SciREX: A Challenge Dataset for Document-Level Information Extraction" (Sarthak jain et al) 논문을 리뷰한다. 이 논문에서는 SciREX라는 과학 논문 데이터셋을 제공하고, 이를 바탕으로 entity recognition(NER), relation extraction(RE)을 수행하는 모델을 제시한다.  위의 그림을 보면 NER과 RE의 목적을 정확하게 이해할 수 있다. 각 색깔은 문서 내에서 추출하고자 하는 entity(노란색: Task, 파란색: Dataset 등)에 해당하며 화살표는 entity간의 relation을 나타낸다. ※ Named Entity Recognition (NER): 문..