QUICK MENU
공공누리 1유형(출처표시)

국립중앙도서관의 보도자료를 제공해 드립니다.
국립중앙도서관의 보도자료 저작물은 "공공누리 1유형(출처표시)" 조건에 따라 누구나 이용할 수 있습니다.

인공지능이 서비스하는 검색과 요약, 체험해 보세요
  • 작성부서 국제교류홍보팀
  • 등록일 2021-04-20
  • 조회 2706
글자크기

인공지능이 서비스하는 검색과 요약, 체험해 보세요

- 국립중앙도서관, AI 기반 요약 및 검색 시범서비스 개시 -



국립중앙도서관(관장 서혜란)은 4월 20일(화) 인공지능 기반의 도서본문 검색과 도서 및 논문 요약을 체험해 볼 수 있는 ‘책에서 답을 찾는 인공지능 검색(nl.go.kr/mrc)’과 ‘인공지능 요약서비스(nl.go.kr/summary)’ 시범서비스를 개시 한다.

▲ 가짜뉴스 없도록 …책에서 답을 찾는 인공지능 검색
‘책에서 답을 찾는 인공지능 검색’은 인공지능이 이용자의 질문을 이해하고 해당 질문에 대한 답을 도서의 본문 속에서 찾아 제시해 주는 서비스이다. 예를 들어 “인공지능이 창작한 음악의 저작권은 누구 소유?”라는 질문을 검색창에 입력하면, “인공지능의 저작물에는 저작권이 인정되지 않지만 인공지능 머신을 활용하여 사람이 창작한 음악이라면 작곡자에게 저작권이 부여된다”는 사실을 「제4차 산업혁명 기술과 지식재산권」(특허청·국제지식재산연수원 공저)의 본문 속에서 찾아 준다. 이 서비스를 이용하면 이용자는 알고 싶은 내용을 사람에게 질문하듯이 문장 형태로 질문함으로써 방대한 도서자료 속에서 원하는 답을 신속하게 찾을 수 있다. 이번 시범서비스는 국립중앙도서관 소장 공공간행물 6,400여 권의 본문 속에서 답을 찾을 수 있도록 개발되었다. 국립중앙도서관은 더 많은 자료를 대상으로 ‘책에서 답을 찾는 인공지능 검색’이 가능해지도록 서비스를 확대해 나간다는 계획이다.

▲ 인공지능 요약서비스로 문단별 요약문을 한눈에!
‘인공지능 요약서비스’는 사회과학, 기술과학, 인문학 등 여러 분야의 도서와 논문에 대해 인공지능이 작성한 요약문을 볼 수 있는 서비스이다. 이 서비스에서는 인공지능이 도서나 논문의 특정 문단을 읽고 그 요약문을 만들어내고 있어, 인공지능이 작성한 문장이 문법적으로, 의미적으로 자연스러운지 살펴보는 것도 흥미로울 것이다. 현재는 문단별 요약만 가능하지만, 향후에는 장별 요약, 도서별 요약 등도 가능해질 것으로 전망된다. 이번 시범서비스에서는 528건의 도서와 논문에서 1~2개 문단씩의 요약문을 체험해 볼 수 있다.

▲ 인공지능 학습용 데이터 구축을 위한 원천 데이터 제공
이번 시범서비스는 기계독해(Machine Reading Comprehension)* 및 도서·논문 생성요약(Abstractive Summarization)**을 위한 ‘인공지능 학습용 데이터 구축(이하 AI 데이터)’(과학기술정보통신부 주관, 한국지능정보사회진흥원 지원) 사업의 결과물로 만들어진 것이다. 국립중앙도서관은 지난해 AI 전문기업인 ㈜포티투마루, ㈜바이브컴퍼니와 업무협약을 체결하고, 소장자료 중 저작권의 제한이 없는 공공간행물과 오픈액세스*** 논문 약 5만여 건을 AI 데이터 구축을 위한 원천 데이터로 제공하였다. 이를 통해 기계독해 AI 데이터 100만 건, 요약 AI 데이터 20만 건이 구축되었다. 구축된 데이터는 AI Hub(aihub.or.kr)를 통해 누구나 이용할 수 있도록 공개된다.

국립중앙도서관 관계자는 “AI 기술을 적용한 새로운 온라인 서비스를 선보일 수 있게 되어 기쁘다. 앞으로도 국립중앙도서관은 첨단기술을 적용한 도서관 서비스를 개발하여 도서관 자원의 활용성을 높이고, 이용자의 정보접근성을 강화하기 위한 다양한 시도를 지속해나갈 것이다.”고 밝혔다.

* 기계독해(Machine Reading Comprehension)란 딥러닝 학습을 통해 인공지능이 질문과 텍스트의 맥락 정보를 이해하여 답을 도출하는 기술이다.
** 생성요약(Abstractive Summarization)이란 텍스트 원문을 인공지능이 이해하여 새로운 요약문을 생성해 주는 기술로서, 본문의 내용 일부를 그대로 가져와 요약문을 작성하는 추출요약(Extractive Summarization)에 비해 난이도가 훨씬 높은 대신 더 자연스럽고 다양한 형태로 적용이 가능하다는 장점이 있다.
*** 오픈액세스(Open Access)란 ‘학술정보에 대한 자유로운 접근과 이용’이라는 개념으로 인터넷을 통해 누구나 어디서든지 각종 연구성과물을 출판과 동시에 자유롭게 공유할 수 있도록 하는 국제적 운동으로, 법적·경제적·기술적 장벽 없이 연구성과물의 생산자와 이용자가 정보를 공유하는 환경을 만드는 것을 목적으로 한다.

붙임
1. 「책에서 답을 찾는 인공지능 검색」 시범서비스 화면
2. 「인공지능 요약서비스」 시범서비스 화면

noname01.jpg
이 자료에 대하여 더욱 자세한 내용을 원하시면
국립중앙도서관 디지털기획과 사무관 김혜련(☎ 02-590-6314)에게 연락주시기 바랍니다.

위로